软件工程师必知的十个概念

开发 项目管理
本文向您介绍作为一个软件工程师应该知道的十个概念,这些概念集中在设计模式、测试、代码重构等方面,希望对您有所帮助。

出色的软件工程师善用设计模式,勤于代码重构,编写单元测试,并对简单有宗教般的追求。除了这些,优秀的软件工程师还要通晓10个概念,这10个概念超越了编程语言与设计模式,软件工程师应当从更广的范围内明白这些道理。

1.接口(Interfaces)

软件工程中最重要的概念是接口。任何软件都是一个真实系统的模型。如何使用简单的用户接口进行模型化至关重要。很多软件系统走这样的极端,缺乏抽象的冗长代码,或者过分设计而导致无谓的复杂。

在众多软件工程师书籍中,RobertMartin写的《敏捷编程》值得一读。

关于模型化,以下方法对你会有帮助。首先,去掉那些只有在将来才可能用得着的方法,代码越精练越好。第二,不要总认为以前的东西是对的,要善于改变。第三,要有耐心并享受过程。

2.惯例与模板(ConventionsandTemplates)

命名惯例和基础模板在编程模式中常被忽视,然而它可能是最强大的方法。命名惯例使软件自动化成为可能,如,JavaBeans框架在getter和setter方法中,使用简单的命名惯例。del.icio.us网站的URL命名也使用统一的格式,如http://del.icio.us/tag/software会将用户带到所有标签为software的页。

很多社会网络均使用简单命名,如,你的名字是johnsmith,那你的头像可能命名为johnsmith.jpg,而你的rss聚合文件的命名很可能是johnsmith.xml。

命名惯例还用于单元测试,如,JUnit单元测试工具会辨认所有以test开头的类。

我们这里说的模板(templates)指的并不是C++或Java语言中的constructs,我们说的是一些包含变量的模板文件,用户可以替换变量并输出最终结果。

ColdFusion是最先使用模板的程序之一,后来,Java使用JSP实现模板功能。Apache近来为Java开发了非常好用的通用模板,Velocity。PHP本身就是基于模板的,因为它支持eval函数。

3.分层(Layering

用分层来讨论软件架构是最容易的。JohnLakos曾出版过一本关于大型C++系统的书。Lakos认为软件包含了层,书中介绍了层的概念,方法是,对每个软件组件,数一下它所依赖的组件数目就可以知道它的复杂程度。

Lakos认为,一个好的软件拥有金字塔结构,就是说,软件组件拥有层层积累的复杂度,但每个组件本身必须简单,一个优秀的软件包含很多小的,可重复使用的模块,每个模块有自己的职责。一个好的系统中,组件之间的依赖性不可交叉,整个系统是各种各样的组件堆积起来,形成一个金字塔。

Lakos在软件工程师的很多方面都是先驱,最著名的是Refactoring(代码重构)。代码重构指的是,在编程过程中需要不断地对代码进行改造以保证其结构的健壮与灵活。

4.算法的复杂性(AlgorithmicComplexity

关于算法的复杂性,软件工程师需要理解这样几件事。第一,大O标记法(bigOnotation);第二,你永远都不应该使用嵌套式循环(循环里面套循环),你应该使用Hash表,数组或单一循环;第三,如今优秀类库比比皆是,我们不必过分纠缠于这些库的效能的差别,我们以后还有机会进行细调;最后,不要忽视算法的优雅及性能,编写紧凑的,可读的代码可以让你的算法更简单,更干净。

5.散列法(Hashing)

Hashing的目的是加速访问速度。如果数据是序列存储的,从中查询一个项的时间取决于数据列的大小。而散列法对每一个项计算一个数字作为索引,在一个好的Hashing算法下,数据查找的速度是一样的。

除了存储数据,散列法对分布式系统也很重要。统一散列法(uniformhash)用来在云数据库环境下,在不同计算机之间分存数据。Google的索引服务就是这种方法的体现,每一个URL都被散列分布到特定计算机。

散列函数非常复杂,但现代类库中都有现成的类,重要的是,如何对散列法进行细调以获得最好的性能。

6.缓存(Caching)

缓存对现代Web程序不可或缺,缓存是从数据库取回,并存放在内存中的数据。因为数据库直接存取的代价非常高,将数据从数据库取回并放在缓存中访问就变得十分必要。比如,你有一个网站,要显示上周的畅销书,你可以从数据将畅销书榜一次性取回放在缓存中,而不必在每次访问时都去数据库读数据。

缓存需要代价,只有最常用的内容才可以放入缓存。很多现代程序,包括Facebook,依靠一种叫做Memcached的分布式缓存系统,该系统是BradFirzpatrick在工作于LiveJournal项目时开发的,Memcached使用网络中空闲的内存资源建立缓存机制,Memcached类库在很多流行编程语言,包括Java和PHP中都有。

7.并发(Concurrency)

并发是软件工程师最容易犯错的地方,这可以理解,因为我们一直遵从线形思维,然而并发在现代系统中非常重要。

并发是程序中的并行处理,多数现代编程语言包含内置的并发能力,在Java,指的是线程。关于并发,最经典的例子是“生产/消费”模式,生产方生产数据和任务,并放入工作线程消费或执行。并发的复杂性在于,线程需要经常访问共同数据,每个线程都有自己的执行顺序,但需要访问共同数据。DougLea曾写过一个最复杂的并发类,现在是coreJava的一部分。

8.云计算(CloudComputing)

RWW最近的关于云计算的文章ReachingForTheSkyThroughComputeClouds讲到了云计算如何改变大规模Web应用的发布。大规模的并行,低成本,与快速投入市场。

并行算法发明以来,首先迎来的是网格计算,网格计算是借助空闲的桌面计算机资源进行并行计算。最著名的例子是Berkley大学的SETI@home计划,该计划使用空闲的CPU资源分析太空数据。金融机构也大规模实施网格计算进行风险分析。空闲的资源,加上J2EE平台的崛起,迎来了云计算的概念:应用服务虚拟化。就是应用按需运行,并可以随着时间和用户规模而实时改变。

云计算最生动的例子是Amazon的Web服务,一组可以通过API进行调用的应用,如云服务(EC2),一个用来存储大型媒体文件的数据库(S3),索引服务(SimpleDB),序列服务(SQS)。

9.安全(Security)

随着黑客的崛起与数据敏感性的上升,安全变得非常重要。安全是个广义的概念,涉及验证,授权与信息传输。

验证是对用户的身份进行检查,如要求用户输入密码。验证通常需要结合SSL(securesocketlayer)进行;授权在公司业务系统中非常重要,尤其是一些工作流系统。最近开发的OAuth协议可以帮助Web服务将相应信息向相应用户开放。Flickr便使用这种方式管理私人照片和数据的访问权限。

另外一个安全领域是网络设防,这关系到操作系统,配置与监控。不仅网络危险重重,任何软件都是。Firefox被称为最安全的浏览器,仍然需要频频发布安全补丁。要为你的系统编写安全代码就需要明白各种潜在的问题。

10.关系数据库(RelationalDatabases)

关系数据库因为在大规模Web服务上缺乏可扩充性而颇受微词,然而,关系数据库仍然是近20年来计算机技术中最伟大的成就。关系数据库对处理订单,公司数据方面有着出色的表现。

关系数据库的核心是以记录表示数据,记录存放在数据库表,数据库使用查询语言(SQL)对数据进行搜索与查询,同时,数据库对各个数据表进行关联。

数据库的标准化技术(normalization)讲的是使用正确的方式对数据进行分存以降低冗余,并加快存取速度,这也是软件工程师必知的技术。

 

【编辑推荐】

  1. 软件工程师必知的12个单元测试技巧
  2. 软件工程之需求分析过程介绍
  3. 软件工程中质量保证体系的监理
责任编辑:佚名 来源: 博客园
相关推荐

2011-07-08 16:37:20

2009-11-04 10:57:35

2010-08-10 13:22:41

2023-10-23 11:49:59

2023-09-20 22:52:12

Kubernetes快捷方式

2017-04-18 09:46:31

机器学习工程师算法

2011-02-28 16:43:55

2009-07-02 14:05:55

2024-01-23 18:49:38

SQL聚合函数数据分析

2023-11-08 18:01:53

硬重置Git命令

2019-07-05 07:49:19

TCPIP网络协议

2014-02-12 09:31:53

2020-06-03 15:25:27

运维架构技术

2019-05-15 11:14:22

监控工具运维

2022-09-16 08:00:00

软件工程师求职薪酬

2013-09-03 09:30:44

软件工程师软件工程师头衔

2014-09-22 09:47:14

2009-02-11 13:15:54

软件工程师女工程师google

2022-07-29 09:12:44

软件硬件开发

2023-09-26 19:14:57

VS Code插件参数
点赞
收藏

51CTO技术栈公众号