频 道 直 达 - 新闻 - 读书 - 培训 - 教程 - 前沿 - 组网 - 系统应用 - 安全 - 编程 - 存储 - 操作系统 - 数据库 - 服务器 - 专题 - 产品 - 案例库 - 技术圈 - 博客 - BBS
51CTO.COM_中国领先的IT技术网站
找资料:

Viusal C++.NET 2003 的优化代码(1)

作者: 出处:中国IT实验室  (  ) 砖  (  ) 好  评论 ( ) 条  进入论坛
更新时间:2006-11-02 13:40
关 键 词:C++  .NET  优化  性能
阅读提示:人们在使用一个新的编程工具时总会感到缺乏自信,本文试图让你对VC的代码优化有更直观的感觉,希望你能通过阅读本文从VC中“得到”更多的东西。

Visual C++.NET 2003

VC.NET 2003不仅带来了两个新的优化选项,它还改进了VC.NET 2002中一些优化的性能。

第一个新增选项是“/G7”,它告诉编译器对Intel Pentium 4和AMD Athlon处理器进行优化。

使用“/G7”选项编译的程序,当我们和VC.NET 2002生成的代码比较时发现,它通常能使典型的程序的运行速度提高5到10个百分点,如果使用了大量浮点代码甚至能提高10到15个百分点。而提高的优化程度可能很高也可能较低,在一些使用最新CPU和“/G7”选项的测试中,甚至提高了20%的性能。

使用“/G7”选项不代表生成的代码只能运行在Intel Pentium 4和AMD Athlon处理器上。这些代码仍可以运行在老的CPU上,只是在性能表现上可能有“小小的惩罚”。另外,我们观察到一些程序使用“/G7”后在AMD Athlon上运行的比用Intel Pentium 4更慢。

当没使用“/Gx”选项时,编译器会默认使用“/GB”选项,此时为“blended”优化模式。在VC.NET 2002和VC.NET 2003中,“/GB”代表“/G6”,即为Intel Pentium Pro, Pentium II, Pentium III处理器优化。

这儿有一个例子,它展示了做与常整数乘法时使用Pentium 4和“/G7”的优化效果,下面是源代码:

int i;

// Do something that assigns a value to i.

return i*15;

当使用“/G6”时,生成了目标代码:

mov eax, DWORD PTR _i$[esp-4]
imul eax, 15

当使用“/G7”时,生成了更快(可惜更长)的代码,它没用imul(乘)指令,在Pentium 4上执行只需要14个周期。目标代码如下:

mov ecx, DWORD PTR _i$[esp-4]
mov eax, ecx
shl eax, 4
sub eax, ecx

第二个优化选项是“/arch:[argument]”,用它可对SSE或SSE2优化,生成使用Streaming SIMD Extensions(SSE)和Streaming SIMD Extensions 2(SSE2)指令集的程序。当使用“/arch:SSE”选项时,目标代码只能运行在支持SSE指令(如:CMOV,FCOMI,FCOMIP,FUCOMI,FUCOMIP)的CPU上。当使用“/arch:SSE2”选项时,目标代码只能运行在支持SSE2指令集的CPU上。

相比于“/G7”,使用了SSE或SSE2优化的程序,一般能减少2-3%的运行时间,个别测试中甚至能减少5%的运行时间。

使用“/arch:SSE”可得到以下效果:

1、在使用单精度浮点数时,使用SSE指令对其处理。
2、使用CMOV指令,它最早被Pentium Pro支持。
3、使用FCOMI,FCOMIP,FUCOMI,FUCOMIP指令,它们也是最早被Pentium Pro支持的。

使用“/arch:SSE2”的话,可以得到所有“/arch:SSE”选项的效果,另外还有以下几个效果:

1、在使用双精度浮点数时,使用SSE2指令对其处理。
2、使SSE2指令集做64位切换。(原文:Making use of SSE2 instructions for 64-bit shifts)

还有其它的好处,在同时使用“/arch:SSE”或“/arch:SSE2” 和“/GL”(全程优化)选项选项时,编译器会对浮点参数和浮点返回值做函数调用规则优化。

上面说的几点优化特性已经包括于VC.NET 2003里了。另外还有一点就是能消除“死参数”--从没被用过的参数。比如:

int
f1(int i, int j, int k)
{
return i + k;
}

int
main()
{
int n = a+b+c+d;
m = f1(3, n, 4);
return 0;
}

在函数f1()中,第二个参数从没被使用过。当我们用“/GL”(全程优化)选项时,编译器将产生如下目标代码来调用f1():

mov eax, 4
mov ecx, 3
call ?f1@@YAHHHH@Z
mov DWORD PTR ?m@@3HA, eax

在这个例子里,变量“n”从没被运算,只有两个参数被f1()使用,所以只传递那两个参数(并且它们是从寄存器传过去的,这比使用栈传更快)。另外,编译这个例子时要禁止内联(inlining),否则函数f1()就不存在了,而直接给m赋予值7。


共2页: 1 [2] 下一页
【内容导航】
发表
查看
我也说两句

匿名发表

(如果看不清请点击图片进行更换)


中 国 领 先 的 IT 技 术 网 站 ·
技 术 成 就 梦 想
·Java基础教程 (查看52371次)
·UML类图详解 (查看46839次)
·Java编程开发手册 (查看25118次)
·UML统一建模语言 (查看24099次)
·C#技术开发指南 (查看22406次)
·Java编程开发手册 (1195个砖)
·Java基础教程 (429个砖)
·C#技术开发指南 (304个砖)
·PB开发教程 (220个砖)
·.NET开发手册 (217个砖)
·Java编程开发手册 (653个好)
·Java基础教程 (569个好)
·.NET开发手册 (251个好)
·PB开发教程 (209个好)
·Delphi开发技术手册 (174个好)
订阅技术快讯
电子杂志下载
名称:网络安全精品应用黄皮书
简介:《2007精品网络安全黄皮书》包括了9个大类24个小类, 800余篇文章,内容包含了熊猫烧香病毒、DDOS攻击、ARP病等热点问题的介绍及解决方案。从病毒查杀、防范、系统、数据等各方面的安全设置到黑客技术的了解、防范,涉及到了安全应用的全部领域, 由浅至深内容全面。
名称:Vista精品应用黄皮书
简介:《Vista精品应用黄皮书》囊括了Vista的各方面内容。此次的精简版,是将里面的内容做了提取,便于用户下载和使用。内容包含了各种Vista的安装与实施、技巧与解析以及各种Vista相关学习文档和相关软件的安全下载。该电子书是了解和应用Vista人员必备的工具手册,并且也是第一本
名称:2006中国IT论坛精品集合
简介:本书由“51CTO论坛推广联盟”制作完成。书中所有内容均来自各联盟成员的论坛(网站)。制作本书的目的是为了集中大家的优势资源,将更多更精彩的内容带给广大技术爱好者。本书是联盟成立以来制作的第一本书。
关键字阅读
频道精选
主编信箱 热线:010-66476606 告诉我们您想看的:专题 文章
关于我们 | 诚聘英才 | 联系我们 | 网站大事 | 意见反馈 | 网站地图
Copyright©2005-2007 51CTO.COM 版权所有