Java与F#的并行程序处理对比

开发 后端
在Java代码中,大量的代码都是用来实现并行化。与之相反的是,F#在处理并行化上只用了两行代码。可见,并行程序设计在Java中可不是那么easy。本文针对Java与F#的并行程序处理进行了详细的讲解。

Azul System的Cliff Click博士是多核心JVM系统方面的专家,之前发表了一篇博文,首先比较了Java与C语言和C++的性能表现,但同时也讨论了C#和.NET。以下三个Cliffs博士的评论让人十分感兴趣:

在标题"Places where C/C++ beats Java for obvious reasons"下:

“值类型,例如复杂类型,在Java中需要一个类来支持”

"Value Types, such as a 'Complex' type require a full object in Java." - Dr Cliff Click

Cliff忘记提及的是.NET同样提供值对象和比复数更加引人注意的humble hash table。

考虑一下以10,000,000个整数/单精度浮点数 填充hash表,这个任务可以使用Java来完成,如下:

  1. package hashtablebenchmark;  
  2.  
  3. import java.util.HashMap;  
  4.  
  5. public class Main {  
  6.     public static void main(String[] args) {  
  7.         int n = 10000000;  
  8.  
  9.         for (int j=0; j<10; ++j) {  
  10.             long startTime = System.currentTimeMillis();  
  11.             HashMap hashtable = new HashMap(n);  
  12.  
  13.             for(int i=1; i<=n; ++i) {  
  14.                 hashtable.put(i, 1.0f / i);  
  15.             }  
  16.  
  17.             System.out.println("m[100] = " + hashtable.get(100));  
  18.             long time = System.currentTimeMillis() - startTime;  
  19.             System.out.println("Took: " + time / 1e3 + "s");  
  20.         }  
  21.     }  

同样的程序在F#中不仅仅代码更短并且速度要快上17倍:

  1. let n = 10000000 
  2. let m = System.Collections.Generic.Dictionary(n)  
  3. for i=1 to n do 
  4.   m.[i] <- 1.0f / float32 i  
  5. printf "m[100] = %f\n" m.[100

特别值得提及的是,Java初始化花费6.967s、稳态花费5.733s,而F#只用了0.414s。

实际上,F#通过这个测试后我们便想给它更大的工作量,而在这台4GB内存的机器上,Java不可能再做更多了。

在别处的评论,Cliff也这样写到Java:

“有非常好的多线程支持,并行程序设计在Java中很容易实现”

"Very Good Multi-Threading Support. Parallel programming is just easier in Java." - Dr Cliff Click

之后又有:

“并非我如此关注C#而是...我认为JIT编码处理基本上比Java要慢”

"Not that I track C# all that closely but... I believe the JIT produces substantially slower code than Java" - Dr Cliff Click

允许我们在其他方面来证明,Computer Language Shootout软包含了一个格式良好的spectral-norm测试,最快的Java解决方案是一个173行的并行程序。其实现用F#来写只需要24行代码:

  1. let A i j = 1.0 / float((i + j) * (i + j + 1) / 2 + i + 1)  
  2.  
  3. let inline mul A (u: _ []) (v: _ []) =  
  4.   System.Threading.Tasks.Parallel.For(0, v.Length, fun i ->  
  5.     let mutable vi = 0.0 
  6.     for j = 0 to v.Length - 1 do 
  7.       vi <- vi + A i j * u.[j]  
  8.     v.[i] <- vi) |> ignore  
  9.  
  10. let AtAu u v =  
  11.   let w = Array.create (Array.length u) 0.0 
  12.   mul (fun i j -> A i j) u w  
  13.   mul (fun i j -> A j i) w v  
  14.  
  15. do 
  16.   let n = 5500 
  17.   let u, v = Array.create n 1.0, Array.create n 0.0 
  18.   for i = 0 to 9 do 
  19.     AtAu u v  
  20.     AtAu v u  
  21.   let u, v = vector u, vector v  
  22.   printf "%0.9f\n" (sqrt(Vector.dot u v / Vector.dot v v)) 

在Java代码中,大量的代码都是用来实现并行化。与之相反的是,F#在处理并行化上只用了两行代码。可见,并行程序设计在Java中可不是那么easy。

Java串行程序初始花费了12.722s稳态花费12.299s,而冷启动的F#只用了12.18s。在8核 2xE5405 2.0GHz Xeon的机器上,Java并行程序初始化花费1.839s稳态花费1.820s,而冷启动的F#并行程序只用了1.60s。事实证明,Java在每一个测试中都表明CLR的JIT并不是“处理基本上比Java更慢”

***,Cliff并没有提到其他两个设计上(Java性能)的不足。首先,Java的泛型代码导致性能大幅下降,由于它使用了许多不必要的装箱操作。其次,JVM栈缺少尾部递归支持,这不仅仅对这个函数式编程的年代带来越来越多的障碍,而且唯一的一般解决方案也比需要的慢上10倍。

 

英文连接:http://fsharpnews.blogspot.com/2010/05/java-vs-f.html

原文链接:http://www.oschina.net/news/26564/java-vs-f

【编辑推荐】

  1. Java并发编程之同步互斥问题
  2. Java中String.format的用法
  3. 如何在Oracle中使用Java存储过程(详解)
  4. 关于读写锁算法的Java实现及思考
  5. 6个提高Java开发者效率的工具
责任编辑:林师授 来源: 开源中国社区
相关推荐

2009-08-19 09:42:34

F#并行排序算法

2011-11-17 10:34:44

并行程序

2010-01-07 10:04:18

F#函数式编程

2010-04-07 16:51:59

F#

2010-03-26 19:03:19

F#异步并行模式

2010-03-26 18:31:59

F#异步并行模式

2010-03-08 09:17:13

F#异步

2010-03-16 09:09:04

F#

2010-01-26 08:25:06

F#语法F#教程

2013-12-16 16:49:57

OpenMP

2013-12-16 16:58:47

OpenMP并行

2009-09-10 14:18:59

Functional F#

2010-01-15 08:33:13

F#F#类型推断F#教程

2010-03-26 19:22:08

F#代理

2009-11-16 09:05:46

CodeTimer

2010-04-06 15:20:56

ASP.NET MVC

2009-08-04 14:23:55

C# Actor

2009-11-09 17:51:51

F#函数式编程

2011-06-09 09:52:41

F#

2009-08-13 17:39:48

F#数据类型Discriminat
点赞
收藏

51CTO技术栈公众号