最近在用weka做一个数据挖掘相关的项目,不得不说,weka还是一个不错的开放源代码库,提供了很多最常用的分类和聚类算法。
在我的项目中要用到一个聚类算法,Affinity Propagation(AP),由多伦多大学的Brendan J. Frey发表于2007年。相比其他的聚类算法,AP算法的聚类结果更加准确。
在AP的官方网站公布了AP算法的动态链接库,我的目标就是实现在Java工程中调用这个动态链接库。
在网上查了资料,发现,如果仅仅是想调用Windows的Native API还是比较省事的,这里我主要针对第三方dll的调用。
下面进入正题。
这里主要用的方法是JNI。在网上查资料时看到很多人说用JNI非常的复杂,不仅要看很多的文档,而且要非常熟悉C/C++编程。恐怕有很多人在看到诸如此类的评论时已经决定绕道用其他方法了。但是,假如你要实现的功能并不复杂(简单的参数传递,获取返回值等等),我还是支持使用这个方法的。
Java Native Interface,简称JNI,是Java平台的一部分,可用于让Java和其他语言编写的代码进行交互。下面是从网上摘取的JNI工作示意图。
下面就举具体的例子说明一下使用步骤:
1) 编写一个类,声明native方法
public class APCluster {
public native int[] CallAPClusterDll( int arg_Int,
double[] arg_DoubleArray,
boolean arg_boolean);
static
{
System.loadLibrary("APClusterDllMedium");
}
}
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
上面是APCluster.java文件,定义了一个APCluster类,其中有一个方法CallAPClusterDll(),需要传递三种不同类型的参数,并且返回一个整型数组。
注意,这里只需要声明这个方法,并不需要实现,具体实现就在APClusterDllMedium中。
APClusterDllMedium就像中介一样,Java通过调用这个中介Dll中的CallAPClusterDll方法,间接调用真正的第三方Dll。
2)编译生成.h文件
第一步:
javac APCluster.java 生成APCluster.class
第二步:
javah APCluster 生成APCluster.h头文件,内容如下:
/* DO NOT EDIT THIS FILE - it is machine generated */
#include <jni.h>
/* Header for class APCluster */
#ifndef _Included_APCluster
#define _Included_APCluster
#ifdef __cplusplus
extern "C" {
#endif10 /*
* Class: APCluster
* Method: CallAPClusterDll
* Signature: (I[DZ)[I
*/
JNIEXPORT jintArray JNICALL Java_APCluster_CallAPClusterDll
(JNIEnv *, jobject, jint, jdoubleArray, jboolean);
#ifdef __cplusplus
}
#endif21
#endif
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
- 12.
- 13.
- 14.
- 15.
- 16.
- 17.
- 18.
注意,APCluster.h这个头文件的内容是不能修改的,否则JNI会找不到相对应的CallAPClusterDll()的实现。
3)创建C/C++工程,实现CallAPClusterDll()方法。
创建一个C/C++工程,工程名为APClusterDllMedium(其实,生成的dll名为APClusterDllMedium即可),导入APCluster.h这个头文件,并创建一个CPP文件,实现.h文件中的方法。
由于我创建的工程是win32控制台程序,所以最后默认生成的是.exe文件,所以还要做一步工程属性修改,让它生成.dll后缀文件。
打开Project Property ->General,做以下修改:
下面就是实现 JNIEXPORT jintArray JNICALL Java_APCluster_CallAPClusterDll (JNIEnv *, jobject, jint, jdoubleArray, jboolean); 这个方法了。先贴代码再慢慢解释吧。
#include "APCluster.h"
#include <stdio.h>
#include <windows.h>
#ifdef __cplusplus
extern "C" {
#endif
typedef int* (__stdcall *APCLUSTER32)(double*, unsigned int, bool);
JNIEXPORT jintArray JNICALL Java_APCluster_CallAPClusterDll
(JNIEnv *env, jobject _obj, jint _arg_int, jdoubleArray _arg_doublearray, jboolean _arg_boolean)
{
HMODULE dlh = NULL;
APCLUSTER32 apcluster32;
if (!(dlh=LoadLibrary("apclusterwin.dll"))) //第三方DLL位置
{
printf("LoadLibrary() failed: %d\n", GetLastError());
}
if (!(apcluster32 = (APCLUSTER32)GetProcAddress(dlh, "apcluster32"))) //具体调用apcluster32方法
{
printf("GetProcAddress() failed: %d\n", GetLastError());
}
int m_int = _arg_int; //类型转换
double* m_doublearray = env->GetDoubleArrayElements(_arg_doublearray, NULL);
bool m_boolean = _arg_boolean;
int* ret = (*apcluster32)(m_doublearray, m_int, m_boolean); /* actual function call */
jintArray result = env->NewIntArray(_arg_int);
env->SetIntArrayRegion(result, 0, _arg_int, (const jint*)ret);
FreeLibrary(dlh); /* unload DLL and free memory */
if(ret)
{
free(ret);
}
return result;
}
#ifdef __cplusplus
}
#endif
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
- 12.
- 13.
- 14.
- 15.
- 16.
- 17.
- 18.
- 19.
- 20.
- 21.
- 22.
- 23.
- 24.
- 25.
- 26.
- 27.
- 28.
- 29.
- 30.
- 31.
- 32.
- 33.
- 34.
- 35.
- 36.
a)首先为了#include <jni.h>,必须添加JNI所在的目录。
打开Project Property -> C/C++ -> General -> Additional Include Directories添加相应目录:
b)在APCluster.h文件中自动生成的函数,只标识了函数参数类型,为了引用这些参数,自己起一个相应的名字:
JNIEXPORT jintArray JNICALL Java_APCluster_CallAPClusterDll
(JNIEnv *env, jobject _obj, jint _arg_int, jdoubleArray _arg_doublearray, jboolean _arg_boolean) ......
c)声明函数指针,就是你要调用的第三方dll中函数的类型。
d)LoadLibrary,导入真正的第三方Dll,并找到要调用的方法的函数地址。
把这个函数地址赋值给函数指针,接下来就可以通过这个函数指针调用真正的apcluster函数了!
e)类型转换:
读读jni.h文件就知道jdouble和double其实是一个东西,jboolean就是unsigned char类型,jni.h中是这么声明的:
typedef unsigned char jboolean;
typedef unsigned short jchar;
typedef short jshort;
typedef float jfloat;
typedef double jdouble;
- 1.
- 2.
- 3.
- 4.
- 5.
但是数组类型就没有这么简单,获取数组要使用类型相对应的env->GetTypeArrayElement(jTypeArray...)。
最后,要返回一个jint类型的数组,就要新创建一个此类型的数组,再为其赋值:
jintArray result = env->NewIntArray(_arg_int);
env->SetIntArrayRegion(result, 0, _arg_int, (const jint*)ret);
- 1.
- 2.
其中,_arg_int代表的是创建数组的长度。
最后return result。
4)Build这个工程。
Build,生成相应的APCluster.dll文件,将这个dll放到java工程目录下。
5)编写测试java程序,调用dll库。
以下为测试程序,Test.java:
public class Test
{
public static void main(String[] args)
{
double arg_doublearray[] = {0.1, 0.2, 0.3};
int arg_int = 3;
boolean arg_boolean = true;
int[] result = new APCluster().CallAPClusterDll(arg_int, arg_doublearray, arg_boolean);
.....
}
}
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
到此,java调用第三方dll就基本完成了。
本文也主要是介绍大概的操作流程,至于具体应该使用哪些API就只有去研究官方文档了。
另外还有一些需要注意的问题,比如64位的程序去调用32位的dll会报错啊等等...这些都是细节问题了。
最后,个人认为,自己动手实践还是很重要,网上都说这个复杂那个难,但是至于难还是不难,还是要实践了才知道...不能不去尝试...
原文链接:http://www.cnblogs.com/AnnieKim/archive/2012/01/01/2309567.html
【编辑推荐】