您所在的位置:开发 > Web > PHP > 在 PHP 中用描点法“绘制”中文

在 PHP 中用描点法“绘制”中文

2005-09-09 14:07 LuciferStar 超越PHP 字号:T | T
一键收藏,随时查看,分享好友!

为了实现更多的自动控制,可以使用CGI(Common Gateway Interface)程序来实现这些功能。

AD:

前言:
现在,越来越多的人喜欢上网了,越来越多的人拥有了自己的个人主页。随着各种自动化软件工具的出现,制作网页越来越简单。但,由于特效随处可得,创新的东西,越来越少。说不定,哪天,你会发现某个网站上的计数器和自己的一模一样。网页越做越老练。网页上的东西,也越来越多,越来越丰富。
设问:

  • 在网页上,如果我要添加一个计数器:
    以前,那就去空间提供商那里要个链接,或其他地方去复制个地址,但这一些,总归是别人做的,好不好,你是没有太多的发言权的,只能一个一个地找。
  • 在网页上,我要将一些信息发布出去:
    假如信息是文本,做一个新页面,加个链接;
    是数据,做一个新页面,加个链接:
    可要是这些数据经常更新,甚至,每小时、每分钟,都可能会改变,你是否愿意守在电脑前,不停修改、上传呢?(咱可不是商业网站,没有人愿意为你而烧钱。)
    而留言板、聊天室、论坛,这些,决不是单靠HTML和JAVASCRIPT就能搞定的。

为了实现更多的自动控制,可以使用CGI(Common Gateway Interface)程序来实现这些功能。
软件需求:
PHP:GD Library
配置支持PHP的服务器。我用OmniHTTPd Professional

对于计数器和实时数据统计、发布,我们可以用图片来完成。在图片中输出文字。
在PHP中,要创建一个图片,并在上面显示点内容,基本步骤如下:

//http头,告诉浏览器,这是一个GIF图片
header ("Content-type: image/gif");
// 要画画,先要有花布不是?创建一个400×300调色板图像
$im = imagecreate (400, 300);
$black = imagecolorallocate ($im, 0, 0, 0);
// 默认黑色背景。
//(默认,是指第一个定义的颜色。如果在此行代码前面定义了另一个颜色,那么,最先定义的那个,就是默认背景颜色。)
$red = imagecolorallocate ($im, 255, 0, 0);
//红色。如果这两行交换,你会发现背景是红色,文字是黑色。
$string="1234567890";
// 要绘制的字符
imagestring ($im,12,10,10,$string,$red);
//在(10,10)开始绘制字符串
imagepng ($im);
// 以png格式输出,也可以用imagejpeg($im);或magegif($im);但后者,如果GD版本高于1.6,就不能用了。
imagedestroy ($im);
// 结束,清除所有占用的内存资源
?>


上面示例,在400×300的图片上,自点(10,10)开始,绘制12磅的"1234567890"。你有没有注意到这张图片的大小是:251字节!你也可以试试其他的输出格式。
图片的大小,与图片中非背景象素点数有关,跟输出多少象素无关。

然而,有一个问题。
你可以用imagestring()输出如下的信息:
imagestring($im,1,0,0,"abcdefghijklmnopqrstuvwxyz0123456789~!@#$%^&*()_+{}|:"<>?[]';,./",$red);
可是,你无法正确输出中文!!!
imagestring($im,1,0,0,"啊",$red);
你看到的,决不是中文!!而是乱码。
PHP默认的字符集是UTF-8,而简体中文是GB2312。

如何解决?!
为了解决这个问题,你可以让PHP加载扩展模块php_iconv.dll(UNIT下的后缀名是.SO),不过,有时候,可能不能正常工作。本来,我要把一段测试代码放上来,可这次,怎么弄都没有成功。为了避免错误,我还是不把它们放上来了。
但,最致命的,如果你的空间服务商关闭了该扩展模块,或者,甚至禁止了加载模块的DL()函数,那,你就只能跟中文BYE-BYE了。
还好,还有其他办法。
可以通过字符映射,将预先转换好的码表中字符输出来。但,你需要一张码表!
或者,手工绘制每一个中文的每一个点!感觉怎么样?!

好,来吧,我们一起来画字!

画字,首先要知道怎么画。
初中的简单函数,学过吧?要画出函数的图形,做过吧?算出某点的坐标,然后连接两相邻点。这种方法,叫描点法。
我们要做的,是尽量多地将点算出来,然后在相应坐标显示出来。
你是否听说过点阵打印机、点阵汉字?
在输出汉字时,它们是用一个个点来表示的。

在某个坐标上显示一个某种颜色的点的函数是:
int imagesetpixel ( resource image, int x, int y, int color)
假定我要在坐标(100,100)处显示一个白色的点,那么,只需如下代码:

header ("Content-type: image/gif");
$image = imagecreate (400, 300);
$black = imagecolorallocate ($image, 0, 0, 0);
$white = imagecolorallocate ($image, 255, 255, 255);          // 定义白色
imagesetpixel ( $image, 100, 100, $white);
imagepng ($image);
imagedestroy ($image);
?>


也就是说,我们只要获取某个汉字的所有点的信息,我们就能够通过这个函数,输出那个汉字。

在文件chs16.fon里,保存的,是国标区位码表(国家标准信息交换用汉字编码基本字符集GB-2312)。它是汉字的点阵字库。(WIN98系统中,此文件在c:windowscommand下。如果你要把它放在UNIX系统下使用,请注意大小写。如果没有,你可以在文末找到链接。)
它是MSDOS时代的,但,好东西,还是应该拿出来一用的。

从chs16.fon里,我们可以读取汉字的点阵数据。每个汉字,都是由16×16个点构成的。笔划走过的地方,点的值为1,否则为0;每个点占用一个位,每8个点构成一个字节。那么,一个汉字,就需要(16×16÷8=32)字节。

下面这个实例,是为了说明字符点阵的表示方法。
这里,定义了一个8×8的矩阵,显示了一个字母C,白色的方块用0表示,黑色方块用1表示,那么,这八行图形的代码分别是:

点击查看原图 点击查看原图

二进制表示

十六进制表示

0

00000000

0x00

1

00111110

0x3E

2

01110000

0xE0

3

01110000

0xE0

4

01110000

0xE0

5

01110000

0xE0

6

00111110

0x3E

7

00000000

0x00


要输出这些点的话,就需要先画第一行,然后第二行、第三行……到最后一行。
用一个循环:
for($hang=0;$hang<8;$hang++)
在每一行中,有八个格子,需要分别绘制,从第一个,然后第二个、第三个……到最后一个。
用一个循环:
for($gezi=0;$gezi<8;$gezi++)
两个循环联列:
for($hang=0;$hang<8;$hang++)
for($gezi=0;$gezi<8;$gezi++)
{ //在这里,我们就能输出点了。
imagesetpixel ( $image, $gezi, $hang, $color);
}

但,我们如何知道到哪里去读某个汉字的点阵数据呢?

一般的字符,比如ASCII码,是用数字0--127(即二进制00000000到01111111)来表示,而中文,则是用两个高位为1的字节(100000000 100000000)表示。如:  半角字符"A",机内码为 (01000001)(它实际上是ASCII码值)。
下面,让我们打开"字符映射表"看看吧。如果你为了节省磁盘,没有安装,那就装一下,不大。如果不会安装,那你就接下去看我乱侃吧。
在字符映射表里,字体选择"楷体_GB2312",点击"特殊符号",这时,你可以看到国标区位码表,从字符(10110000 10100001)开始,一直到(10011111 11111111)。
全角字符"A",机内码为:(10100011 11000001)(它实际是两个高位为1的ASCII码)。
中文"啊"的机内码,是(10110000 10100001);
在GB-2312字符集中,"啊"在表中位置是第16区第1位,这个坐标(16,1),用二进制表示,就是(00010000,00000001)。这,就是"啊"的区位码。
请看:
中文字符:   啊
机内码:    (10110000 10100001)
区位码:    (00010000,00000001)
相差:      (10100000,10100000)
所以,
区位码与机内码的换算公式为 【区位码】+(10100000 10100000)=【机内码】。即:
区位码0 + (10100000) = 机内码0;
区位码1 + (10100000) = 机内码1;
这样的话,点阵数据,就可以通过汉字"机内码"-> "区位码"进行索引、查找。

前面已经讲了一个汉字,在表中要占用32字节,所以,我们定义了一个含有32个元素的数组:
$buffer=array(0,0,0,0,0,
0,0,0,0,0,
0,0,0,0,0,
0,0,0,0,0,
0,0,0,0,0,
0,0,0,0,0,
0,0);
用来保存从字库读出的32个字节数据。

接下来的问题,某一个字符,到底保存在文件的什么位置呢?

由于一个汉字用了32个字节,而GB-2312区位码表表有94行、94列,那么,只要知道该字符在表中是第几个,再乘以32就行了。
所以定义偏移量:
$offset=(94*($qh-1)+($wh-1))*32;
$qh表示区(qu)、$wh表示位(wei);减1,是因为PHP从0开始计数。
位置找到,就只需要用fseek()函数定到码表的这个位置,然后读32字节到$buffer就行了。
另外,由于中文是由两个字节组成,而前面给出的点阵示例是8位,一个字节,所以,画点的代码要修改一下:
for($hang=0;$hang<16;$hang++)
for($j=0;$j<2;$j++)           //因为是两个字节,所以插入一个循环
for($gezi=0;$gezi<8;$gezi++)
{
imagesetpixel ( $image, $gezi +8*$j, $hang , $color);
}

好,我们开始编程吧!


/*************************************
*     文件名:'draw1.0.inc.php
**    中文显示点阵输出   version 1.0
**    只提供简单的操作:输出默认大小的纯中文字符串到图片的坐标(0,0)上
**    更多功能,请见下一版本。
*
****************************************/
function draw($image,$string,$color)
{
$fp=fopen("chs16.fon","rb");//二进制方式读点阵字库chs16.fon
if (!feof($fp))//如果文件指针到了文件末尾,退出,不要忘记关闭文件
{
while($string)//当字符串不为0
{
$qh=ord(substr($string,0,1))-0xa0;
$wh=ord(substr($string,1,2))-0xa0;
/* 这两行代码,其实是获取一个中文的机内码。
substr($string,0,1);是从$string中获取第一个字节,然后,通过ord();将这个字符转换为整数。(由于PHP不支持无符号整数,所以没有这一步转换的话,你就只能得到一个0。)在转换为整数之后,就能进行计算了。机内码减去0xa0(10100000),就得到了区位码。
substr($string,1,2);是获取$string中的第二个字节。*/
$offset=(94*($qh-1)+($wh-1))*32;
/*得到了汉字的区位值后,就开始计算偏移量了。*/
fseek($fp,$offset,SEEK_SET);
/*在字库文件$fp中,将文件指针定位到偏移量。*/
$buffer=preg_split('//', fread($fp,32), -1, PREG_SPLIT_NO_EMPTY);
/* fread($fp,32);是从$fp中读取32个字节数据,然后通过preg_split();分配到数组$buffer中。preg_split();是一个支持正则表达的函数。关于正则表达式,我正在学习中。为什么这样用,我也不知道。PHP手册里有本实例。*/
for($i=0;$i<16;$i++)              //点阵的行数:16 列数也应该是16
for($j=0;$j<2;$j++)             //因为是两个字节,那么,就要一个一个地画了
for($k=0;$k<8;$k++)          //每个字节,都有8个点的数据
if(((ord($buffer[$i*2+$j])>>(7-$k))&0x01))//如果这个点的值为1,输出;否则,没有
{
imagesetpixel($image,$x+8*$j+$k, $i, $color);
}
$string=substr($string,2); //中文由两个字节表示,所以,输出一个汉字后,就要去掉两个字节。
$x=24; //一个汉字输出结束,空开一点,给下一个汉字。因为这个汉字是16×16点,那么,$x的值设为16,就够了。但,太挤了不是?
}
}
fclose($fp);
}

下面,我给出一个测试实例:


header ("Content-type: image/gif");
include 'draw1.0.inc.php';
$im = imagecreate (400, 300);
$black = imagecolorallocate ($im, 0, 0, 0);
$string="中文";
drawer($im,$string);
imagepng ($im);
imagedestroy ($im);
?>


对于这个函数,我们还可以进行扩充,以实现不同的效果。


相关附件1:chs16.fon 本地下载
相关附件2:代码实例打包下载
一个实时用户留言板留言数量统计表实例:
http://medlem.spray.se/letmegetone/messageboard/userinfo.htm

作者联系方式:
Homepage: http://medlem.spray.se/letmegetone
E-mail: singlestudio@hotmail.com

注:本文章为原创文章,版权归文章作者与超越PHP网站所有,未经本站同意,禁止任何商业转载。非盈利网站及个人网站转载请注明出处,谢谢合作!

(责任编辑:超越PHP)
[推荐给朋友] [显示打印版本] 更新日期:2003-07-05 浏览次数: 6587
用户评论 点击这里添加新评论
Avenger
04-Jul-2003 07:46

感谢 LuciferStar 为该文章做出的努力。
lanhuai
06-Jul-2003 10:06

这篇文章太好了,收藏先!
一直都没时间研究PHP的图像处理方面,
但能看到这样好的文章真是太好了,谢谢!
static
07-Jul-2003 12:06

呃...Avenger 老大
代码是我有话的呃
虽说是优化也是翻新重写了
不过 LuciferStar 用这种方式 真的是别出心裁
static
07-Jul-2003 12:09

唉 不好意思看错了
要有话后的代码去论坛吧
http://be10.ods.org/avenger/bbs/index.php?s=&act=ST&f=6&t=1141&st=0
labobooo
16-Oct-2003 01:59

如何让中文显示不同字体
LuciferStar
24-Oct-2003 07:00

由于使用的是点阵字库
所以,如果你要用不同的字体
需要调用不同的字体点阵字库。
ljcao
25-Nov-2003 10:18

Very Good ! Collect Item
GArrison
12-Mar-2004 07:11

不支持换行?
ljljl
28-Apr-2004 12:59

;k;k;k;khhhhhhhhhhhhh
sunknight
25-Nov-2004 02:43

$fontsize = 16;
for($x0=0;$x0<$fontsize;$x0++)
{
for($y0=0;$y0<$fontsize;$y0++)
{
$locBit= $x0 * $fontsize + $y0 ;
$locByte = floor ( $locBit / 8 );
$locInByte = $locBit % 8 ;
if((ord($buffer[$locByte])>>(7- $locInByte)) & 0x01)
{
imagesetpixel($image,$x0+$x, $y0+$y,$color);
}
}
}
对于16点阵的字体 用这个也可以的感觉更容易理解些
axolo
05-Jan-2005 04:16

回到DOS时代的中处理,很久之前我也用C做同样的事情!仿佛回到了当年……
ChenDian
25-May-2005 10:19

使用iconv来显示中文的方法:
header("Content-type: image/jpeg");
$im =imagecreate(400,400);
$white = imagecolorallocate($im,255,255,255);
$black = imagecolorallocate($im, 0,0,0);

//首先将内码转成UTF-8,然后使用中文的TTF字库使用imagettftest函数,
//就可以在图片上输出中文了!

// Replace path by your own fontpath
//不转码的情况
imagettftext($im, 40, 0, 10, 350, $black,"STKAITI.TTF",
"This is a test.测试");

//转成UTF-8的情况
imagettftext($im,40, 90, 200, 320, imagecolorallocate($im, 0,255,0),"STHUPO.TTF",
iconv("GB2312","UTF-8","哈哈,以后
就以用了!"));

imagettftext($im, 40, 0, 13, 202, $black ,"STKAITI.TTF",
iconv("GB2312","UTF-8", "This is a test.测试"));

imagettftext($im, 40, 0, 10, 200,imagecolorallocate($im, 255,255,0), "STKAITI.TTF",
iconv("GB2312", "UTF-8", "Thisis a test. 测试"));

imagettftext($im, 30, -10, 10,20, imagecolorallocate($im, 0,0,255),"SURSONG.TTF",
iconv("GB2312","UTF-8","终于可以显示中文字了,哈哈!"));


imagettftext($im, 30, 10, 10, 150, imagecolorallocate($im, 255,0,0),"STCAIYUN.TTF",
iconv("GB2312","UTF-8","终于可以显示中文字了,哈哈!"));


imagejpeg($im);
imagedestroy($im);
?>

 




分享到:

  1. 程序员面试失败的几种原因,你中枪了吗?
  2. Java未来也许不再是电商的首选开发语言!

热点职位

更多>>

热点专题

更多>>

读书

PHP5与MySQL5 Web开发技术详解
本书是目前中文版本第一个真正介绍PHP 5及MySQL 5新增语法与功能的权威宝典! 本书本着精、全、要三宗旨,从理论中延伸,从实践

51CTO旗下网站

领先的IT技术网站 51CTO 领先的中文存储媒体 WatchStor 中国首个CIO网站 CIOage 中国首家数字医疗网站 HC3i 51CTO学院