频道直达:新闻 - 组网 - 安全 - 服务器 - 存储 - 系统 - 应用 - 开发 - 数据库 - 前沿 - 技术人 - 培训 - 求职 - 读书 - 教程 - 专题 - 产品 - 案例 - 技术圈 - 博客 - BBS
51CTO.COM_中国领先的IT技术网站
找资料:

Ruby语言实现的Ruby语法分析器:ruby_parser 1.0

作者: Werner Schuster/马家宽 编译 出处:InfoQ中文站 2008-01-03 15:38    砖    好    评论   进入论坛
阅读提示:07年12月22日,Ryan Davis宣布了ruby_parser的发布。ruby_parser是一个纯Ruby实现的Ruby源代码语法分析器。这个语法分析器的编写过程中使用了Ruby yACC (RACC),一个包含在Ruby标准库中的语法分析程序生成器。

07年12月22日,Ryan Davis宣布了ruby_parser的发布。ruby_parser是一个纯Ruby实现的Ruby源代码语法分析器。这个语法分析器的编写过程中使用了Ruby yACC (RACC),一个包含在Ruby标准库中的语法分析程序生成器。

ruby_parser(RP)是一个纯Ruby实现的Ruby语法分析器(借助了racc——它在缺省情况下使用C语言的扩展)。RP的输出与语法分析树的输出相同:用ruby中的数组以及基本类型来表达的s-expression。

这个库很容易使用:

RubyParser.new.parse "1+1"  

上面的语句会返回:

s(:call, s(:lit, 1), :+, s(:array, s(:lit, 1)))

Ruby世界中一直缺少纯Ruby实现的Ruby语法分析器。“纯Ruby”意味着该语法分析器:

◆仅仅包含Ruby源文件
◆没有任何本地扩展或者C语言代码(例如通过RubyInline)——C语言代码要求用户系统必须包含C编译器来处理这些代码

上面这些属性对于保证代码能够通用于各种Ruby运行时至关重要。如果一个语法分析器的实现使用了基于C语言的本地扩展,那么它就无法在不支持这些扩展的Ruby版本上运行,例如JRuby、XRuby或者.NET上的IronRuby和Ruby.NET。即便这些Ruby版本支持了本地扩展(JRuby正在考虑这一方案),它还会造成部署问题,因为这要求扩展所使用的库或DLL必须被移植到任何可能的OS/CPU组合之上(否则某些用户将无法使用该语法分析器)。Ryan Davis的另一个项目RubyInline,通过自动编译那些内联的C代码一定程度上的改善了这一状况。但要RubyInline要求目标系统需要包含一个C编译器——这一条件并不是总能满足,尤其是对于Windows系统来说。

因为可以使用类似语法分析树(ParseTree)的通用方法来对Ruby代码进行分析并获得抽象语法树(Abstract Syntax Tree),所以在Ruby历史上的一定时期内,纯Ruby语法分析器的缺失被忽视了。然而自从各种Ruby运行时雨后春笋一样的出现以来,Ruby语法分析器被反复实现了很多次——两次使用Java(JRuby和XRuby),一次使用C#(Ruby.NET所编写的语法分析器也被IronRuby所使用)。所有这些分析器提供了不同的抽象语法树以及获取它们的方式。

这造成了Ruby源代码工具的一些问题。例如,目前Aptana/RDT(基于Eclipse)中包含的Ruby重构工具就被绑定到Java和JRuby的抽象语法树上,这使其无法被用在其他的Ruby实现上。类似的,针对其他基于Java的Ruby IDE的工具也正在被开发,这造成了大量代码分析管理工具被限制在Java和JRuby上。除此之外,这些工具的逻辑使用Java而不是Ruby编写,这对Ruby开发人员来说不够友好。

纯Ruby语法分析器提供了改变这种情况的机会——Ruby IDE(或者其他工具)可以获得Ruby的抽象语法树,同时避免被绑定到特定的语法分析器实现上。例如,一个基于Java的IDE可以在开启JRuby的同时使用ruby_parser进行语法分析。为了达到这一目的,目前版本的ruby_parser需要在输出中增加源代码位置的信息,例如,每个抽象语法树的节点需要了解其在源代码中开始和结束位置的偏移。这对源代码工具来说至关重要,因为虽然纯粹的语法树结构信息也很有用,但是如果工具无法了解节点在源码中的位置,它就不能对源码进行修改。

ruby_parser的另一个使用者是Rubinius。Rubinius是一个绝大部分代码使用Ruby编写的Ruby虚拟机,不过它使用的是Matz的Ruby参考实现(MRI)中所包含的语法分析器,而通过使用ruby_parser可以使Rubinius移除这一部分的C语言代码。此处还存在一个问题:“如果语法分析器是Ruby编写的需要Ruby虚拟机来运行,那么依赖语法分析器的Ruby虚拟器要如何工作?”,这是一个类似“鸡大生蛋,蛋破生鸡”问题。为了避免这个问题,在Rubinius的虚拟器中,ruby_parser的Ruby源代码会被编译为Rubinius字节码。当Rubinius启动时,它通过读取ruby_parser的字节码文件——这些文件不需要进行语法分析——来运行一个Ruby语法分析器。

对于ruby_parser来说,还有许多工作要做。发布说明中列出了其中的一些问题:

◆已知问题:速度还很不尽如人意。运行5500个测试用例目前需要21分钟。
◆已知问题:代码有些难看。不过这不全是我的错,我会尽快改进这一状况。
◆已知问题:目前还不支持newline节点。
◆已知问题:功能还可以更加强大。
◆已知问题:ParseTree中的dasgn_curr声明可能会乱序。
◆待做事情:加入注释节点。

原文链接:http://www.infoq.com/cn/news/2008/01/ruby_ruby_parser

【相关文章】

【责任编辑:火凤凰 TEL:(010)68476606】

专题
C++是垃圾语言?!
Ruby实用开发手册
XML可扩展标识语言详解
UML统一建模语言
初探敏捷开发
我也说两句

匿名发表

(如果看不清请点击图片进行更换)


中 国 领 先 的 IT 技 术 网 站 ·
技 术 成 就 梦 想
·Java基础教程 (查看80568次)
·UML类图详解 (查看72048次)
·C++是垃圾语言?! (查看42009次)
·C#技术开发指南 (查看39556次)
·UML统一建模语言 (查看39017次)
·Java编程开发手册 (1198个砖)
·Java基础教程 (431个砖)
·C#技术开发指南 (311个砖)
·.NET开发手册 (252个砖)
·PB开发教程 (223个砖)
·Java编程开发手册 (658个好)
·Java基础教程 (578个好)
·.NET开发手册 (282个好)
·PB开发教程 (213个好)
·Delphi开发技术手册 (200个好)
订阅技术快讯
电子杂志下载
名称:SQL Server数据库管理精品黄皮书
简介:书中文章经过精挑细选,便于用户能根据自己的实际工作和学习,快速在本书寻找到相关资料。内容涵盖了SQL Server的安装与升级、语句查询、数据备份和恢复、自动化任务、数据同步、数据字典、安全和预防、性能和优化、集群等各方面应用信息,以及DBA管理人员在数据库管理工作中
名称:2007路由技术大全
简介:《2007路由技术大全》由51CTO.com网站特别策划制作,该书包括路由器技术、路由器产品、路由器配置、安全设置、路由器故障处理、路由器密码恢复,以及广大网友在实践使用中的心得经验和技巧文章,内容注重实用性,适用于初学者入门,也适合多年从业者提高,是一本实践和理论完
名称:网络安全精品应用黄皮书
简介:《2007精品网络安全黄皮书》包括了9个大类24个小类, 800余篇文章,内容包含了熊猫烧香病毒、DDOS攻击、ARP病等热点问题的介绍及解决方案。从病毒查杀、防范、系统、数据等各方面的安全设置到黑客技术的了解、防范,涉及到了安全应用的全部领域, 由浅至深内容全面。
世纪枭雄比尔盖茨的王者传奇
世纪枭雄比尔盖茨..
虚拟化技术还有点“虚”
虚拟化技术还有点..
ASP.NET开发教程
ASP.NET开发教程
· ASP.NET开发教程
· 专题:ASP.NET 2.0基础..
· LAMP技术精解
· 服务器节能与绿色IT
· ARP攻击防范与解决方案
· Linux 集群技术专题
· Windows集群服务应用
· CISSP认证成长之路
· SQL Server 2008/2005..
· SQL Server入门到精通
· 网络工程师职业规划与..
· 浏览器的战国时代
· 运营商封堵ADSL共享 中..
· 微软出价446亿美元收购..
· 技术人求职简历完备手册
· 开源虚拟化技术Xen
ARP攻击防范与解决方案
ARP攻击防范与解..
SQL Server 2008/2005全解
SQL Server 2008/..
SOA 面向服务架构
SOA 面向服务架构
· SOA 面向服务架构
· SQL Server 2008/2005..
· Apache技术专题
· 三层交换技术专题
· SQL Server入门到精通
· Apache技术专题
· Windows集群服务应用
· 国际文档格式标准开战
· 路由器设置与口令恢复
· Linux 集群技术专题
· PHP开发应用手册
· SOA 面向服务架构
· 企业数据恢复指南
· 了解统一威胁管理(UTM)..
· 专题:AIX操作系统管理..
· 访问控制列表(ACL)介绍
ARP攻击防范与解决方案
ARP攻击防范与解..
SQL Server 2008/2005全解
SQL Server 2008/..
SQL Server入门到精通
SQL Server入门到..
· SQL Server入门到精通
· SQL Server 2008/2005..
· SOA 面向服务架构
· Apache技术专题
· 三层交换技术专题
· Apache技术专题
· 企业数据恢复指南
· Windows集群服务应用
· 路由器设置与口令恢复
· Linux 集群技术专题
· SOA 面向服务架构
· 了解统一威胁管理(UTM)..
· 反垃圾邮件技术应用
· 访问控制列表(ACL)介绍
· ASP.NET开发教程
· PHP开发应用手册