Xilinx社区
首页 > Kevin专栏 > 用Perl利用Google翻译Latex论文
Kevin专栏
用Perl利用Google翻译Latex论文
来源:  时间:2015-01-22  浏览量:1228

这几天终于搞定了Unbuntu+TextLive+SVN 的工具组合。 网上找的交大博士论文Latex模板也被我根据交大EMBA的模板改头换面,顺利生成了pdf。

人老了,记不住那么多命令。在交大模板的基础上,我添加了一个Makefile。把翻译,生成文档,生成参考文献引用等步骤通通写进去。进一步,利用Makefile管理依赖关系的能力,通过监视参考文献bib文件是否修改过的状态,完成了平时只编译主文件,而参考文献修改后,就能重新生成所有文件以及文件引用号的功能。

查找资料时学到了google scholar有一个选项,打开以后,搜索到的所有资料可以导出BibTex格式的文献引用,非常方便。

今天开始搞定自动翻译的script, 找到哈工大信息检索研究室的这篇小代码:

http://bbs.langtech.org.cn/archiver/tid-4229.html

把他的西班牙文改为中文, zh-CN,先用我Windows中已经装好的Perl Express跑一下,

拷贝以下句子到记事本中作测试:

 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。

第一次试翻译结果是乱码。 分析一下,判断应该是记事本中的中文非UTF8格式造成的。解决方法是在记事本中另存一个文件,另存的时候选编码为UTF-8,再试,就跑通了。 在Linux下应该就不会有这个问题。

这是生成的输出文件的翻译,用机器翻译的标准衡量,翻译得还不错:

I solemnly declare: dissertation submitted is himself under the guidance of instructors, independent research the results achieved. In addition to the text have been marked with the contents of reference, this paper does not contain any other individual or group has been published or the results of written works. Of this article make an important contribution to the study of individual and collective, have been included in the text in order to clear the way indicated. I am fully aware of the legal outcome of this statement from my shoulder.

剩下的,就是把这段程序放到我的工具链中,不停地从Latex中一小段一小段地提取中文,翻译成英文的过程。

前几天,还把事情想得比较复杂,探讨了如何管理自动翻译和手工翻译的问题,比如要设计一些标志位什么的。今天,仔细看了一下GOOGLE翻译,发现了一个小小的选项,就是"提交更好的翻译"。 这样,看上去手工翻译的内容根本无需自己在本地管理,只需要翻译好了提交就可以了.

但是,本以为,下一次自动翻译,就能得到刚才手工翻译的内容,试了一下,结果不行。比如,俺的名字, 谢凯年,他非要翻译成 Xie Kai-year, 纠正了N次,就是死不改悔。查了一下,才知道,这个功能提交的手工翻译需要很久很久google更新翻译版本的时候才会生效。 

还是不死心,试图继续寻找一种在我的google帐户下保存手工翻译的功能。终于找到了2009年6月9日刚出炉的Google Translator Toolkit ,看了看,发现功能覆盖了我想做的工具的所有功能。大喜。简单试了一下,目前还只能从英文到中文,嗨,郁闷。

突然灵光一闪,干脆,写论文先写英文版,然后翻译成中文版,岂不是就解决问题了? 运气好的话,写到一半,等Google Translator Toolkit支持英文到中文,我再用中文写原文,岂不美哉。 

可是,俺的论文写的主要是中国发生的事,需要引用(抄袭)很多中文资料,总不能先翻译成英文,然后机器翻译成中文吧。

比如谢凯年这三个字,翻译成英语成了 Xie Kai-year,再用同样的工具将Xie Kai-year翻译回去,居然成"谢开年"了。这样来回折腾,就像俺煎的锅贴饺子,本以为不停地翻面煎会更好吃,谁知,最后馅都漏出来了,两面的皮都焦了。

美事想多了,容易想入非非。看来,至少现在,Google还不能完全满足我写双语论文的需求,还是回过头来,用Perl处理Latex中的源文件,提取一段一段的中文,用google翻译成英文,再传回Latex的源文件比较好。

还是老老实实写代吗吧。

热点文章
精选视频
推荐资源

中国授权培训机构

北京 电话:(010)82757632
      (010) 62192881
深圳 电话:(0755)86186715
武汉 电话:(027)61389792
成都 电话:(028)80821007
南京 电话:(025)66022032
西安 电话:(029)82230498
邮箱:sales@e-elements.com

中国授权经销商

香港 电话:(852)22127848
北京 电话:(010)84148118
成都 电话:(028)86528262
上海 电话:(021)33678387
深圳 电话:(0755)26584925
武汉 电话:(027)87322806
邮箱:china@avent.com
深圳 电话:(0755)26743210
上海 电话:(021)51696680
北京 电话:(010)51726678
成都 电话:(028)85139576
武汉 电话:(027)87690155
邮箱:
xilinx_enquiry@comtech.com.cn

社区主办


《电子产品世界》杂志社

内容提供


    赛灵思公司

Copyright ©2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
京ICP备12027778号-2 北京市公安局备案:1101082052