搜狐网站
搜狐 ChinaRen 17173 焦点房地产 搜狗
搜狐财经-搜狐网站
财经中心 > 证券频道 > 证券要闻_证券频道 > 股指期货-搜狐证券 > 系列访谈

袁琦:机器翻译在期货信息技术中的应用

  2007年4月21日,2007中国(北京)证券期货信息技术大会召开,搜狐证券频道全程报道了此次大会,以下是赛迪翻译技术公司高级总工程师袁琦先生在大会的发言,主题为“机器翻译在期货信息技术中的应用”。

  主持人黄辉:谢谢张总,最后我们有请赛迪翻译技术公司高级总工程师袁琦先生,请他为我们讲演“机器翻译在期货信息技术中的应用”。

  袁琦:各位专家,现在我介绍一下机器翻译在证券期货信息技术中的应用。刚才谈到了期货国际化,我正好借用张总讲的,机器翻译在证券期货中的应用。

  今天大体点到5个问题,一个是公司简介,一个是机器翻译研发与应用现状,还有典型的案例,另外就是机器翻译在金融、证券业务还有期货当中的应用我们做的项目,最后是演示系统是如何工作的。

  我们赛迪公司直接跟今天的会议息息相关,今天就是信息技术的大会,我们赛迪集团有4大块的业务。咨询是一大块,另外就是媒体和培训。我们赛迪翻译技术公司,是在高科技的IT产品下面。

  我们从87年到现在整整20年的时间,一开始是做MMT工程。从96年开始做一个国际化的语言翻译工程。从2000年我们主要建语料库,做各种一系列的词库,我们做了将近7年的时间。从前两年开始我们跟中国的Lancaster大学工程一起研究,把这个研究成果纳入我们的机器翻译系统,这包括在国内和国外的评测都处于领先的地位。

  我们的翻译机器产品的特点主要有这样几个。一个是翻译质量的提高,因为我们采用了多引擎翻译系统,不是过去市场上的单一的翻译系统,我们把统计语言学等等集合在里面,我们比过去市场上的翻译系统准确度提高了20个百分点。我们的系统不光是MT,也有TM,把很多大量的记忆放在里面,这样很多地方不需要借用人的翻译。

  第三点我们提到做了可比语料库,跟美国和西方的文化做对比的研究,把他写到中国的系统里面去。所以翻译出来的东西又是本土化,比如说翻译英文,有一些英文的表述。另外现在我们这个系统在国外特别是在欧洲,已经把它放在翻译流当中,作为一个生产性的工具可以提高效率。所以我觉得今后金融或者是期货,走向国际化的市场之后,要大量搜集各方面的信息,很希望把这个系统推到金融行业里面。而且系统的开发也不是专门为金融开发了,我们以前承担的是军事、情报实时的收集。就像我们每天看参考一样,大量的信息过去搜集完全靠人工,现在靠机器,生成的文本放在后台上,我们跟美国的大使馆说这样很方便,人工录入的汉字要花很多的时间,一会儿我演示一个金融系统的应用可以看出来。所以国外的情报要用积极的处理可以节省大量的劳动力。

  另外我说一下,机器翻译研发与应用的现状。我们天天带的U盘,但是I盘很多人不会说,就用U disk,老外都看不懂,实际上是USB flash drive,或者是USB drive,我们都是通过研究出来的放到词库里面。像招商引资,就是4个字,把它拼出来了就是英文。我们在报纸和网站上经常看到。但是现在我们通过语言学研究之后,把它变成很地道了。把招商引资叫做promote investment,这让老外看起来很亲切,很地道。类似这样的很多,我就不再举例子了。我们总说电子信息产品,我们拼起来就是英文,实际上国外叫做electronics and IT products。我们研究之后把这个放在系统里面了,这是我们20年研究的,在机器翻译里面一个实际的应用。我们把中国人怎么翻译常犯的错误,我们把它纳入到系统里面,这是我们系统最大的特点,现在国内的其他的翻译机器的开发做不多这一点,我们是跟应用结合起来的。微软的培训教材有一段话,我们的机器翻译都是错误的,很老的翻译,是把生产率提高15-20%,免除与客户接触予支持的时间。看起来是对的,实际上让人概念很不清楚,但是我们系统用模块处理就是机器翻译系统的特点,我们把人为的错误学习进去,把这种句型用freeing time for翻译成腾出时间用于什么,就是我们生产力增加了15-20%,腾出时间用于客户接触和支持。我们把这个输入系统里面,变成了模块,增加了系统的可读性。

  所以,正因为我们十几年将近20年的研究,这是我给出一个国家科技部在05恩年9月做的一个全国主要厂家的翻译评测,这个红颜色的CCID就是我们赛迪集团,从这里可以看出得分,可读性和忠实度是最高的,我们多年一直是在领先的。这是另外一个评测,同样也是很高的。我们重要的应用可以看出翻译机器的应用。北京奥运翻译平台工程,我们语言系统的应用,我们在前两个礼拜被众多的明年北京奥运会做笔译,我们靠这个系统,这提高了很多的效率。从今年下半年,将近上万名的运动员和教练员,还有国际奥委会,英文的全部用我们的系统自动化处理,这是国内最新的新闻。

  这是我们奥运库里面,像“迎奥运、讲文明、树新风”等等用英语怎么表达,所有的东西奥运的格言我们一些语言专家将近30个人天天做把它装到库里的事情,而且是奥运的语言,所以我们跟本身的奥组委的专家有沟通。还有北京的期货协会的领导也谈到了,还有今天证监会的领导也谈到了,希望把我们的系统和期货业结合起来,共同开发一个为全国的期货业还有证券业服务的很好的平台。我觉得证监会的领导还有期货协会的领导,他们想法是非常好的,我们很愿意配合这个事情。

  另外再介绍一个很大的案例,就是中国欧盟信息社会项目,这是最近几年咱们国家跟西欧的发展很多项目都上来了,其中有一个项目是由国务院信息化工作办公室来抓的,直接是国务院管理。整个的工作语言和专家团队全部都是英文,但是国务院和其他各省市的报告必须用中文来行文,全部用我们的系统处理,都给上万个专用的库。因为时间的关系我也不再介绍了,这主要是讲机器翻译有什么好,这其中的一点。比如说中国和欧盟的信息社会项目有一个4万多字的项目,刚发起的时候,很多关键的术语都是靠人翻译的,翻译得很不准,其中欧盟很多的管理先进经验都引到中国。比如说administrative capactwity building,当时翻译成了6种,其实哪一种都不对,最后通过资料库的统计翻译成了行政管理能力建设,这是很规范的语言,这是报到国务院和地方省市都是行文很规范的。所以机器翻译有很多的特色。

  我们在开发期货金融翻译系统当中,同样也通过建立了大量的双语语料库发现了很多的问题,就CME,我们统计完了之后各种翻译方法都有,有芝加哥商业交易所、芝加哥商品交易所、芝加哥期货交易所等各种不同的中文翻译。我们跟清华大学的教授讨论,把CME定义成芝加哥商业交易所,CBOT定义为芝加哥期货交易所。我们的系统,它保证了语言的风格和用词都是一致的,所以为什么组委会会选用我们的系统,主要是有这些特点,还有在金融方面的应用。

  我们的指标是库特别大,上百万的词库,另外像每个专家金融、期货方面有8万多条,期货术语有5千条,还有齐全个术语有几千条,我们都是通过加工之后放到系统里面去。我们现在系统运行的比在线翻译还要准确,因为我们和微软的研究人员也有一个内测认证报告,就是说我们的系统现在走在最前面。

  我们开发金融系统是做哪些东西。语音语调是很有价值的,我把它抽取做成双语,然后放在系统里面,像这个是期货的,就是介绍期货合约等等,我们大量收集了很多的双语资源,然后把它放在库里面。还要通过这个库里面,我们有很多的短语搭配。这个英汉的就是关于期货方面的术语,大量的术语都是统一做出来的。当然了,既然有英汉的就有汉英的,这个汉英的。这些东西都是我们金融系统里面所必备的。

  另外我再介绍一下英汉金融双向商业系统的各种输出文件,这里面是各式各样的,我挑几个典型的。这个是抽取进虫术语的双语词表,这个不是人做的。这个词表是自动生成的,这个不光是金融,像搞研究的,比如说期货情报,进去之后我会做成双语词表,这个是自己做出来的。一个几万字的,一分钟就生成了。另外一个是嵌入金融术语的原始文件。有很多的翻译不愿意用机器处理的风格,认为太死,但是很多术语的表达是牵扯不到原文里面,这样人只能参考术语,再翻译成英文,但是可以提高很多的效率。第三个是机器生成的输入对照标注,双语的标号都是机器自动标的。还有一个汉英系统同样有一个功能,我讲一下,我们的翻译都是自动标注的,所有这里有很多很多就是专业术语,他都是有统一的叫法,全部都是自动标注的。

  下面我演示一下这个系统。这是我们这个系统可以翻译各种格式,网页格式、word格式和各种文本格式都可以处理。这是国外交易所的一个网页,这里面在翻译了,因为这里面有图象,翻译完之后保持这个网页的格式,把英文完全翻译成中文了。这就是我们平时在网上看文件,经常要保持原文的格式,但是还可以翻译成本国的语言,是这样来处理的。这是一个典型的例子,现在中文就出来了,现在是全中文化的。

  这个是一个文本文件的翻译,这里面有翻译有好几种,我选文本文件的翻译。现在翻译的就是下面是中文,上面是英文的原文。翻译的时候最后生成的文本格式有各式各样的,翻译完了可以对照原文来看,上面是原文,下面是翻译的结果。但是同时,我们的软件还有其他的输入格式,我可以上下对照的,我还有双语对照的,就是在原文下面生成了中文,是一句一句交替的,这样比较方便。当然还有其他的格式,其他的格式是什么呢?我把文章标注术语等等。因为时间的关系,如果有兴趣的单位可以去外面我们的展台看一下,有多种功能可以自己测试一下。而且,如果在会议期间大家的单位要用,我们会很优惠地给大家提供这个服务销售这个产品。我的报告到此结束,谢谢大家!

  主持人黄辉:感谢袁总,至此本次大会接近尾声,我们有幸聆听了以上5位专家的见解,使我们对信息技术在中国金融方面的保障有了认识,我们希望通过这次会议可以给期货公司和广大的IT公司架起桥梁,构建安全的金融业务系统平台,并为金融系统业务做出我们的努力。2007年中国证券期货信息技术大会到此结束,非常感谢大家的参与,谢谢大家!

(责任编辑:陈然)

我要发布

用户:  匿名  隐藏地址  设为辩论话题

*搜狗拼音输入法,中文处理专家>>

新闻 网页 博客 音乐 图片 说吧  
央视质疑29岁市长 邓玉娇失踪 朝鲜军事演习 日本兵赎罪
石首网站被黑 篡改温总讲话 夏日减肥秘方 日本瘦脸法
宋美龄牛奶洗澡 中共卧底结局 慈禧不快乐 侵略中国报告



说 吧更多>>

说 吧 排 行

茶 余 饭 后更多>>