您好、欢迎来到现金彩票网!
当前位置:秒速快三 > 双语对齐 >

怎么自己构建一个英汉双语语料库?

发布时间:2019-07-28 03:33 来源:未知 编辑:admin

  准备英汉对照的双语文档。可以是两个文档,其中一个英文,一个中文;也可以是英中上下对照或左右对照的单文档。无论是双文档还是单文档,都要注意原文与译文需要严格对照,这是后续软件识别的重要基础。文档格式可以是office系列格式,但最好是word这种简单的容易识别的格式。如:我们在word中准备一篇英中双语对照的文档:

  关于语料对齐,我以前专门写过一篇文章:如何用最简单的方法创建双语平行语料库?

  里面讲了几种对齐工具,我推荐的是Tmxmall在线对齐。Tmxmall对齐功能的具体操作步骤我也写过文章,可参考:双语平行语料库人工对齐工具说明│Tmxmall Aligner

  3、在trados等CAT工具中新建翻译记忆库,把之前保存好的tmx文件导入即可。

  以上就是自己构建一个英汉双语语料库的方法,上述方法同样适用于建立中英语料库或其他语种的语料库,如中俄、中葡、日中等等,只要在操作的时候修改语言对即可。

  除了自己对齐语料存为tmx格式外,也可以直接购买Tmxmall公有云包月服务(里面有千万级句对的语料资源可供翻译中提取),或在Tmxamll 语料商城上按需购买别人放上去的各专门领域的语料库。祝顺利。

http://poisondarts.net/shuangyuduiqi/173.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有