您好、欢迎来到现金彩票网!
当前位置:秒速快三 > 双语对齐 >

如何建立自己的语料库

发布时间:2019-07-28 03:33 来源:未知 编辑:admin

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  首先要明确建立的是单语语料库还是双语语料库,因为用到的建库软件和方法不一样,单语语料库的建立过程相对简单一些。

  (1)准备单语语料,将语料都转换成TXT格式,建议按一定规律给各个文档命名

  (3)将准备好的文档全部导入软件,然后就可以在AntConc里检索语料了。具体使用方法可以自行百度。

  准备英汉对照的双语文档。可以是两个文档,其中一个英文,一个中文;也可以是英中上下对照或左右对照的单文档。无论是双文档还是单文档,都要注意原文与译文需要严格对照,这是后续软件识别的重要基础。

  业内有几种主流的语料对齐工具,我个人用的最多的是Tmxmall在线对齐。

  (3)在trados等CAT工具中新建翻译记忆库,把之前保存好的tmx文件导入即可。

  附:关于原语料来源,一是自己翻译积累,二是权威网站获取,优质的原语料是优质语料库的前提。如果觉得自己做语料库耗时间,也可以到Tmxmall语料商城上看看别人上传的各类语料库,和其他译员交易已经建好的语料库。

  1. 多做翻译,之后把翻译对齐(可以用Tmxmall做在线对齐,比较简单),对齐后的文件便是tmx记忆库格式

  3. 倘若公司以前有做过的翻译语料,直接可以用Tmxmall做对齐,复用以前的翻译

  Tmxmall对齐方式是先基于段落对齐,然后再细化为句对齐,很好的提高了工作效率及准确。

http://poisondarts.net/shuangyuduiqi/174.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有