伴随AI技术在翻译行业逐步深入的应用,如何在确保机器翻译优势的前提下,满足商用交付质量成当下亟待解决的问题。
传神语联在十年前提出多语智能信息处理,并通过旗下的语联网平台,将多方面的自然语言处理技术、大数据技术、大量在线译员、以及大规模的术语语料资产有机结合,通过创新的人机协作体系向各语言服务机构赋能,帮助各类组织和个人,以前所未有的综合效率和成本获得所需的语言服务,从而实现更快、更丰富的全球文化、贸易和信息交流。
那么,自然语言处理技术对语言服务行业将带来怎样的改变?与AI时代有着怎样密不可分的关系?
探索多语智能,求解千年难题
事实上,翻译作为沟通世界的纽带与基础要素,早在东汉就有记载。而在形成规模和组织后的1600年,行业都未曾出现重大突破;法国科学家早在1933年开始畅想机器翻译,在近代50年才有突破性发展。
随着全球化深入和数字化时代到来,翻译不再只是满足高端人士的工作需求,而是深入人们生活的各个场景与基础生活需求,如购物、知识获取、社交等多语需求场景,无时不在,无处不有;未来,新的应用场景像电网上电器一样,不断增长。
物流行业的智能分拣机器人、各种工业机器人等,都是人工智能相对成熟的“场景边界”效果。但在“开放世界”中的多语种网页浏览与知识获取、生活交互场景等,还有很长的路要走。自然语言的处理则是解决这些问题的关键。
以上场景的应用,就需要强大的自然语言处理。而当前,一般的机器翻译引擎都只能在简单的新闻稿等领域有比较好的表现,在复杂的专业领域则无法胜任。普适性的机器翻译在广泛使用上,也已遇到瓶颈。
在此大背景下,创建语联网的大胆想法涌入何恩培的脑海,并在心底生根发芽。
从2011年设想至2017年酝酿问世,传神语联用了6年时间。从调研、论证到技术探索与创新,一次次的自我革命,终于等来传神语联“人+机器,孪生译员”诞生的这一刻。
“孪生译员”模式,通过设置“场景边界”的方式,跟踪一个翻译组织乃至一名译员的翻译过程,在翻译结果、上下文等场景化数据中进行学习,建立多维度异构模型并持续迭代,让每个翻译组织或译员,都可以将自己的翻译经验、风格数字化克隆,形成具有专属特征的孪生翻译引擎。同时,将自己的翻译资产,变成24小时躺着赚钱的服务能力。
例如文本解析、智能聚类、智能分拆、智能匹配、智能纠错、智能合并等一系列技术,都将在这一过程中发挥作用,组织起几十、几百乃至几千名翻译人员同时处理一个翻译任务,并使得每个人都能够很好地完成自己的工作,从而远超人工翻译效率,并保证翻译结果。
技术赋能创新,信息获取和转化方式更便捷
数字技术的不断发展,为互联网经济发展赋予了全新思路,技术的融入,赋予了人们快速跨越语言障碍的方式方法,更便捷更高效的满足信息转化的需求。
传神语联网研究院执行院长何征宇曾在演讲中提到,语联网自主开发构建IOLAIDrive语联网人工智能底层支撑系统,并在产能智能化组织调度、机器翻译以及人机共译等三大关键核心NLP技术领域取得突破进展。语联网提出新的交付标准“HWD”,即交付速度的计量记录刷新: 十万字以小时(HOUR)计,百万字以天(DAY)计,千万字以周(WEEK)计,将来还可能进一步提升。
传神语联创始人兼董事长何恩培表示,“信息大爆炸时代读取信息的对象,已经从单纯的人类,变为了人与机器同时阅读和处理。因此多语信息的处理,不仅要做好效能提升,更要在此基础上进行创新突破,打破人力处理能力的瓶颈和界限,衔接好人与机器,这是身处多语信息处理领域所有企业的共同使命。”