传神语联何恩培:别着急唱衰机器翻译 未来将是人机共译时代-程序员宅基地

640?wx_fmt=gif&wxfrom=5&wx_lazy=1


机器翻译替代简单劳动,复杂劳动、智慧劳动人来做,这就是传神“人机共译”正在做的事情。


前几天,腾讯同传作为机器翻译产品的代表,成为了博鳌论坛开幕式及部分核心论坛的同声传译;原本想着这次有机会再国际级会议的舞台上一展风采,没想到却出了洋相,接连出现了多次低级失误,似乎也印证了腾讯CEO马化腾在朋友圈中说的那句:“新尝试,多包涵。”


于是,人工智能将很快取代翻译人员的呼声似乎弱了下去,取而代之的则是“机器翻译就是个花架子”、“这届机器翻译不行”之类的言论。人们对于机器翻译的膜拜,仿佛在一夜之间出现了反转,从追捧变成了唱衰。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


对此,传神语联网网络科技股份有限公司董事长、CEO何恩培有着自己的看法:“百度、腾讯、科大讯飞等正在做的机器翻译方面的努力,值得行业尊重和正确对待,这是值得肯定的努力,是一次具有划时代意义的尝试。‘腾讯们’的尝试更是一种对市场的有益教育:翻译距离人很近了,不再遥不可及,跨境游、国际商务等涉及大众息息相关的翻译需求近在眼前。”


同时,何恩培也强调:由于人工智能目前尚未成熟,跟人类智慧产物——语言的结合只是一个过程,而且永远并不能完全替代人类翻译,不要过度炒作过度消费。积极拥抱AI,更应该客观的对待。


640?wx_fmt=jpeg

传神语联网网络科技股份有限公司董事长、CEO何恩培


翻译将是人类智慧的高地



在采访何恩培之前,笔者一直认为,人工智能或许在很多领域都可以超越人类,但唯独无法在想象力方面超越人类。不过,何恩培给出了一个更加具象化的答案:翻译是人类真正的智慧的高地,语言文字因人的存在而存在,语言文字是人类“全息智慧”的“一维表达”,从长远看来,AI应该能够超越人类的智力,但人的智慧却是难以逾越的。


为什么这么说呢?何恩培认为,这还要从人类语言的特性说起。首先,语言具有种族性,不同的语言是在不同的文化背景下产生的,它是不同民族对待事情和看待事情的方法。以沙发为例,这是欧洲人对待坐卧用具的称呼,具有种族的独特性;在中国的字典里并没有相对应的词,所以音译,而不是翻译为某种椅子。


其次,语言的种族性是由文化背景支撑的,没有文化支撑语言是不可能生存下来的。世界上曾经有一种世界语,是人类渴望无障碍沟通人造的一种统一语言,一度推广达到3000万人,但现在使用者可能不到两千人,这种不是基于文化底蕴的语言是不可能生存下去的。


第三,语言是一群人的共识,具有不可论证性和不可推导性,也就是说,某个东西的称呼本质其实是大家的约定俗成,这一点在方言上表现尤为明显。比如,“知不道”、“去两天”等,它们的意思分别是“不知道”和“去几天”,对于人工智能而言,它会认为“知不道”的语序有误,也会认为“去两天”就是指两天,而不会认为这是一个约数。共识随着时间变化而偶然发生,机器短时间内不可能更精准表达出来。


第四,围棋之所以可以被AI迅速超越,是因为围棋本身是有固定的规则,有确定的输赢结果,所以AI可以自我对局不分昼夜的训练。但语言不同,不但具有种族性、不可论证性和不可推导性,而且语言表达不具有唯一性,几乎不能象ALPHA那样在自我生成棋局、自我对局训练中提升。我看到有些报道在探索翻译的“自我对局训练”,个人观点认为,那最多是产生一种“机器方言”,如同一个封闭部落自我使用的方言,不可能达到符合现代社会人类需要的翻译水平。


第五,也是最重要的一点,机器基于文字的“一维训练”无法取代人脑“全息信息”之间的映射。人脑的全息信息是来自眼耳鼻口舌身意的全部信息的综合,是基于共同文化经历体验和共识而形成的。语言文字只是人脑全息信息的一维表达,它依赖人脑全息信息映射才能真正被理解,两种文字的映射理解是以两种文字背后的全息信息为背景的。所以,依靠一维语言文字的大量数据训练出来的机器翻译机器人,基本只能机械的“映射”难以全面实现全息转换,自然无法将原文真正意义转换到另外一种语言。以某一个翻译现场为例,译者会根据演讲人的情绪、语气、神态,以及文化背景等进行全息场景的合成,再用语言表达出来,但机器却不能做到这一点。因此语言文字和翻译都将因人的存在而存在,是人类智慧的表达。从长远看来,人工智能能够超越人类的智力,但人的智慧却是难以逾越的。



640?wx_fmt=jpeg


慎言替代 人机共译时代将成为未来



近两年的人工智能热潮,让“人工智能威胁论”一时间甚嚣尘上,许多圈内人士因人工智能的出现显得恐慌和无所适从。在翻译领域,“人工智能代替人类译者”的呼声也很高。


在笔者看来,人工智能是建立在大数据分析的专业和能力上,是一个具有理解、推理和学习能力的系统;但它并不会取代人类的专业能力,只是对人类专业能力的增强。机器翻译也是如此,人工智能的应用同样也是对人类译者能力的增强。


何恩培也持有类似的观点:人工智能可以在短时间内处理数以亿计的语料数据,在算法、数据、记录等方面都能够超越人类译者,从长远来看,人工智能在智力上可以全面超越人类;但人类有顿悟的时候,机器则没有,人工智能在智慧上很难超越人类。因此,人工智能是相互协作关系而不是对立关系,机器翻译替代简单劳动,智慧劳动人来做,这也是由译者的特殊性决定的。


比如,传神公司给做网文翻译的译者做提升培训,开班时有一个学生的翻译水平是团队最差的,但经过一周的启发、培训和演练,成为团队第三名。可以想象一周时间内有限的素材培训,对AI来说,可能还不够“塞牙缝”,更谈不上质量进步。但因为人的一周培训是“全息训练”,而AI只是“一维训练”,这是至今人类独一无二的能力。


640?wx_fmt=jpeg


目前主流的机器翻译仍处在弱人工智能阶段,即便在智力水平上要想超越人类也需要一定的时间。在这种情况下,何恩培提醒,“AI威胁” 论虽然唤醒人类重视人工智能翻译,但也给翻译行业造成困扰,使得学翻译的人为自己前途担忧,这必将导致翻译人才缺失,而翻译其实不可能被人工智能完全替代,这就会为人类文明传播速度和传播效果带来不利影响。


希望译者应该明白一个道理,机器翻译出来了,不是人没事干了,而是“搬砖”的事情不用人干了,那些需要人才能翻译好的信息还在那里。只是如果人类译者只想去干搬砖的简单底端活儿赚钱,那就是要和机器抢工作,那就是找死。


在人工智能尚未完全智慧化并被人类自由支配的前提下,过度炒作人工智能,是极具破坏性的文明自毁行为。”何恩培强调。


相反,如果人类能够合理运用人工智能,就可以更加快速地完成低端翻译任务,解放翻译生产力。人类译者可以将更多的精力放在创造性的高端翻译上,把简单的翻译交给机器翻译去做。据了解,在过去1600年间,人类的翻译能力只提升了2~3倍,但仅仅过去20年,人类社会的信息量就增长了1000倍,如果不借助人工智能的帮助,翻译工作将变得越来越难以为继。


有统计显示,中国解放以来引进的国外图书大概17万种,而全世界畅销的英文图书大概324万种,大约95%的图书没有进入中国。不是中国读者不需要,而是很多外文书看不懂看不到。由此可见,信息量海量是可见的事实,这直接导致翻译需求更加多样化和复杂,翻译效率和质量需要同步提升。因此,行业更应合理运用AI,快速完成低端翻译任务,解放翻译生产力,把译者精力放在高级翻译领域中,创造更大价值。不仅如此,如果有机器翻译的帮助,不同语言、不同种族之间的信息交流效率就会大大提升,人类文明的进程甚至都会因此加速。


就像不久前谷歌AI产品负责人Apoorv Saxena所说:“我们的AI技术发展很快。很多时候,我们机器翻译翻对了,但是,更多时候,我们翻错了。”


因此,人工智能和人类译者之间是相互协作的关系而不是对立关系。“机器翻译替代简单劳动,复杂劳动、智慧劳动人来做,这就是传神‘人机共译’正在做的事情。”何恩培表示。


利用技术盘活翻译资源 传神要让人类没有语言障碍



对于人类译者来说,威胁并不仅来自机器翻译。一直以来,人类译者的劳动和回报都并不匹配,一方面很多译者所从事的都是简单、重复的翻译工作,翻译资源浪费严重且很容易被机器翻译替代;另一方面,译者收集资料的时间很长,但客户只按照翻译字数算钱。


据何恩培介绍,传统的翻译模式具有两大特点:


1、专家模式,这种模式的核心是专家的经验,专家的信息处理效率较低,每天只有2万字左右;不仅如此,专家在持续工作强度下派稿准确率只有70%左右,而人工智能的准确率很容易达到90%以上。因此人工智能不仅仅在翻译过程起作用,在整个翻译流程都会有很大价值。


2、来料加工模式,这种模式就是客户给什么资料,译者就翻译什么。没有资料来译者就没事干,这也是为什么翻译一直没有成为产业的原因,缺乏和技术、产品及场景化需求的结合。


为了推动传统翻译行业的变革,传神打造了语联网生态,从机器翻译和人工译者两个角度出发,通过搭建平台整合世界上所有的译者和机器翻译,输出标准产能给客户,真正激活传统翻译行业。


目前,累计申请和获得的专利近300项、软件著作权超百项。传神语联网已经形成大型企业嵌入式语言服务、中小企业按需语言服务、云服务接入、移动互联网应用等多种业务模式,满足不同场景不同类型用户的无障碍沟通需求,已经覆盖国际工程、装备制造、影视传媒、情报资讯、跨境电商、文化旅游、服务外包、会议会展等五十多个领域。比如,一个制造行业的翻译需求可以通过语联网的大数据分析等快速找到相匹配的译者,从而提升翻译的效率和质量。


据了解,基于语联网平台,传神已经架构建成了一个产业链,Transnbox、小尾巴、语翼、那啥,涉外政警务等多个示范运用正像水和电一样,更多地融入人们的工作与生活中,从客户的产能筛选、识别、应用场景,到最后的客户,形成一个基础生态,将来在上面可以产生一万个上万活跃的应用和接入,每一个都可以通过母语设施去解决沟通问题。


“传神者,必以形。形与心、手相凑而相忘,神之所托也。”明朝董其昌所说的这句话同样形象地表达出了语言的魅力所在。而何恩培的传神就是希望实现语言的“神之所托”,让所有的译者都能够享受技术进步带来的价值,做一个快乐的“传神者”;并让人类沟通没有语言障碍,让人们如同水电一样方便地使用语言服务,用母语沟通世界。


640?wx_fmt=gif
长按指纹  识别二维码   关注我



欢迎讨论与转载,转载请注明作者与出处。

“常言道”已入住今日头条、百度百家、一点资讯、搜狐新闻、网易新闻、凤凰新闻、腾讯新闻、新浪新闻、界面、UC、号外等多个媒体平台。有合作意向请发送邮件至[email protected]



版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/M59Ht9D0J/article/details/79988243

智能推荐

02架构管理之研发管理-程序员宅基地

文章浏览阅读178次。研发管理(Research and Development Management,R&D Management)是一种系统性的管理活动,是以产品开发流程为基础的项目管理体系,旨在规划、组织、协调和监督研发项目,对研发项目的人员、计划、质量、成本等进行综合管理,从而打造高效能的研发团队,更好更快地实现项目目标。研发管理的本质是从流程化,标准化,制度化等维度建立管理机制。最终的核心目标是通过管理的法治建立标准化的操作规范,再通过标准化的规范提升人员的协作效率、监督机制、系统稳定性/安全性等。

磁盘访问性能分析及RAID简介_吞吐量和raid关系-程序员宅基地

文章浏览阅读1.3k次。简要介绍了磁盘访问性能相关指标,CPU的交互方式,和RAID_吞吐量和raid关系

塑胶模具报价计算原理方法与程序-程序员宅基地

文章浏览阅读2k次,点赞3次,收藏4次。塑胶类产品的生产依赖于模具(Tooling),曾经为公司做过一个塑胶模具的报价系统。模具的成本,与ERP中的产品成本原理相似,材料费,人工费和制造费用,再加上企业利润,构成基本的价格。 常用的公式如下所示 模具价格=模具材料费+模具加工费+税金+利润 其中材料费占20%~30%,加工费50%~60%;一般模具利润率10%~30%,大型模具利润率20%~35% 模具时间与成本的关系如下 ..._塑胶模报价计算公式

logging模块使用_logging模块ch在生产可以打开吗-程序员宅基地

文章浏览阅读159次。最详细的还是 官方文档最简单的使用# -*- coding:utf-8 -*-import logginglogging.debug('debug message')logging.info('info message')logging.warn('warn message')logging.error('error message')logging.critical('crit..._logging模块ch在生产可以打开吗

千峰web前端入门html+css笔记(一)_千峰web前端开发-程序员宅基地

文章浏览阅读933次。标题描述_千峰web前端开发

深入浅出计算机组成原理:FPGA、ASIC和TPU(上)-计算机体系结构的黄金时代(第32讲)...-程序员宅基地

文章浏览阅读984次。一、引子过去很长一段时间里,大家在讲到高科技、互联网、信息技术的时候,谈的其实都是“软件”。从1995年微软发布Windows 95开始,高科技似乎就等同于软件业和互联网。著名的风险投资基金AndreessenHorowitz的合伙人Marc Andreessen,在2011年发表了一篇博客,声称“Software is Eating the World”。Marc Andree..._计算机组成原理 fpga

随便推点

react 里面的东西居中_react图片居中-程序员宅基地

文章浏览阅读437次。react 里面的东西居中。_react图片居中

zookeeper_zookeeper访问地址-程序员宅基地

文章浏览阅读5.2k次。1.linux下安装完zookeeper之后,进入conf目录编辑zoo.cfg文件,找到dataDir属性更改其路径为zookeeper目录下的zkData文件夹.(因为其默认的目录在Linux下会定清理)(1)进入到zookeeper目录下的bin目录启动zookeeper,使用sh zkServer.sh命令启动zookeeper(或者zkServer.sh start命令启动).(2) 继续在bin目录下使用sh zkCli.sh命令启动zoo..._zookeeper访问地址

windows以G为单位整数分区公式(精准)_win7分盘100g公式-程序员宅基地

文章浏览阅读572次。下面是js的脚本,100G为例:// JS var num = 100Math.ceil(Math.ceil(num*1024/7.84423828125)*7.84423828125)使用方法,只要有浏览器就行,打开浏览器进入开发者模式F12,选择控制台将上面的代码粘贴到控制台中,红字部分为100G应分配的M数.如需其它容量大小自行修改100为对应的值..._win7分盘100g公式

新书推荐|Windows黑客编程技术详解-程序员宅基地

文章浏览阅读70次。《Windows黑客编程技术详解》面向对计算机系统安全开发感兴趣,或者希望提升安全开发水平的读者,以及从事恶意代码分析研究的安全人员。理论技术与实战操作相辅相成,凸显“道与术”庖丁解牛式剖析Windows用户层和内核层黑客技术原理代码兼容性高,支持Windows 7到Windows 10全平台系统近年来,全球大规模爆发勒索病毒和挖..._demongan

【UE4】制作加载图片Splash_ue4 splash image-程序员宅基地

文章浏览阅读5.2k次,点赞7次,收藏18次。很多小伙伴都会有疑惑,有的大神可以有自己独特的加载界面,其实这个编辑过程很简单,今天带大家来一起Try一Try! 长话短说,如果我们不做改变,每一个编辑器加载时的界面都是一样的,那我们怎么样去根据自己的喜好来改变这个logo呢?1.打开虚幻编辑器,项目设置2.项目设置中找到这个更改界面,然后把鼠标放在logo上,我们可以看到这个图片是虚幻自带的文件中原本就默认存在的,那我们就..._ue4 splash image

Acwing算法提高课_acwing提高课-程序员宅基地

文章浏览阅读154次。90%的dp问题都能转化为最短路问题,拓扑图可以转化为dp问题。记住模型,到相似题目就会有更清晰的思路,不会到无从下手。_acwing提高课

推荐文章

热门文章

相关标签