传神语联何恩培:别着急唱衰机器翻译 未来将是人机共译时代-程序员宅基地

640?wx_fmt=gif&wxfrom=5&wx_lazy=1


机器翻译替代简单劳动,复杂劳动、智慧劳动人来做,这就是传神“人机共译”正在做的事情。


前几天,腾讯同传作为机器翻译产品的代表,成为了博鳌论坛开幕式及部分核心论坛的同声传译;原本想着这次有机会再国际级会议的舞台上一展风采,没想到却出了洋相,接连出现了多次低级失误,似乎也印证了腾讯CEO马化腾在朋友圈中说的那句:“新尝试,多包涵。”


于是,人工智能将很快取代翻译人员的呼声似乎弱了下去,取而代之的则是“机器翻译就是个花架子”、“这届机器翻译不行”之类的言论。人们对于机器翻译的膜拜,仿佛在一夜之间出现了反转,从追捧变成了唱衰。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


对此,传神语联网网络科技股份有限公司董事长、CEO何恩培有着自己的看法:“百度、腾讯、科大讯飞等正在做的机器翻译方面的努力,值得行业尊重和正确对待,这是值得肯定的努力,是一次具有划时代意义的尝试。‘腾讯们’的尝试更是一种对市场的有益教育:翻译距离人很近了,不再遥不可及,跨境游、国际商务等涉及大众息息相关的翻译需求近在眼前。”


同时,何恩培也强调:由于人工智能目前尚未成熟,跟人类智慧产物——语言的结合只是一个过程,而且永远并不能完全替代人类翻译,不要过度炒作过度消费。积极拥抱AI,更应该客观的对待。


640?wx_fmt=jpeg

传神语联网网络科技股份有限公司董事长、CEO何恩培


翻译将是人类智慧的高地



在采访何恩培之前,笔者一直认为,人工智能或许在很多领域都可以超越人类,但唯独无法在想象力方面超越人类。不过,何恩培给出了一个更加具象化的答案:翻译是人类真正的智慧的高地,语言文字因人的存在而存在,语言文字是人类“全息智慧”的“一维表达”,从长远看来,AI应该能够超越人类的智力,但人的智慧却是难以逾越的。


为什么这么说呢?何恩培认为,这还要从人类语言的特性说起。首先,语言具有种族性,不同的语言是在不同的文化背景下产生的,它是不同民族对待事情和看待事情的方法。以沙发为例,这是欧洲人对待坐卧用具的称呼,具有种族的独特性;在中国的字典里并没有相对应的词,所以音译,而不是翻译为某种椅子。


其次,语言的种族性是由文化背景支撑的,没有文化支撑语言是不可能生存下来的。世界上曾经有一种世界语,是人类渴望无障碍沟通人造的一种统一语言,一度推广达到3000万人,但现在使用者可能不到两千人,这种不是基于文化底蕴的语言是不可能生存下去的。


第三,语言是一群人的共识,具有不可论证性和不可推导性,也就是说,某个东西的称呼本质其实是大家的约定俗成,这一点在方言上表现尤为明显。比如,“知不道”、“去两天”等,它们的意思分别是“不知道”和“去几天”,对于人工智能而言,它会认为“知不道”的语序有误,也会认为“去两天”就是指两天,而不会认为这是一个约数。共识随着时间变化而偶然发生,机器短时间内不可能更精准表达出来。


第四,围棋之所以可以被AI迅速超越,是因为围棋本身是有固定的规则,有确定的输赢结果,所以AI可以自我对局不分昼夜的训练。但语言不同,不但具有种族性、不可论证性和不可推导性,而且语言表达不具有唯一性,几乎不能象ALPHA那样在自我生成棋局、自我对局训练中提升。我看到有些报道在探索翻译的“自我对局训练”,个人观点认为,那最多是产生一种“机器方言”,如同一个封闭部落自我使用的方言,不可能达到符合现代社会人类需要的翻译水平。


第五,也是最重要的一点,机器基于文字的“一维训练”无法取代人脑“全息信息”之间的映射。人脑的全息信息是来自眼耳鼻口舌身意的全部信息的综合,是基于共同文化经历体验和共识而形成的。语言文字只是人脑全息信息的一维表达,它依赖人脑全息信息映射才能真正被理解,两种文字的映射理解是以两种文字背后的全息信息为背景的。所以,依靠一维语言文字的大量数据训练出来的机器翻译机器人,基本只能机械的“映射”难以全面实现全息转换,自然无法将原文真正意义转换到另外一种语言。以某一个翻译现场为例,译者会根据演讲人的情绪、语气、神态,以及文化背景等进行全息场景的合成,再用语言表达出来,但机器却不能做到这一点。因此语言文字和翻译都将因人的存在而存在,是人类智慧的表达。从长远看来,人工智能能够超越人类的智力,但人的智慧却是难以逾越的。



640?wx_fmt=jpeg


慎言替代 人机共译时代将成为未来



近两年的人工智能热潮,让“人工智能威胁论”一时间甚嚣尘上,许多圈内人士因人工智能的出现显得恐慌和无所适从。在翻译领域,“人工智能代替人类译者”的呼声也很高。


在笔者看来,人工智能是建立在大数据分析的专业和能力上,是一个具有理解、推理和学习能力的系统;但它并不会取代人类的专业能力,只是对人类专业能力的增强。机器翻译也是如此,人工智能的应用同样也是对人类译者能力的增强。


何恩培也持有类似的观点:人工智能可以在短时间内处理数以亿计的语料数据,在算法、数据、记录等方面都能够超越人类译者,从长远来看,人工智能在智力上可以全面超越人类;但人类有顿悟的时候,机器则没有,人工智能在智慧上很难超越人类。因此,人工智能是相互协作关系而不是对立关系,机器翻译替代简单劳动,智慧劳动人来做,这也是由译者的特殊性决定的。


比如,传神公司给做网文翻译的译者做提升培训,开班时有一个学生的翻译水平是团队最差的,但经过一周的启发、培训和演练,成为团队第三名。可以想象一周时间内有限的素材培训,对AI来说,可能还不够“塞牙缝”,更谈不上质量进步。但因为人的一周培训是“全息训练”,而AI只是“一维训练”,这是至今人类独一无二的能力。


640?wx_fmt=jpeg


目前主流的机器翻译仍处在弱人工智能阶段,即便在智力水平上要想超越人类也需要一定的时间。在这种情况下,何恩培提醒,“AI威胁” 论虽然唤醒人类重视人工智能翻译,但也给翻译行业造成困扰,使得学翻译的人为自己前途担忧,这必将导致翻译人才缺失,而翻译其实不可能被人工智能完全替代,这就会为人类文明传播速度和传播效果带来不利影响。


希望译者应该明白一个道理,机器翻译出来了,不是人没事干了,而是“搬砖”的事情不用人干了,那些需要人才能翻译好的信息还在那里。只是如果人类译者只想去干搬砖的简单底端活儿赚钱,那就是要和机器抢工作,那就是找死。


在人工智能尚未完全智慧化并被人类自由支配的前提下,过度炒作人工智能,是极具破坏性的文明自毁行为。”何恩培强调。


相反,如果人类能够合理运用人工智能,就可以更加快速地完成低端翻译任务,解放翻译生产力。人类译者可以将更多的精力放在创造性的高端翻译上,把简单的翻译交给机器翻译去做。据了解,在过去1600年间,人类的翻译能力只提升了2~3倍,但仅仅过去20年,人类社会的信息量就增长了1000倍,如果不借助人工智能的帮助,翻译工作将变得越来越难以为继。


有统计显示,中国解放以来引进的国外图书大概17万种,而全世界畅销的英文图书大概324万种,大约95%的图书没有进入中国。不是中国读者不需要,而是很多外文书看不懂看不到。由此可见,信息量海量是可见的事实,这直接导致翻译需求更加多样化和复杂,翻译效率和质量需要同步提升。因此,行业更应合理运用AI,快速完成低端翻译任务,解放翻译生产力,把译者精力放在高级翻译领域中,创造更大价值。不仅如此,如果有机器翻译的帮助,不同语言、不同种族之间的信息交流效率就会大大提升,人类文明的进程甚至都会因此加速。


就像不久前谷歌AI产品负责人Apoorv Saxena所说:“我们的AI技术发展很快。很多时候,我们机器翻译翻对了,但是,更多时候,我们翻错了。”


因此,人工智能和人类译者之间是相互协作的关系而不是对立关系。“机器翻译替代简单劳动,复杂劳动、智慧劳动人来做,这就是传神‘人机共译’正在做的事情。”何恩培表示。


利用技术盘活翻译资源 传神要让人类没有语言障碍



对于人类译者来说,威胁并不仅来自机器翻译。一直以来,人类译者的劳动和回报都并不匹配,一方面很多译者所从事的都是简单、重复的翻译工作,翻译资源浪费严重且很容易被机器翻译替代;另一方面,译者收集资料的时间很长,但客户只按照翻译字数算钱。


据何恩培介绍,传统的翻译模式具有两大特点:


1、专家模式,这种模式的核心是专家的经验,专家的信息处理效率较低,每天只有2万字左右;不仅如此,专家在持续工作强度下派稿准确率只有70%左右,而人工智能的准确率很容易达到90%以上。因此人工智能不仅仅在翻译过程起作用,在整个翻译流程都会有很大价值。


2、来料加工模式,这种模式就是客户给什么资料,译者就翻译什么。没有资料来译者就没事干,这也是为什么翻译一直没有成为产业的原因,缺乏和技术、产品及场景化需求的结合。


为了推动传统翻译行业的变革,传神打造了语联网生态,从机器翻译和人工译者两个角度出发,通过搭建平台整合世界上所有的译者和机器翻译,输出标准产能给客户,真正激活传统翻译行业。


目前,累计申请和获得的专利近300项、软件著作权超百项。传神语联网已经形成大型企业嵌入式语言服务、中小企业按需语言服务、云服务接入、移动互联网应用等多种业务模式,满足不同场景不同类型用户的无障碍沟通需求,已经覆盖国际工程、装备制造、影视传媒、情报资讯、跨境电商、文化旅游、服务外包、会议会展等五十多个领域。比如,一个制造行业的翻译需求可以通过语联网的大数据分析等快速找到相匹配的译者,从而提升翻译的效率和质量。


据了解,基于语联网平台,传神已经架构建成了一个产业链,Transnbox、小尾巴、语翼、那啥,涉外政警务等多个示范运用正像水和电一样,更多地融入人们的工作与生活中,从客户的产能筛选、识别、应用场景,到最后的客户,形成一个基础生态,将来在上面可以产生一万个上万活跃的应用和接入,每一个都可以通过母语设施去解决沟通问题。


“传神者,必以形。形与心、手相凑而相忘,神之所托也。”明朝董其昌所说的这句话同样形象地表达出了语言的魅力所在。而何恩培的传神就是希望实现语言的“神之所托”,让所有的译者都能够享受技术进步带来的价值,做一个快乐的“传神者”;并让人类沟通没有语言障碍,让人们如同水电一样方便地使用语言服务,用母语沟通世界。


640?wx_fmt=gif
长按指纹  识别二维码   关注我



欢迎讨论与转载,转载请注明作者与出处。

“常言道”已入住今日头条、百度百家、一点资讯、搜狐新闻、网易新闻、凤凰新闻、腾讯新闻、新浪新闻、界面、UC、号外等多个媒体平台。有合作意向请发送邮件至[email protected]



版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/M59Ht9D0J/article/details/79988243

智能推荐

FTP命令字和返回码_ftp 登录返回230-程序员宅基地

文章浏览阅读3.5k次,点赞2次,收藏13次。为了从FTP服务器下载文件,需要要实现一个简单的FTP客户端。FTP(文件传输协议) 是 TCP/IP 协议组中的应用层协议。FTP协议使用字符串格式命令字,每条命令都是一行字符串,以“\r\n”结尾。客户端发送格式是:命令+空格+参数+"\r\n"的格式服务器返回格式是以:状态码+空格+提示字符串+"\r\n"的格式,代码只要解析状态码就可以了。读写文件需要登陆服务器,特殊用..._ftp 登录返回230

centos7安装rabbitmq3.6.5_centos7 安装rabbitmq3.6.5-程序员宅基地

文章浏览阅读648次。前提:systemctl stop firewalld 关闭防火墙关闭selinux查看getenforce临时关闭setenforce 0永久关闭sed-i'/SELINUX/s/enforcing/disabled/'/etc/selinux/configselinux的三种模式enforcing:强制模式,SELinux 运作中,且已经正确的开始限制..._centos7 安装rabbitmq3.6.5

idea导入android工程,idea怎样导入Android studio 项目?-程序员宅基地

文章浏览阅读5.8k次。满意答案s55f2avsx2017.09.05采纳率:46%等级:12已帮助:5646人新版Android Studio/IntelliJ IDEA可以直接导入eclipse项目,不再推荐使用eclipse导出gradle的方式2启动Android Studio/IntelliJ IDEA,选择 import project3选择eclipse 项目4选择 create project f..._android studio 项目导入idea 看不懂安卓项目

浅谈AI大模型技术:概念、发展和应用_ai大模型应用开发-程序员宅基地

文章浏览阅读860次,点赞2次,收藏6次。AI大模型技术已经在自然语言处理、计算机视觉、多模态交互等领域取得了显著的进展和成果,同时也引发了一系列新的挑战和问题,如数据质量、计算效率、知识可解释性、安全可靠性等。城市运维涉及到多个方面,如交通管理、环境监测、公共安全、社会治理等,它们需要处理和分析大量的多模态数据,如图像、视频、语音、文本等,并根据不同的场景和需求,提供合适的决策和响应。知识搜索有多种形式,如语义搜索、对话搜索、图像搜索、视频搜索等,它们可以根据用户的输入和意图,从海量的数据源中检索出最相关的信息,并以友好的方式呈现给用户。_ai大模型应用开发

非常详细的阻抗测试基础知识_阻抗实部和虚部-程序员宅基地

文章浏览阅读8.2k次,点赞12次,收藏121次。为什么要测量阻抗呢?阻抗能代表什么?阻抗测量的注意事项... ...很多人可能会带着一系列的问题来阅读本文。不管是数字电路工程师还是射频工程师,都在关注各类器件的阻抗,本文非常值得一读。全文13000多字,认真读完大概需要2小时。一、阻抗测试基本概念阻抗定义:阻抗是元器件或电路对周期的交流信号的总的反作用。AC 交流测试信号 (幅度和频率)。包括实部和虚部。​图1 阻抗的定义阻抗是评测电路、元件以及制作元件材料的重要参数。那么什么是阻抗呢?让我们先来看一下阻抗的定义。首先阻抗是一个矢量。通常,阻抗是_阻抗实部和虚部

小学生python游戏编程arcade----基本知识1_arcade语言 like-程序员宅基地

文章浏览阅读955次。前面章节分享试用了pyzero,pygame但随着想增加更丰富的游戏内容,好多还要进行自己编写类,从今天开始解绍一个新的python游戏库arcade模块。通过此次的《连连看》游戏实现,让我对swing的相关知识有了进一步的了解,对java这门语言也有了比以前更深刻的认识。java的一些基本语法,比如数据类型、运算符、程序流程控制和数组等,理解更加透彻。java最核心的核心就是面向对象思想,对于这一个概念,终于悟到了一些。_arcade语言 like

随便推点

【增强版短视频去水印源码】去水印微信小程序+去水印软件源码_去水印机要增强版-程序员宅基地

文章浏览阅读1.1k次。源码简介与安装说明:2021增强版短视频去水印源码 去水印微信小程序源码网站 去水印软件源码安装环境(需要材料):备案域名–服务器安装宝塔-安装 Nginx 或者 Apachephp5.6 以上-安装 sg11 插件小程序已自带解析接口,支持全网主流短视频平台,搭建好了就能用注:接口是公益的,那么多人用解析慢是肯定的,前段和后端源码已经打包,上传服务器之后在配置文件修改数据库密码。然后输入自己的域名,进入后台,创建小程序,输入自己的小程序配置即可安装说明:上传源码,修改data/_去水印机要增强版

verilog进阶语法-触发器原语_fdre #(.init(1'b0) // initial value of register (1-程序员宅基地

文章浏览阅读557次。1. 触发器是FPGA存储数据的基本单元2. 触发器作为时序逻辑的基本元件,官方提供了丰富的配置方式,以适应各种可能的应用场景。_fdre #(.init(1'b0) // initial value of register (1'b0 or 1'b1) ) fdce_osc (

嵌入式面试/笔试C相关总结_嵌入式面试笔试c语言知识点-程序员宅基地

文章浏览阅读560次。本该是不同编译器结果不同,但是尝试了g++ msvc都是先计算c,再计算b,最后得到a+b+c是经过赋值以后的b和c参与计算而不是6。由上表可知,将q复制到p数组可以表示为:*p++=*q++,*优先级高,先取到对应q数组的值,然后两个++都是在后面,该行运算完后执行++。在电脑端编译完后会分为text data bss三种,其中text为可执行程序,data为初始化过的ro+rw变量,bss为未初始化或初始化为0变量。_嵌入式面试笔试c语言知识点

57 Things I've Learned Founding 3 Tech Companies_mature-程序员宅基地

文章浏览阅读2.3k次。57 Things I've Learned Founding 3 Tech CompaniesJason Goldberg, Betashop | Oct. 29, 2010, 1:29 PMI’ve been founding andhelping run techn_mature

一个脚本搞定文件合并去重,大数据处理,可以合并几个G以上的文件_python 超大文本合并-程序员宅基地

文章浏览阅读1.9k次。问题:先讲下需求,有若干个文本文件(txt或者csv文件等),每行代表一条数据,现在希望能合并成 1 个文本文件,且需要去除重复行。分析:一向奉行简单原则,如无必要,绝不复杂。如果数据量不大,那么如下两条命令就可以搞定合并:cat a.txt >> new.txtcat b.txt >> new.txt……去重:cat new...._python 超大文本合并

支付宝小程序iOS端过渡页DFLoadingPageRootController分析_类似支付宝页面过度加载页-程序员宅基地

文章浏览阅读489次。这个过渡页是第一次打开小程序展示的,点击某个小程序前把手机的开发者->network link conditioner->enable & very bad network 就会在停在此页。比如《支付宝运动》这个小程序先看这个类的.h可以看到它继承于DTViewController点击左上角返回的方法- (void)back;#import "DTViewController.h"#import "APBaseLoadingV..._类似支付宝页面过度加载页

推荐文章

热门文章

相关标签