ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
阅读:5611回复:28

翻译这种职业,迟早要淘汰

楼主#
更多 发布于:2016-08-05 13:03
https://support.office.com/zh-cn/article/02e29e25-93b2-4799-b707-3a9e0ccefd46
重要: 本文是由机器翻译的,请参阅免责声明。请在 此处 中查找本文的英文版本以便参考。
想做翻译?明智的95后、00后的你,千万不要有这种危险的想法

千万别瞧不起目前还处于非常初级幼稚状态、在对待高级复杂内容的翻译时漏洞百出的谷歌翻译机。当前的谷歌翻译机,在处理某些语言例如韩国语时,连翻译最简单初级句都是根本狗屁不通。但十年后,谷歌翻译机会彻底毁你三观,让你不得不承认,如今在就业市场上尚能有一席容身之地的诸如酒店餐厅服务员、收银员、司机、翻译,这类职业,在不遥远的未来,很快将成为历史和过去,从事这些职业,失业是必然的

最新喜欢:

iMjmJ.Com小爱卖家iMjmJ....
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
沙发#
发布于:2016-08-05 13:15
人工智能正以非常惊人的几何级数的加速度奋力增长。可以预言,不出五年,你周边的人和事,各种生活小节,将变得与现在非常不同。非常非常不同。现在全球的一些地方如日本等地,已经如雨后春笋般冒出了一些机器人酒店,在不久的将来,全自动驾驶智能汽车、自动翻译机、机器人农作物收割机、机器人超市收银员、机器人家政保姆、乃至机器人金融分析师、机器人股票黄金石油期现货操盘手,所有你能想到的从“低端”到“高端”的各种职业领域里,都将出现机器逐渐替代人脑的趋势,直至完全替代人脑。这不是危言耸听。这是必然。时间问题而已。95后、00后们,千万要选对行,选对行很重要
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
板凳#
发布于:2016-08-05 13:28
因为人工智能不是以线形速度增长的,而是以几何级数的超高加速度增长,你以现在的目光去预言未来,低估人工智能的超巨大潜能甚至是危害,是注定没用的。人工智能将使人类面临前所未有的巨大机遇和挑战,搞得好,人类通过将记忆植入机器获得非生物性永生,统治银河系甚至宇宙,搞不好,则人类将面临被彻底灭亡或取代的风险,从而地球演进到human 2.0时代。人工智能是比地球任何一种超级武器都危险的东西,但如能尊重它、敬畏它,做好充分的预案并学会善加利用、往积极正面的方向引导,则会是人类社会的巨大福祉所在
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
地板#
发布于:2016-08-07 00:51
当然了,95前的年龄不算太小的还是可以做做的,这行业短期不会消失,尤其是文学翻译,文学作品翻译的机器可替代性在短期内还远低于技术性文档翻译,智能机器要能培养出复杂情感还不是眼下能一蹴而就的事
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
4#
发布于:2016-08-07 00:52
但文学翻译的需求量也低
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
5#
发布于:2016-08-10 17:02
人工智能在可预见的近期一段时间,尚不能完全取代人脑,但会无限趋近,这是必然的趋势;至于完全取代,理论上也仅仅是时间问题。人在物理上也是高级碳基生物,人工智能从理论上发展出更高级的硅基(或者矽基)生物完全没有问题。只有某些核心问题,诸如生物体“意识”的物理本质、超距作用的本质,这类,未来也可以结合量子物理(近期市场上热门的量子通信领域是其最大应用领域之一)的最新前沿进展来进一步挖掘

低难度系数的技术性文档,完全由翻译机来解决,这是未来5~10年最多15年内就看得见的事情
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
7#
发布于:2016-09-14 01:56
也不能说“狗屁不通”,大概意思还是出来了。只不过不符合语言习惯。
------
谁告诉你“大概意思还是出来了”?

http://m.cafe.daum.net/molanthro/I4pX/57?q=D_cbHzArtfdds0&

아직까지 아쉽게도, M117중 Geno 2.0 등 정밀검사 결과가 알려진 한국인이 순흥 안씨분 한 분밖에 없고, 현재 하플로트리로는 F8*에 속한다는 것 외에는 밝혀진 것이 없습니다. 그리고 일본인도 이번에 처음 나온 도요하라씨 외에는 없어서 샘플 수의 부족이 가장 큰 장애 요인인 것 같습니다. 한국인 주류 M117이 과연 어디 가지에 속하느냐 하는 것이 가장 궁금하고, CTS4960 같은 경우는 한국인과 북중국인에서만 샘플이 나오므로, 분명히 북방 루트를 통한 것이 한국인과 일본인 다수에서는 가장 많겠지만, 현재까지 CTS4658 계열은 남방에서만 샘플이 나왔으므로 남방 루트를 가정한 것입니다. 물론, 현재까지는 샘플 수가 절대 부족하지요.
这是谷歌给的翻译:

然而不幸的是,只有一个检测结果是已知的,例如M117格诺2.0的韩语安sunheung分钟,并在当前浮动不会显露出来,所不同的是利属于F8 *。也因为日本也是如此,只不过这次我们从一开始就似乎是一个缺乏样品,最大的障碍。最好奇的,CTS4960这种情况下,韩国和北美自中国的样品出来而已,显然,它是通过北线数韩国和日本,但许多,远远CTS4658系列韩国烧酒的M117是你属于那里的东西真的是因为样本从南边仅排是假设南线。当然,样本数褶边永远不够直到现在。

那你给我讲讲,“大概意思”是什么?
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
8#
发布于:2016-09-30 20:01
http://zzl.healthsites.xyz/?qry=d3d3LmJhbm5lZGJvb2sub3JnL2JuZXdzL3NvaG5ld3MvMjAxNjA5MzAvNTk1ODA3Lmh0bwW

《外语盲有福了 谷歌推出神经网络翻译 水平堪比真人》

上述链接随时会被G*F*W屏蔽,因此附上原文PDF,以方便在屏蔽后继续浏览

外语盲有福了 谷歌推出神经网络翻译 水平堪比真人.pdf
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
9#
发布于:2016-10-01 00:32
仔细看原文,他说的是汉译英的水平,其他的没说,但相信要跟进完善也只是时间问题。

俄的话屈折度大一点,偶尔还会有定向/不定向动词选取之类的纯语义问题,但这些都不是事,因为NLP是一类大项目,细化可以到semantic analysis甚至pragmatic analysis工具的研发,假以时日足可解决这类问题。
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
10#
发布于:2016-10-01 00:46

http://money.163.com/16/0930/13/C27EB6H1002580S6.html

谷歌神经网络翻译媲美真人笔译?

日前,谷歌推出神经网络翻译,翻译质量接近人工笔译。这让人们不禁发出感叹:“是不是以后我们都不用学英语了?”

早报记者 徐明徽 实习生 李娇

继AlphaGo战胜韩国职业棋手李世石没多久,人工智能再下一城。9月27日,谷歌推出了新的翻译系统,声称该套翻译系统基于对于人类神经思考的模仿,能够与真人翻译竞相匹敌。

在谷歌的发文《规模生产中的神经网络机器翻译》(A Neural Network for Machine Translation, at Production Scale)中,宣布将机器学习技术纳入网页和手机App翻译中,从前汉译英的尴尬局面将大为扭转。

翻译系统面世后,根据用户们的测试,发现汉译英的准确率高得惊人。

众所周知,将汉语恰切地译为英语是一件不易之事,而简单的机械翻译对于那些谷歌翻译的依赖者来说已远远不够。谷歌公司称,相较之前的算法,谷歌神经机器翻译能减少80%的错误,与通过标准测试的真人翻译所差无几。

在之前的一项西班牙语译为英语的测试中,设定满分为6分,谷歌旧的翻译系统得到3.6分,人类普遍得分为5.1分,而谷歌的新系统得到了5分的好成绩。

从前的译介模式是短语式的,翻译系统将一句话拆分成单词或者词组进行翻译,往往得到一些语句不通的结果。而新的翻译系统称之为谷歌神经机器翻译(GNMT),这项新的技术运用更少的机器设计选择,它将一句话视为整体进行解码,虽然仍是将一句话分割成若干独立单元,但每个单元都放在句子的前后进行考量。这就像一个初中生进入高中大门,为完成作业,要尝试在一本巨大的词典中查找单词和短语。神经机器翻译与以往的翻译模式用的是同样一本大词典,但旧的翻译模式只是逐个查词,而神经机器翻译却训练出两种神经网络,可以生产出另一种语言的完整的文本。这对于汉语翻译是极为重要的,因为汉语中由于搭配不同导致一个词往往有不同的意思。

翻译准确性

何以达成质的飞跃

谷歌神经网络翻译为何能够在准确性上有质的飞跃?

据悉,谷歌神经翻译克服了之前神经机器翻译在准确性和速度上的缺陷,带有8个编码层和8个解码层的长短时记忆(LSTM)网络用来增强注意以及记录瞬间感觉残留。注意力机制则连接下层解码层和上层编码层,以此来提高并行度从而降低耗时,推理计算中的低精度的算法则提升了最终的翻译速度。

第一步,网络将中文单词编码为一系列向量,每个向量代表整句话所有单词的含义。一旦整个句子被神经网络阅览,解码即开始,生成相应的英语句子。而解码则是一个将已编码的中文向量与相关的英语单词生成的加权分布的过程。连接编码解码的曲线代表解码过程中所考量到的编码词汇。

而为提高对生僻词的处理,谷歌将词语分成有限的子词单元,从而方便输入与输出。而束搜索技术则使搜索长度规格化以及具有覆盖性,这使得翻译输出的句型可大量覆盖译介语种的所有单词。这一切都可归为人工智能,人工智能算法不依赖于人类逻辑,比起人们从前使用的手工编写的算法来说,人工智能算法能找到更好的方式完成任务。人工智能网络自身会学习怎样翻译,它专注于结果如何,而不受人类思维优先的干扰。麦克·舒斯特,开发此项目的谷歌工程师说,“你不必选择,系统会全面进行翻译。”

中译英只是谷歌翻译所支持的一万种语言中的一种。谷歌表示,今后翻译将更多依赖于人工智能。在之后的几个月时间里,谷歌还会设计出适用于更多语言的谷歌神经机器翻译。当然,此种神经机器翻译还不能称得上完美,固然基于神经的人工智能表现不错,但仍有很多细微之处机器算法不能够真正领悟。比起人类翻译,谷歌神经网络翻译仍会犯许多人类翻译不会出现的错误,如掉词、误译专有名词、罕见术语,以及忽略上下文语境孤立翻译某句话等等。不过,起码这种新的翻译模式只是让意思流失在翻译结果上,而非在翻译过程中就面目全非。

ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
11#
发布于:2016-10-01 09:16
你这个是神经网络翻译?链接在哪儿我看看。不是的、像http://translate.google.cn这种就不要拿上来了

前面说得很清楚,是在谈谷歌神经网络翻译的中译英准确率,根本还没上线,与此无关的免谈
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
12#
发布于:2016-10-01 22:50
嗯,不过有两个问题:

1) 我还是没在网页版上明确看到GNMT字样明示,表明当前上线版本就是GNMT版

2) 你自己输的那些例句,多数是非常成语化、文学化的单音节词居多的歌词,这个确实很难为谷歌,你要知道当前的人工智能还没有先进到能明确分辨很多转义功能过强的单音节汉语词在不同场合下语义差别的程度:

i) 像“挑”,挑选的挑(由“拣”之近义引申为表“筛选”)与挑挑(挑担)的挑(表“承受”),含义无疑是不同的,谷歌并没有聪明到能把“挑担”这一动词的未完成体现在时(或:现在进行时)在前后两个音节中间的位置插入体助词“着”的“挑着担”的形式当作“挑担”的一个变位而不是将“挑着担”的“挑”单独拎出来理解为“拣”的意思的程度。

ii) 类似地,在日常生活用语中,“起来”一词通常作为状补来用(除了父母叫孩子起床时说“起来!”等场合),一般地,除了歌词等极少数场合会将“起来”前不加动词(像“站起来”to stand UP、“拾/拣起来”to pick UP这种)而单用作独立动词,谷歌还没有聪明到对你的这些歌词体文本以及一些文言文等单音节词过多的文本有极高理解力的程度

iii) 像“大法”这种词都是非常偏门的生造词,通常在词库里只会和一些约定俗成的前缀构成专有名词,例如吸星大法、乃至氵去车仑大法等等,在当前词库中如果找不到其带上述这类前缀的匹配的情况下,单独出现一个你临时生造和拼凑的新词,以当前的技术,要让processor理解,确实勉为其难了

此行将启动中加总理年度对话机制,与加拿大总理杜鲁多举行两国总理首次年度对话。

像这种新闻体文本,它的翻译准确率为什么比你那些一大堆与日常生活明显脱离的高度浓缩的单音节词占多数的歌词体、乃至诗词体的文言文形式的文本的翻译准确率高得多?看看下面我给的例子就知道了:

1) 他不想担这个责。
谷译:He did not want to take the blame.

2) 他不想承担这个责任。
谷译:He did not want to take on that responsibility.

你现在知道对于现阶段仍较初级的人工智能而言,多选长词、双音节以上歧义性小的语义明确的词让它译的重要性了吧?呵呵

当然你可能会失望:非得用这么中规中矩的标准双音节词它才能理解,那我还要这破玩意何用?白痴也知道“承担”和“责任”在此处分别是take on和responsibility啊,它在词库里一搜,搜到后进行简单代入,这不是傻瓜都会么?根本没语义分析能力分析出我单单输入一个“责”在此语境下是“责任”而不是“责怪”的意思,那它还算什么人工智能?

---
不,它其实比你想象的要聪明些。并不是只懂得简单代入操作的。

例如,你试着对比输入下面两组:

2) 他不想承担这个责任。
谷译:He did not want to take on that responsibility.

2) 他不想承担这个风险。
谷译:He did not want to take the risk.

这说明,谷歌翻译机已有能力在词块不连续(中间隔了指示代词“这个”)的条件下,“意识”到与responsibility相搭配的“承担”一词需译作take on,而与risk相搭配的“承担”一词却只需译作take就行。这个其实已经是非常了不起的高智能了。在游离语块间要能做到这种隔空感应。在技术上需要有很大的飞跃,不仅需要有基于“正则表达式”(regular expression)的模糊匹配技术的配合,而且甚至也可能已经要求机器要有“自进化学习”能力,能从一些已有的corpus中提炼出这种基于不同语境的差异化对译能力
[ask于2016-10-02 00:16编辑了帖子]
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
13#
发布于:2016-10-23 19:18
http://m.weibo.cn/single?id=4033783289702805

重大利好:【速记员要失业:微软语音识别错误率已低于人类】
微软经过训练的神经网络已可以像人工一样识别人类语音。微软让NIST 2000系统与专业速记员进行了比赛。结果显示,自动化系统的错误率首次低于人工。今年早些时候,百度研究院宣布,百度Deep Speech 2的语音速记速度比人工打字快3倍。

原文出处:
http://finance.sina.cn/usstock/mggd/2016-10-23/detail-ifxwztrt0195413.d.html?wm=3049_0015
微软语音识别错率已低于人类
2016-10-23 16:40 新浪财经
...
在周一发布的报告中,微软让NIST 2000自动化系统与专业速记员进行了比赛。结果显示,自动化系统的错误率首次低于人工。报告称:“这是会话语音领域首次报告的(自动化系统)达到人工水平。”
...

------
这其实意味着,今后随着人工智能语音识别技术的推进,你再也不用愁找不到某些稀有语言的免费在线听力文本了,因为你将拥有一套由微软等高科技巨头自主研发的transcriptors,将所有不带文本的在线小语种(特别是稀有语言像爱沙尼亚语维洛方言võro kiilʼ视频新闻或者伊纳里萨米语anarâškielâ视频新闻这种)新闻音视频直接转录为文字,用于相关语言的听力练习,而无须再费劲去找那些带转录脚本的网站来训练稀有语言的听力和口语
[ask于2016-10-23 19:56编辑了帖子]
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
14#
发布于:2016-11-23 15:58
YLE Uutiset上居然也有带文字的北萨音频新闻,意外:

http://yle.fi/uutiset/osasto/sapmi/da_illuda_nuortalasvalggaid_vuoiti_tanja_sanila/7511924
Dá illuda nuortalašválggaid vuoiti Tanja Sanila!

http://areena.yle.fi/1-3783931
Dearvva!(北萨米语) Tiõrv!(斯科特萨米语) Tiervâ!(伊纳里萨米语)

http://yle.fi/radio/ylesapmi/suora
YLE Sámi Radio

http://www.samediggi.fi/nuorat/index.php?option=com_content&view=article&id=1%3Atervetuloa&lang=sms
ask
ask
白银十字骑士
白银十字骑士
  • 社区居民
  • 忠实会员
15#
发布于:2016-12-04 16:16
看了这个,真是忍不住了:能把kellegagi läbi saada(=tulla toimeen jonkun kanssa)“译”成这样,也算是“高”,实在是“高”得无语

你不知道läbi saada和tulla toimeen不能按字面来译,“译”成saada läpi jonkun kanssa也就算了,直接给你个saada就完事了,这叫哪门子的翻译?人工智能还有很长的路要走
[ask于2016-12-04 16:36编辑了帖子]
游客

返回顶部