随着AI科技完善,很多基础重复性的岗位将会消失,而 AI 翻译只是人工智能和人类博弈的冰山一角。
■ 题图来源于电影《翻译风波》( The Interpreter ) 剧照
今年8月,搜狗进行了在美 IPO。今天的搜狗已经不再局限于输入法和搜索的产品布局,而与百度站在了争夺人工智能的赛道上,其中,最惹人瞩目的就是 AI 翻译。
去年第三届世界互联网大会,搜狗首秀了 AI 黑科技——机器同传。此后,搜狗一发不可收拾,今年5月份全球机器智能峰会( GMIS 2017 )会上,搜狗“汪仔”与人工速记 PK 4:1完胜,让人热血沸腾;9月初,搜狗语音交互中心机器翻译团队斩获国际顶级比赛 WMT 双料冠军。( WMT 全称是 Workshop on Machine Translation,是由来自欧洲和美国的高校、研究机构的研究人员联合举办的业界公认的国际顶级机器翻译比赛之一。合伙君注)
CEO 王小川致员工内部信中,有着这样激动人心的描述:“已经没有人怀疑搜狗的生存问题了,唯一的悬念就是搜狗能否在搜索领域实现颠覆,能否在人工智能领域引领重大的创新。”
不少“外部人”看了信也热血澎湃,毕竟翻译领域人工成本高居不下,如果能用 AI 解决高成本问题,无疑劫走其中大部分的红利。
所以,AI 翻译是下一个创业的风口吗?笔者认为,现在时机尚不成熟。
首先,创业公司缺乏大规模参考数据。
Google 是较为典型的例子,产品用户数量推动产品多语言本地化,从而加大对于翻译高效、准确、低成本的需求,倒逼翻译产品的诞生。而AI翻译产品恰好能够解决这些痛点,产品与公司科技感使命的调性不谋而合。
从 AI 翻译本身来讲,AI 技术需要把海量的数据通过优良的算法,运用现代并联分布式计算出来。搜索功能提供用户行为数据,为人工智能提供了海量的价值数据。据相关资料显示,搜狗每日语音识别的 PV 是在2.6亿次,产生的语料规模是22万小时。
大数据无疑是难攻克的一个点,用户数据基本被中国互联网的几大巨头所吸引,互联网现阶段,难以出现航母级产品与之抗衡。
其次,技术难度较大。
一个 AI 翻译产品做到翻译精确至少需要攻破几个难题:形式端,拍译要攻克图像识别,同声翻译要攻克语音识别;内容端,攻克文本语言分析、大数据。而这些,都远没有达到 AI 的阶段,机器缺乏对视觉场景、听觉场景、自然语言处理的常识判断。
翻译行业本质上是一个人文行业,翻译讲究“信达雅”。以文本语义分析为例,需要解决三个问题:语料积累(字音、字形、语法等)、语境场景收集和副语言与文化背景。但是社会变化日新月异,调研人群和沟通客体都存在着不确定性,所以在文本语义分析方面存在着较大的失误和偏差。
再次,盈利模式不明。
类 AI 翻译产品(尚未有产品达到 AI 翻译)有两种模式,一种是以 Google、搜狗生产互联网形式产品,如 Google 翻译 APP 和搜狗 PC 端智能翻译入口,另一种是以科大讯飞生产的实体机。
现阶段,Google、搜狗基本免费向用户开放,依靠流量广告收益。作为实体机的后者,或许保留了一些创业空间。今年5月的中国国际大数据产业博览会上,科大讯飞旗下产品“讯飞听见智能会议系统”着实惊艳全场:机器同传的准确率达到了95%以上,且在展示视频里,可以切换奥巴马的翻译声音。据2017年科大讯飞年中财报显示:“旗下的晓译翻译机在报告期内销售近6万台”。
另一方面,新兴的实体翻译机也异军突起:北京分音塔科技的准儿翻译机在京东众筹预售,完成600%的用户抢购;双猴科技的“魔脑晓秘”融合谷歌、百度、讯飞、微软四大翻译引擎。这些都表明了智能翻译实体机作为可以作为 AI 翻译赛道上的试水产品。
9月19日,百度智能 WI-FI 翻译机在日本名古屋第16届机器翻译峰会上大放异彩,这是百度在语音识别技术上的一大突破。这款翻译机不仅可以翻译中、英、日多种语言,还自带80多个国家移动数据流量,为手机、电脑提供上网服务。这款翻译机为人类突破巴别塔之隔,又迈进了科学的一大步。
作为 AI 翻译的排头兵,百度 WI-FI 为首的实体翻译机可以极大降低人工翻译的成本,提高翻译效率。但是,翻译机也有很多局限性:如受众范围过窄,技术精准要求高……这些都会成为翻译机盈利的潜在风险。
如果说机器翻译与人工翻译是一场赛跑,翻译精准就是赛跑终点线。作为残酷的产品使用者,只要翻译精准,并不在乎翻译者是人还是机器。1919年,在审判德国的巴黎和会上,英法两国代表共计1000人目睹了“同声传译”的第一次亮相,“同声传译”作为高级精英职业形象深入人心。在无数小语种学生还在趋之若鹜的学习同声传译时,AI 翻译谋杀的风声便喧嚣尘上。国际化浪潮下的新兴职业,百年之后就变得危机四伏。
AI 颠覆人工的趋势并不是耸人听闻,高盛纽约交易员从600个缩减到2个,富士康6万名员工被4万个机器人所代替。正如李开复先生论断,随着AI科技完善,很多基础重复性的岗位将会消失,而 AI 翻译只是人工智能和人类博弈的冰山一角。
在《超智的哲学论述》中,牛津大学超人类学家尼克·波斯特洛姆计算预言:2020年,人工智能会达到人类智慧的10%;2040年,人工智能将达到人类智慧的50%;而到2075年,AI 将达到人类智慧的90%。那时,像 Lucy 一样的超智能体将会出现,人类会和自己亲手创造出的敌人博弈,Lucy 所要做的第一件事,就是把人工智能的人工二字抹去。