随时随地能够掏出手机自学英语的确大大方便了英语学习者,但人工智能真的能替代真人老师吗?
图片来源:视觉中国
我第一次知道“英语流利说”,是三个月前在地铁站里看到他们的广告海报。
“我的老师非人类
AI大数据深度了解
个性化学习效率高”
广告语非常抓人眼球,但我在心里默默吐槽,目前人工智能能做到较为精准的语音识别不假,但怎么可能能够教英语呢?麦肯锡全球研究所于2016年发表的一项研究告诉我们,现有技术最难实现自动化的工作内容包括管理和发展他人(9%的自动化潜力),决策、计划或创意工作(18%的自动化潜力)或者与客户、供应商等其他利益相关方的交流(20%的自动化潜力),这意味着,教书育人的可自动化程度较低,说现在选择去当老师是规避未来失业风险的最佳手段之一也不为过。
但前阵子读了同事王付娇关于英语流利说的报道之后,我意识到“AI英语教学”可能不仅仅只是一个噱头。
英语流利说是一家上海的创业公司,其目标是通过人工智能为学员提供定制化的英语教学服务。每个注册用户首先需要做一个在线水平测试,系统会根据测试结果自动匹配相关课程。用户在APP中跟读、朗读、完成听力或语法练习,这些资料将进入英语流利说的语料库中。在千万次的调试和算法优化后,课程内容将越来越匹配用户的水平,从而更有针对性地进行训练,提高用户的英语水平。
截至2017年9月,“英语流利说”APP已有超过5000万注册用户。英国文化教育协会语言测评研发部的负责人Barry O’Sullivan教授评价其为“这是我在过去20年间所见到的语音自动评分领域最重大的突破,在语言测评领域有着巨大的潜在应用价值”。
真有那么厉害?我决定试试。
下载了APP,完成注册后,系统会首先要求用户完成一个据称5分钟就能得知你真实英语水平的测试。测试题是以“看图说话”的形式进行的,图片展示的是场景,测试者会看着图片听一段对话或独白,然后做完形填空(考察语法和词汇)、选择题(考察听力)和复述跟读(考察听力与口语发音)。
最开始做的一组题非常简单,我一边漫不经心地做着题,一边想着一会去哪里吃晚饭。渐渐地,我发现题目的难度在逐渐增加,我需要更加专心地听录音,更仔细地审题,复述出更长的句子……一个又一个5分钟过去,已经饿得无法集中注意力的我不禁在心里哀嚎,怎么还没有结束呀。
终于测试结束,系统立刻就显示了结果:Level 5中级,相当于托福78-101分、雅思6-7分、四六级450-500分。我忍不住对着手机屏幕翻了一个大大的白眼,拜托,你告诉一个托福112分、在某对标常青藤的美西大学以全A成绩获得硕士学位的海归她的英语只有中级水平,开什么玩笑!?
在采访英语流利说联合创始人兼首席科学家林晖时,我仍然为我的测试结果忿忿不平。“我们的教学产品其实跟测试的形式有点像,但是测试的目的跟教学不一样,需要在短期测试出你的水平,我们叫它自适应测试。我们的算法根据前面测试的情况调整后面的难度,所以英语水平低的用户5分钟就可以完成测试,水平高的用户要花上一些时间。”林晖告诉我。
林晖表示,语言测试是一个非常专业的领域,而市面上流行的各种英语测试(比如大家熟知的托福、雅思和四六级)都所侧重。如果说托福针对的是英语水平较高的群体,那么英语流利说针对的更多就是英语初级或中级学习者,因此测试更多考察的是输入型知识而非输出型知识。英语流利说目前一共分为8个等级,据林晖估计,90%的中国英语学习者处于“入门”级(Level 1)和“基础”级(Level 2),相当于欧洲语言共同框架(CEFR)中的A1级和A2级,他们也正是英语流利说最大的用户群体。
在测试结束、得知评级结果后,系统会根据用户的水平匹配教学产品“懂你英语”。“懂你英语”是英语流利说APP内的付费课程,30天的课程收费为99元。林晖介绍说,教学产品的形式类同测试形式,完全依靠人工智能的算法实现交互性教学,比如跟图读单词,“AI导师”会给予及时的反馈,“通过听觉、视觉的多模态输入调动你的积极性,以及加入一些游戏化的元素”。
林晖甚至自信地表示,只有人工智能才能做到真正的个性化教学:“对于人工智能而言,算法做好后,就是输入和输出,输入就是每个学生的具体情况,输出就是这个时候应该做出怎样的反应。市面上所谓的一对一英语教学,其实不是定制的,鉴于老师的备课精力不够,教学内容很多时候没有根据学生的学习状况作出调整,但机器可以不断学习不断纠正。”
但英语要怎么教这件事,当然不可能是人工智能自己就能发明出来的。英语流利说的首席学术顾问和“懂你英语”的主要作者是Lance Knowles,他在英语教学领域有超过35年的经验,也是移动端系统课程设计的先行者。“(Lance Knowles)强调听和说的重要性,不是上来就教词汇和语法,而是培养语言分块的能力。英语级别比较低的人语言分块能力比较弱,级别高的人处理语块能力比较强。人工智能系统能够训练你处理语块的能力,训练你对于时序的紧张感,所以我们的课程里是看图、听声音,没有文字。”林晖说。
做完采访后,我正式开始了英语流利说付费课程的体验。每一个级别共有三个单元的课程,每个单元有四张卡片,每张卡片共有6节课,包括听力(Listening)、词汇(Vocabulary)、对话(Dialogue)及对应的三个游戏模块。同游戏升级打怪一般,每答对一道题,用户可以积累金币,金币的数量对应每节课的得星数量,只有前一张卡片每节课至少获得一颗星,第二天才可以解锁下一张卡片。英语流利说对用户的要求是每天至少学习30分钟,每周至少学习5天。系统会实时统计数据,告诉用户当下的学习进展和技能水平。
课程的展开形式的确和测试很像。以旨在扩充用户词汇量的“词汇”课为例,系统会首先显示单词,然后以图说的形式给出包括这个新词在内的若干个例句,然后出完形填空、跟读句子、选择题、听读句子等题目来巩固用户对新词的理解和应用。在完成听力、词汇和对话课后,三个游戏模块基本上就是帮助用户复习学习过的内容,之前听过的段落会对话会反复出现,以各种题型加深用户的记忆。
因为课程中出现的新词都是我熟知的词汇,所以我没有什么在学习新知识的感觉,但可以想象初级用户在刚开始学习“懂你英语”的时候会不适应——既不出现文字,也没有中文注释,完全要依靠听觉、视觉和联想能力来在具体语境下加深对新词汇的印象,然后通过朗读和听读验证学习效果,这的确和我们习以为常的英语课太不一样了。但我也确实在学习过程中发现了自己的薄弱环节:有些时候我会在听读的时候没能做到完整准确地说出句子,问题往往出现在丢失了某个介词,这实际上是反映了我的语法熟练程度不够。在系统数据统计中,语法也的确是我得分最低的部分。
为了弥补纯线上课程缺乏真实互动感的问题,英语流利说设置了微信群制度,由真人员工担任“班主任”,每日在微信群里指导用户音标、语法和纠音练习,并定期召开线上班会,集中回答用户在一段时间内的学习疑问。用户也可以给班主任发私信,寻求一对一的帮助。不过在知道我的“班主任”带着8个班级近800位学生,每天会被学生的各种问题狂轰滥炸时,我不禁为她心疼三秒钟。另外,用户被要求组队建群,每日在群中发当天课程完成30分钟以上的截图。如果全队成员在一段时间内都保持良好的记录,将获得特殊课程免费的奖励。
这其实是我第一次加入所谓的“微信打卡群”。老实说,以前我一直对所谓的“打卡”嗤之以鼻,但两周下来我发现这种peer pressure确实有助于督促自己每天学习。有个周末出去玩high了,忘记学习打卡,我还真的产生了负疚感,即使和打卡群的另外两个小伙伴素不相识,不过是“打卡之交”。
据了解,英语流利说已经拥有全球最大的中国人英语语音数据库,且该数据库通过用户的不断使用仍在积累大量数据。“数据提高人工智能,人工智能又推进产品改进,形成正向循环的闭环。”林晖说。目前的用户数据显示,AI英语教学是有效果的,付费用户提升一个级别平均需要36.5个小时。林晖曾经把一个用户的语音拿来做过对比,听了以后起了鸡皮疙瘩,“三到四个月的时间就可以很明显感觉到有提升,特别是在发音层面。”
在我不太满意的测试缺乏对输出型知识的考察方面,林晖表示目前英语流利说掌握的技术已经可以模拟真人对话。在采访中,他向我展示了一款刚刚上线的对话游戏产品。在这款产品中,人工智能扮演的是一个在酒吧里以打翻酒杯为由找我搭讪的男生,会根据我的即时反映迅速“接话头”,虽然回过头去看,人工智能给出的回应比较百搭,似乎怎样都能把对话朝它既定的方向进行下去。
AI:“Oops, sorry, I didn’t mean it! Would you like another drink?” (啊呀对不起,我不是故意的。你想要再来一杯么?)
我:“No thanks. I’m allergic to alcohol so I can’t drink at all.”(不谢谢,我对酒精过敏,所以我完全不能喝酒。)
AI:“Please, I insist. Give me a chance to make up to you. By the way, I’m a psychologist, let’s see what kind of person you are. So tell me, Bloody Mary or Gin? Which one would you like?”(拜托,来嘛,给我个机会补偿你。话说我其实是一个心理学家,让我们来看看你是个怎样的人吧。告诉我,血腥玛丽和琴酒,你想要哪个?)
我:“Bloody Mary, please.”(请给我血腥玛丽吧。)
AI:“Cool! Then you must be very creative. I haven’t introduced myself yet. You can call me Leo. I live in a very typical American family. Actually here is a picture of my dad, my brothers and me. Who do you think is the most handsome among us?”(酷!你一定很有创意。对了我还没有介绍我自己。我叫Leo,我来自一个非常典型的美国家庭。其实我带着一张我爸爸、我的兄弟们和我的合照。你觉得我们当中谁最帅?)
我:“Ben.”(Ben最帅。)
AI:“Yeah, he is kind of cute.”(是啊,他是挺可爱的。)
在人工智能能够模拟真实对话后,人类老师是否就会被取代了?林晖的回答是,虽然人工智能在知识传递上有很大的优势,未来甚至可以实现明星语音教学来弥补情感交流,但教学中那剩下的10%——人文关怀、创造力和同理心——人工智能是无法做到的。“我对人工智能的理解是,不一定要做人机交流才是人工智能,能够帮助人类进一步提升工作学习效率的就是人工智能。要实现真正意义的人机交互还没有那么快,目前在垂直领域可以做到,比如我们的产品。但要是你试图跟它聊点别的,还是算了,因为我们给它设定了范围。目前的这些产品还是享受了深度学习以及移动互联网数字化带来的红利,但是人工智能还有很长的路要走。”他说。
我必须得承认,我对“AI英语教学”有了改观。虽然回想到自己在中学时代学英语,我仍然觉得那时和同学结成搭档在课上表演英语对话、去老师办公室里背诵课文被老师纠正发音、完成英语演讲接受老师和同学的点评这些点滴经历是无可替代的宝贵财富,但随时随地能够掏出手机自学英语,在人工智能精准的语音识别下能够迅速找到欠缺之处加以强化练习,的确大大方便了英语学习者。
但从另外一方面来说,人工智能严格遵照规则行事的特性决定了它注定缺少人际交流间特有的灵活度。这一点在发音评测中最为明显,我发现系统经常无法识别讲话中的介词,即使发音没有任何问题;只有一板一眼字正腔圆地念句子中的每一个词,系统才会显示发音完全正确。另外,系统对重音和语气语调也缺乏区分度,只要有一点点和原音不一样,就没法拿高分。但在现实生活中,这样的问题不会成为判断一个人英语好不好或影响交流质量的决定性因素。自从开始用英语流利说APP后,每当遇到英语采访我都会特别留心对方是怎么说的。以英语为母语的采访对象有时也会犯简单的语法错误,每当这个时候我就不禁暗想,如果是AI导师,会给这句话打80分、90分还是95呢?它又会如何给对方评级呢?
当然这不是人工智能的问题,它的存在意义,就是帮助用户尽可能准确掌握英语的语言规则。很大程度上来说,英语流利说这样的英语学习APP甚至能在普及英语上扮演重要角色,想想看吧,每个月花三杯星巴克的钱,就能跟着发音纯正、能随时根据你的情况调整课程难度的AI导师学英语了,这比市面上动辄上万的英语培训划算多了。
(实习记者王九宁对本文亦有贡献。)