为了读懂你,AI究竟有多努力?

访客4年前黑客文章716

为了读懂人类语言表达的意思以及捕捉文字背后的情感,人工智能的对话系统都进行了哪些改进与发展呢?本文将以此为题展开分析说明。

为了读懂你,AI究竟有多努力?

今天我们不聊算法,也不聊数学,写一篇人人都能看懂的小学生作文。

01

1966年,来自麻省理工学院的计算机科学家Joseph Weizenbaum发布了一款名为“ELIZA”的聊天机器人。Eliza 的知识范围有限,只能和特定领域的人聊天。但是在Eliza 刚出现时,很多用户认为他们是在和真人对话。注意看以下这段对话:

为了读懂你,AI究竟有多努力?

‍从以上对话来看,很难不被认为是一名已婚妇女在向她的心理医生大吐苦水,没有人会认为这是一次人机交互的对话。但实际上,ELIZA并没有尝试去理解用户的输入是什么意思。

如果你细心看对话的内容你会发现,ELIZA经常在复述用户说过的单词。它的实现方式很聪明,主要是采用一种“将计就计”的策略,将用户的陈述重新表达为问题并返回给用户。

尽管这些对话都是通过规则匹配方式实现的,但是一些巧妙的关键词提取可以让它比较自然地接话,让用户觉得眼前的这个“人”具有共情能力。ELIZA甚至被用来假冒过心理医生,并且有许多和它对话过的人都不相信这只是一个程序。

在我看来,虽然ELIZA只是浑水摸鱼,重复叙述者所说的内容,但是它的出现,对后续聊天机器人的设计思路有很大的启发。通过规则匹配不能让机器人很好地引导交互对话,但是却能够满足任务式对话的需要。

时间来到了1995年,一名叫Richard S. Wallace的科学家观察到一个现象。他发现组成人们日常谈话主题的句子不过几千句,如果他做一个对话机器人,想要覆盖所有的日常用语,甚至包括一些不常用的话语,大概只需要4万个回答就足够了。只要将这些问答结果全部输入到程序中,那么它就可以回应95%以上的日常对话了。

说干就干, 于是诞生了一款名为“ALICE”的聊天机器人。我们看看这款机器人的对话过程:

为了读懂你,AI究竟有多努力?

这次的对话就更加像是两个真人之间的交流了,而且也看不到ALICE在复述对话者的内容,而是尝试与之交谈,甚至在言语中透露出一点小个性出来。

ALICE就像是ELIZA的加强版,使用更大的语料库,使用更先进的关键词匹配技术,甚至是好几个答案对应一个问题,可以随机显示或者根据逻辑判断,选出合适的答案。这样就显得回答不会那么死板,更像是真人之间的交流。实现思路虽然很简单,但这种方式已经能够满足大多数任务型对话的场景。

自从苹果公司在2011年发布Siri以后,多个智能个人助理(IPA)出现并且进入市场,比如谷歌助手、微软的Cortana以及亚马逊的Alexa等等。

除了物料库、匹配逻辑的进一步升级以外,这类个人助理还可以访问手机里的多个数据源,如音乐、电影、日历、电子邮箱和个人资料。因此它们可以提供不同场景下的大量服务,例如播放音乐、查天气、拨打 *** 、发短信等等,都是这类IPA的基操。

为了读懂你,AI究竟有多努力?

虽然以上对话看起来已经很智能了,但总觉得差了点什么。Siri仅仅是在接收指令,然后给出反馈,其实也没有理解我们在说什么,甚至很难去分析我们的要求。

当我询问Siri最近有什么好看的电影时,它没办法直接回答,只能根据我的问题到网路上检索然后反馈结果。虽然这种交互已经能够满足我们日常大部分任务式对话,但是距离我们所想的“智能”好像还是有一些距离。

02

为什么让机器理解语言这么难?主要是因为以下两方面的原因:

1.一方面是因为语言的规律错综复杂,不是用简单的统计就可以计算出概率的。不同的语言之间语法结构不用,并且同一种语言对于同一个意思有不同的表达方式,同一个表达也可能有不同的理解。我们去建立一个语料库相当于重新为人类语言建立一个百科全书,工作量十分巨大;

2.另一个方面的原因是使用语言有特定的语境。语言是在特定的环境中,为了生活的需要而产生的,所以特定的环境必然会在语言上打上特定的烙印。

例如“百度”原本是一家企业的名字,但是经过该企业的市场教育后,大家想说“搜索一下”时,很自然就说成了“百度一下”。这时候这个名词就赋予了一个新的特定动作,这些都是让计算机难以理解的表达方式。

相关文章

没有人愿意用你的产品,你该怎么办?

没有人愿意用你的产品,你该怎么办?

产品经理关于产品的烦恼可能有很多,但是最致命的一点可能就是——没有人愿意用你的产品了。这就相当于你努力了半天,结果用户看都不看一眼,连知道为什么不行的机会都没有。那么产品经理到底该怎么办,才能解决这个...

莫被互联网家装套路,家装新进化另有他路

莫被互联网家装套路,家装新进化另有他路

编辑导读:互联网家装是家装行业现代化的必经进程,可是一昧的吹捧互联网家装是不行取的,家装新进化才是家装行业发明的将来偏向。本文作者对此展开了阐明和接头,我们一起来看一下。 互联网家装的最终失利并没有...

腾讯上线“智慧零售”,体验并不“智慧”

腾讯上线“智慧零售”,体验并不“智慧”

前端时间,微信在腾讯服务中上线了“智慧零售”小程序,笔者在一番体验与操作后,发现这个小程序不仅不太“智慧”的亚子,甚至有些“反智”。 “前段时间刷朋友圈,看到了一条腾讯智慧零售的广告,带着疑问点了进...

滴滴入局「同城货运」,能否改变货运市场乱象?

滴滴入局「同城货运」,能否改变货运市场乱象?

在今朝的货运市场,存在着乱收费、客户体验欠好等现象,滴滴入局同城货运,会给这个行业带来什么变革呢?本文将从四个方面举办阐明,但愿对你有辅佐。 想写这篇文章主要有2个配景,第一个配景是因为最近装修需要...

B站《后浪》、《乐队的夏天》、李佳琦出圈的背后,是先「入圈」

B站《后浪》、《乐队的夏天》、李佳琦出圈的背后,是先「入圈」

五四青年节,哔哩哔哩(B站)宣布了一个“献给新一代的演讲”视频——《后浪》。 跟着在《新闻联播》前播放,各主流媒体的转载,《后浪》一连在各大媒体、各自媒体平台、小我私家伴侣圈发酵。“后浪”也成为网络...

免费阅读会是昙花一现吗?

免费阅读会是昙花一现吗?

2020年,受到疫情影响,家家户户闭门不出,各大互联网公司为了帮助大家消磨时间,可以说是操碎了心。视频、游戏、在线办公、在线教育、直播、电视……等等以内容为主的行业,纷纷受到资本的青睐,获得超高的日活...