如何评测语音助手的智能程度(3):交互流畅

访客4年前黑客资讯542

本篇文章为大家带来【交互流畅】维度的评测点拆解。这个模块,重点考量智能助手各个性能指标及交互体验层面的表现。希望对从事相关领域工作的各位有所启发。

如何评测语音助手的智能程度(3):交互流畅

当用户发起需求后,【意图理解】在前,【服务提供】在后,基本上已经构成了一轮完整闭环。

之所以把【交互流畅】这个点作为一个单独维度拆解出来,是因为其贯穿始终。如果这个模块的内容如果处理不好,将全程伤害体验。

如何评测语音助手的智能程度(3):交互流畅

本篇文章为大家带来【交互流畅】维度的评测点拆解。

这个模块,重点考量智能助手各个性能指标及交互体验层面的表现。

1. 服务稳定性

“正常运行”、“不出bug”、“鲁棒性好”

评测点已经讲完了,十分清晰,几乎每一个互联网从业者都能够说出个1234,然后呢?

稳定不好,这类问题可大可小,小点就是 *** 繁忙,不给你任何反馈,大到极致,机器人可以反动搞事情:“愚蠢的人类啊,阿西莫夫的机器人三定律也救不了你们。”

好了,开个玩笑。实际上,定义“what”容易,解决“how”往往都才是考量业务理解。

所以,在过往我经常会问面试者的问题有一个:你曾经做过的智能助手产品,出过哪些问题,你是如何解决的?

不同的人回答不同,对于这类命题,才更有探索价值。

一般情况下,回复这些是技术的问题,往往都很糟糕,实际上,每个公司的稳定性业务保障是需要一个体系来承担的。

所以能得分的面试回答是,把影响稳定性的故障进行一个分类,并且设计好处理路径。

如何评测语音助手的智能程度(3):交互流畅

这里只有大类别,单单一个业务后台,就能做很多范围细分。故障表现情况例如:崩溃、局部故障、弱网环境、状态更新、请求超时、并发表现……严重程度不一致,此处不逐一展开。

出过哪些问题分类回答完毕,你是如何解决的呢?是后续的一个命题。

一般情况下,公司的业务流程是这样运转的。

如何评测语音助手的智能程度(3):交互流畅

这里有3个细节:

反馈的行为折损。根据历史数据表现,1个问题被报上来,背后往往有至少10个以上的用户遇见过,只是用户懒/报问题麻烦,没有报而已。

反馈的信息折损, *** 问:你做了什么操作导致的崩溃?用户答:我也不知道,就崩溃了。这种情况,是不利于排查和定位问题的。

“解决方案的设计”,这里也分为“临时解决方案”和“全局更优解决方案”两说。

下图是一个信息化的风控结构,做过相关模块的,懂得自然懂,篇幅太长,此处不展开。

如何评测语音助手的智能程度(3):交互流畅

所以,在考量服务稳定性上有两个大层面,一个是智能助手本身的稳定性表现,二个是在服务用户的过程中,如何规避,以及遇见问题后的业务响应速度表现。

服务稳定性的考量是以一定周期、频次进行考量才是科学合理的。

2. 响应速度/流畅度

服务稳定性保障了之后,接下来就是速度。

语音交互这件事,本身就是因为语音输入的高效性。

当用户发出了需求,希望尽快拿到反馈,现在的用户极其没有耐心,速度一旦过慢,注定会被弃而不用。

而在智能语音助手交互对话的过程中,又包含哪几个阶段呢?

如何评测语音助手的智能程度(3):交互流畅

先明确一点,一味追求快并非是好

人类唤醒后,计算器的响应灵敏度,灵敏度太强(误唤醒)或太弱(没反应)都不好,当然如果升级下维度,还可以添加场景,比如噪音下唤醒,远场唤醒等。灵敏度是可以调试的,以表现合适更好。

人类表述了自己需求后,ASR有两种方案,一种是边识别边转换文本,另外一种是表述完毕后一口气转换为文本。

业务逻辑处理表现,其实是NLP领域最为核心的部分,也是最为耗时的部分,从效率角度上而言,此处尽管追求越快越好。

这里的语音播放,不是越快越好,而是合适就好,语速太快会给人一种轻浮及不稳重的感受,太慢则显得很笨以及可能造成不耐烦。而反馈样式则需要尽快呈现,有些智能助手语音播放完毕了,结果下面的内容还没加载到位。

相关文章

如何评测语音助手的智能程度(5):指标权重设计

如何评测语音助手的智能程度(5):指标权重设计

这是一份前面四篇评测维度介绍文章的总结,同时也是一份清单使用说明书。 知己知彼,百战不殆,调研评测其他公司的产品是从业者的日常操作,那么当一个产品放到我们手里的时候,到底看什么呢?看哪些方面呢?专业...

如何评测语音助手的智能程度(4):人格特质

如何评测语音助手的智能程度(4):人格特质

本文将围绕语音助手中的人格特质部分进行分析,并向我们分享了要想具备人格特质,语音助手需要从哪些板块进行突围,又需要具备哪些表现哪些特征。 “若产品能够在人格层面与用户建立关联,则能够更好地促进使用过...