首页 热点资讯 义务教育 高等教育 出国留学 考研考公
您的当前位置:首页正文

用日常对话的六项原则来进行VUI设计——让机器说人话

2024-12-18 来源:华拓网

用人类对话的六项原则改变语音用户界面的设计。

下一代的技术接口用更微妙的人类自然语言使我们超越了滑动、轻触和点击的固有局限性。图形用户界面(GUI)的设计技术和隐喻根本不适用于新的语音交互时代,新浪潮下的语音用户界面(VUI)设计必须基于我们首先学习且最了解的通信系统,即——对话。

对话是一个非常复杂但系统化的媒介,其定义原则远远比小学教育更加微妙和引人注目,比如"永远不要用'和'或'不要打断我'开始一个对话"。当我们与其他人交流时,我们把谈话的复杂性视为理所当然,这基本上已经是谈话的第二个性质了。但是当我们开始使用设备设计一个口语对话时,如果我们不了解真实且深入的交谈时怎么运作的,就无法做出好的用户体验。而由于声音是一个人社会身份的标记,所以赌风险尤其高:使用设计不佳的VUI用户觉得“愚蠢”、“笨拙”,让他们觉得自己被技术操纵了,下次就不会再去用了。但其实好的VUI不应该是这样的。

基于日常对话六项原则,不仅可以保证对话的顺利进行,而且将帮助VUI设计人员驾驭这个以人为本的UI新时代。


原则1:给你的VUI一个个性

你可能认为你的简单语音应用程序不需要个性,但这不是需不需要的问题。比较这两个日历应用程序,第一个应用是带有助理特性的,这不是真正意义上的“角色”,我们能不能完成操作全凭运气,而第二个应用是带有经过设计后的人物个性的。

(贴不过来视频,大家自己翻墙看)

不管你是否计划过,所有的声音都会投射成一个人物角色。假设没有将VUI当成是一个人物角色去设计,如上面第一个声音的例子,那么它在“友好”和“有帮助”这两个性属性上会总是显得很不足,同时让人感到很无聊。

由于几十万年的演变,我们人类无法用人格特征来评价语言,即使它时是一款智能手表或GPS系统。即使是最小的语音样本也会让人联想到说话人的性格,这不是个人意见而是一个事实,并且已经被像拉布夫这样的社会语言学家在1964年证明了。我们已经进化成为根据声音来总结人的专家。

在一项引人注目的研究(Giles&Powesland 1975)中,教师被要求根据三件事情对八名虚构学生进行评估:书面作品样本、照片和录音演讲样本。结果令人惊讶,由对话样本产生的有利印象超越了书面作品和照片的负面印象。相反,对学生言论的不良印象,会超越其他两个来源的有利印象。其他研究表明,我们依靠交谈来评价别人的友好、诚实、守信、智慧、教育水平、守时、慷慨、浪漫等品质,好的对话甚至享有“特权”,在一定情况下更容易被录取。总之:对话很强大!


原则2:获得进一步的对话

在日常的谈话中,有很多问题似乎都需要『是』或『否』的答案,但它们实际上是要求更多的信息。这里有两个例子:

你可能想知道为什么这些对话者看上去很不合作,这是因为他们打破了一个核心的谈话规则,叫做“量的准则”。根据会话行为的这个原则,所说的话应包含当时交谈所需要的信息,不应包含超出需要的信息。所以即使说话的人已经提出一个问题的字面意图,除非他们进一步丰富信息,否则这个对话是不会令人满意。在上面这两个例子中,我们不知道谁来参加聚会,也没有听到令人满意的理由。

同样的,这些说话的人让我们处于一个想要知道更多却未能获得答案的状态,虚拟助手也是如此。试着比较以下两种处理相同情况的方法,设想出现了一个让用户不太满意的价格波动的情况:

显然,第二个VUI的角色更更能干更讨人喜欢。但是,它不仅仅是一个有足够的社会智能来推动对话的助理,同时也是你的用户。这种本能不能被压制。这是一个用户尝试将对话深入的例子,就像他正在与某人交谈一样:

现在,如果识别语法被设计为仅仅期望数字,例如“两个”,那么该用户将会反复收到一些仅供参考的错误提示。如果这样的回应无法由识别器处理,那么就要考虑将对话拉回到正常交流的轨道,并轻松实现对话的重新排列,如“对不起,那有多少人?”(升调)。研究表明,在误判错误的情况下,用户通常只需要一个简单的反馈。没必要让机器用沉重的陈词滥调的行业术语来让用户关注到这个错误,例如"我很抱歉我不明白。请说出你聚会上的人数。你可以说,例如"二"。

总结:我们在设计会话流时要超越仅仅文字上的表达,试着去让您的VUI可以通过用户所提供的信息来回答有价值的答案以维持对话。另一个结论是,业界认为,“认知错误”实际上是我们人类盲目提供合作和信息的结果。


原则3:简短且相关

对话与写作不同,是存在时间链路的。一个人讲话的时间越长,他对听众施加的脑力负担就更多。在不给短期记忆不造成负担的前提下,我们精神上只能处理有限的信息。"说"通常被认为是积极且富有成效的,而"听"则是一种“被动”技能。在现实生活中,听会涉及到很多工作。所以对你的VUI来说,时不时地让听众休息一下、说一说,也是重要的方面。比较这两个例子,第一个VUI用话将听众淹没了,而第二个则更简洁:

不像写作的“永久性”,对话是短暂的,转瞬即逝。语音信号也是线性的,从而使得VUI中的不相关信息特别令人讨厌,因为与GUI不同,没有办法去掉材料。迫使用户艰难地使用设计不善的VUI是在浪费用户的宝贵时间。我认为无关紧要的对话是人们不喜欢客户服务应用程序的首要原因。许多VUI设计师和开发人员以促销信息、增销和提供指示的形式将无关的信息传递给公众。您无疑熟悉类似“输入您的十位电话号码,从区号开始”这种明显引导。

用户的利益感是关键,人们不喜欢花费额外的时间就能轻松地找到东西或完成任务。研究表明,在完成相同任务时,如果VUI相比较于其他替代方法无法展现其明显的优势,用户将不会选择使用。毕竟那又有什么意义呢?因此,成功的VUI设计提供了在相关性和便利性上的优势。

总结:确保信息简短有力。让用户有机会说话。除非用户能够获得明显的好处,否则不要深入到很细节的地方去。


原则4:利用上下文

要相关,我们必须遵循上下文:一个好的对话参与者会跟踪对话,记住之前的转折和交流,并了解对方的处境 。例如,他们在国外时路上遇到一场严重的风暴,或者他们今天已经尝试过三次,使某些设置发生了变化。

同样,VUI设计也应充分利用用户的上下文。如果用户将他们的信息委托给界面,那么界面应该基于已经做了的事、已经了解的内容以及之前在对话框中说过的内容来进行响应。明显的失败将会严重地破坏智能助手的判断。一个众所周知的不为人们所喜欢的例子是:VUI的要求“当菜单选项有新变化时请仔细听。”这是另一个版本:

这种类型的信息,是我称之为“媚俗的VUI”的一种类型的核心,因为它会忽略用户的上下文,所以它是不受欢迎的。只要想想它乐意承认的所有假设,它假定用户之前已经呼叫,假设已经呼叫的用户听到了不同的“选项,其实,用户在几分钟前就已经挂电话了。它经常认为“最近”是指“几个月前”,它假设用户把听到不同的选项都记住了!因为提示忽略了用户的上下文,所以最终提供的信息几乎与所听到的每个人无关。目前,我们已经谈到了在VUI的世界,什么样的对话以及为什么不相关的对话进行起来感觉就像惩罚。

结论:我们在这个行业中经常谈到个性化、人工智能和数据驱动创新。但是,简单地跟踪对话并继续“感知”用户的处境的设计将有效地提高对人类智能的看法


原则5:通过单词顺序和压力引导用户的注意力

VUI对所说的内容的理解程度对于决定如何构建个人消息的结构是至关重要的。否则,如果不能“继续跟踪”,就会给听众的理解过程带来负担,并造成信息模糊的不适感。听听下面这两个关于回应同一个用户请求的不同的VUI的回答:在一个不存在的日期上预订航班。

为什么第一个录音听起来很奇怪像机器人,而第二个录音听起来很自然?解释就是末尾焦点原则。根据这个对话规则,简单来说,用户在使用语言时对于如何在话语中排列信息有着无意识的期望。默认情况下,“新”信息处于或接近结尾并进行强调,“旧”信息一般放在“新”信息的前面。在第二个例子中,新信息是“30天”,所以感觉放在最后是正确的,并且适当地强调。第一个例子听起来很奇怪,旧的信息“六月”这个话题已经被误导了,就像是听众获取的新信息一样。为了听起来自然,不应该强调或放在句子的结尾。

句尾焦点的违规会导致在互动过程中产生过度的摩擦。但是,通过尊重用户对信息结构的期望,不仅在用户体验上更加直观,并且能够确认VUI准确听到了用户说的话。

这个例子表明,通过把旧的信息放在首位(“印度的总理”),用户马上就知道识别器听到的是“印度的总理”,而不是说“意大利的总理”,在这种情况下就不需要注意接下来的名称了。

结论:利用用户对单词顺序和压力放置的期望,将他们的注意力集中在重要的位置上。除非你的VUI的角色是基于星球大战中的尤达,否则尽可能将已知信息放在新的信息之前。


原则6:不用教,对话是直观的

我最讨厌的一种业余VUI设计的表现就是:“教”用户如何说话。这里有两个例子:

这些消息意味着你需要被教如何使用英语,否则,VUI将不会给你这些指示。这种风格的提示:“如果你想干某件事,就要说或做什么”,“如果你要得到某样东西,那就要说或者做什么”等是客户服务按键电话中应用程序的遗迹:“需要技术支持,请按1;付款和结算,请按2 ...“事实上,这些信息只有在触控的世界管用。那是因为没有人一长大就知道“1”是指“技术支持”;我们也不知道开发人员或设计者都分配给了那些按键什么含义。但在VUI的世界里,这种提示风格听起来就很荒唐。它揭示了一个无法解释的问题,向公众提供VUI的真正的好处是:对话是直观的,用户不需要被教。

试着把上面那个按键电话风格的提示和下面这个愉快的对话做比较...

很难想像,一个遇到困难的人会得到简单、直截了当的提示。如果这样做,你就会解决这个问题。我们已经谈到了简短,相关性和利用上下文。所以再次,只有在必要时才处理错误。

结论:避免在VUI中的“教学式命令”。如果你必须解释一个命令那就就出错了;请回过头来找找哪里出错了。试着用问一个清楚的问题来代替填鸭式灌输的命令,那是谈话,让用户也拥有发言权吧!

随着聊天机器人的进步、助手和应用程序的到来,我们现在有机会说:好的对话是成功的用户体验的关键。用“you're”代替"you are”,说“Oh” 和“Thanks”,或者引用关于冰淇淋的意见。对话是大自然中最伟大的杰作之一,也是我们最强大的通过声音进行交流的手段。人类自身的互动规则有着悠久的历史,如果我们不加以利用那无疑是愚蠢的。从技术上来说,第一步就是意识到对话的真正意义。

显示全文