P7七月上线全新AI声音,真的更像真人?

头像vip
智能座舱老司机
G3P7
07-27 15:16 · 带你玩溜智能座舱

本文转载自懂车帝
原创:潘梓春
原标题:《解析 | P7七月上线全新AI声音,八问小鹏产品团队:真的更像真人吗?》

小鹏Xmart OS车载智能系统中的智能语音助手小P即将通过OTA获得一款全新AI声音,预计将于7月通过整车OTA首先搭载在小鹏P7上,并适用于小鹏P7全系车型。

据悉,新声音采用了“全新一代超大规模在线神经网络引擎+小型离线拼接引擎”的技术组合。根据国际通用语音质量评测方法MOS评测,在满分5分情况下,小P全新AI声音得分高达4.49分,是目前微软MOS语音质量评测得分最高的车载智能语音助手。

简单来说,就是小P说话变得“更像人了”。过去,车主可能觉得小P的声音不够好听,于是小鹏团队给它换了一个更好听的声带。而如何把这个声带安装在“人”或者车上面,是一项复杂度至少能媲美外科手术的工作,有非常大量的工作要去适配和调整。

懂车帝了解到,小鹏的产品团队对这个新声音有三个要求:
1. 声音一定要足够清晰且像真人,这就对音质、声音的清晰度,以及发音的自然度有非常高的要求。
2. 对小P的角色定位:希望它是一个在所有车型中能做到最好的秘书或助理。
3. 希望小P既能够非常自信地向你传递我能帮你做什么,而且我能回应你的诉求。与此同时,还能够很清晰地帮用户拉近距离,有一定的亲切感。

关于实际使用过程中有可能会遇到的问题,以及用户对于“新小P”的好奇,懂车帝也问了问小鹏AI产品高级专家郝超和AI产品专家陈思云。

Q:老款G3和新款G3i上可以实现吗?

A:车型规划这一块,首先P7上新声音都是全量发布的状态,其它车型还是跟着我们的规划走,后面还是以具体车型规划相关的信息公布为准。

Q:网络对小P的服务有影响吗?

A:如果遇到网络不好的情况,我们会做大量的工作让网络不好的环境下声音的质量不变差。在线的可以理解为一个情绪饱满、生龙活虎,或者一个温柔的人;离线的话,可能就有点不在情绪,或有点没有那么生动的感觉,但还是那个人,还是会有一些差异。

我们现在能做到的是97%以上的声音是非常好的声音(应该是最好的声音),个别断网的情况,且这个声音可能之前比较特殊没有做过太多的训练和处理,也许它音质会有一些下降,会变得像以前一样有一个机械音。其实不是以前的声音,只是现有声音降级到一个偏机械的版本。

举个例子,用户如果在高速上过一个5公里长的隧道,但这个隧道里其实是有一个岔路口需要语音播报。但这么长时间里没有网络,小P很难去预测这么长段的内容,提前进行优质声音埋入,这种情况下可能会出现一句离线的播报,这时候声音会降级的有一些机械感。

我们经过比较长时间的路测之后,大概只有1%或2%的比例才会出现这种情况。可能开一个月的车,会听到一两句话降级到机器声音的感觉。

Q:小鹏和Siri谁的MOS评分高?

A:欢迎大家拿到车机之后,可以问手机上的Siri,再问一下小P,我相信大家能明确感知到哪个更好,你可以拿任意一个手机上的语音助手或看到任何一个产品去对比,看哪个更好,我们对产品上还是有比较强的信心的。

Q:小P会调侃用户吗?它说话也有语气吗?

A:会有一些轻重缓急,比如在一些特殊的场景下,有的话术可能在第一次提示你和第二次提示你的时候,它会有一些语气上的轻重缓急,这个是会有的。

但是在目前的这个版本上面,其实更多的还有赖于用户发现的,因为我们并没有对全量的语气做训练,它更多的是在部分情况下像彩蛋一样的埋在我们的系统里。

我们能够做到的是同样的文字、同样的话我们用不同的语气、不同的速度、不同的感染力、不同的音调、不同的顿挫去说。

比如说我举个例子,我们在车机上有多种的脱手警告的,话术稍有不同。比方说我第一次预警语气带一点点严厉,下次是非常严厉。但这个只是说我们做了一个能力的预埋,具体功能实现其实还是靠我们未来长期的规划。

Q:以后小P可以选择男生或者女生的声音吗?

A:我们全新AI声音会更新到车上,但是现有的小P的声音也还在,用户也可以根据自己的习惯去选择保持即有的用户习惯。

多音色或者说其他的个性化,目前暂时是没有这块的计划。我们核心还是当前以我们新上的这个声音为主。

Q:我可以录入我家孩子的声音、录入女朋友的声音吗?

A:如果我们让这个小P又是你孩子的声音,又是你爱人的声音,或者又是你朋友的声音,它能这样去变化声音,那么你对它这个AI的认知可能会有一些变化。大家到底愿不愿意,或者说在车里自己孤独的环境下有一个自己特别熟悉的声音、亲人的声音出来,会不会是一个好的体验,这个其实我们也在探索和思考当中。

总之,我们核心还是希望我们的小P它偏向于有自己独立的一套个性、人格,我们也在思考这个问题,但没有确切答案,只是我们的一些思考。


Q:这次更新的新语音助手,语速还是那么慢吗?

A:语速重口难调。我们也做过一些内部小调研,我们的语速其实不是偏慢的,会比一般正常模型语速、或一般车企比稍微快那么一点点,非常轻微,几乎用户感觉不到,这是我们调研的结果。

我们认为快一点点,即能提高一点点自然度,反而用户也会觉得比较舒适。语速快了一点点之后,对原来机械模型来说,反而用户会觉得好像比以前自然了一点点,有可能是因为停顿的感觉变弱了,这是一个小的细节。

在快一点点的情况下你还是会觉得声音比较罗嗦的话,这种情况下更多是来自于在你不想听到它说话的时候它不能够更简单,在一些你没听清,比如导航的一些重要路口、路段,我们需要把语速放慢下来,这种来回的调整,其实是最合理的,也是更接近真人的状态。

Q:全新的语音系统可以操控智能辅助驾驶吗?

A:大家其实应该也已经试过语音变道的功能了,我们上一个版本已经发出来这样的功能了,用户也比较爱用,用“请帮忙我向右变道”、“向左变道”类似这样的方式可以实现语音和智能辅助驾驶的联动。

智能座舱老司机求关注

本文收录于话题:智能座舱-小P语音

点击了解更多智能座舱

imageimage
精彩留言 (5)
查看其它回答
  • 头像
    张彦生
    08-15 10:23

    都八月中了,更新了吗

  • 头像
    码头街扛把子
    08-04 00:08

    特别期待

  • 头像
    诚信519519
    07-29 22:48

    真的假的

  • 头像
    DYWONG
    P7
    07-28 17:33

    7月没几天了,快推送呀

  • 头像
    牛小朋
    P7P5Reserved
    07-28 12:34

    加油小鹏