“小悠”与其他语音助手的技术代差,牵扯到多重领域多重因素。
首先自然是技术上的领先。
目前,他们已在原有架构上,融合了“端到端语音识别架构”。
即:将语音信号直接映射到文本,跳过传统HMM的“声学模型-语言模型”分步处理流程。
结合HMM-GMM混合模型的端侧部署,使得“小悠”的语意理解能力,远超传统算法构建的语音模型!
识别延迟降低40%,准确率提升至95%!
同时,通过自研的压缩算法,他们将混合模型参数,从100MB压缩至25MB,以适配微光S1等千元机。
也包括后续的微光2。
而三星的“S Vocie”,因模型笨重,仅能在旗舰机型运行。
其二,数据维度上的降维打击!
毫不夸张的说,“小悠”从诞生起,便站在“数据富矿”之上。
悠米社区、极光微博、微信等社交平台,日均10亿+的聊天消息、公开动态,以及往日沉淀的海量数据,构成了“千亿级真实语境训练集”!
海量数据的投喂,使得“小悠”。。
另一方面,口袋钱包的海量交易记录、星光手机的数千万用户使用日志,使得小悠能深度理解“生活服务类指令”。
此外,他们自研的“自适应学习率算法”,使得模型在训练过程中,能够根据数据特点,自动调节学习速度,大幅提升训练效率。
再结合“实时反馈迭代机制”,用户每次使用小悠的语音指令、纠错行为,都会实时同步至极光云。
形成“数据采集-模型训练-功能更新”的72小时闭环。
加之骄阳100算力卡的加持,模型迭代效率,至少是竞品的6~10倍!
其三,生态协同上的“天选优势”!
跟三星、苹果等硬件厂商不同,“小悠”背靠的极光,是一家互联网公司。
一家掌控着多款超级应用,以及庞大生态的互联网巨头!
而星光科技,又为其提供了一个完美的载体。
在开放“小悠”API接口之后,截止现在,除了极光自有产品外,已有527第三方应用接入。
其中58家,如饿了么、高德地图、宝宝树、下厨房等,完成了深度适配,可实现“语音指令-服务落地”。
例如,用户说“帮我找上次点的那家米线”。
“小悠”可跨应用关联历史订单、地理位置、用户评分等10个维度的数据,完成用户指令。
而其他语音助手,由于并未同第三方应用的接口深度打通,对第三方应用的支持,仅停留在基础调用层面。
至于为何各家互联网大厂,鲜少会深度适配第三方语音助手,原因很简单——不愿为他人做嫁衣。
语音交互的入口价值极高,谁都想要自己做。
此外,如企鹅、阿狸等大厂,掌握社交、电商等核心数据。
若深度适配第三方语音助手,可能会导致用户行为数据大规模流失。
更何况,大厂核心业务,多是基于单体架构,与语音助手的微服务架构,通常难以兼容。
这也是所有硬件厂商,普遍面临的难题。
而背靠极光生态的“小悠”,这种顾虑就要小多了。
虽同样很难接入,其他互联网大厂的应用,但光是极光系应用的无缝适配,便足以为“小悠”构建起一道,竞品无法复制的体验护城河!
以上多重因素的结合,才是“小悠”一骑绝尘的根本原因。
此前,由于软硬件的限制,为保证用户体验,也为了进一步带动星光X2的销量,他们并未将“小悠”,下放到其他机型。