谷歌AI盛宴:语音识别加速推进 驱动人机交互变革
5月9日,一年一度的GoogleI/0开发者大会在加州如期召开,AI是整场大会的主打词。全新的Android P系统、谷歌助手、Google Maps地图等AI产品,为我们打开了以AI为核心的未来美好生活图卷。其中,语音识别技术如何让人机对话更自然流畅,是本次大会的精彩亮点。
谷歌助手还可以退而求其次约定其他合适的时间和地点。整个过程流畅自然,很难让人相信电话对面的只是一个虚拟的人工智能助手。
继互联网之后,人工智能正在成为改变世界的驱动型技术。在政策的加持之下,科技巨头对人工智能技术抱有极大热情,不断投入热钱和人力。前几年,没听说过人工智能不足为奇。现在是不做人工智能不好意思说。其中,在人工智能领域中,语音交互技术是最为成熟的技术之一,也是各大企业的兵家必争之地。“人工智能机器人”、“智能家居”、“智能车载系统”、“智能手机”等人工智能加持的产品都离不开语音交互技术。除此之外,新零售、智慧教育、智慧医疗等新兴事物对语音交互的应用需求也并不小。
目前,主流语音助手识别率普遍高于97%,已经迈过商业应用的技术门槛。但随着语音助手开始走进普通百姓家,语音技术的短板也随之显露。比如说嘈杂环境中,识别率降低;口音问题,阻止语音助手正确识别……实际中,语音识别技术仍存在各种各样的问题,这也导致语音助手使用体验不佳,产生鸡同鸭讲的尴尬与笑话。如何让语音助手更智能,语音交互过程更自然成为巨头努力的方向,谁能把语音识别技术准确率提高3个百分点,谁就有可能掀起行业变革。不过从97%提升到100%,其中隔着的不只是3个百分点,还有诸多行业难题。此外,语音识别标准空白,也是阻碍语音助手落地的重要原因。
2017年以来,语音识别技术不断成熟,上述难题也有所突破。比如说谷歌I / O大会上,语音助手更逼真拟人的回话,就是一个很好的佐证。阿里巴巴最新透露,其机器智能技术实验研发了高工业噪声环境下的语音识别及传输技术,可以在85分贝工业噪声下,将一米处正常音量语音转换为文字,并可发送至手机等设备上。校企合作也频频传捷报,西北工业大学研发的“语音识别智能标点预测系统”,通过与腾讯的校企合作项目,已经成功在腾讯上线应用。
技术的突破,促使语音助手渗透率快速攀升。前瞻网数据显示美国目前的手机语音助手使用比例已经从2013年的30%左右快速攀升至2015年的60%以上。随之而来的是,各大研究机构对语音识别技术的市场估值。据公开数据显示,预计到2020年,全球语音识别的市场规模将会从2015年的61.9亿美元增长到200亿美元。
结语:未来语音识别应用场景会越来越垂直化,企业要分割这一市场,还要加强原创技术创新。当下,在语音识别内容的准确率上,各科技企业和团队都有了相应的突破,而在接下来的一年里,如何降低周边环境的干扰以及如何提高对声音的识别准确率将是语音识别所要解决的问题。