评论:语音搜索亟待突破中文识别技术瓶颈

相关专题: 云计算

  金峰

  在手机语音搜索这一移动互联网热点领域,苹果公司依旧是先行者。此前,苹果公司推出了iPhone 4S,并在其中集成了语言控制Siri模块——这使得用户可以通过语音对手机进行控制,同时也可以通过语音进行搜索。苹果公司巨大的行业示范效应使得手机语音搜索的市场被引爆,各类语音搜索应用迅速涌现。

  近日,台湾宏达(HTC)旗舰级新手机HTC Endeavour被曝出包含一项名为“HTC Speak”的语音助理软件;国内热门移动互联网应用订餐小秘书也推出支持语音搜索餐厅功能的安卓(Android)版及苹果版客户端。此前,百度、谷歌、腾讯、UC、科大讯飞等都陆续推出自有移动语音搜索应用,一时间语音搜索似乎成了未来智能终端的必备选项。

  事实上,与国外不同,目前国内手机语音搜索市场虽然已具备一定的用户需求与初步的技术积累,但仍处在市场导入期阶段。

  不过,手机语音搜索应用虽未被广泛普及,但目前国内手机语音搜索的市场发展基础已经形成。

  首先,手机语音搜索迎合了国内手机用户的需求。用户在使用手机时,有相当比例的时间处在移动状态下。在这种状态下,用户视觉的使用需要在使用手机与其他行为间进行分配,因而无法专注地使用手机。而语音搜索则解决了这一问题,用户可以通过“说”来提交需求,通过“听”来获得反馈,而不会影响用户正常行为。

  其次,Siri成功引发了用户对语音搜索的使用兴趣,国内手机语音搜索市场发展的引爆点已经出现。

  第三,中文语音搜索的技术基础已初步形成。语音搜索并非苹果公司独创,核心技术也并非完全掌握在苹果公司,这就使得语音搜索的广泛应用成为可能。目前,科大讯飞、谷歌等企业历经多年的发展,通过语音库、语义库的构建,已经能够较好地识别用户的语音;而语义库的构建,也实现了机器对人自然语言的解读,为更加精确反馈搜索结果奠定了基础。同时,移动互联网与云计算的发展,也使得基于在线庞大语音、语义库,实现精准识别成为可能。

  尽管手机语音搜索市场基础已经形成,但是短期内市场无法规模推广,其根本原因在于目前技术仍不成熟。

  众所周知,每个人的口音均有一定的差别,能够准确识别用户在说什么,本身就是一件很困难的事情,而中文的同音不同字情况较多,将用户的语句识别为哪些词组,还需要考虑上下文的具体情况,相比英文、德文等拉丁语系的一个发音明确对应一个单词而言,中文的识别难度无疑会更高。同时,在中文中,同样的一句话,在不同的语境中,具备了不同的含义,识别难度会更大,很难实现以自然语言进行搜索,并准确反馈搜索结果。

  此外,为了调用语音、语义库,以更加精准地理解用户的意思,目前不少语音搜索服务商的做法是将用户所说的语音上传到服务器,由服务器进行识别,但这对网络的速度、服务器的处理能力等提出了较高要求。

  为了推动手机语音搜索产品加速步入成熟阶段。在现阶段,将有诸多厂商,按照手机语音搜索成熟阶段的理念提供相应产品,并不断优化。这些产品主要包括手机输入法、搜索框的输入、手机语音应用等。它们在初期或许并不成熟,用户需要努力用标准的普通话发音,而不能用自己所常使用的说话方式,并且未必能够得到精确的反馈结果,因此,此类产品往往被用户尝鲜式使用,并被当作一种娱乐工具而非应用工具,但是,在产品被用户使用的过程中,厂商能够不断采集用户的声音、用户语言,从而形成较为完善的语音库、语义库,使得产品能够逐步趋向成熟。同时,手机语音搜索的另一个发展方向是音调搜索,例如用户想搜索一首音乐,但他只能记得部分的声音片段,如果他能够哼唱出音调,那么搜索工具同样能够支持搜索。预计在未来,此类产品将不断涌现。


微信扫描分享本文到朋友圈
扫码关注5G通信官方公众号,免费领取以下5G精品资料
  • 1、回复“YD5GAI”免费领取《中国移动:5G网络AI应用典型场景技术解决方案白皮书
  • 2、回复“5G6G”免费领取《5G_6G毫米波测试技术白皮书-2022_03-21
  • 3、回复“YD6G”免费领取《中国移动:6G至简无线接入网白皮书
  • 4、回复“LTBPS”免费领取《《中国联通5G终端白皮书》
  • 5、回复“ZGDX”免费领取《中国电信5GNTN技术白皮书
  • 6、回复“TXSB”免费领取《通信设备安装工程施工工艺图解
  • 7、回复“YDSL”免费领取《中国移动算力并网白皮书
  • 8、回复“5GX3”免费领取《R1623501-g605G的系统架构1
  • 本周热点本月热点

     

      最热通信招聘

      最新招聘信息

    最新技术文章

    最新论坛贴子