在输入法都打AI牌的年代讯飞的先发优势还

2019年04月11日 来源:

早在2016年10月锤子科技新品发布会上,讯飞输入法就因罗永浩的现场演示火了一把,老罗在现场用很快的语速随口说了一段内容,讯飞输入法瞬间“打”出文字,识别结果一字不差。

当时,讯飞输入法的语音识别率是 97%。而在昨天下午举行的讯飞输入法媒体见面会上,产品总监翟吉博宣布,这个数字变成了98%。

罗永浩介绍讯飞输入法

此外,据市场品牌负责人李强军介绍,讯飞输入法用户规模突破6亿,语音输入月覆盖率达50%,语音渗透率保持逐年上升态势。

至于准确率是否能够达到百分之百,讯飞输入法产品总监翟吉博的回答是:技术上目前还做不到。

首先,同音字是个难题,只能尽可能提高命中率,这也是为什么搜狗、百度、讯飞都要给输入法加入语音修改功能的原因。其次,用户非常口语化的表达机器无法识别,人机交互习惯需要磨合。此外,嘈杂环境下语音识别会受到环境音的影响。

讯飞输入法产品总监:翟吉博

技术:DFCNN语音识别框架

讯飞输入法从人脑神经科学入手对人类记忆进行仿生,实现大量无监督的数据去辅助有人工标注的数据。受图像领域 CNN 应用的启发,科大讯飞研发了深度全序列卷积神经络(Deep Fully Convolutional Neural Network,DFCNN)语音识别框架成都显示IC报价
,使用大量的卷积层直接将语谱图作为输入,相比传统语音特征作为输入,降低了信息损失,表达了语音的长时相关性。

同时,借鉴图像识别中效果的络配置,每个卷积层使用 3×3 的小卷积核训练更深的 CNN 模型,输出单元直接为终的识别结果(比如音节或汉字),将感知智能、认知智能等 AI 技术应用在输入法上,一分钟可识别 400 字,并支持多语种实时语音翻译、超长语音输入、耳语输入、离线语音输入等功能。

特色:提出方言语音解决方案

对于口音和方言识别的难题,讯飞输入法提出方言语音输入方案来解决。依托科大讯飞对 AI 技术及语言深度研究的积累,采用 Multi-lingual 多语言建模,通过多方言数据共享方式训练;辅以 Global Phone全球音素集,从声学层面的相似性统一各方言的音素定义,对方言“语图谱”模型做进一步精进,从而有针对性地提升方言语种的识别能力广州隐形防盗网批发

目前讯飞输入法支持 22 种方言,其中粤语、四川话、东北话等识别率均已超过 90%。2017年对外发起“方言保护计划”,建立“中国方言库”,积累海量方言数据,让这些数据为深度学习提供素材。本月底铲运机电缆
,讯飞输入法将新增苏州话识别,方言识别语种将扩充至23种。

基于科大讯飞精简和优化的 Hybrid-DFCNN 全新语音识别框架,6月底讯飞输入法将上线 Hyper-CNN语音新引擎,随之通用语音识别准确率将相对提升 15%,此外可以优化中英混合语音输入、粤语等重点方言、标点判断准确率,提升语音输入的体验。

重新定义键盘,新增面对面翻译和 OCR 拍照

在百度输入法的发布会上,AIG 负责人王海峰发表了他对输入法的看法,认为即便现在有语音输入的加持,其实还不足够,未来的输入方式一定是 AI 加持的“全感官输入”。讯飞的判断是,输入法将不再局限于五笔、九宫格、二十六键、手写固定键盘形态,从而推出“莫得键盘”、“语音键盘”、“VG 语音交互面板”等人机交互模式。

莫得键盘即“没有”键盘,基于讯飞输入法智能语音技术,支持语音输入、语音口令控制,实现无键盘输入。为语音重度用户量身定制了语音键盘,呈现便捷的语音输入形态,只凭一张嘴就能轻松打字、修改甚至自动加标点符号,不需学习其他技能。基于智能语音应用,打造 VG(VoiceGame)语音交互面板,利用 AI 在交互层面进行了尝试。输入过程等同“玩游戏”,语速快慢、声音大小等直接体现了创意交互。

讯飞输入法将语音识别、语音合成以及机器翻译等新技术融合在一起,新增面对面翻译,支持中文与英日韩俄多语种即时翻译,并且将面对面的交互方式引入语音翻译应用中。例如,在对话双方各讲母语时,另一方就会同步看到翻译结果。

基于用户刚需,新增了 OCR 拍照输入,可以识别书本、路牌、名片等印刷体上的文字以及手写字体。手写识别准确率也高达 90% 以上。

体验:语音识别哪家强?会后,雷锋(公众号:雷锋)分别试用了搜狗输入法和讯飞输入法。

讯飞语音可一次性不间断输入249个字,搜狗语音可输入221个字。整体来看,讯飞识别率更高一些。

在对诗歌的识别方面,两家输入法都有很好的表现。读者也可试试用自己家乡的方言,看看这些有 AI 加持的输入法能否识别。

随着语音识别技术的发展,可能未来我们真的不再需要用手打字,至于讯飞对未来人工智能语音输入的展望,翟吉博的回答是:“现在的产品在省时高效和足够简单自然这些维度上并没有做到。假如有一天技术成熟了,我们通过意念或者脑电波输入文字,打开,盯着屏幕看两秒,文字就发出去了,我想这会是一个更加的输入法。”

AI普遍化后,讯飞需要寻找新的差异点据速途研究院2017年调研数据显示,输入法市场上,搜狗以 63.6% 的市场份额,接下来是百度和讯飞。王海峰说,百度输入法是百度 AI 技术应用的桥头堡,新的 AI 技术将会首先应用在输入法上。搜狗 CEO 王小川也表示将 AI 赋能升级输入法列为搜狗 2018 年度 AI 战略之一,并且输入法不止可以打字,还将承载信息获取和流量分发。在输入法都打 AI 牌的年代,讯飞的优势何在?

对此,翟吉博在接受雷锋的采访时表示,讯飞一直以来聚焦于语音输入,对于语音输入的用户场景体验和未来发展有着更深的理解。此外, 在语音技术方面持续创新,会一直寻找新问题并用技术和产品设计解决。“我们永远是往前多走一步,持续探索。”

但是,据雷锋了解,目前用户的输入习惯主要还是以拼音输入为主。速途研究院的数据显示,六成多的用户还是选择拼音输入,其中九宫格拼音输入接近用户的输入习惯,可以单手掌控输入。

随着技术的发展,语音转化成文字的正确率越来越高,选择语音输入的用户在不断增多。对于语音输入,讯飞输入法支持 22 种方言,百度输入法则提供了语音翻译,支持 28 种高频次语言同声传译。

目前输入法市场格局形成了一超多强的局面,搜狗输入法长期保持市场,且不断发展。百度输入法借AI 之力奋起直追,讯飞等输入法也在不断差异化,努力加强个性化特色功能。在识别率方面,头部厂商在语音识别准确率上均达到 97% 以上的高水准,而百度和搜狗都拥有得天独厚的庞大搜索数据库为深度学习算法提供燃料,语音输入用户习惯的养成却尚待时日,主打 AI 语音识别的讯飞,可能还需要再继续探索其他差异化策略。

相关文章:

讯飞输入法3.0: 支持英语语音输入

讯飞输入法iOS 6.1完美适配版放出

CNCC 2016 | 搜狗 CEO 王小川:输入法的未来是自动问答

为iPhone X加点料,搜狗输入法iOS新版上线

百度输入法 8.0 版本上线,王海峰称其是“百度 AI 的桥头堡”

搜狗输入法医生版上线,解决医生群体打字难问题

相关文章
  • 奇才惨败只因畸形心态系列赛华盛顿步行者自我调节单节制胜
    奇才惨败只因畸形心态系列赛华盛顿步行者自我调节单节制胜

    步行者VS奇才 希伯特勾手数据 投篮点实录调查热议 阅兵北京时间5月10日,印第安纳步行者在华盛顿以战胜了奇才队,在失去个主场之后,重新拿回优势,在整个系列赛中以。奇才全场作死的节奏约翰-沃尔控球至前场,然后一记出人意料地高抛传球……结果...

  • 天津地铁6号线首期开通段实现轨道连通
    天津地铁6号线首期开通段实现轨道连通

    12月7日,随着西站至西青道站区间一方道床混凝土浇筑完成,地铁6号线首期开通段实现轨道连通,为月底前完成轨道焊接,及后续进行列车冷、热滑试验夯实了基础。轨通是地铁工程洞通、轨通、电通三通关键节点之一。地铁6号线首期开通段铺轨总计约77单线公...

  • 时尚妈妈的天然育儿方式
    时尚妈妈的天然育儿方式

    天然育儿是一种全新的育儿方式,它提倡运用上天赋予人类的自然孕育能力来抚育宝宝,使孕育宝宝的整个过程变得更能亲近自然、感受自然、体会自然和运用自然的力量。在国际上,天然育儿的抚育方式已经得到了越来越多妈妈们的认可。自然分娩怀孕生育是上天...

  • 影坛大佬向华胜病逝终年64岁曾与哥哥向华强捧红周星驰全文
    影坛大佬向华胜病逝终年64岁曾与哥哥向华强捧红周星驰全文

    摘 要:据香港媒体报导,永盛电影公司老板向华胜,患上食道癌末期后,多次传出病危,上月向华胜太太端木樱子表示向华胜情况稳定下来,一直在北京医院休养,20日传出向华胜病逝消息,随后向向太陈岚求证,她亲口证实向华胜今晚病逝,终年64岁。易娱乐11月2...

  • 衢州火车站暑期将开通15对临时列车
    衢州火车站暑期将开通15对临时列车

    学生们盼望的暑假马上就要来临,从衢州火车站了解到,今年我市铁路客运将增加1.5对临时列车。今年的暑期客运从7月1日起到8月31日止,共计62天.3%。平均每天将发送4000多人次,高峰日预计会达到5400人次。暑期客运期间,我市会开通1.5对临时列车,分别为上海南开...

  • 村支书举报贪污反被控预谋贪污 一审获刑7年
    村支书举报贪污反被控预谋贪污 一审获刑7年

    中新安阳4月8日电(吴扬 晓非)自河南滑县人民法院获悉,当地一村支书在举报村委会贪污的同时,自己却被检方指控参与“预谋贪污”,一审获刑7年。据滑县人民法院判决书,2012年2、3月份,滑县修建快速通道和创业大道征用部分土地,其中包含滑县新区军旅庄村学...