互联网

马上金融自主研发ASR技术 电话录音场景下客户字准率88% 可识别多种方言

来源:网络    作者:      2020年06月02日 16:35

导语:


ASR即自动语音识别。此项技术是通过“声音”到“文字”的转换,能让机器就像耳朵一样能够“听懂”人说话。这一技术已经在很多场景中广泛应用,比如通过语音可以对手机发出指令,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能,以及智能电话机器人、智能外呼系统、智能电话客服系统等都需要应用ASR技术。

在呼叫中心领域实际应用场景中,自动语音识别技术在应用方面比起一般PC系统的应用来说更具挑战。比如复杂的噪声环境、各种方言交杂,再加上不同行业有着大量的专有句式和专业词汇,使得语音识别存在技术难题和误识情况。

基于这些痛点,马上消费金融(以下简称“马上金融”)打造了自主研发的语音识别模型,不仅能够有效地解决上述难题,还在识别准确率上得到大幅提升。目前,该模型已经在马上金融的智能外呼、智能客服、电话录音质检等多个业务场景落地。经实测,在电话场景、各种噪声环境下,马上金融ASR的字准率达到88%,在业界处于领先水平。马上金融凭借自身在金融科技领域的深耕和垂直电话场景数据的大量积累,语音识别技术已在信托领域智慧双录、重庆百货等商家落地应用。

马上金融ASR技术具有多种方言识别能力。为满足不同客户群体需求,马上金融的语音识别技术在语种丰富度上持续发力,在原有常见语种基础上,开放了四川话、重庆话的识别能力,后续还会陆续开放对粤语等方言的语音识别能力。经过长期的打磨训练和效果调优,目前重庆方言语种的语音识别技术已在重庆百货应用于电话录音质检等业务场景。

得助-智能语音质检系统是马上金融自主研发的集成语音识别(ASR)、声纹识别、情绪识别、自研语言处理(NLP)等多种先进的人工智能(AI)技术于一体的智能语音质检系统。该系统采用先进算法,充分利用上下文信息提升模型识别效果,目前已应用于马上金融呼叫中心场景,覆盖58个节点,34条流转路径等高度复杂业务,召回率达到90%,识别正确率达到86.5%。

据马上金融2019年度数据统计,得助-智能语音质检系统的智能质检单项违规检出率比人工抽检的检出率提升最高可达36倍,其中,7个智能质检项是人工抽检效率的5倍以上,14个智能质检项的结果全部优于人工抽检,违规质检—虚假承诺还款效率提升13倍。


(文章为作者独立观点,不代表艾瑞网立场)
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 广告赞助| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10