新闻动态

从要录上数十个小时的语音素材,到录入几段话九游官网登录入口jiuyou官网,再到现时仅用一句话就能复刻声息,语音合成技艺有了新打破。6月26日,科大讯飞语音合成技艺全新升级,一句话声息复刻与超拟东说念主合成两大中枢技艺收尾打破。
在智能语音鸿沟,科大讯飞声息复刻成果的中枢野心恒久围绕相同度与准确度两大维度伸开。相同度决定“第一耳印象”,包含音色特色及立场韵味;准确度则关乎声息复刻是否好用,确保发音法度、停顿当然、口吻连贯。
这次讯飞技艺打破的关节,除了星火语音大模子底座的基础和捏续迭代,还构建了一套三阶段档次化语音建模框架。最初,通过星火底座大模子精准捕捉发音法例和韵律特征。其次,在音色复原阶段解耦并重构声学特征。终末,通过高精度声码器复原高保真波形。
而在需要真切商酌的场景里,仅有相同音色并不及够。讯飞的超拟东说念主合成技艺则赋予AI声息以“险峻文情商”。靠近多轮对话的复杂度,科大讯飞建筑了险峻文感知的语音生成系统。该系统交融历史文本及对应音频特征,通过跨模态编码器分析险峻文,让AI声息能像真东说念主一般粗鲁反映心理升沉和话题转机。在真东说念主与AI声息的对话测试中,跟着话题和心理变化,合成声息的口吻会及时救济,给出哀而不伤的口头修起,举座当然度接近真东说念主水平。
现时,蔚来、奇瑞、广汽、长城、日产、本田等主流车企选用了讯飞超拟东说念主技艺,重塑车内智能商酌体验。在数字实质创作鸿沟,讯飞智作平台的超拟东说念主数字东说念主技艺收尾“一张像片+一句话灌音”定制专属编造东说念主,其唇形同步率高达98%。该技艺已匡助天津大学教授打造慕课个东说念主IP,简化教学视频制作经过。医疗场景中,搭载口头合成技艺的导诊机器东说念主使用方言与老年患者商酌时,对话当然度也有大幅提高。
科大讯飞盘问院院长刘聪示意:“咱们但愿声息不啻于器具,更成为承载口头与个性的新维度。”
南边+记者 郜小平

