南安农业网
日期归档
热点专题 当前位置:首页 > 热点专题 > 正文

Blizzard Challenge 2019国际语音合成大赛,灵伴斩获亚军

在刚刚结束的“暴雪挑战2019”国际语音合成竞赛中,凌的语音合成系统获得了第二个综合评价指标。这是精神合作伙伴第二次在“暴雪挑战2013”比赛中获得第一个综合评价指数,并在6年后再次获得二等奖。

历史上最困难的“中国合成”挑战

“暴雪挑战”国际语音合成竞赛由卡内基梅隆大学和日本名古屋工业大学联合发起。它是语音合成领域最权威的国际技术评估竞赛。旨在构建开放统一的语音合成技术评估平台,加强研究机构之间的技术交流与沟通,促进语音技术的快速发展。

与之前的比赛相比,本次比赛的难度达到了新的高度。比赛要求每位参赛者使用约8小时的罗振宇脱口秀声音材料来合成一种自然,易懂的声音,并尽可能与罗振宇的自身特点相似。

更重要的是,组织者严格限制声音样本的来源:罗振宇自己的声音材料只允许使用主办方提供的8小时录音,禁止使用从其他来源收集的数据;罗振宇以外的演讲者声音该材料可以随意使用。

因此,本次比赛主要面临两个挑战:如何使用罗振宇自己的8小时录音;如何利用其他发言者的声音来帮助算法更好地理解罗振宇自己的言语特征。

超稳定的合成系统,最佳的语音清晰度

在任务难度大,竞争力强的情况下,精神伙伴提交的综合系统在自然性,相似性和可懂度三个指标上表现优异,取得了关键指标自然性的第四和相似性。第二名,合成语音清晰度第二名,总排名第二名。

自然性和相似性分别表明合成声的自然程度和与罗振宇本人的相似性。得分越高,合成语音越自然,与罗振宇本人的相似度越高。从得分上看,在自然程度和相似度方面,精神伴侣分别得到4分和3.9分,总分7.9分,落后于M,差距较小。

从排名的角度来看,灵魂在自然性,相似性和可懂度方面排名第四,第二和第二。

在考虑自然性和相似性的情况下,伴侣的排名与第二位相关。

在考虑自然性,相似性和可懂度的情况下,歌手的排名排名第二。

值得一提的是,精神伴侣的可懂度得分在相似性和自然性的十大团队中排名最高,这意味着伴侣的语音合成可以被“理解”最多。

人工智能技术之路通常是对系统能力的全面评估。从语音合成要求的角度来看,自然性,相似性和可懂度是实际应用场景的关键指标:相似性是语音合成模型定制业务的主要对象;并且可理解性在人机器中。在交互过程中,它直接决定了客户是否能够轻松准确地理解机器人所表达的内容。

因此,本次比赛中精神伙伴的技术选择主要考虑真实的着陆场景,并选择相对稳定的“无偏”解决方案。比赛结果也充分展示了伴随合成技术的综合优势。

自然性,相似性和可懂度累积排名(越低越好)

“路长路长,路长,我要上下走。”这次比赛的结果既是对精神伴侣的荣誉,也是对精神伴侣的激励。语音互动的探索,同伴的精神,以及世界上的研究伙伴,还有很长的路要走。精神伴侣将继续脚踏实地、开拓创新,实现技术和产品的双重改进,为人类和智能机器人的共同发展创造光明的未来。

2013年暴雪挑战赛精彩回顾

2013年,这一新的精神伙伴团队首次参加。在时间紧、任务重、对手强的多重困难下,团队一举击败了许多国际顶尖科研机构,在自然性和相似性两个评价领域获得了绝对优势。在暴雪挑战国际语音合成大赛综合评价中获得第一名,是组织者在语音合成领域公认的第三个里程碑性技术突破。

在自然度方面,精神伙伴(团队代码M)得3.9分,超过第二名0.6分。

0×251f

0×2520个

自然度得分(精神团队代码为M)

查看官方审查结果文件:

http://info.sunhsinthread.cn



南安农业网 版权所有© www.zhuanhua6.net.cn 技术支持:南安农业网 | 网站地图