网易用AI技术,帮助听障人士说出“人生第一句”|最前线
文|林炜鑫
编辑|邓咏仪
近日,网易集团、网易公益联合浙江省残疾人福利基金会发起“人生第一句”声音复原公益计划,利用网易互娱AI Lab的iSpeech技术打造首个AI复原听障人士原声的工具。
(资料图)
听障人士仅需在「音书 APP」上传2分钟没有完整语义的发声片段,之后在产品中输入想要表达的文字,就可以用原本的声音说出来。
目前该产品已向全国听障人士免费开放,帮助他们无障碍、有情感地与外界交流,用自己的声音说出“人生第一句”。
不久前,浙江省残疾人福利基金会面向浙江特殊教育职业学院的学生和「音书APP」的部分用户开展调研。
调研结果显示,仅有十分之一的受访对象能够通过简单的口语与身边的人进行交流,他们中的大多数,最大的梦想便是能说出“人生第一句”。
网易互娱AI Lab技术总监林悦告诉36氪,目前市面上绝大多数语音克隆产品,需要比较完整、有一定时长的语段,不适合相对发音困难的听障人士使用。
此次研发历时两个月,网易互娱AI Lab研发团队用上了iSpeech技术,基于海量数据的预训练模型,加上听障人士极少量的纯语音数据快速微调算法模型,在快速克隆新的说话人音色的同时,保留基础模型的内容发音能力。
来源:网易
林悦表示,这次研发的难点在于,从极短的无语义语音中提取到个人声音特征。正常的语音合成技术往往需要半小时到一个小时的语料建模,而网易团队克服了技术难度,仅需要听障者发出的两分钟简单音节,就取得了效果。
一位听障理发师使用该技术与母亲通话时,母亲听到“儿子的声音”后非常激动,称从未想过能听到儿子说话。这名理发师说,能用自己的声音与人交流,可以大大提升自信心。
网易宣布,这项技术研发遵循“科技向善”的理念,供听障人群免费使用,希望能提高他们的生活便利性。
接下来,网易团队希望利用AI技术,赋予合成语音以情感表达能力,让听障人士通过语音传递更丰富的情感。
据了解,此次运用的iSpeech技术原是由网易互娱 AI Lab 针对游戏场景推出的 AI 创作工具,已落地服务于《大话西游》《一梦江湖》《荒野行动》等 10 余项游戏项目产品之中。
通过这次研发,这项技术在游戏的使用场景也有更多可能性。林悦举例,游戏里会有给NPC角色定制语音包的需求,这项技术将减轻研发人员的负担,不再需要严格按照文本录制声音,只需日常的说话语音,就能达到效果。
关键词:
责任编辑:宋璟
-
网易用AI技术,帮助听障人士说出“人生第一句”|最前线
-
超值服务放心选 联想暑期特惠购 只换不修福利放送中
-
电脑老是卡屏死机不动(电脑老是卡屏)
-
重庆市六届人大常委会第三次会议闭幕
-
自由泳1千米世界纪录(自由泳女生1000米世界纪录)
-
两岸“Z世代”赴浙江横店研学“走进历史”学文化
-
上官婉儿简介王者荣耀(上官婉儿简介)
-
签了股份协议却查不到到底是否有效
-
求贤 | 央企大舞台!保利6盘联招策划,策神看过来!
-
刘芊含年龄多少(刘芊含年龄)
-
早上多云中午烈日下午大雨 入伏首日西安天气“三变脸”
-
金融监管总局:1-6月全国农业保险累计提供风险保障逾3万亿元
-
@太原人!8月1日起施行!山西首个!
-
改革兴豫丨在“双减”中做好科学教育“加法”
-
日媒:江宏杰律师公开警告,如果福原爱不交出孩子,考虑将她告上法庭
-
美畅股份:预计2023年半年度净利润同比增长30.59%至36.59%
-
菏泽百世快递电话 百世快递电话
-
万联证券:游戏板块估值有望持续修复
-
7月28日7时起,文锦渡口岸将全面恢复入境方向货车通关
-
云霄县部署推进生态环境保护重点工作
-
iPhone 14 卫星紧急求救功能立功!两名迷路游客获救
-
2023年南昌红谷滩区小学学校招生学区范围公布红谷滩发布
-
缺人才造芯片 美国慌神了
-
丰巢与中海、佳兆业、招商集团达成合作
-
大兴安岭呼中区塔河-呼中66千伏输变电项目开工架起电力天路为发展赋能充电
-
保定市第二医院成功抢救一例热射病猝死患者
-
延吉绿化带改造升级,美丽城市再添新装
-
购买的芯片基金一直亏怎么办?
-
刘家峡黄河与洮河交汇处呈现出形态迥异的景象
-
防水砂浆中防水剂量含量 防水砂浆防水剂掺量
-
税收大数据“搭桥” 上半年税务部门助困难企业实现购销超100亿元
-
六旬男子在火车上喝半斤二锅头后扰乱车厢秩序、袭警!被刑拘
-
大数据板块早盘走弱,大数据ETF跌超1%
-
“物理课”上的技术碰撞:追求极致的芝华仕,生动诠释“舒适源于科技”
-
亚非学员学习桂林米粉制作技艺:将美食带回家乡