环球播报:微软发布 AI 声音生成工具 VALL-E，只需 3 秒音频即可模仿人说话

发布时间：2023-01-10 12:09:51 文章来源：IT之家

当前位置：主页 > 资讯 > 国内 > 正文

(资料图片仅供参考)

1月10日消息，微软最近发布了一款名为VALL-E的人工智能工具，只需3秒音频即可模仿人说话。

该工具经过60000小时英语语音数据的训练，并使用特定语音的3秒剪辑来生成内容。与目前的许多人工智能工具不同，VALL-E可以复制说话者的情绪和语气，即使说话者本人从未说过的单词也可以模仿。

了解到，康奈尔大学的一篇论文使用VALL-E合成了几种声音，大家可以在GitHub上聆听这些AI合成的音频。

研究人员指出，在许多情况下，Vall-E的性能优于当前的文本到语音转换模型。然而，该研究还写道，人工智能模型目前存在几个问题。例如，文本提示中的某些单词可能会发音不清晰、完全遗漏或在输出中出现两次。此外，该模型目前难以模仿某些声音，尤其是带有口音的声音。

像其他AI新技术一样，VALL-E在安全、伦理等方面也引发了担忧。微软发布了关于使用VALL-E的道德声明，但未来的使用用途方面没有明确说明。

目前，微软Vall-E尚未开源。微软已经在GitHub上创建了一个，但目前只包含一个描述文件。

环球播报:微软发布 AI 声音生成工具 VAL2023-01-10

全球快报:春运前三天，广铁发送旅客346万人2023-01-10

高盛：温暖的冬天对天然气价格构成下行风险2023-01-10

开年大加仓，电力设备夺回2个第一！融资资2023-01-10

2022年视频号日活跃创作者数同比涨幅超100%2023-01-10

江苏省13市重污染天气橙色预警解除2023-01-10

这场数字健康盛会揭示，千亿居家健康设备正2023-01-10

华发股份：60亿定增申请获受理逆势拿地2023-01-10

环球快报:距离黄金拐点的时间越来越近了！2023-01-10

金都城：高位震荡多头依旧有利！2023-01-10

每日速看!景良东：欧盘关系黄金强弱，形态2023-01-10

苦荞茶产地哪里的好？2023-01-10

每日快播：捷泰科技 8GW-TOPCon设备进场!2023-01-10

硅料、硅片价格今年首周持续下跌组件订单2023-01-10

当前快看：光伏350MW!甘肃能源监管办电力建2023-01-10

湖南润美基因科技有限公司违规被罚11万余元2023-01-10

掌阅科技(603533.SH)股东王良累计减持1.71%2023-01-10

春运第四天：铁路上海站预计发送旅客24万人2023-01-10

天猫健康“父母体检”搜索量涨5.3倍2023-01-10

2022年四季度人才流动报告：生产、销售类岗2023-01-10

视频号直播未来将投入50亿流量助力创作者2023-01-10

视频号直播商业潜力释放 2022年销售额同比2023-01-10

3.26GW!山西忻州公布2022年风、光发电项目名单2023-01-10

图灵看市1.10-黄金多头短暂修整、1881成为2023-01-10

短讯！隆基光伏全产业链项目建设协调会召开2023-01-10

资讯：巴菲特对比亚迪的减持还在继续！2023-01-10

SpaceX 成功发送太空太阳能发电演示装置,2023-01-10

【看新股】成都农商行完成上市辅导备案，资2023-01-10

广州年桔销售火爆，涨价近20%是怎么回事？2023-01-10

陕西省蓝田县特产有哪些？|天天微速讯2023-01-10