NVIDIA 展示可修改并生成声音的 AI 模型 Fugatto

2024-11-26 11:11来源:未知

辉达(NVIDIA)周一展示一款用于生成音乐和声音的新型人工智慧(AI)模型,此模型以音乐、电影和影像游戏制作者为诉求对象,可以借此修改声音并生成新的声音。

辉达表示,目前还没有公开发表这项技术的计划。这项技术称为 Fugatto,是Foundational Generative Audio Transformer Opus 1的缩写。这技术与Runway等新创公司和Meta Platforms 等大公司展示的技术一样,可以根据文字提示来生成声音或影片。

Nvidia的技术可以根据文字描述生成音效和音乐,包括新奇的声音,例如让小号发出狗叫声。

和其他AI技术的不同之处在于,它能够接收和修改现有的声音,例如将钢琴弹奏的一段旋律转换成人声唱出的旋律,或者改变语语录音的口音和情绪。

辉达应用深度学习研究副总裁 Bryan Catanzaro说:「若回顾过去50年的合成音频,会发现现在的音乐听起来已经不同了,因为有了电脑和合成器,我认为生成式AI将为音乐、影像游戏和想要创造事物的普通人带来新的功能。」

辉达的新模型是基于开放资料训练而成,该公司表示仍在讨论是否且以什么方式公开发表这项技术。

辉达(NVIDIA)周一展示一款用于生成音乐和声音的新型人工智慧(AI)模型。路...
辉达(NVIDIA)周一展示一款用于生成音乐和声音的新型人工智慧(AI)模型。路透

最新内容




《TNT新闻网》带您走进信息爆炸的时代!投稿邮箱:[email protected] 广告投放:[email protected]

Copyright © 2012-2024 TNT新闻网 版权所有

技术支持:TNT新闻网