开头:智通财经网
英伟达(NVDA.US)推出了一款用于生成音乐和音频的新式东说念主工智能(AI)模子,旨在为制作音乐、电影和视频游戏的东说念主们提供事业。
凭证英伟达的说法,这款模子名为Fugatto(Foundational Generative Audio Transformer Opus),不错使用任何文本和音频文献来生成或修改音乐和声息。
举例,该模子不错凭证文本领导创建音乐片断,从现存歌曲中删除或添加乐器,转换声息中的口音或心情,致使发出从未听过的声息。
英伟达专揽音频究诘司理、管弦乐队指引兼作曲家Rafael Valle示意:“咱们但愿创建一个能像东说念主类同样交融和产生声息的模子。”
英伟达指出,告白代理商不错使用Fugatto快速定位多个地区的现存告白,并在配音中加入不同的口音和热枕。此外,视频游戏开辟者不错使用东说念主工智能模子修改游戏中事先录制的金钱,以适专揽户在玩游戏时不断变化的行为。
Fugatto不错使小号发出狗吠声或萨克斯管发出喵喵声。该公司补充说,通过微斡旋少许的颂扬数据,究诘东说念主员发现它不错处分未经事先检修的任务,比如从文本中生成高质地的歌声。
英伟达示意,Fugatto的完好版块使用了25亿个参数,并在包含32个Nvidia H100 Tensor Core GPU的Nvidia DGX系统上进行了检修。该模子的举座责任耗时一年多。
Fugatto可能会与Runway等初创公司以及 Meta Platforms(META.US)等大公司的近似本事伸开竞争。10月,Meta 发布了名为Movie Gen的东说念主工智能模子,该模子不错凭证用户领导创建传神的视频和音频编订。
本年 2 月云开体育,ChatGPT制造商OpenAI推出了Sora,它不错凭证文本指示创建传神且豪阔念念象力的场景。这家由微软(MSFT.US)补助的公司尚未向公众发布文本转视频模子。
Nvidia英伟达模子文本音频发布于:北京市