搜索
  • 首页
  • 快讯
  • 资讯
    • 推荐
    • 财经
    • AI
    • 创新
    • 城市
    • 最新
    • 创投
    • 汽车
    • 科技
    • 专精特新
  • 直播
  • 视频
  • 专题
  • 活动
搜索
寻求报道
我要入驻
城市合作

用文本生成音乐,Meta发布开源AI工具AudioCraft | 最前线

虞景霖·2023-08-03 11:15
更简便、更高质量的文本生成音频AI模型

作者 | 虞景霖 

编辑 | 邓咏仪 

美东时间8月2日,Meta发布了一款开源人工智能(AI)工具AudioCraft,可以根据用户给出的文本提示创作音频和音乐。

相较于AI在生成图像、视频、文本的应用,AI生成音乐领域的发展相对落后。这是由于生成高质量的音频需要对不同类型的信号、模块进行不同层级的建模,加上该领域开源的代码较少,可以说是AI生成内容中最具挑战性的领域。 

本次AudioCraft以开源的形式进行发布,目的也是为了能够让“研究人员和从业人员能够使用自己的数据集训练自己的模型,减少由于训练数据的局限性带来的偏误,推动AI生成音乐或音频的发展。” 

AudioCraft包括AudioGen、EnCodec(改进版)和MusicGen三个核心部件。通过MusicGen和AudioGen,AudioCraft可以将用户给出的文本指令转变为任何类型的音频或者音乐,再由EoCodec(改进版)进行优化。 

AudioGen是一个AI生成音频模型。它能够扩展现有音频,或者通过文本提示生成音频,例如生成狗叫声、汽车喇叭声或者木地板上的脚步声。此外,AudioGen还能从声学角度区分不同对象的声音,对其进行分类。Meta使用公开的音效素材对该模型进行训练。 

EnCodec(改进版)是一个基于神经网络的音频压缩解码器,能够帮助用户生成人工痕迹更少、更高质量的音乐,还能对音频文件进行无损压缩。 

MusicGen是Meta在今年6月初推出的开源AI模型,能够根据文本提示生成音乐。Meta使用自有或经过授权的音乐对其进行训练,累计使用约40万个音频及文本素材,训练总时长超过20000小时。

MusicGen和AudioGen生成音频/音乐

尽管Meta使用了多个音频素材对模型进行训练,但Meta也承认,用于训练AudioCraft的数据集缺乏多样性,素材大多为西式音乐,且使用的文本提示语言仅限于英语。通过AudioCraft生成的音乐质量尚不足以取代专业人士制作的商用音乐。 

Meta本次采取的策略类似于此前发布Llama 2大语言模型——无需商业授权即可使用。因此,AudioCraft的开源发布可能可以吸引大量用户,而不仅只是那些对文本生成音频感兴趣的用户,扩大Meta的知名度。

根据Meta的FAIR团队介绍,与早期文本生成音频的AI模型相比,AudioCraft大大简化了生成流程。用户能够使用AudioGen和MusicGen进行音频生成,甚至可以从头开始开发自己的文本生成音频模型。 

Meta并不是第一家AI生成音乐的公司。此前,OpenAI曾在2020年推出AI音乐生成器Jukebox,谷歌在今年发布的音乐生成模型MusicLM,其他常见的类似模型还有Riffusion、Mousai和Noise2Music等。

+1
87

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
登录后参与讨论
提交评论0/1000
你可能也喜欢这些文章
最前线|KubeCon China 2024在香港举办,中国成为全球第二大开源贡献国
第十八届中国基金合伙人大会:LPGP聚智解码行业生态
业绩快报|B站2024年Q2广告收入同比增长30%,毛利润同比增长49%
奔驰补课智能化,“端到端”智驾方案将在新平台上线|最前线
2024世界机器人大会在京开幕
最前线|阿维塔将于年内发布多款增程车型,进一步降低购车门槛
27款人形机器人齐聚「2024WRC」,既能写毛笔、干家务,还可以做搬运和质检|最前线
最前线|快手发布Q2财报:电商GMV仍有双位数增长,但增速放缓
最前线|苹果Vision Pro有平替,售价4299元的PICO 4 Ultra来了!

最新文章推荐

昆仑万维5大AI基座模型持续创新,AI应用加速落地,商业化成果显著 龙湖:“三高”模式不可持续,预计2028年经营性业务收入占比超50% 谷歌停止一个漏洞赏金计划,是因为安卓变安全了? LV老板的家办,一口气投了5家AI公司 为何如今的PC DIY玩家,都不再重视独立声卡了? 9块9低价潮,席卷汉堡店 智驾“新旧势力”大混战:比亚迪、长城加码,小鹏、华为优势渐弱? 半年融资逾75亿,国产机器人熬来好日子 带飞联想AI PC的,未必是AI “暴雷”的Biotech,开始另起炉灶
虞景霖
新锐作者

关注新能源、AI、Web3,欢迎交流yjl011001yjl

最近内容

用AI简化视频创作流程,「换境Studio」要做一站式后期编辑软件 | 早期项目
谷歌AI春晚宣告Gemini时代将至,10倍能效10倍上下文碾压OpenAI?
闻道AI联合创始人朱悦瀛:AI赋能商业信息检索 | WISE2023商业之王大会

下一篇

芭比的Birken、街溜子的CROCS,今夏的主角是拖鞋

小拖鞋,大市场

2023-08-03

热门标签

电子监管 射频 深圳市金立通信设备有限公司 垃圾短信 深圳咖啡馆 cnet 淘宝客 肯耐珂萨 ios越狱 bigboss 穿越无人区 联想股票 张瑞敏 深圳东进 11区 产品经理职责 臭鼬工厂 网景公司 evelyn 电池管理系统 大衰退 再生医学 安全生产法 板材 木材 先行者 皓镧传 东宫 战争电视剧 好莱坞大片
意见反馈
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

PHP网站源码丹竹头阿里店铺托管龙华网站排名优化广州百姓网标王平湖企业网站制作龙岗模板推广东莞网站推广方案坪地网络推广坑梓外贸网站建设沙井网站建设设计西乡网络营销光明阿里店铺托管东莞企业网站设计荷坳外贸网站建设罗湖百搜标王横岗百度网站优化排名丹竹头设计公司网站坪地网站优化推广大鹏营销网站坪地企业网站制作石岩SEO按天计费光明关键词排名包年推广大鹏网页制作南山标王宝安标王爱联网站优化软件西乡百搜词包永湖阿里店铺托管观澜网站优化软件爱联网络推广松岗建站歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化