谷歌“狂飙”生成式AI赛道,最新模型可凭文字、图片“创作”音乐

《科创板日报》1月28日讯(编辑 宋子乔)在生成式AI模型的赛道上,谷歌正一路“狂飙”。继文字生成AI模型Wordcraft、视频生成工具Imagen Video之后,谷歌将生成式AI的应用场景扩展到了音乐圈。

当地时间1月27日,谷歌发布了新的AI模型——MusicLM,该模型可以从文本甚至图像中生成高保真音乐,也就是说可以把一段文字、一幅画转化为歌曲,且曲风多样。

谷歌在相关论文中展示了大量案例,如输入字幕“雷鬼和电子舞曲的融合,带有空旷的、超凡脱俗的声音,引发迷失在太空中的体验,音乐的设计旨在唤起一种惊奇和敬畏的感觉,同时又适合跳舞”,MusicLM便生成了30秒的电子音乐。

又如以世界名画《跨越阿尔卑斯山圣伯纳隘口的拿破仑》为“题”,MusicLM生成的音乐庄重典雅,将冬日的凌厉肃杀和英雄主义色彩体现地淋漓尽致。写实油画之外,《舞蹈》《呐喊》《格尔尼卡》《星空》等抽象派画作均可为题。

MusicLM甚至来个音乐串烧,在故事模式下将不同风格的曲子混杂在一起。即便要求生成5分钟时长的音乐,MusicLM也不在话下。

图片马上加载完成,请稍后

另外,MusicLM具备强大的辅助功能,可以规定具体的乐器、地点、流派、年代、音乐家演奏水平等,对生成的音乐质量进行调整,从而让一段曲子幻化出多个版本。

MusicLM并非第一个生成歌曲的AI模型,同类型产品包括Riffusion、Dance Diffusion等,谷歌自己也发布过AudioML,时下最热门的聊天机器人“ChatGPT”的研发者OpenAI则推出过Jukebox。

MusicLM有何独到之处?

它其实是一个分层的序列到序列(Sequence-to-Sequence)模型。根据人工智能科学家Keunwoo Choi的说法,MusicLM结合了MuLan+AudioLM和MuLan+w2b-Bert+Soundstream等多个模型,可谓集大成者

其中,AudioLM模型可视作MusicLM的前身,MusicLM就是利用了AudioLM的多阶段自回归建模作为生成条件,可以通过文本描述,以24kHz的频率生成音乐,并在几分钟内保持这个频率。

相较而言,MusicLM的训练数据更多。研究团队引入了首个专门为文本-音乐生成任务评估数据MusicCaps来解决任务缺乏评估数据的问题。MusicCaps由专业人士共建,涵盖5500个音乐-文本对。

基于此,谷歌用280000小时的音乐数据集训练出了MusicLM

谷歌的实验表明,MusicLM在音频质量和对文本描述的遵守方面都优于以前的模型

不过,MusicLM也有着所有生成式AI共同的风险——技术不完善、素材侵权、道德争议等

对于技术问题,比方说当要求MusicLM生成人声时,技术上可行,但效果不佳,歌词乱七八糟、意义不明的情况时有发生。MusicLM也会“偷懒”——起生成的音乐中,约有1%直接从训练集的歌曲中复制。

另外,由AI系统生成的音乐到底算不算原创作品?可以受到版权保护吗?能不能和“人造音乐”同台竞技?相关争议始终未有一致见解。

这些都是谷歌没有对外发布MusicLM的原因。“我们承认该模型有盗用创意内容的潜在风险,我们强调,需要在未来开展更多工作来应对这些与音乐生成相关的风险。”谷歌发布的论文写道。

本文标题: 谷歌“狂飙”生成式AI赛道,最新模型可凭文字、图片“创作”音乐
永久网址: https://www.laoziliao.net/finance/info/60199304 (请复制分享给好友)
标签: 谷歌 ai

料友留言(数量:2条)

料友:清扬 2023-01-28 21:26
谷歌毫无创新
料友:老资料网友430 2023-01-28 22:00
可惜没办法用
相关文章
国内半导体行业设备需求增加,拓荆科技去年净利预计最多增近5倍
拓荆科技 视觉中国 资料图 1月29日,国内半导体专用设备厂商拓荆科技股份有限公司(下称“拓荆科技”,688072)公告披露2022年年度业绩,经财务部门初步测算,预计公司2022年年度实现营业收入16.50亿元至17.20亿元,与上年同
标签营收,半导体,归母净利润,净利润,拓荆科技
返乡置业潮来了!河南县城售楼处爆单,房企人士:二十年没见过
本文来源:时代财经 作者:钟黛 图片来源:图虫创意 伴随着20亿人次投入春运,压抑了三年的返乡置业需求开始释放。 “过了元旦,感觉县城楼市的销量一下就起来了。我们在河南、安徽的项目,大年三十居然卖了不少,初一下午又有签约的。从业地产二十
标签河南,房企,置业
蓝思科技:预计2022年净利同比增17%-22%
36氪获悉,蓝思科技公告,预计2022年净利润24.22亿元—25.26亿元,比上年同期增长17%—22%。经公司财务部门初步测算,计提和转回减值准备将减少公司当期利润总额5.04亿元。
标签净利润,36氪
殷剑峰:居民消费率为何这么低?
经济发展的终极目的是消费,投资只是手段。投资减少了今天的消费,是为了增加明日的消费。 如果一个经济体的投资越来越多、消费越来越少,那么,投资的回报率也会越来越低。最终,没有消费支撑的投资也将难以为继。 观察2012~2021年间主要国家的
标签消费
谁主导了本轮美元的贬值?欧元、大宗商品、还是美联储
一.欧元大幅走弱是2022年美元走强的重要因素众所周知,在美元指数的结构中,欧元占美元对标的一篮子货币中的比重最大,占比高达了57.6%。 2022年美元的大幅走强除了美联储大幅加息等因素以外,受俄乌冲突及能源危机影响,欧元的大幅走弱也是支
标签美联储,天然气,欧洲_财经,美元指数,欧洲央行,欧元,大宗商品,欧元兑美元
半导体2022年的A股“答卷”
观察产业变化的视角有很多,而资本市场是非常有效的一个角度。半导体产业,依然是社会高度关注的。因此,新年伊始,我们从A股的视角来看看,半导体产业发生了什么变化?又会如何映射实业发展,甚至预测2023年的变迁。 稀缺性降低 2022年,半导体
标签a股,资本市场,半导体产业