作者|繁语
编辑|方奇
媒体|AI 大模型工场
最近,SunoV3 在社交媒体的爆火已不必多说。
虽然 AI 生成音乐的工具并不少,比如 Stability AI 的 Stable Audio 2.0 、Adobe 的 Project Music GenAI,但 SunoV3 的出现还是给业界带来了“亿点点”震撼。
你只需要用自然语言输入一个主题,Suno 就能够在一分钟内作词、编曲、演唱,直接生成一首一分多钟的音乐,最重要的是它作曲的歌听起来有模有样,还怪好听。
Suno 在英文歌生成方面表现强劲,不过它生成的中文音乐总感觉差点意思。
在国内,4 月 2 日昆仑万维推出类似 AI 音乐生成大模型“天工 SkyMusic”,相比 Suno 它的中文音乐水平明显提升很多,无论是对歌词的理解还是适配歌词的曲调和演奏方面都相对好很多。
AI 音乐一出,人人都是音乐家。网友开始各种整花活,生成歌曲《上逼班》、爆改周杰伦的《晴天》、甚至还有网友直接把莲花清瘟说明书“喂”给它。
有网友表示,好好好,这个世界终究是癫了,歌手也要完蛋了。
天工 SkyMusic 现在已经面向社会开启邀测,正式版将在 4 月 17 日正式面向全社会免费开放。
AI 大模型工场拿到内测资格后就立马上手体验了一下,试试效果如何。
目前可以在手机上体验“天工 SkyMusic”的功能,可以通过自带的应用商店或者“昆仑万维集团”公众号下载并安装“天工”APP。
安装完“天工”APP 之后,通过点击界面上方的“音乐”,即可开始体验“天工 SkyMusic”的音乐创作功能。同时,在该界面还有“灵感指南”和“发现好歌”的功能,可以看看当前的灵感话题和其他人创作的歌曲,让你在作曲之前可以找找灵感。
在“天工 SkyMusic”界面,你会看到醒目的“开始写歌”按钮。点击这个按钮后,你会转到到歌词编辑页面。在这里,你可以直接输入你已经写好的歌名和歌词,或者利用天工 AI 的“AI 写词”功能,根据你的灵感自动生成歌词。同时,可以填写结构名称,如【前奏】、【主歌】、【副歌】等,让 AI 更好地理解你的创作意图。
完成歌词编辑后,你可以点击“选择一首歌曲作为生成参考”来选择一首你喜欢的歌曲作为参考,确定你创作的歌曲的基调。你不仅可以从已有的歌曲库中选择,还可以上传你自己喜欢的音乐文件作为参考。上传的文件需为 mp4、m4a、wav、mp3、mov 等格式之一。
在选择完参考歌曲后,点击“生成歌曲”按钮,天工 SkyMusic 会根据你的歌词和参考歌曲,快速为你生成三个音乐作品。你可以试听这些作品,选择你最喜欢的一首进行下载和分享。
天工 SkyMusic 虽然不能吃到酸菜鱼,但它能“吃下”酸菜鱼菜谱。天工 SkyMusic 采用了非常经典的 rap 风格来演唱《酸菜鱼之歌》,节奏感很强的同时,采用了非常轻快的节奏和情感,让歌曲充满了趣味和创意。让人“一口接一口,根本停不下来”。
此时,心情正好,阳光正好,写下了两句打油诗,让天工 AI 进行续写,并生成了歌曲《阳光正好》。虽然这一版并非是最符合原本歌词意境的,但却是相当具有技术含量的。女声的高音独唱,加上简单的钢琴和弦,让这份阳光正好多了一丝雨后初晴的味道,而这份无限接近于真人的高音,给人以走出泥潭的力量,使之从一众欢快的曲调中脱颖而出。
“天工 SkyMusic”还能用温柔的男声唱起流行乐,一首《再见一面》唱出电视剧男女主分别之际的依依不舍,回忆起往昔种种的甜蜜,让不舍之情更加浓烈,虽然恋人已经分别,但梦里却还是那张熟悉的面庞,怎叫人不为这段感情动容。
依托于天工大模型的优秀性能,能够让天工 SkyMusic 不受限于特定的曲风,不论是高音的独唱,还是流行歌曲,抑或是特色的东本二人转,均有不俗的表现。这份个性与创意,与简单易懂的操作,能够让用户的每一份灵感都得以实现。
“天工 SkyMusic”的音效处理也十分出色,无论是音频的清晰度,还是音色的饱满度,都达到了业界领先水平。这使得用户在创作过程中,能够更好地把握音乐的细节,让作品更加完美。
此外,天工 SkyMusic 还具备强大的社区分享功能。用户可以将自己的作品分享到社区中,与其他音乐爱好者交流心得,互相学习,共同进步。这种互动性的设计,不仅让音乐创作变得更加有趣,也让用户能够从中获得更多的创作灵感。
听完上面的音乐,是不是给你的内心带来“亿点点”震撼,AI 竟然已经能制作如此高质量的音乐作品,曾经音乐创作梦想的小火苗是不是也瞬间燃起?
天工 SkyMusic 是目前国内唯一公开可用的 AI 音乐生成大模型,基于昆仑万维“天工 3.0”超级大模型打造。
目前,天工 SkyMusic 具有五大特点:
1、高质量 AI 音乐
天工 SkyMusic 能够生成 80 秒 44100Hz 采样率双声道立体声 AI 歌曲,并可根据用户输入的歌词风格生成对应歌曲风格。
2、人声“以假乱真”
人声合成是 AI 音乐生成中最重要、最能体现生成效果和品质的维度。天工 SkyMusic 的 AI 人声合成能够达到业内顶尖的 SOTA 水平,中文水平极为优秀,发音清晰、无异响。其中文演唱效果更是显著好于国外产品,领先世界水平。
3、歌词段落控制
天工 SkyMusic 能够通过歌词来控制歌曲,让生成的歌曲可以明确分辨出不同歌词段落的情绪变化,体现出主歌和副歌、前奏和主歌的段落差异。
4、多种音乐风格
天工 SkyMusic 支持说唱、民谣、放克、古风、电子等多种音乐风格,用户在创作音乐时,可以通过参考音频制定想要的音乐风格。
天工 SkyMusic 这五大优势来自其自研的类 Sora 模型架构的底层技术支持。具体来看,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;
Diffusion Transformer 负责演唱,通过 LDM 让 Music Patches 被还原成高质量音频,使得“天工 SkyMusic”能够支持生成 80 秒 44100Hz 采样率双声道立体声歌曲。
这套模型能不仅能 hold 住音频及音乐的处理,在视频处理层面也有极佳效果。
昆仑万维董事长兼 CEO 方汉,在最近的采访中表示,昆仑万维“信仰大模型的力量”,并预计在 3 至 5 年后会出现 C 端杀手级的产品。
成立 16 年的昆仑万维,以游戏起家,业务覆盖社交、娱乐等多个领域,2022 年“All in AIGC”。
2023 年一整年在该战略的推动下,昆仑万维在人工智能领域发展迅猛。同年 8 月推出国内第一款 AI 搜索产品天工 AI 搜索;9 月,推出多模态大模型 Skywork-MM;10 月,开源百亿级大语言模型天工 Skywork-13B 系列;12 月 1 日,发布国内领先的 AI Agent 开发平台天工 SkyAgents。
今年 2 月,更新天工基座大模型 2.0,成为国内首个搭载 MoE 架构并面向全体 C 端用户免费开放的千亿级参数大语言模型 AI 应用。
在 “All in AGI 和 AIGC” 的战略推动下,昆仑万维逐步形成了 AI 大模型、AI 搜索、AI 音乐、AI 动漫、AI 社交、AI 游戏等 AI 业务矩阵。
昆仑万维作为一家在海外长期做内容和社交的平台级公司,不仅希望 AI 能在 B 端发挥价值,实现行业降本增效,更希望 AI 在 C 端能够让用户更好地表达自己,降低用户内容创作的门槛。
正如昆仑万维全新使命所表达的那样:实现通用人工智能,让每个人更好地塑造和表达自我。
■ 科大讯飞星火 京东 ▍产业大模型案例
■ 商汤日日新、腾讯,昆仑万维 ▍ 金融大模型案例
■ 盘古大模型,中国电信,医联 ▍医疗大模型案例
■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例
■知乎,360 大模型,火山引擎 ▍ 教育大模型案例
■ 网易,金山办公大模型 ▍ 更多行业大模型案例
上次介绍大模型重塑产品时代,BAT 新老玩家“生产力比武”
本文由大模型领域垂直媒体「AI 大模型工场」
原创出品,未经许可,请勿转载。
/
欢迎提供新的大模型商业化落地思路
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。