中美AI音乐正面刚,谁是最强王者?中国AI音乐天生与国外偕行掰手腕 ...

交流
沉默不是金 2024-5-14 13:11:24 399 0 来自 中国
要说近来AI最火爆的细分范畴,那就不得不提到AI音乐天生。
    外洋有「Suno」、「Udio」、「StableAudio2.0」……国内现在只有昆仑万维的「天工SkyMusic」,但以上每一个AI音乐天生应用都是实打实的可上手。
    那么,同为AI音乐天生范畴具代表性的产物,同样主打几分钟内即可天生高质量的音频内容,中外AI音乐天生模子毕竟有何差别?哪些产物本领更被用户所看重?
    接下来,就让我们以外洋代表玩家「Suno」和国内代表玩家「天工SkyMusic」为对比,一探毕竟,来一场气力对决吧!
    起首让我们同时打开「Suno」」和「天工SkyMusic」。
    现在Suno只有网页端产物利用入口,而「天工SkyMusic」则是在集成在手机APP端,这一点上来说,「天工SkyMusic」更得当国人的利用风俗。
    先来说「Suno」,它的界面包罗了Home、Create、Library、Ecplore等几个次级页面,Home相称于是「Suno」用户作品的“展示柜”,收纳了接待度较高的热门作品,以及各种音乐风格的作品合集,好比布鲁斯、说唱、古典等。点击Create即可进入创作页面。



    而「天工SkyMusic」被收纳在「天工APP」的板块,同样具备用户作品展示、灵感指南等功能。相较而言,「天工SkyMusic」的界面更为简便,创作入口更为直接。
    从操纵层面,固然都是AI音乐天生应用,但这两款产物的天生逻辑有着一个极大差别。
    「天工SkyMusic」让用户在曲库中选择歌曲大概是本身上传歌曲作为参考;「Suno」则必要用户用较为精准的乐理知识精准形貌想要的音乐风格。



    相较而言,「天工SkyMusic」对于纵然没有音乐配景的小白用户,哪怕缺乏专业乐理、乐器等专业练习,也不妨碍用户精准“告诉”AI想要的是什么。
    但在「Suno」的创作过程中,必要用户用天然语言正确地输入“提示词”,包罗计划音乐风格相干的关键词形貌,如:Pop、Folk、Acoustic,以及感情氛围相干的词,如:Uplifting、Hopeful、Joyful……,这实在在用户上手之时,就举高了门槛,好比该怎样精准形貌雷同《以父之名》曲风的音乐?



    「天工SkyMusic」对没有担当过专业音乐培训的平凡人来说更加友爱。绝大部门平凡人对音乐流派的相识水平不深,对曲风的把握也不敷精准,泛泛形貌很难过到抱负作品,找一首雷同的音乐来做参考,可以或许比语言形貌更好地表达对作曲的需求。相比之下,「Suno」大概更得当对音乐感爱好的极客大概专业音乐人士来利用。
    接下来,我们再来看看两款AI音乐应用自带的“AI作词”功能测评。
    让我们以《洛阳铲》为题,看看「Suno」和「天工SkyMusic」分别给出了怎样的答卷?



    团体来说,「天工SkyMusic」主动天生的歌词更符合古风结果,而「Suno」主动天生的歌词略显生硬,缺少了歌词应有的灵动与韵味。固然,让一款外洋应用“说”中文已经是难为TA了,这题算附加题,不计分。
    人声合成是最能体验AI音乐天生结果和音乐品格的维度。「天工SkyMusic」的AI人声合成,可以或许产生中文程度极高、发音清楚的歌声,显现出杰出的音频质量和传神的演唱结果,已经到达业内SOTA程度!
    在这方面,两相对比,Suno的中文演唱程度就显着差了许多,唱起中文歌来显着有一种老外说中文那味儿。下面这首Suno天生的音乐作品,确着实中文发音上既不清楚也禁绝确。
    视频1
    【用户用suno制作的中文歌】
    值得一提的是,对于中文用户来说,「天工SkyMusic」还具备一个超等惊喜的功能——方言歌的创作!中国是一个拥有丰富方言文化的国家,各地的方言都有其独特的韵味和表达方式。通过提供「方言版」歌词,并利用具有方言特色的歌曲作为参照,「天工SkyMusic」就能天生出具有浓厚地方特色的音乐作品。
    以用户天生的这两首四川rap和粤语情歌为例,不但展示了方言歌曲的创作大概性,也表现了「天工SkyMusic」在中文范畴的上风。四川rap的热情和节奏感,粤语情歌的婉约和蜜意,都通「天工SkyMusic」得到了复刻!
     [满是爱四川版.MP4]
     [剁椒鱼头.mp4]
    颠末现实上手后的深度体验,信赖中外AI音乐天生大模子大PK的胜败,已经有了明白的答案。
    究竟上,根据官方数据,在人声和BGM音质、人声天然度、发音可懂度等几个指标上,「天工SkyMusic」的综合性能都逾越「SunoV3」,成为最新音乐AIGC的SOTA模子,让中国的自研大模子技能第一次在AIGC范畴领跑环球。



    4000亿参数,国内音乐AIGC性能之王
    「天工SkyMusic」的各方面本领都能秒杀国外音乐大模子,背后的技能底气来自那里?
    这要从多年前,昆仑万维的AI结构提及。2016年公司就收购了StarMaker,负责整个产物的研发及运维工作,并以此开展AI音乐的研究及结构。
    本年2月,昆仑万维发布了天工2.0,已经远超行业水准,令人赞叹!现在,4月17发布的天工3.0可谓光速发展,其模子技能知识本领提拔凌驾20%,数学、推理、代码、文创等本领提拔凌驾30%,相称于是一个“文武双全”的博士!
    在天工3.0推出前,市面上公认最锋利的大模子Grok-1参数为3140亿,天工3.0到达了惊人的4000亿!相称于这个“博士”的大脑储存了云云巨大的信息,并能以秒为单元举行处置惩罚。
    天工3.0一经发布便成为环球最大的开源MoE大模子之一。在MMBench等多项权势巨子多模态测评效果中,“天工3.0”的体现已经凌驾了GPT-4V,领跑环球,给人们带来全新颠覆式的人工智能体验。
    「天工SkyMusic」便是基于“天工3.0”基座开源大模子,不但实现环球领先,还做到了AI音乐天生范畴的“环球首家公开技能架构”。
    「天工SkyMusic」接纳音乐音频范畴类Sora模子架构,但为了得到更传神、更专业的音乐结果,绕开了现在市面上主流的符号音乐天生技能门路,选择了一条对技能要求更高,资源投入更大的大模子技能门路。
    在无数次研发实行算力算法投入下,「天工SkyMusic」乐成攻克难关,探索出Encoder—DiT——Decoder的最佳方案。
    正是在AI范畴数年深耕,才气厚积薄发。「天工SkyMusic」的发布引爆音乐财产,让专业人士不再为高昂的音乐制作本钱苦恼,让热爱音乐的平凡人感受到音乐创作的兴趣,更是天下看到中国自研大模子在垂直范畴的气力。
  “AI会代替音乐人吗?”这类题目各人也不消再担心。将来,「天工SkyMusic」将成为中国音乐财产紧张的创作工具之一,资助音乐人创作更多良好作品,进步服从。昆仑万维也将连续优化、迭代财产,推动中国AI及音乐财产发达发展。
您需要登录后才可以回帖 登录 | 立即注册

Powered by CangBaoKu v1.0 小黑屋藏宝库It社区( 冀ICP备14008649号 )

GMT+8, 2024-10-19 12:42, Processed in 0.160174 second(s), 33 queries.© 2003-2025 cbk Team.

快速回复 返回顶部 返回列表