相关赛道:

“让每个有才华的普通人都可以创作音乐” ,ACE虚拟歌姬完成Pre-A轮融资 | 5Y News

五源资本 5Y Capital 2021-09-08 13:59:34 来源: 五源资本 5Y Capital

ACE虚拟歌姬近日宣布完成数百万美元Pre-A轮融资,知春资本领投,老股东五源资本继续跟投。

ACE虚拟歌姬是一款结合了AI歌声合成技术的音乐创作APP。其主体公司北京时域科技致力于用全新的音乐引擎赋能用户进行音乐UGC创作和分发,并通过打通创作端、消费端的结构化数据,形成新的音乐供给的同时,使未来革新音乐媒体形态及消费体验成为可能。

Q1

为什么要创业做ACE虚拟歌姬?

郭靖:2015-2016年是我的gap year,我去硅谷想探索一下未来有什么有趣的方向可以让我有所作为。这是我人生中一个奇特的转折点,为了一边探索一边筹备以后想做的事,原本是non-tech出身的我,开始自己写机器学习代码、建网站、手绘动画、hack手机硬件……

这让我意识到,很多事情没有那么难,阻碍人们创造力发展的很可能不是创造力本身,而是工具门槛和领域内既得利益者塑造的假权威。前者拉高了人们开始尝试的门槛,后者常常树立错误的目标,让人觉得,“必须要做到那样精细、高端、专业,才能称之为作品”。但创造力不应该是人使用工具的能力,或者人把自己变成工具的能力,而是人之所以为人的、最底层的东西,灵光一闪的idea和伟大的感觉……工具应该更好地去为人服务,这个观念我称之为“去工具化”。

2018年底,我和合伙人结束了AI方向的第一次创业,在寻找新机会时看到了AI生成领域的新突破——AI可以赋能音乐的创作,让好听的音乐不再是垄断在头部创作者手里,而是每个有才华有灵性的普通人都可以创作。这让我们非常兴奋。音乐一直没有UGC化,普通人创作音乐到底卡在什么地方,从那时候起,我们就开始在寻找答案。

Q2

你对AI赋能音乐创作的未来有哪些想象?ACE虚拟歌姬会在其中承担什么角色? 

郭靖:ACE将是下一代的音乐创作与分发平台。

现在的音乐从创作、制作、发行、变现的各个环节都存在高门槛的问题,高门槛带来的是典型的PGC生态。有才华的人从想开始学习创作歌曲,到把歌曲制作成可发行的作品、真正发行出来受到关注、真正产生利益,每一步都困难重重。每个环节消耗的成本越多,意味着整个行业越倾向于筛选出少数、确定性、低风险的标的,也就是所谓头部。

ACE从第一天起,就同时在做创作与分发。在创作端,AI是一个很好的技术变量,比如我们的AI歌声合成,让“歌声”这个音乐创作中最重要的乐器实现数字化,创作者可以随时调用各种音色的虚拟歌手——他们7x24小时为你服务,让你去实验自己的作品。在所有乐器都已经数字化调用的当下,让人类歌声数字化,是数字化音乐创作中一直未能解决的一步。

另外,诸如AI作曲、作词这些技术,可以进一步降低创作门槛,将创作中的“问答题”一部分变成“选择题”,用审美驱动创作,而不是用工具熟练度驱动创作。但同时我们不局限于AI技术的使用,任何可以降低音乐创作门槛的技术变量都会被用于ACE的迭代,ACE创作工具的终局将是一个结合了AI、云渲染、实时协作、音乐可视化的新一代音乐创作引擎。

音乐创作者的数量应该是千万级别,现在还有1到2个数量级的差距。我们相信新的创作者可以带来全新的更广阔的内容空间以及全新的内容形态,这样才能逼近音乐这种内容的最优解,那个时候人类徜徉在崭新的音乐之海上,可能无法想象我们现在的音乐是如此的枯燥和匮乏。

Q3

创业以来最难的事情是什么?最有成就感的是什么?

郭靖:最有成就感的是,我们把AI歌声合成技术做到了可能是全球最好的水平,从演唱自然度、歌手还原度、情感丰富度上,目前还没有找到比我们更好的落地产品。而我们的团队都是一群非典型技术人才,CTO原先是开发游戏引擎的,主力算法工程师是02年的,我们尝试了很多方法,最终搞定了很多歌声合成算法和工程上的突破。

在发现人才这件事上,我们也走得比较刁钻,从最开始迷信标签,到主动发掘到动手能力强的年轻人。很有趣的是,这些人才的正反馈,也进一步让我觉得,人类的创造力来自于想法和灵性,专业度和经验积累只是一个低天花板的进入门槛。任何一个领域里,逾越了这个门槛后的人们,做好该领域的一件事,本质上跟做好一顿饭,打扫好自己的房间,没有什么区别。厉害的人,做饭也厉害,只要他能跨过置办锅碗瓢盆的门槛。

之前一年多一直挣扎在寻找技术人才上,所以我一度认为解决技术问题最难。但是现在觉得,找到对的事情,永远是创业路上最难的。我们相信音乐创作平权的大愿景,但是每个阶段什么是最主要的问题,路径怎么设计,第一步达到什么目标,这些事是最难的,也是我最应该解决的问题。

Q4

关于Z世代什么最令你好奇?你是怎么理解Z世代创作者的?

郭靖:其实我认为Z世代和以往任何一个时代的年轻人没有什么不同,都是一帮赤诚的真我没有退化的人。人变老的过程,就是用真我交换现世的资源、地位、经验的过程。

在真我与功利交换的过程中,现在的年轻人,面对着一个可能是最友好的环境。他们可以以前所未有的程度保留真我的同时,也达到功利上的自我实现。因此,你会发现他们总是超乎我们老家伙的想象。尤其00、05后,他们拥有极度多元的爱好和审美,又会在你意想不到的地方达成共识。他们不会为了标榜而个性,好的就喜欢,不论你是摇滚、嘻哈、电音还是凤凰传奇、民族歌手。他们有很强的好恶,却没有明显的忌口,另外他们还有很强的道德洁癖。

理解Z世代的方法,就是把自己想象成一个不受现世功利、既有价值观绑架的人,你会喜欢什么,讨厌什么。这些特性也体现在Z世代的创作中,他们的歌曲作品既可以是文艺清高的,也可以是鬼畜搞怪的,这里面没有大人们强加的鄙视链,好听,创意好,他们就觉得好。

Q5

在所在领域,你有什么反共识的思考?外界对你们最大的误解是什么?

郭靖:首先的一个反共识是相对于音乐制作行业的,大家普遍认为现在短平快的媒体在摧毁人们的音乐审美。这件事我不认同,我认为人们应该花更多的注意力去欣赏音乐中那些真正让你“DNA动了”的东西,那些big idea。big idea是这首歌用海丰话给你描绘了一个你从未见过的生活场景,让你仿佛穿越到了90年代的乡镇,骑着破摩托踩着人字拖。big idea不是什么蓝光音质,不是音乐人经常强调的声音中丰富的动态。

另外,对于创作工具应该降低门槛这件事,我早期和大多数人理解相同,认为门槛越低越好。但我现在觉得,门槛和表达,是一个trade off。门槛如果低到需要压缩内容的主干逻辑,那必将牺牲内容表达。就像短视频工具最终也不得不教会创作者,什么是转场、什么是剪辑,但小咖秀不用,因为小咖秀不是内容创作工具,而是博取社交糖果的工具。这种工具需要做到最高的投入产出比,投入最少的学习成本,创作出最好玩的内容,但并不关心表达,不能真正创作出有消费性的内容。

所以我们做AI赋能音乐,没有选择全自动生成这条路线,因为我觉得,如果点个按钮,算法就给你一首歌,告诉你“呐,这是你的歌”,这不是在赋能表达。

Q6 

最近在思考的跟工作无关的问题是?

郭靖:电梯里整天在放“虎皮凤爪就吃王小卤”的广告。虎皮凤爪为啥叫“虎皮”呢?坑坑洼洼的质感更应该像蛤蟆皮吧。我想是因为“虎皮尖椒”,虎皮尖椒叫虎皮是因为炸完了辣椒上有一条条乌黑,像老虎的纹。但是炸完后,尖椒皮也会呈现坑坑洼洼的质感。到了虎皮凤爪这儿,这种坑坑洼洼的质感就会让人联想到虎皮这个称谓了。小时候老师告诉我们“美轮美奂”是形容建筑宏伟的,但我每次写作文,我都用美轮美奂形容我们学校的校花,我错了吗?语言的演化是基于共识的归纳法,还是基于元数据的演绎法呢?

ACE上有首歌,底下有个留言是“好活,就是有点好,虽然好听,但是就是比较好听,也不是说哪里不好听,只是比较好听而已。”另一个用户回复这条留言“你搁这搁这呢?”(笑死我了hhhhh)网络用语的演化过程,其实任何一个有context的人类,都能感知到它是多么的make sense,多么提高了表达的效率(不仅是意义,还有情绪),只是这些东西又很难用语言的叙述逻辑阐释。只能借用一个杀马特表情包的文案:“嘘,别说话,用心去感受。”

Q7

推荐一部你最近非常喜欢的作品?

郭靖:五条人《踏架脚车牵条猪》。

Q8 

为什么选择五源资本的投资?

郭靖:在众多内容形态的UGC化中,音乐一直是个难啃的骨头。音乐的很多特性让它具备了一定的头部倾向,不是所有人都相信音乐可以UGC化。但是五源和我们都相信人性底层的自我表达需求,和每个人潜在的表达欲和想象力,相信任何内容形态创作者的基本盘,都应该是“有才华的普通人”。

这些底层信念是我们做这件事的原生动力,也使得我们需要选择具有同样信念和同层次想象力的伙伴。

石允丰

五源资本投资经理

Q1

为什么投资ACE虚拟歌姬?

石允丰:工具的价值其实是被长期低估了。当你给用户提供一个创作工具,用户所能迸发出的创意往往会让人惊艳。2010年手机前置摄像头的成熟,让视频创作的门槛大幅降低,催生了今天我们每天都在刷的抖音快手。我们一直在思考什么是今天让创作门槛100倍降低的技术变量,那AGC(AI Generated Content)是我相信的一个答案,我相信AI有机会发挥移动互联网早期的手机摄像头的作用。

而音乐在过去的状态可能是10万个人听歌,1000个人唱歌,1个人创作歌曲。这个世界上「创作音乐 / 听音乐」的比例远低于其他媒体介质。音乐创作在过去对于普通人(比如像我这样唱歌跑调的人)来说挑战巨大。但音乐是人类最古老、最自然的自我表达方式之一,ACE虚拟歌姬今天让普通人也能和AI一起创作音乐、玩音乐、用音乐表达自我,也出现了非常有趣而独特的AI音乐风格。

今天大多数的AI在C端的应用都在匹配内容和人,那我希望AI不只是一个“猜你喜欢”的匹配器,AI有机会在音乐创作中激发更多普通用户的创意。AI生成的音乐可能和短视频App早期一样,大部分人并不觉得手机上短短的几秒动图和长视频网站上的网剧比起来有什么价值,但当我们把时间拉长,AI和用户共创的音乐,可能是10年后用户每天都在听的音乐。

目前,在中文AI歌声合成领域,ACE的AI歌声合成技术已经达到全球最顶尖水平,在演唱自然度、演唱情感度、技术先进与使用便利性上都远超其他歌声合成引擎。

ACE虚拟歌姬为用户提供多个AI虚拟歌手,用户可以在ACE的创作工具中,输入歌曲的旋律、歌词,并且选择AI虚拟歌手进行歌曲演唱。结合ACE提供的BGM曲库,智能音阶以及灵活的“演奏歌声”玩法,用户即使不懂乐理,也可以配合伴奏,凭感觉“摸”出一首歌曲。另外,ACE的“填词玩法”可以让用户在其他用户创作的歌曲旋律上进行二次创作,进一步降低了音乐创作的门槛。

ACE虚拟歌姬搭建起了一套从零音乐基础到巨佬制作人的完整成长体系,在满足创作者用音乐创作记录生活、表达自我的需求同时,也帮助创作者快速进阶。在ACE虚拟歌姬的优质创作者中首次创作音乐者比例达到了60%,典型如零音乐基础的创作者「與章」已在平台发布近30首原创作品。

创作者年龄分布在15-22岁,Z世代音乐风格偏好广泛,表达欲旺盛,在ACE虚拟歌姬中所创作中歌曲展现出了独特的消费性,发布的音乐作品从古风、二次元、到鬼畜,包罗万象,更有优质作品在其他平台自发传播成为热门。每天,ACE平台上都会诞生1-2千首全新的歌曲,且这个数量还在持续增长。Z世代音乐创作者所展现出的才华与爆发力已有目共睹,仅Spotify歌手歌曲播放量累计Top20 中Z世代歌手就已占5席。

除了创作端,ACE还提供了作品社区功能,用户可以将作品发布到社区中与其他人分享,听众也可以在feed流中找到自己喜欢的歌曲,关注喜欢的创作者。目前,ACE虚拟歌姬达到了上百万的累计用户,用户年龄也主要集中在15-22岁,以00后、05后为主。用户在作品主页中相互鼓励,高频互动,形成了内容创作与消费的正向循环。

但ACE虚拟歌姬还只是北京时域科技用AI赋能音乐创作,打造全新音乐创作与消费”愿景的小小一步。接下来北京时域科技将升级现有创作工具,不止于“AI歌声创作”,把ACE的创作工具拆分成一个独立的音乐创作引擎ACE Studio,更好地为Z时代的创作者赋能,北京时域科技CEO郭靖谈道。

北京时域科技团队背景多元且富有创造力,有来自腾讯字节跳动、中科院的工程师,也有大二就创办自己的音乐厂牌并成为华纳最年轻签约创作者的天才音乐人,以及02年出生,13岁就开始Coding的天才算法工程师。

传统音乐创作工具有诸多问题待解决,如所有DAW(数字音频工作站)几乎都不在中国售卖、需要付费本地下载大量音源、从无到有创作音乐难度太大等等,这些问题导致音乐创作的门槛极高且创作效率低下,ACE Studio将基于云端渲染,通过AI赋能、素材模块化、实时协作,让更多有潜力的创作者不必因为安装、创意与协同的门槛而被拒之门外,ACE Studio旨在成为新一代音乐创作者的聚集地。

ACE Studio与ACE虚拟歌姬的组合,将彻底打通音乐创作与发行的数据通路,以结构化的MetaData为核心,改变现有的音乐创作及消费生态:创作可迭代、版权可确权、呈现形式多样化,从而加速音乐行业的进化,真正实现优质创作者不断涌现(而不再是十年等一个周杰伦),音乐供给与场景的极大丰富,用户需求的快速满足,彻底改变人与音乐的关系。

显然,音乐行业已经多年没有发生大的变化,北京时域科技所选择这条路也并不容易,但正如硅谷教父Peter Thiel所说,创业公司就像游击队,喜欢选择那些不易生存的深山老林作为根据地。对于郭靖来说,去做那些别人不做,很难被攻破的事情让他与团队更有成就感——这不仅是创业公司的运作方式,更是创业的本质,也决定了你为竞争对手设置的壁垒有多高。

相关文章
稳中求进、质效并升:江苏银行擦亮普惠为民底色
CampNetwork完成2500万美元A轮融资,1kx和BlockchainCapital领投
交通运输部等:预计“五一”假期新能源汽车流量占日均总流量近20%
合盛硅业陷盈利困境,激进扩张后遗症凸显,实控人家族去年拿走近八成分红
1459亿,Chrome浏览器可能要卖了
精灵数据APP
金融大数据服务平台
立即打开