把AI科技融入音乐,他们做到了。
文
世昕
编
石灿
在古希腊神话中,音乐天才俄尔普斯有一把精美绝伦的七弦琴,能够弹奏出世间最令人陶醉的音乐。
后来,这把七弦琴被悬挂于天穹之上,谓之“天琴”。
“我们是做音乐科技的,所以想借这个名字传递这样一个理念,希望用科技让用户更好的享受音乐的美好。”
这里的“我们”指的就是“天琴实验室”。在前不久腾讯音乐娱乐集团(TME)打造的“ROCKNCode”TechME技术周上,天琴实验室——作为集团旗下首个音视频研究实验室正式亮相。
QQ音乐技术副总裁周文江向刺猬公社(ID:ciweigongshe)介绍,天琴实验室的前身是QQ音乐和全民K歌多媒体研发中心,实验室致力于通过AI科技提升旗下多个音乐平台的视听体验。
这到底是怎样一个团队,他们又研发出了哪些“音乐黑科技”,音乐技术未来的发展方向又会如何?带着诸多疑问,刺猬公社和天琴实验室的成员们聊了聊。
让音乐更具科技感
你是否经常会有这样的体验:一段熟悉的旋律在脑海里盘旋,却想不起来歌曲的名字;别人轻声哼唱的歌曲动听悦耳,又始终找不到原版;短视频背景BGM吸引了你的注意,评论里“求出处”却找不到答案。
如何解决这些“尴尬时刻”?你可能会想到现在各大音乐平台标配的功能:“听歌识曲”。
这一功能的最基础的核心技术在于把控音乐的“指纹”,也就是一首歌曲独一无二的声纹特质,并通过算法技术对音频指纹特征进行匹配。天琴实验室就是这一技术的先驱者之一,早在年就在QQ音乐平台上线了相关功能,并且长期在这一领域保持着领先优势,是世界音频识别技术赛道的“领跑员”。
“在音频识别这方面,我们处于国内外领先的地位。”天琴实验室音频团队负责人Ethan的自豪溢于言表。
能保持领先,天琴自然有“秘籍”,那就是不断推进技术革新。
自年起,天琴实验室便开始了“下一代听歌识曲技术”的研发工作,“秘籍”一练就是一年多,最终推出了以“翻唱识别”“哼唱识别”两大成果为核心的“听歌识曲2.0”。
新版本将“听歌识曲”的使用场景扩大到了生活中的各种时刻,无论是网络翻唱、现场live、视频背景BGM还是随意哼唱,用户都能找到想要的音乐。也是在这一年的世界音频检索评测大赛(MIREX)上,天琴实验室的听歌识曲技术凭借平均3秒识别一首歌曲的成绩一举拿下“音频指纹”项目的世界冠*。
之所以会进行这样的技术革新,根本原因还是为了解决用户新一轮的“查找难”痛点。“我们当时发现现在很多翻唱作品甚至比原唱火,但是通过以往的声纹匹配通用技术,用户却是找不出翻唱版本的音乐的,因为歌曲声纹已经改变。”
Ethan开始回忆公司决定研发“听歌识曲2.0”时的经历,“当时还有三个月就是春晚,业务判断上面出现的歌曲全是现场演绎版本,不仅用户使用听歌识曲的需求量更大了,新技术能否精准识别翻唱作品也成了新的关键点。”
音频识别,图源网络
技术难度高、用户需求大,顶着重重压力,在年春节前,Ethan团队终于获得了技术突破,翻唱识别率大大提升。春晚是最好的证明机会,当天晚上,Ethan带着团队进行了功能测试。
“还记得当时是刘欢在春晚演唱电影《流浪地球》的主题曲《带着地球去流浪》,我们的‘听歌识曲’技术直接识别到了电影版的歌曲。而在这之前技术是做不到的,直到现在仍然只有QQ音乐可以做到。最终的测试结果让我们都非常满意。”已经过去了一年多,Ethan还是对那一刻记忆犹新。
同时,对于Ethan来说,“同行的认可”也带给了他极大的鼓舞。
他提到了两个平台:酷我和