你喜欢什么歌？算法或许能预测_数据分析师-CDA数据分析师官网

热线电话：13121318867

你喜欢什么歌？算法或许能预测_数据分析师

2014-12-20

你喜欢什么歌？算法或许能预测_数据分析师

披头士乐队（Beatles）的骨灰级粉丝当然能够详细说出披头士在八年间音乐风格的变化。而现在，科学家开发了新的算法，借助数学方法和计算机技术来分析歌曲或者专辑之间的相似度，并且成功地对披头士和其他知名乐队的歌曲按照专辑的发行时间进行了排序。论文的作者里奥尔·沙米尔（Lior Shamir）接受采访时这么说道：“我相信，当计算机的计算能力越来越强大的时候，一些现在只能由人类完成的音乐或者艺术作品，在将来会更多地借助计算机的帮助。”

“With the Beatles”

“如果你不是披头士的粉丝，估计说不上来《Help!》其实比《Rubber Soul》录制的更早，但是我们的算法可以。”沙米尔在声明中说道，“我们的实验表明，人工智能能够分辨流行音乐风格的变化与进步。这是一种全新的方法，而它只用‘听’就可以了。”

米沙尔是一位计算机科学家，但他同时对计算机和人文学科的交叉研究而着迷。“我很喜欢将计算模型运用在人类的艺术创作里，比如视觉艺术方面。”他这么说道。米沙尔的算法能够让计算机将每首歌转换为类似二维频谱的视觉图片。这张图能够显示歌曲声波变化的频率、形状以及纹理。接着，该算法通过比较声音的“频谱”来对不同的歌曲进行分析与排序，最后利用统计学方法对两首歌曲进行相关性分析。

米沙尔向人们解释了他们是如何将音乐转换为二维图像的：“频谱仅仅是用来展示数据的一个方法。比如，横轴可以是一首歌曲的时间线，纵轴则是每一个音节的频率等等。所以我们可以用二维图像的方法来表示一首原始歌曲。对于专辑，我们则会综合专辑所有歌曲的特征。”然后，米沙尔向果壳网展示了算法最后生成的披头士歌曲和专辑的相关性树状图。图上歌曲以及之间的连线长短表示它们的相似度，距离越长，相似度越低，反之亦然。“如果是专辑的话，那么简单来讲我们会取所有歌曲的平均值。”他说道。接着，计算机会根据歌曲以及专辑之间的相关性，分析计算出它们在图片上的位置、距离树状图主干的距离以及节点的位置，最终输出出它们的排序图。

披头士歌曲与专辑的树状排序图。图片来源：研究论文

该算法分析出了《Please Please Me》出自披头士的第一张专辑《With the Beatles》，它也正确地指出了披头士不同时期的专辑顺序。它同时显示，披头士的这些早期的歌曲和晚期的歌曲，比如“Abbey Road”是截然不同的。虽然《Let it Be》是披头士发行的最后一首歌曲，但实际上这首歌比《Abbey Road》录制的更早。也就是说，尽管打乱了发行日期，米沙尔的算法可以根据歌曲的特征，从而正确地识别出歌曲创作的顺序。

“Let it be”

米沙尔的研究并未止步于披头士。他在分析了披头士的歌曲后，自然而然地将目光转向了其他知名乐队：“除了披头士，我们还分析了很多乐队，比如U2或者ABBA。对于这些乐队，我们的算法都成功地根据歌曲特征进行了正确的时间顺序排序。”其他被分析的乐队还包括惊惧之泪（Tears for Fears）、比吉斯（Bee Gees）和皇后乐队（Queen）。

U2乐队（左）以及ABBA乐队（右）歌曲与专辑的树状图。图片来源：研究论文

熟悉U2乐队的粉丝能注意到，算法也会认为U2在1983年发行的歌曲《War》与他们的其他歌曲在风格上是如此的不同。ABBA乐队在音乐风格上则基本保持了一致性，而他们在1981年发行的《The Vistor》的风格则非常的一枝独秀。米沙尔和他的同事们同样发现，惊惧之泪的两首跨越15年的歌曲在风格上有惊人的相似性：分别是乐队在1989年解散前录制的《Seeds of Love》和2004年重组时录制的第一首歌《Everybody loves a Happy ending》。算法同样正确地对皇后乐队的专辑《Hot space》之前与之后的歌曲进行了时间上的排序（《Hot space》被认为是皇后乐队风格转变的标志性专辑）：《Hot space》之后，他们的风格远离了之前的主干，转向了另外一边。

惊惧之泪（上）与皇后乐队（下）歌曲与专辑的树状图。图片来源：文章论文

而对于不同乐队之间的音乐风格比较，米沙尔表示：“每个乐队都有自己独特的声音和风格，所以他们彼此是不相同的。我们的实验结果表明，算法能够轻易地将他们区分开来。”他同时也打趣地表示：“分析中国风的音乐是个好主意，我们应该要尝试一下。”

“Everybody loves a Happy ending”

沙米尔希望，这个算法能够用来整理音乐资料库，并且帮助用户更好地浏览与搜索他们所喜爱的歌曲、艺术家与专辑。而在像Spotify、Pandora和各种网络电台的音乐流媒体服务里，该算法能够更准确地根据用户已经“赞”过的歌曲来建立用户的音乐偏好，从而推荐更符合用户口味的歌曲。这样，就不再需要根据以往的分类或者相似歌手来进行音乐搜索，也不需要用户一而再、再而三的对电台进行“调教”。

“信息革命能够让每个音乐家向公众推广他们的作品，但现在的问题是，我们如何更好地在庞大的数据流里发现我们喜爱的音乐。” 米沙尔说道， “我希望建立这样一个系统，它能更好地根据它‘听’到的歌曲来学习用户的音乐喜好，然后不断地寻找更多用户也会喜欢，但可能并不知道的音乐。我希望，这能成为一场‘革命’（披头士的歌曲《Revolution》，即革命）。”

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；