你很可能有过这样一种体验:不知道听什么歌的时候,打开「随机播放」。突然「随」到一首你曾经很喜欢,却好久没听过的歌,旋律一下把你带回到了过去的某个时刻,令你心生感慨。
(资料图片仅供参考)
对年轻人来说,「随机」的存在像空气一样理所当然。但实际上,它的历史并没有那么悠久,直到上个世纪 80 年代,「随机」功能才开始出现在 CD 播放器上。
如果你年龄稍大,熟悉磁带的工作原理,就更容易意识到:「随机播放」是音乐数字化之后,才可能被开发出来的功能,模拟介质是做不到的。
它绝不只是一个小功能那么简单。「随机」对计算机、信息学的发展有着深刻意义。
你甚至可以说「随机」是人类第一次创造了某种「生成式机器」。
因为,随机排列信息,就是在创造新的信息。
从 70 多年前,图灵设计的「随机数生成器」,到今天的「生成式 AI」,随机的概念贯穿了整个计算机发展史,也深刻改变了我们消费信息的方式。
在它不断演变、进化的过程中,我们也需要自问:人类是否还掌握着自我意志的缰绳?是否还拥有创造的自由、选择的权利?
随机播放
如果你用了苹果上个月刚推出的古典音乐 App,Apple Music Classical,你大概率会发现,它没有「随机播放」功能。
这不难理解,古典乐里的交响乐、协奏曲,时长一般在 30 分钟左右,且往往被分为三个乐章,不同乐章之间有明确的顺序,不能被打乱。
这导致,如果你想听古典乐,最好明确知道自己要听的是什么曲子。古典乐不能随时开始,随时结束,也无法「随机播放」。
这与古典乐诞生的时代背景有极大关系。在古典乐蓬勃发展的 18-19 世纪,「留声机」还没有被发明出来,人们想要听音乐,就必须去剧院,听乐队现场演奏。
与之形成鲜明对比的是流行乐。今天大部分流行歌曲的长度,多为 3-5 分钟。即便大部分专辑会包含 10 首左右的歌曲,长度加起来也接近一首交响乐,但歌曲与歌曲之间并没有明确的「顺序关系」,可以被随机。
这同样与时代、技术背景密不可分。流行乐的曲目长度之所以是 3-5 分钟,是因为 20 世纪初,首次被标准化的,78 rpm 的黑胶唱片,它单面能保存的声音长度,就在 3-5 分钟。
留声机和唱片的出现,开启了流行乐的时代。
包括「专辑」的英文是 album,还有「相册」的含义。这也是因为,早期的专辑由多张单曲唱片组成,这些唱片被装在一个类似相册的包装里,所以才用了 album 这个词来指代「专辑」。这种新的音乐组织形式,最终导致歌曲之间的「顺序关系」被弱化。
而激起人们「重新排列歌曲」热情的,是磁带。
磁带相比黑胶,最大的区别就在于它可以「擦写」,留声机也进化为录音机,人们开始自己录制磁带。
过程中出现了「混音磁带」。80 年代的人们,会买来空磁带,把多张不同磁带专辑里的不同歌曲,录进空白磁带,做成一张实体的「歌单」。当年最流行的录放机,常常会配备两个磁带卡槽,就是为了方便用户制作自己的混音磁带。
尽管只是重新组织、排列歌曲,这种「再创作」却给用户带来了一种全新的体验。把不同的歌曲以不同顺序放在一起,就能表达出完全不同的意义。当时的年轻人,纷纷开始制作自己的「混音磁带」,彰显品味,表达心意。
进入 CD 时代,音乐从连贯的模拟信号,开始演变为数字文件,这让「随机播放」终于成为可能。
最早是在 80 年代,飞利浦的工程师首次在 CD 播放器上实现了随机播放,后来索尼开始将随机功能作为一个卖点,放在了 CD 播放器上。
2000 年以后,MP3 播放器开始涌现,「随机播放」迎来了它的真正的黄金时代。包括当时刚刚回归的苹果的乔布斯,也将随机播放视为一个关键功能,加入了 iPod 和 iTunes。
2005 年,苹果推出 iPod shuffle,一款把随机功能刻在灵魂里的播放器。iPod shuffle 没有屏幕,除了控制播放/暂停、音量、上/下一曲按钮之外,就只有一个「随机」开关。它的设计理念就是让用户随时随地,戴上耳机,听到一首随机的歌曲。
如果说随机播放有什么妙处,一方面在于它打乱了专辑一成不变的曲序,加入了一点「不确定性」;另一方面也在于它代替用户做了「选择」,人们不用再从一个冗长的曲目列表里挑一首歌来听,而是只需要不断按「下一首」,等着随到一首自己想听的歌。
这种不断按「下一首」的体验,是不是跟今天我们刷短视频很像?实际上,短视频的核心交互机制,就是一种「随机播放」。
从「随机」到「推荐」
当年乔布斯如此重视「随机播放」,并非偶然。
「用电脑模拟随机」的尝试,可以说贯穿了整个计算机的诞生和发展史。它最早可以追溯到 20 世纪 50 年代,「计算机之父」阿兰·图灵,在史上第一台通用计算机 Ferranti Mark 1 里,加入了一个随机数生成器。
早期的随机数生成器,曾分化为两条技术路线,真随机和假随机。
简单来说,真随机是利用自然界中的随机物理现象,特别是与电相关的现象所产生的「噪音」,作为随机的依据。比如图灵最早的随机数生成器,就是通过导体中电子热震荡产生的噪声,一次生成 20 个随机比特,相当于可以生成一个 0 到 1048575 之间的十进制随机数。
与之相对的,假随机则是通过数学方法「算」出一个随机数,以及从设定好的「随机数池」里抽取数字。还有一些方法,能通过一个比较小的真随机「种子」,经过计算,推算出更多、更大的随机数。这样做可以提升随机数生成的效率。
人们对「真随机」的思考,最终上升到了哲学高度。
比如有观点认为,类似于「投掷硬币」这样看似随机的事件,如果你能充分描述硬币初始的运动和受力状态,同样可以预测投掷的结果。而类似的逻辑,可以推广到任何系统,只要构建足够准确的模型,充分描述系统状态后,就能推算出结果。
所以很多人都认为,真正的随机,只存在于量子物理层面。
但在具体应用上,随机数的「真假」已经不那么重要。除少数领域如密码学、博彩业,需要通过尽可能高质量的真随机,来保证系统的不可预测性、安全性。除此之外,大部分随机功能都开始往另一个方向演变——加权随机。
加权随机的一个经典应用是在游戏领域,比如暴击系统。
举一个很简单的例子,当游戏里一个角色的暴击率是 50% 时,玩家有 12.5% 的概率遇到三刀连续不暴击。出现这种情况的概率不低,但这却是一个很反直觉的体验,很容易导致玩家觉得「概率不真」,也给游戏体验带来了过多不确定性。
所以,今天的大部分游戏开发者,都会采用「动态加权随机」的设计。
具体来说,当暴击率是 50% 时,玩家第一次攻击的暴击几率会低于 50%,但如果没有暴击,下一次攻击的暴击概率就会上升,直到接近 100%,但总体的暴击几率依然符合 50% 的数字,只是暴击的出现会相对变得更均匀。在手游领域,类似的思路催生了另一种被广泛采用的设计:抽卡保底机制。
这种经过设计、修改的「加权随机」,最终在移动互联网时代,演变为了内容推荐算法。
比如曾被乔布斯重视过的「随机播放」,在流媒体服务的时代,演变为了个性化推荐的电台、歌单。
Spotify 率先迈出这一步,决定 all in 算法,Apple Music 也随之跟进。后来,几乎所有的流媒体音乐服务,都开始借助算法,向用户推荐个性化的「随机」歌曲。
最终,这种体验造就了移动互联网最成功的产品形态——短视频。
如果我们将短视频应用的交互逻辑拆解到底层,它几乎就是一个永远不会结束的「随机列表」,用户不断向上「刷」的动作,就像是在 iPod shuffle 的时代不断按「下一曲」。
而这种你永远不知道下一首歌、下一个视频会不会更好听、更好看的心理机制,持续吸引着用户,令他们流连忘返。
「自我意志」的缰绳
如果我们把抽卡、短视频、推荐算法都视为「随机」的一种变体,毫无疑问,「随机」已经统治了世界。
而这种统治也不出意外地,引发了争议。比如不少人认为,抽卡游戏本质上就是一种「赌博」,短视频则过度侵蚀了人们的时间和精力。各家都推出了一些「防沉迷」系统,辅助用户在使用这些 App 之余,掌握自己的生活。
包括音乐也是一样。今天有一部分「专辑原教旨主义者」认为,听专辑就必须按顺序听,随机播放是一种错误。
这一争端最早还只是爱好者之间的事情,但它在 2021 年被带到了台面上。当时知名歌手 Adele 在新专辑《30》发布后不久,向 Spotify 发出了控诉,指责 Spotify 专辑界面上的播放按钮,会默认随机播放整张专辑。她认为专辑本身的曲序不应被破坏。
事情最终以 Spotify 修改产品收场,直到今天,你在 Spotify 上点开任何一张专辑,默认的播放按钮都是「顺序播放」。
但这依然无法逆转「随机」的魔力。
今天的人们使用音乐软件,听歌单、听个性推荐、电台越来越多,除了极少数大牌歌手,还拥有强大的听众号召力之外,大多数音乐人,都需要想办法「迎合算法」。
很多作曲者,甚至在创作之初,就会有意设计一个非常激烈、有落差感的「高潮」,因为这样的曲子会更容易被用来做 TikTok、抖音的背景乐,也就更容易被算法推送到用户的耳朵里。
包括 Apple Music,早期极力宣传自己的歌单都由真人编辑,而非算法生成。但在 2021 年,苹果也推出了「自动播放」功能。
这个功能与 Spotify 的算法系统类似,会在用户播放一张专辑、歌单后,继续自动播放算法推荐的歌,无限续播下去。
事实证明,所谓的「个体意志」,其实相当虚弱,特别是在那些琐碎的事情上。就像被问到「晚上想吃什么?」,我们总是希望对方直接给到一个足够好的答案——我们想要的不是选择权,而是决策权。
但令人担心的是:如果我们将一切的选择都交付出去,交给算法和机器,最终的那个「决策权」,或许也会逐渐变得摇摇欲坠。
今天,越来越多的创作者,无论是音乐人、写作者,还是视频作者,都感到越来越难把握创作的「脉搏」,因为算法的偏好瞬息万变,稍不留神就会被冲刷下去。
而如果说推荐算法的影响还只是「人类发现了火」,生成式 AI 的涌现,以及它的潜在影响,则可能达到「核反应」的级别。
截至目前,一切的生成式 AI,它们的神经网络学习机制,本质都是在随机遍历各种词语、像素,在纷繁的神经网络里不断进行「加权随机」,找到一条概率最大的通路,生成结果。这个结果可以是语句、图片或视频。
生成式 AI 的出现,必然会戳到人类的「软肋」。毕竟你不再需要自己去遣词造句、拍照、画图……就像你不需要想自己要听什么歌一样。
这里的问题同样在于,我们会不会因此失去原本的能力?越来越多人会不会像短视频时代一样,不再知道歌名、歌手一样,失去说话、造句的能力?
答案依然藏在「随机」的漫长历史中。
无论是随机播放,还是内容推荐算法,都并没有抹除创作者的存在。技术不断发展,不变的是每一代人,都找到了聆听、理解音乐,以及进行二次创作的方法,后者甚至变得越来越丰富。而越是在一个充满不确定,充满随机的时代,越是需要我们主动去理解、思考,握住意志的缰绳。
这正是「个体意志」的体现,思考不停,创造不止。