计算机不可能替代音乐家——访谈谷歌网络音频API团队负责人Chris Wilson

龚诗茹  | 音乐财经 |  2014-11-10 17:22 点击:
【字体: 】   评论(

Chris Wilson在谷歌开发了Chrome浏览器,并领导网络音频API团队。他认为,人们并没有找到让计算机变得有创造性的办法,认为计算机将取代音乐家的想法有点牵强。本文编译自《音乐商业》杂志10月刊的访谈。


MBJ:最近为什么你开始涉足音乐?

Chris Wilson:我是计算机科学与工程专业的毕业生,但我十几岁的时候就是狂热的合成器迷。这份热情一直延续到我30来岁并且还成立了一个乐队,但后来解散了。后来妻子和我决定要一个孩子,于是我的空闲时间几乎留给了他们。

Web浏览器贯穿我的整个职业生涯,最初我在伊利诺伊大学工作,然后到美国国家超级计算应用中心(NCSA)开发Mosaic,参与编写它的Microsoft版本-这是非常早期的浏览器。后来我搬到了在西雅图的微软,并帮助开发了IE浏览器。大约四年前,我受雇于谷歌,但由于我的合同中的非竞争条款,我不得不中止一年的浏览器方面的工作。

我进入了Chrome浏览器的开发团队,之后开始研究网络音频API(网络音频应用程序编程接口)。Chris Rogers是API方面的首席工程师,他曾设计API来做各种各样强大的音频应用。对于任何其它的音频API,你要研究一本关于数字信号处理(DSP)的书并处理输出的每一个字节。我喜欢用振荡器调整声音,建立一个二阶滤波器,设定截止频率和Q因子。将所有这些东西集成在Web浏览器中对我来说意义重大。跟Chris一起,我学到了大量有关DSP以及网络音频API的工作原理。所以当他后来离开谷歌,我接管了网络音频工作组。此后我开始标准化API并在谷歌内部推行。虽然我也做其它工作,但开发网络音频API是我最大的兴趣。

MBJ:为什么一个网络音频API的发展对音乐家很重要?

Chris Wilson:因为它可以让音乐家们进行远程合作,这在今天是不能实现的,因为所有的硬件和软件都不兼容。试想一下音乐家在Web浏览器上进行合作,从最初的构思到实际的创作,以及社区建设的潜力。想象一下一个数字音频工作站可以让你做东西并立即发布,以便其他人也可以介入到你的制作过程。有一些东西需要被修正或者被添加,我们也在发现挑战。

MBJ:那些挑战是什么?

Chris Wilson:音乐之间的合作是很自然的,我们会在一瞬间对声音做出反应。当一组笔记本使用同一个的WiFi播放音乐时,电脑会发送数据包请求。每一台计算机都在问:“我的数据包到达那里了吗?”当数据包互相发生冲突时,系统将会等待一段时间然后重新尝试。如果只是几个数据包被发送,那将不是一个问题,但如果是许多个数据包呢?想象一下将视频混合在一起。WiFi的问题是它不能使用一个可扩展的协议。它有一个内置的延迟——每一个数据包最多延迟大约6毫秒。如果我在这一端用笔记本连接WiFi,试图与另一端同样连着WiFi的好友合作,那么我们将会有12毫秒的延迟。延迟也会因为其它原因发生。事实上,由于TCP/IP的限制,让WiFi网络发生少于50毫秒的延迟几乎是不可能的。因此,音乐家进行在线合作的进程将会很慢。一个真正的现场音乐演出合作需要一个新的网络。4GLTE会有低很多的延迟,但它十分昂贵。

与此同时,你将会看到许多谷歌文档风格的相互合作,也许你跟你的朋友正在Ableton Live相同的音轨里一起工作。而且你在你的系统上制作音频,你的朋友也在她的系统上制作音频,你们都发送控制信息却不必担心延迟。从延迟这方面来讲,控制信息比音频信息更容易处理。

MBJ:我们能期待不久之后一个新网络的发展吗?

Chris Wilson:不幸的是,你没有在其他地方进行网络现场音乐合作的需求,这使得很难倡导新的网络。谁会仅仅为了一个现场音乐合作而去替换现有的网络基础设施呢?对于视频,你可以很容易通过我们目前的通路推送1080p(全高清)视频。在游戏里,你的帧速率是每秒60帧,这意味着每帧之间的间隔是17毫秒。按照这个速度,你可以落后你的好友好几帧而不至于感到厌烦。

不过,学术界里正在建设的系统也许能帮上忙,但我不认为它们能很快在家庭中推广使用。你可以用Google Fiber实现这一点,它比一般的宽带连接速度快100倍。

MBJ:新网络需要一个新的商业模式吗?

Chris Wilson:是的!在美国,当人们听到”节流使用网络”会十分沮丧。但是如果这样的替代品试图同时推送5个高清视频,你将占满整个带宽并影响到邻居的使用。在这种情况下,节流是有必要的,我们往往喜欢无限制数据套餐而不喜欢计量使用。而在欧洲,人们则习惯按使用的字节付费。事实上,按字节付费将更有利于在线现场音乐合作。

MBJ:你能再深入介绍一下网络音频API吗?

Chris Wilson: 在Chris Rogers开始开发网络音频那会儿,网络中的音频实在太糟糕了。你可以在后台播放音频文件,但不知道什么时候能播,因为音频的加载和解码被包裹在了一起。此外,带JavaScript的音频还会产生抖晃,这取决于其它正在运行的事件。

各种各样的原因导致构建一个音频编辑器也很困难。音轨最多能有5轨,如果有人试图建立,那么就不得不在平台之间来回切换。你有精确调整声像的能力的能力但声音的质量却很差。

网络音频试图建立一个专业的音频平台,让你得到精确采样的音频回放。你可以对音频加以处理,里可以得到系统里内置的滤波器之类的效果器,还可以做音频分析和可视化——因为你最想做的事情之一就是将你能听到的东西形成图像。

我们通过让开发人员访问解码器解决了编码和解码的问题:你可以加载和编码自己的音频,当你需要它的时候可以精准回放。你可以同时叠加许多声音——超出了耳朵实际上检测到它们的能力。该软件只是在做数学题,所以没有硬件上的限制。通过网络音频,你可以建立一个128种声音的合成器,然后有一个回路和效果器管道,并与可视化、分析、编码和录制挂钩。

核心是,这是一个为游戏制作声音的伟大又易于使用的平台。我的一位同事正在为谷歌I/O年度大会(一个面向软件开发者的会议)准备有关开发HTML 5游戏的讲座。他在会议两周前找到我,告诉我他需要为他的游戏找一个声音管理器并且他知道他应该使用网络音频API。于是我看了看他的工程,20分钟之后我想出了一个声音管理器。使用网络音频API实现3D音效很容易。事实上我总是告诉人们,学习一门编程语言不需要先行的框架。只需要使用网络音频,因为你可以很容易发现每个部分是如何整合在一起,从那里你还可以处理其它东西。

MBJ:你的音乐人工智能是什么?

Chris Wilson:我想没有人找到了真正让计算机变得有创造性的方法。举个例子,即使在今天,想出一个主唱音轨或者一段即兴演奏并不是我们考虑的计算机的任务。计算机可以对我们的创意有所帮助并成为助手。Band-in-a Box在我实在不知道该在旋律间填充什么音乐时帮助了我。“给我一些随机的音乐,我看看我是否会喜欢”——这样的想法自第一代琶音器发明之后一直都存在。

此外,认为计算机将取代音乐家的想法有点牵强。人们担心鼓机将要取代鼓手,风琴将要取代室内音乐家,但实际上这些都没有发生。相比1700年,人们平均花更多的时间聆听音乐,更多的人制作音乐而不仅仅只有专业人士。

你看诸如Pandora和Spotify的音乐服务,他们有效地使用人工智能找出下一首为你播放什么歌曲。这些程序能够在上下文中感知你的情绪并给出推荐。你可以追踪听众的偏好以及分析音频,但人类的活动在某种程度上是不可或缺的。

MBJ:软件开源对音乐/音频开发有什么作用?

Chris Wilson:这是为谷歌工作让我感到最强劲的事情之一。我开发的许多软件都是开源的。开发这款软件的门槛很高,依赖于思想交流和教育的目的。我相信开源软件对整个产业都有好处,尤其是最近五年的音乐领域。我相信它可以与闭源软件共存,我并不反对想要赚钱的开发商。但是我十分高兴看到人们能从你做的东西里学到什么,这也是我开发网络音频API的原因。

除此之外,有数以百计的卷积脉冲响应文件你可以组合成自己的录音免费提供在互联网上。也许你可以找到一些家伙在德国中部的大教堂里录的混响在网络上提供给其他人使用。

本文编译自伯克利音乐学院《音乐商业》10月刊,如希望阅读原文请点击超链接下载!

原文作者: Griffin Davis 和 William Kiendl


中国音乐财经网声明:

我们尊重行业规范,每篇文章都注明作者来源和原标题;我们的原创文章和编译文章,都是辛苦访谈和劳动所得,请转载时务必注明来源:”中国音乐财经网“及微信号"musicbusiness"。
朋友们,如果您希望持续获取音乐产业相关资讯和报道,请您在微信公众账号中搜索"musicbusiness"或“音乐财经”,或用微信扫描左边二维码,即可添加关注。

TAG: 谷歌, Chris Wilson,
分享按钮