天美音频中心专家:游戏音频有哪些前沿方向?


导语:天美十三周年,天美联合知乎游戏,举办“游戏未来十三问”主题圆桌,邀请游戏从业者、玩家和广大朋友们,一同探讨和展望游戏的未来。本文为圆桌议题“游戏音频将如何发展?有哪些前沿方向?”下的回答,希望对大家有所帮助。

答者:天美音频中心专家 Beej Paz、Olivier PASCHAL、Rick Hernandez、Merle、Chris、赵鸿飞

游戏音频,即是存在于游戏世界里的一切声音,然而大家是否能够想象,在如今的一款开放大世界游戏中,存在的声音文件数量也许不是以千计,也不是以万计,而是以十万计。

在越来越庞大且复杂的游戏面前,游戏音频早已不是什么隐于背景中的音乐,仅由几位神秘的音乐艺术家就能闭门完成。在才华与灵感之外,AI 算法、机器学习、Object-Based Audio 技术、跨国合研等先进技术与模式,也已悄然融入游戏音频这块依旧让人略感陌生的领域。

天美音频中心制作室
游戏音频到底是什么?正在经历哪些新趋势?未来将如何发展?我们邀请到了来自天美音频中心的六位音频专家,其中有一直与天美共同成长的中国设计师,也有来自海外 AAA 游戏厂商的外籍专家。他们将与我们分享对游戏音频的热爱,以及对其未来发展的展望。
—— “我认为非线性声音设计是未来开启音频创意的关键。互动性和参与感是将声音与人联系起来的最佳途径,并且只能靠非线性声音设计,也就是游戏音频来实现。
大家好!我是 Beej Paz,我已经在游戏行业摸爬滚打了 13 年,加入天美之前,我在育碧担任音频总监。
游戏音频是我毕生热爱的事业,我认为非线性声音设计,是未来开启音频创意的关键。互动性和参与感是将声音与人联系起来的最佳途径,并且只能靠非线性声音设计,也就是游戏音频来实现。
当玩家在游戏中的决策/行动有了意义时,我们就能以此为切入点,让音频发挥作用。如果声音设计能够更贴近玩家、更具有意义,那么我们也能顺利建立起与玩家之间连接的纽带和信任。
音频带来的愉悦和沉浸感可以让玩家得到情感上的满足,塑造一个又一个的“感觉棒极了”的时刻。我们为玩家打造出的这些“魔力”时刻,不仅能够启发灵感,还将影响下一代从业者对未来游戏音频的观念。
我们总是从过去和现在的那些伟大前辈们身上得到启发,收获灵感。这是一种传承,我们这代游戏音频人就是这么过来的。
我在给音频设计师新人做武器音频设计方面的培训,图源育碧官网[1]
我主攻的方向是创意音频设计。我一开始入行是因为痴迷于武器设计和玩法,喜欢研究游戏声音是如何让玩家“入戏”的。我还热衷于探索音频的各种可能性,希望能通过声音,进一步走近玩家,建立共鸣。
要做到这一点,最佳途径就是打造出玩家们游戏时的记忆和体验,而这具体到音频设计师的工作中,就是关于武器音效、人物音效、技能以及玩家角色发出的一切声音
玩游戏其实是非常个人的一种体验,因为游戏角色是玩家的虚拟形象,是网络空间里的另一个自己。这对于游戏音频设计师来说是大显身手的好机会,为玩家的虚拟生活打造出更丰富多彩的体验,打造出让他们酣畅淋漓和念念不忘的音效!
玩家以角色形象体验游戏时,会在游戏世界看到自己的缩影。在这个维度上,我们希望玩家感觉自己就是游戏的主角,正在谱写他们自己的故事。此外,我们还能够通过声音创造情感和沉浸感,为玩家提供一种关键的体验和记忆。
当我们让玩家相信并感受到这个世界的真实,作为主角的玩家也是游戏体验的一部分,沉浸感就由此而生。背景氛围,视觉上的色彩和基调,加上风格相符的声音体验和音乐,会让玩家产生情绪和感受。对于音频设计师来说,这些都是很好的工具,能让我们为玩家打造奇妙、难忘的体验。
探讨令人难忘的音频时,我们可以把它和“感受”联系在一起。我们之所以会记住某些东西,是因为它们在我们的大脑里留下了正面的回忆。我打心底相信出色的音频设计师和音乐作曲家创作出标志性的声音记忆后,它们会深深地印在玩家的潜意识中。它的形式也许非常简单,比如说一段音效,或是某个角色的标志性配音。
在《使命召唤》系列中,玩家击杀反馈或爆头时,游戏加入了“叮铃”式的音效。这么多年来,这些简单的音效对 FPS 游戏音频产生了深远的影响。这是因为当玩家爆头的时候,游戏会发出标志性“砰”的一声。这马上就与玩家形成了一种联系,并让爆头操作与激爽/难忘的感受联系在一起。这个标志性的音效也许会成为体验和动机的一部分,驱使玩家不断去爆头得分。
《使命召唤》中最常听到的传奇音效 —— 命中标记的音效

另一个比较好的例子是,声音会给玩家留下难忘且身临其境的体验。下图是《最后生还者》循声者(Clicker)的视频演示,它真的给玩家留下了非常难忘和可怕的视听体验。
《最后生还者》中的循声者

有太多的游戏音频给玩家留下过很多美好的回忆。其中很多都是根据某个最早的音频修改或改编而来的,这些早期的音频设计让人印象特别深刻,玩家百听不厌,甚至还会把它们用在 Mod 里。屠夫的台词“啊...新鲜的肉!”就是个经典范例。
屠夫是《暗黑破坏神》系列中的 Boss,“啊...新鲜的肉!”为其台词,《魔兽》系列、《Dota》系列、《无主之地》系列等多部作品,均在游戏中对这个角色和其台词进行致敬
游戏音频的另一个关键功能是游戏音乐的运用,我们可以把其中的感受和情绪传递给玩家。音乐作为一种沟通手段,我们有多种有效的运用方式,让玩家享受美好的时光并沉浸其中。
音乐会驱使玩家的行动,控制游戏的节奏,并为体验定下基调。在游戏音频领域中,这是个强大的工具,可以完善整个游戏体验。
我一直坚信 AAA 游戏的音乐可以围绕以下三个层面打造有质量的游戏体验:

互动

叙事

剧情声/环境声

注:剧情声(Diegetic Sound)来源于电影术语,特指在一个叙事世界中已存在或正在发生的,而不是这个世界以外的东西。在电影领域,常常和声音结合一起出现,属于场景内的声音,角色可听见。
对我来说,最有趣的肯定是互动音乐。这是因为基于玩家在游戏的行为,我们这些音频设计师可以自由发挥去操控或驱动音乐。互动音乐是基于玩家正在体验的玩法状态或场景的反应。它也可以用来体现过渡事件 ,比如说玩家本来安心前行,突然要与成群僵尸战斗。
下图是一张简单的情绪色彩图,代表了音乐的强烈程度。你可以看出,刚开始情绪强度较低,然后逐渐上升,在游戏中的行动或冲突结束后,强度又恢复到较低的水平。
叙事音乐其实就类似于乐谱。在大多数情况下,它们都是脚本化的音乐事件,在序列中会播放特定的音乐。这有点像电影场景的线性配乐(例如:英雄的悲剧死亡,秘密的揭示等)。
剧情声/环境音在大多数 AAA 游戏中迅速流行了起来。这些都是源自游戏世界本身的音乐。有的例子是游戏里的音乐家/演奏家演奏乐器或吟唱歌曲,大部分时间里,他们也会跳舞。《巫师》系列里的游吟诗人就是一个常见的例子。
《巫师》系列《巫师之昆特牌》
2015 年参与《幽灵行动:幻影》的时候,我有幸负责音乐的音频文件,用作游戏的交互音乐设计。通过使用作曲家的音频文件,我可以构建出契合游戏情境的氛围音乐片段,比如说制定策略、进攻、防守、胜利、失败和加时阶段的场景。
游戏的音乐风格得保持一点黑暗色彩,还同时得是英雄主义风格的。我想要的风格类似于一个内心向善的神秘黑暗士兵。于是我使用了带有神秘黑暗骑士气息的乐器,此外,考虑到角色的设计和外观,音乐还需要带点电子流行乐的风格。
在核心玩法中,我们需要在不干扰武器音频和多人体验的情况下,用声音呈现高度的行为交互性。音乐设计是对音频设计的一种补充,当二者平衡地配合,就能呈现出很好的效果 —— 从团队出场,到敌人交火,再到过渡到得分界面,音乐都以交互地方式不断发生变化。
《幽灵行动:幻影》
因此,前文中我提到了令人难忘的音频和所谓玩家的“感受”,这两大要素的组合,在我看来是 AAA 游戏音频未来和潜在发展趋势的重要组成部分。
我认为在 AAA 游戏领域,音频功能的社交属性会成为未来值得探索的方向,这个探索方向在手游领域中也同样适用。
如今,我们的玩家已经步入了虚拟世界的社交时代。这会带来各种可能性,比如说 Meta(原 Facebook)未来几年将要实现的愿景。音频的社交属性不仅仅局限于语音通信和聊天,我们可以为玩家提供更多的东西,比如说利用互动音频内容来促进社交活动
我在前文提到了玩家的虚拟角色和化身,关于这一点,我觉得在未来某个时期,玩家也许会希望自己的角色唱歌,演奏乐器,并与其他玩家合作。
《盗贼之海》
这只是一个例子,但我不禁开始想象,玩家与其他玩家角色在网上同步和演奏音乐的可能性。在一些常见的音乐游戏中,玩家可以在单人模式下打鼓,弹吉他和唱歌,如果你有《吉他英雄》的设备和乐队的话,还可以和朋友在线下表演。
玩家也可以自己写歌,然后用网上的虚拟乐器组建乐队,这也是一种可能性。如果我要做一款这样的游戏,我可能会取名为《乐队计划(The Band Project)》。通过稳步发展的音频内容和音频技术,也许我们可以让玩家聚在一起创作自己的内容,毕竟他们向来都很享受做这些事情。
很多优秀的游戏创意都源自于 Mod。《Dota》可以算是基于《魔兽争霸》编辑器产生的 Mod。玩家天生就有创造力,他们很喜欢创造属于自己的内容,并和朋友一起体验享受。《我的世界》就是通过协作和社交激发创意的典范。
放眼未来,如果游戏允许玩家创建或操控游戏音频内容的话,会是一番什么样的光景呢?这可以通过各种形式和想法去实现,但核心在于赋予玩家控制音频内容的权力,这也就意味着合作是有意义的。
在我们看来,普通人和玩家都有一个自然的共通点,那就是喜欢社交,玩家也总是希望与另一个虚拟化身进行互动。未来,在玩家操控的角色中应用玩家自己的声音,也是未来可能影响游戏音频的方式之一。
这也许会成为很酷炫的事情,比如说当玩家创建角色,选择发色、体型和衣服的时候,他们可以用麦克风录制声音,把自己的声音应用到角色的声音动作上(攻击,受伤,死亡),甚至还可以设计特殊的台词和对话,当玩家处于多人模式的时候可以触发这些内容。
现在的自定义角色功能已经成熟到可以调整眼睛大小和头发颜色这样的细节,也许未来录制的声音也可以调整成特定的效果(比如说像机器人或怪物一样的声音,音调变化等等),所以只需要加入 DAW 插件,玩家就可以在自定义声音时选择预设好的效果。
听到你自己定制的角色语音绝对会是件很酷的事情。
有玩家在《恶魔之魂》角色自定义中捏出怪物史瑞克风格的人物[4]
关于游戏音频的社交属性,我们再深入聊聊这一发展趋势的背景。现实中有许多才华横溢的音频内容创作者,但我们需要配置音频管线技术,使音频内容处理,内容存储,以及各类智能系统得以运行,如此我们就可以像在《我的世界》中操控像素方块那样,处理音频了。
这些只是比较疯狂的脑洞:如果我可以与虚拟摇滚明星角色一起写歌,然后组一个乐队,接着在网络上一炮而红。作为玩家,我很乐意去体验这样的事情!
在线共同创作,现在已经是一个比较流行的趋势,也确实能把大家聚在一起。
举个例子,Nathan Evans 的那首船歌改编网络神曲“Wellerman”火了以后,掀起了一股翻唱和合拍热潮,来自各行各业的网友们纷纷加入,还增加了声部和乐器伴奏进行二次创作。
《Wellerman》衍生创作[5]

《Wellerman》衍生创作
未来,我们可以像 Nathan Evans 那样尝试游戏音频内容的共创。
对于音频制作者来说,这种令人难忘的个人、社交化体验也许会成为未来探索的方向。可能最近的五到十年里就会出现这样的趋势。
我们可以想象一下 50 年之后会迎来什么样的趋势?也许我们可以直接对着音乐播放器播放大脑里的音乐?
谁知道呢?感谢大家阅读我的回答 :)
—— “电子游戏正朝着更大规模、更快速和更复杂的未来加速前进,因此深度/机器学习辅助制作是游戏音频未来的必经之路。
未来的游戏音频会是什么样?这个话题聊上几小时、几天、几个月甚至好几年都聊不完 —— 不过这本来就是 IT 从业者该关注的事情。
作为天美音频中心的一名新成员,我很高兴,也很荣幸能跟大家分享我对未来 AAA 游戏音频制作的看法。
概述
首先,如果要对游戏音频的未来做出预测,我会立马想到以下三个维度:
美学:未来的声音“听”上去如何?(游戏音频未来的趋势、风格、互动性……
技术:我们如何实现?(工具科技、公司人才……)
媒介:用户如何体验?(平台、收听设备、环境等等)
每个维度讲起来都挺复杂,但值得深入。不过我这次希望先跟大家重点聊聊“技术”这一维度 —— 从游戏音频技术这片汪洋大海中,拎出一个特定的通用层面来介绍:工具和工作流
大家一起畅想未来、集思广益并将之付诸行动,对于游戏音频这一行业来说非常有必要,如果游戏游戏音频对你来说是个陌生的领域,我希望这篇文章能起到一些科普的作用。
《星球大战:战机中队》
1 游戏音频的未来发展方向?
身为游戏音频策划,我们不仅要克服重重挑战,让玩家能有悦耳的享受,还必须在技术上不断迭代,迎接未来。
我们需要不断思考:面对新兴技术,如何减少技术差异、快速磨合以便将更多精力投入在声音美学上?
电子游戏正朝着更大规模、更快速和更复杂的未来加速前进。因此,深度/机器学习辅助制作是游戏音频未来的必经之路。
我肯定不是第一个提出这一观点的人。其实在内容创作领域,这种看法已经是语音和音乐界的普遍共识,但除此之外,还没有太多和游戏音频相关的具体讨论,也就是深度/机器学习如何规模化落地,并转变我们对游戏音频的认知?背后的因素又是什么?今天我们就一起来探讨这些问题。
2 为什么需要深度/机器学习的辅助?
我觉得如果能先晓之以理,那么有些预测会更有说服力:
2.1 音频制作:低调吃亏的幕后团队
和视效团队相比,游戏音频部门(尤其是音效)就是吃了 “低调”的亏,不仅预算紧张,团队规模也小得多。因此,资深游戏音频师往往都是多面手,有多年的经验累积。
对比一下大家就知道了:视效有很多细分专业,包括动画、角色、环境、灯光、特效、绑定、UI、概念等等,而大部分公司的音频部门基本全靠音频设计师和作曲家。
除了严苛的职业素养要求,当代媒体产业中“音频跟着画面走(大多数内容创作的模式)”的现象,也让音频策划背负着巨大的压力,处处束手束脚。
如果你深谙制作的话就会明白,面对多个同时推进的项目,身处流程的最后一环,会让设计、执行和交付变得异常被动。我们需要随机应变的头脑,前瞻性的思维,以及缜密睿智的规划来按时按质完成工作。
《星球大战:战机中队》
不过有时候,我也感觉这可能得怪我们自己过于保守,不敢放开手脚。在已有的制作模式中反反复复、美学创新聊胜于无,最后只能实现不断妥协下的一些小目标。
人都是视觉动物,这一点在当今时代更为突出。我不是在抱怨,但身为游戏音频从业者,我们得拼尽全力去创新,才能解决各种难题;我们必须用有限的资源变出更多花样,这个趋势正在日驱主流!
2.2 日益庞大与复杂的游戏音频世界
毫无疑问,每个游戏音频设计者都面临这个终极难题:我们如何走出目前被动的行业“生存”窘境,先人一步,打造令人耳目一新的未来音频体验?
除了游戏声音的本质属性外,游戏音频还面临制作上的挑战。为了实现更具沉浸式的 AAA 级体验,如今的游戏音频师设计们还要应对下面这些日益增长的趋势:
趋势① 游戏的内容越来越多 -- 更多的音频文件
游戏音频远不止音乐那么简单,还包括音效、配音、环境音效等等。举个例子,现在不少 AAA 游戏至少有 50 首配乐。有的游戏为了追求极致体验,往往需要数千种音效和十万多个配音文件!(这里不是说数量越多就越好,数量的多少并不是衡量好坏的标准,毕竟每个音频都有自己的价值和制作难度)。
现在的 AAA 游戏基本都是开放或半开放世界,还得有对比鲜明的区域设计。角色数量也不止于寥寥数个,往往有几十甚至上百之多。
《王者荣耀国际版》
而武器、交通工具、过场动画、旁白和解说词的数量也同样如此......
趋势② 内容深度要求越来越高--更专业的知识储备
合适的声音能让游戏呈现出鲜活、逼真的效果。因此,音频策划还得了解特定事物背后的运作机制。
做《极品飞车》的时候,我和前同事特意研究了一下汽车的运作机制,就是为了能不负玩家期待,做出高质量的音效。
那研究得做多深才够?这么说吧,我有个同事费了好一番功夫才找出斯巴鲁 WRX 这款车声音独特讨喜的原因:这款车用的排气管是不一样长的!

图源网络
趋势③ 内容更加模块化和粒度化--更抽象的设计对象
为了让游戏更加生动,提高它的实时互动性,并优化游戏制作和性能,我们必须将声音不断拆分成小模块。
比如,玩家听到的是一声枪响,但这里面可能整合了 8-10 个微声,精确到赫兹(Hertz)和毫秒级别,再通过逻辑复杂的播放方式串联,形成无缝的听觉体验。
汽车引擎声也是这么个原理:比如高尔夫 GTI 的这一声轰鸣,其实有 10-15 层不同的声音叠加在一起。声音的模块化设计,需要超高的专业水平,而资深的音频设计师真的是凤毛麟角。
抽象事物的制作流程具体化,本身就需要更细致的把控,面临更多的问题,比如说可能会对成品效果抱有更高的期待,或者暴露技术设计机密(毕竟把人家车子的引擎都研究了个底朝天)。
趋势④ 播放逻辑更错综复杂--更复杂的制作过程
复杂性上去了,意味着专业人才不好招,新人培训也不好做,系统维护更是难题。
以我制作《极品飞车》系列的体验来看,一个音频策划光解码和熟悉系统就要花好几个月的时间,之后还得再花大量时间熟悉系统才能完全上手。在《极品飞车》游戏引擎中进行调音是项超高难度的技术活,要应对很多环环相扣的小细节。
举例来说,对于普通的碰撞现象(如脚步声、子弹撞击、碎片坠落、角色的物理互动等等),我们需要建立系统,对物体 A 与 B 碰撞时的角速度进行实时分析,再结合 A 和 B 各

朝水里扔石头的声音和水滴在石头上的声音是不一样的。

同样是往水里扔石头,轻轻扔和使劲扔所发出的声音是不一样的。

同样是敲门声,花园的小铁门和大型机库金属门发出的声音也是不一样的。

金属大门的敲击声不等同于金属集装箱的敲击声。

大型金属空芯体敲上去的声音也和实心的不一样。

现在你可以试着把这个概念应用到各种材料组合上,然后再把所有可能的碰撞速度考虑进来。这还没完呢,我们还要考虑碰撞的角度:90 度角的撞击和 45 度角的撞击听上去也不太一样......
如果要重现逼真的听觉体验,这个工作量是可想而知的。
趋势⑤ 全球化趋势的制作团队--更多的差异性
纵观我 AAA 游戏的开发生涯,其中总是涉及全球合作,跨国跨文化的协作背后需要大量且稳定的精力支撑。现在这已成为 AAA 游戏开发的常态,音频制作也不例外。
一个项目上的人越多,整个体验的统一连贯性就越难把握,毕竟每个人的技能风格本身就存在差异(我们暂时还没进化成机器人……)。
此外,还要考虑文化、沟通习惯、硬件、办公设施、环境等因素的影响,要想克服这些差异需要很多技巧(以及耐心)。
《星球大战:战机中队》
再加上过去两年里疫情带来的影响,很多西方员工基本在家办工,或是分散在不同的办公地点。混合远程办公模式已经成为一些公司的新常态。在公司里,我们可以借助各种设备,在一定程度上控制并规范音频的质量;但在家办公的话就另当别论了。
趋势⑥ UGC 的增多 --更难应对各种游戏状况
如今,玩家能在我们的游戏中自定义游戏体验。内容越多、模块越多,可能的组合也越多。我们必须保证每种可能的组合场景都符合游戏的美学框架,同时不会对游戏过程造成干扰。质量控制也因此变得更难把控。
举个例子,《极品飞车:热度》推出的自定义排气声浪功能:

其中会有超过 100 辆特色载具。

每辆车都会有 8 到 10 个核心行为(包括点火,空转,向前_加速,向前_减速,向后_加速等等等等)。

每辆都会有 3 个配置。

所有发动机都可互换。

4 个玩家可自定义互动参数。

10 个参数设置等级。

以上所有要素结合起来,代表着超过 40 万个需要测试的场景!当然也就会需要大量的时间才能完成。
《极品飞车:热度》
趋势⑦ 服务型游戏概念的兴起--更频繁更新的内容
在产品本体上线后,开发团队会在后续的运营中加速推出更新内容,为玩家喜欢的游戏持续提供动态、丰富的体验。这也是压在游戏音频制作头顶的又一座大山。
为了支持服务型游戏模式,游戏音频团队可能要在最极端的情况下高度集中精力,完成紧张的准备工作,并完美地将其付诸实现。
在上一个团队工作时,我们建立了一套强大的工作流程,能在全球范围实现次日交付。当时全靠打时差战,成功为一大型体育项目,完成了业内最快的一次关键内容更新。
虽然我们可以利用便利的工具完成交付任务,但我们在交付季依然面临着巨大的潜在压力。仿佛时间永远不够用。
说了这么多的挑战和现状,你应该能理解为什么游戏音频策划很难在美学上施展抱负,因为光是完成手头的工作已经让我们焦头烂额。
我们需要更多支持,但不能总指望团队不断挖人,毕竟音频领域的硬核人才本来就很稀缺 —— 而且这也不是音频制作领域一贯的发展风格。
因此,我已经迫不及待准备迎接深度/机器学习,随之而来的关键算力让我们得以追求更宏大的目标和梦想。
3 游戏音频制作如何利用深度学习技术?
据维基的定义,机器学习是人工智能的一个分支,利用算法解析数据,在经验学习中改善具体算法并进行决策。而深度学习则是一种以人工神经网络为架构,对资料进行表征学习的算法,它是机器学习中的一个子领域,可实现最接近人类水平的人工智能。
深度学习 vs 机器学习
机器学习用算法解析数据,从中学习并根据所学内容进行决策。
深度学习可以进行自主学习并作出智能决策。
深度学习是机器学习中的一个子领域,可实现最接近人类水平的人工智能。下面我来具体聊聊未来的深度/机器学习辅助工作流程。这项技术极有可能会颠覆我们现有的工作方式。我会按不同的制作过程来详细展开:

大体的工作流

设计

内容创作

实现和 QV 监控

混音

分析和性能优化

3.1 大体的工作流
我们都想消除日常工作中的技术摩擦,让想法尽快落地。但问题是,如果不知道该如何优化工作,就无法实现优化。用我朋友 Fred 的观点来解释就是“我们对未知一无所知”。
当然,没人能知晓所有的可能性,而大多数人也只能看清短期内的规律。平日里我们埋头苦干,很少有机会跳出繁杂的工作日常,去梳理所有工作线索和环节,也没时间复盘过去几周、几个月以来的重复性操作。
《星球大战:战机中队》
深度/机器学习能帮上什么忙?
大家可以想象一下这样的画面:我像往常一样在电脑前工作,这时屏幕突然弹出了一条消息:“也许我可以帮到您。”
“嘿,Oli,过去一周里,您重复了 40 次相同的流程操作,每次平均用时 90 分钟。在我的协助下,这一流程可以精简到 15 分钟左右,每周减少 2 天的工作量。下面的优化可以让您每天提早半小时收工,同时还有余力再接手新任务 XXX,为团队做出更大贡献。”
A 搜索某个文件中的规格参数信息(我可以根据您目前进行的工作和讨论的内容,来判断您需要搜索的是什么)。
B 根据这些参数,将工作从软件 X 导出到相应的目标路径(我可以基于您目前的工作内容作出判断)。
C 在软件 Y 中预览新文件,查看是否运行良好(这一步骤可由我代为执行,如出现任何技术问题我会及时通知您)。
D 在中间件_Z 中添加文件,并对播放规则和参数进行调整(基于您当前的工作并同我数据库中类似项目进行特征对比,我能够作出相应推断)。
E 建立并体验游戏,在游戏整体环境中感受新作品(对此我可以创建所有特定场景,让您即刻体验当前的作品;但这一步需要您亲自测试以获得直观感受)。
F 接着,您可能需要返回软件 X 中进行迭代,或直接分享新作品,并更新项目状态(这一步我无法代劳,需由您亲自决策):
—— 选项 A:如果您需要迭代,在您准备好后我们可以重新开始上述循环。
—— 选项 B:如果您对内容感到满意,我们可以进入下一步。
G 对您新增的游戏内容做音频/视频捕捉,为每个场景创建各自的文件夹并为其命名(根据您目前的工作和测试好的场景,这一步可由我代为处理)。
H 将这些文件发送给用户 A、B、C 和 D 用于更新(根据您正在开发的功能,我知道这些用户是谁以及他们可能的回应)。
I 将您刚才工作的任务状态更新到项目管理方案里(这一步我可以代劳,但必要时您仍需手动输入评论)。”
“您是否希望自动执行上述流程,同时,我会在必要时通知您,并由您接手操作?”
—— 选项 A:希望,请带我飞向未来
—— 选项 B:不希望,我只想活在过去
基本上,这完全就是一个后台工作流分析器,它能不断了解特定用户的工作方式。
分析器的主要任务有两点,一是通过用户的目标、行动和一系列操作来识别模式,并提出“一键式”的优化建议,方便后续的使用。
二是对中央用户数据库中的相似目标进行比较,看看是否有更高效、更优的方式来实现类似结果,然后提出优化建议(并提供执行过程以供学习参考)。
通过成熟的中央数据库,分析器甚至可以尝试预测用户正在开展的工作内容,并提出协助完成剩余工作的建议,当然这一概念也适用于团队工作。
我相信这就是未来的发展趋势,因为这项技术并不局限于游戏音频领域,它会影响未来每个人生活的方方面面。它带来的优势和便利绝对会让公司和个人都大开眼界!
《极品飞车:热度》
3.2 设计
基于输入的关键词,我们可以获得有关媒体或文件的参考建议,类似当下的 AI 音乐生成模型。
打个比方,如果我想知道“以古巴为背景的卡通复古未来主义浪漫怀旧休闲 FPS”听起来会是什么样的感觉,我会让 AI 搜索所有匹配的电影、电视剧、游戏、广告、书籍……并按相关度排序,然后基于结果中提取的全部音频内容,随机生成一些声音纹理模型。
同理,你也可以通过在线媒体的趋势分析来测试自己创作出的内容。
3.3 内容创作
大家已经看到,语音和音乐行业早就斥巨资开发深度/机器学习,为的就是能基于用户的特定输入指令生成无穷无尽的内容。
我在开篇提到过,大型 AAA 游戏有超过 10 万个语音文件,如果你对这个数字还有印象的话就更能理解技术辅助的重要性了。
多语言的本地化需求还会让这一数字翻上几倍,EA Sports《FIFA》系列的解说词已经通过本地化翻译成了 13 种语言。
没记错的话,一款 AAA 游戏平均也会推出 7 种语言版本,语音在 AAA 游戏中算是耗时久且数据量庞大的一个分支了。
《FIFA 22》
虽然目前文本转语音的技术并不完美,但已经算比较先进了。未来,我们能生成各种性别、年龄、种族、语言和情绪的声音,而且不需要录音、编辑、处理、数据库录入等操作,这一切不过是时间早晚的问题。
也许我们距离取代真人演员还有很长的路要走,但这仍然是一项非常关键的技术,让音频制作者可以在最终录音前进行更精确的原型设计,从而实现更自然的效果。
当然,围绕这种技术有各种各样的争论和恐惧:如果有人用它来“深度伪造”怎么办?演员的未来该何去何从?但这背后的商业机会不可小觑,我们也只能顺应潮流的发展了。
如果想在配音上进一步深挖,我们还能聊聊内容的实时生成,比如说我们可以根据玩家的行为实时生成对白,带来更有互动性和沉浸感的体验;更有趣的例子是游戏可以捕捉玩家自己的声音,这样当他们的角色进行对白或讲述剧情的时候,玩家听到的就是自己的声音。
除此之外,我们也可以把线下的最新体育动态快速整合进游戏解说中,让玩家立马“入戏”(对真实比赛进行自动分析,在游戏中即时整合并生成相关内容)。
我曾设想过这样的方案,用大量的真实世界数据(录音或声谱图)来训练深度学习解决方案,建立一个完整的、基于实物的真实模型。
如果这真的能够实现的话,那么系统可以自动创建所有的复杂行为,甚至可能比手动制作更优质、更快速。这样一来,我们甚至连音频样本都不需要了,因为所有内容都可以通过强大的合成模型实时生成。
最后补充一点,就是内容交付上的控制。比起上面的应用场景,内容交付控制应该会更快更容易实现。在前文我已经提到了,游戏开发团队的音频制作者来自世界各地,因此音频内容的差异性也更加明显。
潜在的人为失误会被不断放大,导致内容交付缺乏整体统一性,从而引发后续雪崩般涌现的 QV 问题。比如说有的音量太大,有的风格不一,或是质量没有统一标准。
面对这些问题,我们可以在音频文件被整合进游戏前,先放到健全性测试系统中跑一遍,用已通过测试的内容,来交叉验证新文件的质量。
《星球大战:战机中队》
3.4 实现和 QV 监控
深度/机器学习如何帮助我们对游戏音频进行整体管控?按照规范做出好内容是一回事,但在游戏中播放大量预期之外的音频事件可就是另一回事了。

在技术的加持下,未来的系统也许能实现以下功能:

尽可能模仿真实玩家玩游戏的方式。

从玩家游戏中提取音频 玩法数据。

对所有数据进行分析、组织并以数据面板的方式清晰呈现,供音频团队审阅。

提出行动建议、标记潜在问题、高亮不符合标准的情况。

甚至能够针对特定问题进行自主处理,比如声音过响这类问题。

修复声音文件。

处理特定音频实现参数问题。

处理特定播放逻辑问题。

处理特定代码问题。

随后系统循环启动、迭代直至问题成功修复。

这样的系统甚至还能扮演“监察”的角色,在实现过程中帮我们从源头避免不必要的问题。这一点对大团队来说非常有必要,因为大家的某些参数设定或调整的数值可能完全不同。
比方说,用户在参数中输入“10”的时候,就会弹出一条提示:“您确定要设为‘10’吗?此类内容的平均数值是 0.7,最小 0.5,最大为 0.9”。
当然,我们也可以设计方案导向型的系统,给出这样的提示:“经过分析,您的音量似乎低于平均值,而且参数 XYZ 的设置都为可接受范围内的最小值……如果您允许的话,我可以帮您调整成合适的参数。”
3.5 混音
(鉴于篇幅有限,3.5 和 3.6 部分就快速带过了。)在混音这一块,未来我们是是可以根据不同的平台和设备,或基于特定的设备规格和型号,自动执行与之相匹配的混音或母带处理?
有没有可能根据玩家的感官、情绪、环境等条件进行实时个性化混音?
或者根据实时游戏场景,自动执行智能音频/响度/动态等参数的分配?
《极品飞车:热度》
3.6 分析和性能优化
考验你想象力的时候到了:你觉得深度/机器学习如何成为分析和性能优化的小助手?
4 总结
综合上述内容,大家是否已经意识到了深度/机器学习在游戏音频制作上的巨大潜力,而且它并不局限于游戏行业,未来,你也能在自己身处的行业感受到技术带来的飞跃。
不过,也许有人会疑惑,如果大家都用这样的技术,那所有的内容听起来不都一模一样,这样岂不是特别无趣?
这是个很好的问题。
身为创意人员,首先我们要摆正自己的心态:技术只是辅助工具,没法替代我们去工作。
在现实的工作过程中,我们总会需要人工的介入,比方说决定技术的交付方式(参看上文“以古巴为背景的卡通复古未来主义浪漫怀旧休闲 FPS”案例)。这些系统还得具备“创意补偿”的功能,好让音频设计师在必要时表达他们的情感。
别忘了,我们的人工智能和深度/机器学习才刚开了个头,未来的路也许还很漫长?不过,万物瞬息万变……有可能一眨眼就能实现。

《星球大战:战机中队》
好了,这次先聊到这里。感谢大家耐心看完了整篇文章。
我不知道自己讲得是否清晰,有没有道理?你是否也曾经思考过这些问题?读完是否给你带来了一些启发?
我期待和大家有进一步的探讨,各抒己见,碰撞思想的火花。大家一起并肩探索,实现更远大的梦想!
—— “未来游戏的发展大趋势还是偏向 VR 领域。
这个问题非常有意思。每当新一代主机推出时,我都会琢磨其中有什么新东西是为音频而准备的?主机的音质越来越好,现在我们已经可以播放 48k[ZA1] 采样率的音频,未来或许还能不压缩音频直接播放 96k,甚至 24 比特的高清音频?要真能做到这样那当然好了,音频有没有被压缩过,干音频这行的一听就能听出明显不同。
但玩家都是音频小白,他们能感受到这种升级的差别吗?玩家没有经过专业的听觉训练,很可能根本听不出区别。所以这算是游戏音频领域真正的进步吗?技术上当然算,但我认为游戏音频的未来并不在这一块。
我当年刚投身游戏行业的时候,市面上的工作室非常少。不仅数目少,而且这些工作室最多只愿意招一个人来搞定所有游戏音频的工作,从音效、音乐到旁白全都交给一个人干。所以最后就变成几百个人抢一个职位。
如今可不一样了。现在有那么多游戏工作室,那么多游戏初创公司,很多音频岗位甚至都招不到人。
当年我入行做声音设计的时候,没有哪个学校能教你做游戏音频,但现在我们有各种各样的游戏音频培训课,甚至还设立了学位让年轻人入行前可以充分学习。
所以我觉得,现在有了这么多科班出身的音频人才,可以推动游戏声音的进步,甚至媲美那些音效出色的电影。
未来游戏的发展大趋势还是偏向 VR 领域。虚拟现实潜力无限,有可能成为未来的主流游戏方式,完全替代传统游戏,大多数人们只玩 VR 游戏。
这个技术很了不得,通过这种媒介可以实现一些非常奇妙的事情。虚拟现实加上空间音频技术,可以为玩家带来非常真实和沉浸的体验,所以这可能是未来游戏音频真正向前发展的一个方向。
如果能降低和消除 HRTF 的梳状滤波效应,就能够带来很棒很真实的音效。
我主要是给 AAA 游戏做武器声音和生物声音。由于很长时间以来我经手的游戏都包含了这两类元素,所以我也为这两类声音开发了一套流程,专门制作超脱现实的分层音效。
说来也是很巧,我做的基本上都是有着长枪重炮和可怕怪兽的游戏。这就是缘分!我开发的这个方法,通过将不同层级的音效组合起来,最终打造出一种较现实更浮夸一点的枪声。
我如何设计 FPS 武器音效
枪声设计的三种不同的发声单位和作用
声源
实地录音
我们需要跟着专业录音团队和枪械师一起到现场,专门为我们的游戏采集新鲜的声音素材。在理想的情况下,我们会去到几个不同的地方,录制不同类型的回声。
比如说,去一个周边都是高楼林立的地方,采集市区的回声;去林间采集森林的回声,包括到开阔场地和其他与游戏环境相关的地方去采集声音。
我们音频团队在录坦克的声音
我们会设置三个收音距离,将麦克风装置放在近、中、远三个点位处,采集这三个距离的声音,通过多个原始素材完成距离建模。而不是像大多数游戏一样,单靠音效衰减来模拟远距离。他们那样做出来的声音,在音色和还原度方面就远远不如这个方法。
录制所有不同方位的音效是关键。我们还会有一个头戴式的麦克风,用来录制第一人称听到的声音;还有一个装在枪身上的麦克风,用来捕捉枪在移动和震动时,各种机械部件发出的大量细微声响。
1P 也就是玩家所控制的角色所包含的声音要素,都需要在录音的时候能够考虑到

游戏中 3P 也就是友方和敌人的声音组成和要达到的目的有很大的区别
声音设计
我们会加入一些不同的元素,比如一些声音“佐料”:能量元素、击打元素,来补充实地录制的声音,让修饰后的枪声更具震撼感,而同时又能保证音效不会偏离我们实地录制的真实枪声。
在这个阶段我们还会加入一些有趣的元素,给每支枪都带来各自专属的音效,使其更具现代感或未来感。为了配置每支枪的专属枪声,我们需要设计一系列复杂、好玩的声音元素。
游戏实战
连发与单发枪响
为了给快速射击的武器带来最棒的音效,我们必须要将单发和连发的循环音频相结合。连发的枪声节奏稳定,而单发枪声更具力量感,但最重要的是单发保证了枪声尾音的自然感。
玩家停扣扳机后,连发音效停止,但单发音效此时只是暂时中断。也就是说,当玩家松开扳机,开火声音停止那一刻,此时已经射出去的子弹音效会继续播放。枪声的回声和尾音混杂在一起,造就了这种玩家停止开火后仍会继续播放的音效。这种设计方式赋予了枪械独特的枪声,并且在不同的地方击发还会发出不同的枪声效果。
此外,我们还会放置多点标记,保证连发循环枪声每次都从随机的位置开始播放,这样一来每次射击的枪声听起来就都有所不同,而且更自然。
枪声尾音
枪声的尾音是游戏武器声音中很重要的一部分。要想真实还原枪支的声音,就需要把回声做好,让玩家听起来感觉就像真的是在那个场景中开火发出的声音。
在高楼林立的城市里开枪,和在仓库、峡谷、旷野或是山间开枪产生的枪声尾音完全不同。我们必须要把尾音做好,这样玩家才会觉得枪声听起来很真实,很入戏,能沉浸在我们的游戏世界中。
分离机械声音
我们把枪身上麦克风捕捉的原始声音提取出来,分离成枪支零件/枪支部件运作的不同声音元素。这些部件运作的声音通过 LFO(低频振荡器)处理。随着剩余子弹越来越少,我们会逐步放大枪支部件运作的声音,直到子弹打光播放空仓击发的声音。
第一枪
开枪时很关键的一点就是后坐力的感觉。当玩家打出第一发子弹的时候,我们会通过加入一些富有冲击力的“佐料”,比如击打声、爆炸声等等。让这声枪响就像真枪一样,听起来更响、更有冲击力。
最后一枪
在最后一声枪响之前,当弹夹即将耗尽之际,也就是只剩 5 到 10 发子弹的时候,枪声中会包含更多部件运作声和金属声。
当最后一发子弹从弹夹或弹匣中打出的时候,我们会额外再调高部件运作声和金属声,让玩家知道子弹已经打完了。
这样的设计不仅听起来很爽,也能让玩家可以直接通过声音判断还剩多少子弹,不用去看 HUD。当玩家熟悉了不同的枪支的音效之后,他们就会知道什么时候必须要换弹了,而这个换弹时机往往可以决定两方交火的胜负。
很难说游戏音频日后将会走向何方,但未来还是一片光明的!
—— “基于强大的 AI 算法,我们已经初步尝试用人声采样来让 AI 随意生成任何台词...游戏中所有的 NPC 都会基于你的存在来生成陪伴你的内容。
我从事游戏音频行业十多年了。这么多年我的潜意识依然定义自己首先是一个游戏玩家,然后才是游戏音频工作者。因为我是先爱上游戏,才开始走上游戏开发这条路。
所以或许是这种纯粹的热爱,给予我每天搬砖的源动力,和源源不断的设计灵感。玩了 30 多年游戏,从第一台 Game Watch 到 FC,MD,SFC,PS,SS,GB,GBA,GG,NCG……说都说不完。
每一个游戏机都代表了一个年代的硬件水平,以及当年的开发者能给我们的极致体验。甚至不夸张的说,游戏的发展其实一直在引领民用硬件的更替。
一路看着这个行业的变化和进步,是一种很奇妙的感觉,直到如今,我自己也加入了这个行业,成为他们的一员。

团队为《王者荣耀国际版》录音
游戏语音的作用是什么呢?我认为,它的核心作用是帮助叙事、打造沉浸感,塑造角色 IP。游戏语音能够给玩家传递最直观的精准信息,为角色注入灵魂的核心。
无论早期的电影还是游戏,语音都是在一切模块相对成型以后,最后才进入这个领域的。这是为什么?是因为语音不重要吗?我觉得不是。个人认为应该是当时的技术条件没有跟上。
从 8bit 模拟的魂斗罗死亡语音或者说音效开始,游戏开发者一直致力于把真实的人性情感代入游戏,从而让玩家得到更加放大的游戏体验。
在那个硬件和技术都匮乏的年代,开发者用了大量的技术手段模拟人声频段,来让玩家体验到“听起来很像人声”的音效。
“奥利给”这个词这两年挺火爆的,可能没有多少人知道它其实源自街头霸王里隆和肯的必杀计升龙拳喊招“syo ryu ken”。
当时的采样率品质不够高,加上街机厅的环境嘈杂,使得很多玩家都没听明白角色到底说了什么,但是所有人都记住了主角这让人热血沸腾的怒吼。
《街霸 4》
早期在街机厅,会用升龙拳的人很少,每台机器都被人围得里三层外三层,碰到高手对战,很多小朋友都挤不进去。这个时候忽然听到“syo ryu ken!”伴随着一定是围观玩家的惊呼!哇!他会升龙拳!没错,这就是它的魅力和感染力。总能在你最希望听到的时候跟着你的内心一起发声,跟你的灵魂完美同步!
接下来,游戏语音的未来会是什么样的呢?这也是我们作为游戏语音的创作者和设计师,每天都在思考的一个问题。我认为大致分为几个维度。
首先从声音样本方面来说,目前的游戏语音生产方式,是由配音演员完成对游戏台词的录制,经过后期处理然后放入我们的音频工程,再去绑定对应触发的机制或者参数来调用的。这方式还会持续很长一段时间,但改变即将到来。
在近 20 年的游戏音频工作中,我一直有个困惑:如何才能留下最经典的声音?
工作室里的话筒
很多优秀配音演员的音色是独一无二的,可是每个人都会老去,巅峰的音色也会衰退。他们为游戏配的语音只能永远的留在那个游戏中,而没有办法出现在新的游戏中。我们有办法给他们的声音保鲜吗?随着技术的进步,人声采样将会逐渐解决这个问题。
基于强大的 AI 算法,我们已经初步尝试用人声采样来让 AI 随意生成任何台词,未来当我们拿到某个配音演员的音色授权,他的声音就可以在这个游戏里出现。
这对游戏音频工作来说是一个很有效率的方式。设计师可以随时调整台词文案并即时生成,不再需要反复找演员录音。而用户也可以随时像“捏脸”一样,捏出自己喜欢的角色声线。
当然,会有人说听起来还不够像真人?没错!但这只是时间问题,并且很快就会被攻克。当采样精度和数据模型足够的时候,更加真实的音色就会被“生产”出来。
聊完样本,接下来聊聊在游戏中会有什么不同的体验。
相信很多玩家都跟“Siri”聊过天,想象一下,你进入一个游戏,走到 NPC 面前,“他”看到你走过来会说:“嘿!老兄,你今天过的怎么样?”
而你可以直接跟他说:“还不错,我去干点什么好呢?”
NPC 回答你:“我听说你刚干掉了恶龙,手头还有几个重要任务?,不如先去找XXX”
……
NPC 与你互动的所有对话都是围绕着你的游戏进度计算出来的,都是对你体验游戏最有帮助,最融入游戏情境的内容。
而这一切,你只需要开口跟 NPC 聊天,他就会回答你。所有的 NPC 都会基于你的存在来生成陪伴你的内容。当然,这些设计都要源于我们的声音设计师精心的设计。
那么样本有了,体验设计也有了,但好像还缺一个东西。我觉得应该是标识性。这是一个产品语音设计的灵魂。
“syo ryu ken”,“全军出击”,“打碎他们的骨头!”……这些台词,一句就能代表一个游戏,它们经久不衰,在这么多年过去后,依然能让我们想起曾经那个游戏机前热血沸腾的自己。
我为什么要放在最后说?并不是我忘了最重要的东西,而是提醒很多设计师:之所以你的作品没有标识性,就是因为你都快做完了才想起来这一点……这个说起来简单,其实是很考验一个设计师能力的!
—— “目前,论精准的定位,Object-Based Audio 的优势非常明显,它能够基于游戏对象的位置直接保存声音的朝向、距离、混响等一切空间信息在 Metadata,最终完美的在播放终端还原出来音源位置。
随着手游研发方向 AAA 化,越来越多的国内团队都在计划让手游登陆多平台。多平台的播放设备差异,直接影响到最终的混音方式,技术应用等等。
以现如今的沉浸式音频技术为例,很显然,传统的立体声已经无法满足各游戏对于声音的沉浸感的追求,即便是手机端,各大硬件厂商和游戏研发公司,也已经逐步在运用各种沉浸声技术,来提升耳机或者手机扬声器的空间和定位。
市面上有各种成熟的商业相关技术供声音设计师使用,常见的有传统环绕声(例如 5.1,7.1.4 等等),和 Ambisonics,但是这两种技术,声音的定位精度都有一定局限性。
传统环绕声技术,以我们熟知的 7.1.4 为例,3D 的空间感来源于将 12 个通道的声音发送到前后左右的 7 个扬声器,地面 1 个低音炮和头顶的 4 个扬声器,这也是通常杜比全景声所要求的基本配置。
可想而知,扬声器的数量决定了声音在空间的精度,比如声源点在两个扬声器之间的时候,发出来的声音定位就不会有那么精准了。
图源杜比官网
而 Ambisonics 则可以理解为是一种用虚拟多通道,来模拟三维空间声场的环绕声技术,它与传统环绕声最大的区别在于,它不局限扬声器的数量,我们可以通过解码在各种扬声器阵列中还原出来它的三维空间声场。
但是 Ambisonics 的基本原理是先将声音的方位 一一 映射在一个球形声场,再通过解码还原,实际的发声位置和发音源位置也无法做到百分百吻合。
图源 Audiokinetic 官网
所以,提到精准的定位,Object-Based Audio(以下简称 OBA)的优势就体现出来了。这是目前在手游中还未被用到的另一种沉浸式声音技术,因为它对硬件和性能都有一定的要求,但是在主机游戏,和影视、音乐行业中,相对来说有着更领先的发展。
OBA 会基于游戏对象的位置直接保存声音的朝向、距离、混响等空间信息在 Metadata 中,最终在播放终端渲染出来空间化效果,这种传输技术最大限度的提升了空间定位精度,真正的能做到声音和发音源位置一致。但也正是因为保存和渲染的信息较多,所以对于性能的要求也较高。
而 Wwise2021.1 版本推出了 OBA 的音频管线之后,再一次将这个技术在游戏中的应用带入到了大家的眼前。
在 Wwise 的官方游戏 Demo《Wwise Audio Lab》中,篝火的声音设计为我们提供了一个非常好的案例,将篝火的声音分成高、中、低频三个样本,分别用 Audio Objects(OBA 在 Wwise 中的声音格式显示),Ambisonics,立体声的格式播放。
当劈里啪啦的高频声,通过 Audio Objects 格式在宽阔的空间中出现的时候,整个篝火声音的空间感显的丰富且有层次。虽然实际游戏中,因为性能限制,这种做法会显得比较奢侈,但是这无疑为声音设计师今后在声音的沉浸感设计上,带来了非常大的可塑空间。
Audiokinetic Software Product Manager:Damian Kastbauer,图源 Audiokinetic 官网
杜比实验室作为沉浸声音频行业的佼佼者,一直在通过手机终端的杜比全景声技术升级给大家带来越来越好的沉浸式聆听体验,想必他们对 OBA 会有更深刻的认识。
所以借助这个机会,我也邀请到了来自杜比的工程师李亮,他将与我们分享对于 OBA 的看法。
1. 未来随着硬件的高速发展,OBA 会成为一种趋势吗?
这个趋势已经越来越明显了。
未来的沉浸音发展主要有两个方向:
其一是用越来越多的物理扬声器来提升空间声音像素,比如近些年逐步商业化的电影院,现场扩声,主题乐园,以及家庭影院的沉浸式音频方案, OBA 能让混音师专注于建构一个的 3D 声场,不用担心不同大小场合里具体有多少支扬声器,内容在终端渲染时才实现 3D 坐标到物理扬声器的 Mapping。
其二就是在通过耳机连接设备体验时,越来越强大的 HRTF 技术,让“虚拟声音像素点”越来越密集。打个比方就像埃隆马斯克绕地球的星链技术,卫星越密集准确度越高。如果说 7.1.4 和 Ambisonics 是沉浸式音频的开端,我们可以理解为 “音床(Bed)”,它构建了沉浸式音频的三维基础,那么 Object Based“对象”就是让沉浸式音频更真实。
尤其在游戏角度,Object Based 极为重要。试想 7.1.4 下有一个声源在 L 和 Ls 中间响,传统的 Channel Based 的 HRTF 就只能是 L 和 Ls 两个虚拟扬声器一起响,来模拟“音箱缝”里的声像,而 Object Based 的话,光这个”音箱缝”里就可以容纳很多个微小角度差异的发声源,具有独立的 HRTF。
更不用说发声源动起来的时候,连带着它的 XYZ 坐标信息都可以一起被渲染到 3D 空间的任何位置。听感上来说,就是四个字:精准顺滑。
2. OBA 在性能方面的表现如何呢?
性能上来说 Object 用的越多,独立的 HRTF 渲染就越多,对设备的性能要求也就越大。目前看来 Object 信号和元数据通过操作系统铺的管道,在终端设备上进行独立运算是一个趋势。
而更高效的 HRTF 数学模型也是这领域各个玩家的核心科技,未来的性能压力会越来越小。
总结
可以看到,近几年开始,无论是 Wwise 还是杜比,都对 OBA 表显出了足够的关注。
随着硬件高速发展,在游戏音频行业,沉浸式音频技术的应用将会越来越极致,未来无论是帮助玩家打造游戏世界的真实感,还是提升游戏中的听声辩位,都有着非常值得期待的进化空间。
—— “有些人专门去做枪声的录音,一做就是 20 年,这样的人才是专家中的专家。
这些年因为有大量的优秀作品涌现出来,如《王者荣耀》《使命召唤手游》《QQ飞车》等,还有 AAA 大作如《Apex 英雄》《刺客信条:英灵殿》《极品飞车:热度》等,这些产品在受到众多玩家喜爱目的同时,游戏的方方面面都得到了前所未有的关注。
围绕这些产品的音乐、音效、配音、音频技术等领域,产生了很多相关的讨论和话题,这也给游戏声音品质,或者说音频设计人才的储备,提出了更高的要求。
《王者荣耀》
未来,我们相信游戏内容的垂直性和专业度一定会越来越强。比如,如果我们未来要做一款射击类游戏,首先就会要求这款游戏必须包含所有优秀的“AAA 级别设计”,也就是说,以前所有优秀的射击类音频的效果、技术,都应该是我们未来这个产品的“及格线”,或者说“起跑线”。
只有这样,玩家在进入游戏后,才会觉得这款游戏比我所有玩过的射击游戏都要“好玩”“爽快”和“准确”。
为了完成这个目标,我们应该放眼全球,去看哪些人才,真正是这个领域里的“专家中的专家”。
要知道,一个声音设计师,不是工作了几年,就能去录枪,就能做好枪。在好莱坞工业里,有些人专门去做枪声的录音,一做就是 20 年,这样的人才是专家中的专家。
我们有了专家和人才,再与世界上最好的艺术家们一起合作,用匠心,耐心,开放的心态去打磨产品,最后才能真的做好一款让玩家满意的作品。
参考资料
https://www.ubisoftsingapore.com/post/portfolio-build-tips-audio
https://www.youtube.com/watch?v=U3bo_gP594k
https://www.youtube.com/watch?v=fXrKVgTj66Q
https://www.gamebyte.com/people-are-recreating-shrek-in-demons-souls-on-ps5/
https://www.youtube.com/watch?v=WHv7mcKdLtk
https://www.youtube.com/watch?v=UgsurPg9Ckw
本文由 手游矩阵 来源发布

天美音频中心专家:游戏音频有哪些前沿方向?

评论问答