Guitar.com的标志

“我们可以花年试图理解他们在物理层面,或者我们可以自动化”:神经DSP的道格·卡斯特罗在机器学习如何超越人类理解的放大器

革命背后的男人AI-driven四皮质层分析员对窥视的黑盒。

公司的负责人的名字命名的神经网络,道格·卡斯特罗)的创始人神经DSP——有些惊人的科技方法。“我们的口头禅在神经是我们应该只使用AI当一切被排除了,”他告诉我们在放大,从公司的总部在芬兰(我们也会疏忽,,更不用说照亮神经DSP标志身后)。所以我们是怎么走到这一步的,神经DSP四皮层是其中一个最强大的硬件模型,由于人工智能吗?

已经说过很多次,数字模型近年来取得了巨大的进步。四皮层一直很大一部分,利用机器学习(和处理能力的工程师在2000年代可能只有梦想)创建一些真正优秀的吉他的声音。但是,尽管该公司的名字,依靠神经网络和人工智能并不总是包罗万象的游戏计划。

“这些技术所以炒作,”卡斯特罗说。”很多人都试图迫使它变成工作可能更传统的方法来解决的问题。实际上这不是一个好的解决方案很多东西。”

人工智能并不总是计划的时候,四皮层。但强大的硬件分析员之路总是很长,就是明证,四皮层来到2021年,四年后神经建国。“我们公司开始建立它,”道格告诉我们,“不久,我们意识到这将是一个很多硬件的开发、制造,用户体验设计,最重要的是,算法的研究”。

在这里,道格看到了机会:“我们意识到,我们必须做所有的DSP工作无论如何,我们马上开始制作插件。帮助我们带来资金,建立品牌,确保我们设置四皮层是一个成功。”

神经DSP四皮层

起初,插件被建立了传统的方式,没有机器学习。但这种方法很快就明显的局限性。“我们发现了我们的一个出超亮,世界级的博士在七周模型一个放大器。忘记任何延误,混音,出租车模拟,所有这些。一个amp - 7周。和找到足够多的人擅长传统音箱造型是非常困难的,有很少人理解它从上到下,你需要真正理解模拟电子,和DSP算法,模拟行为转化为方程,然后你需要擅长编程,所以他们写的代码效率和实时运行模型。找到一个人可以做所有的这些工作?这是真的硬。”

“这就是为什么很少有公司在做音箱造型在超高级别,”道格补充道。“没有足够聪明的人工作。超级聪明的人通常进入其他领域更有利可图,你知道,造型放大器…”

道格还指出,雇佣足够的工程师和程序员来完成创建四皮层在仅仅四年显然是将财务几乎是不可能的。所以,根据神经的咒语,传统的方法工作的几率是零,所以是时候大炮。“所以我们想,如果我们能自动化机器学习的发展,那么可能性仍然非常糟糕——但一个非零数字!百分之五听起来可怕,但比零。”

从来没有告诉我

所以招聘工程师的传统音箱造型方法,神经DSP开始B计划:“找到世界级的机器学习也玩音乐的人,和想在安培工作。”

“我们有幸遇到一些真正有才华的人从我们的本地工程大学(芬兰阿尔托大学的),它有一个伟大的音频DSP项目,和一些传奇教授。我碰巧遇见了几人的研究团队我们了。我告诉他们关于这个想法,他们告诉我,他们已经在一些机器学习相关的造型。这是一个奇迹,我们遇到了!”

虽然道格是一种观点,即神经网络是一种即时解决每个问题,很难不去看到他们只是一个有些不可思议。“机器学习的好处是,五个人,你可以做的工作可能需要数百人,”道格说。“我们一直致力于内部工具和使它更有效率,所以它不是在其最终形式,但是我们的机器学习六个工程师可以做这项工作10到20人。我们想让它10倍,在效率方面。到达那里,但还有很多工作要做。”

Doug指出机器学习以及效率,帮助神经DSP创建令人难以置信的准确的放大器模型。“有很多事情发生在一个管放大器不很好理解。我们有很多管做什么,饱和曲线——这是有据可查的。但后期的放大器,与电源之间的相互作用,会发生什么时期,输出变压器和无功负载的演讲者,有很多奇怪的事情发生,它不是很好理解。

“传统上,造型你理解非常好已经非常困难,然后造型你不懂的东西完全是真的,真的很难。我认为这就是为什么许多amp模型,声音真的不密切感觉很接近,因为有5%不是模仿正确的,因为我们不懂如何amp的表现。”

道格拉斯·卡斯特罗的神经DSP
道格拉斯·卡斯特罗的神经DSP。信贷:Tapio Auvinen

到空

周围神经网络函数的方式提供了一个独特的快捷方式建模的问题不太理解的东西。很简单,网络是给定一个输入和一个输出,然后训练如何转到另一个。它不需要知道发生了什么在变压器等等,只需要知道是什么,,什么出来。“我们意识到,我们可以花几年试图了解发生了什么在物理层面,”道格说,“或者我们可以自动化。我们只是运行信号通过放大器——我们不需要理解效果每个放大器的一部分。如果它有一个对信号的影响,我们应该能够重现。这就是这样的黑箱建模的优势。”

“黑盒”,在机器学习,是指一个程序的主要副作用有效写作本身——逻辑往往是人类程序员无法解析。这种效果更严重更高级的算法在后期的培训(“没有人类活着,能告诉你谷歌的算法是如何工作的,”道格票据),但它不是总是机器学习的一个固有的方面。

我们问Doug如果它是可能的裂纹黑盒的盖子,如果你需要做出改变。“我们所做的调查,很多。黑盒模型是可靠的,你开始从一种“浅灰色”方法——那样你就可以验证的事情,提前测试。我们没有一个规则,我们从不打开算法——如果有什么奇怪的,无论如何,我们打开它。”

但最终,代码如何翻译吉他输入音调更不透明。“你每次都能得到期望的输出,但它内部做的太复杂了,任何人都很难理解。有些是self-writing代码在他们自己的代码部分:模型的代码写到本身的一部分,这是很迷糊了,”道格说。

道格不分享的细节模型实际上是如何训练,但他给了我们一个图片的处理时间和力量。“我们记录信号几个小时,然后我们火车模型的训练时间下降,我们有一个巨大的服务器存储空间,我们使用目前,但很快我们会把它移动到云处理。在我们自己的服务器上,这将是四到六小时的录音,然后八小时的培训。我们可以减少培训时间明显与云。”

神经DSP四皮层

打开pedalboard门,哈尔

之前我们聊天道格,人工智能已经成为新闻头条略有些超现实的原因。一个工程师在谷歌发布了记录他与λ之间的对话——谷歌的人工智能聊天机器人,声称该计划所取得的感觉。显然,这个故事有能力创建一些耸人听闻的标题,但道格和神经DSP团队不卷入科幻炒作。

“我读到成绩单是编辑。当这样的编辑那一刻,你知道,它可以操纵唤起读者的情感。一半的我们的机器学习团队来自音频,另一半更涉及语音合成,一个更传统的用于机器学习。有一个神经科学家团队。我注意到这些人留下了深刻的印象记录,说实话。如果是一个突破,我认为我们不会有通过一篇博客文章中听说过。”

所以AI可能不是真正的,但是有一些非常人可以参与的事情,等组成。“已经有很多神奇的工具辅助成分,如果你困,他们帮助你提出应该如何继续下去。“我们好奇神经DSP是否其涉足这一领域。道格是乐观的,但谨慎超过他能嚼咬掉。“只是因为你可以做一件事,这并不意味着你可以无限期突然规模——复杂性往往呈现指数级增长。但这是有可能的,如果你已经有了一个可以扩展的框架。”

尽管创作工具可能不是眼前的地平线上,还有一个区域Doug看到更多潜在的神经的参与:生产。“有机器学习工具帮助de-skill这一过程将是非常重要的。插件已经实现民主化记录之前,你不需要一个超级华丽的工作室。格莱美奖已经赢得了一个像样的笔记本电脑,一个接口和一个价值几百美元的插件。

“现在你不需要依靠任何人,任何标签,你可以控制你自己的音乐。但另一方面失踪——一个真正的革命,我们需要减少所需的技能。这并没有改变在过去的30年里,你还需要知道很多关于录音、混合、掌握——这是一套完全不同的技能,如果你弹吉他已经10年你需要另一个10到真正学习生产。”

所以神经参与生产是什么样子?“像我们已经与amp造型——就大大大。这是一个艰巨的任务——扩大的墙看起来很高,但是我们肯定做研究。

“很多人知道他们想要什么:他们的想法的歌已经在他们的头上,他们只需要一种方法来记录它听起来不错,而无需支付一个人500块钱跟踪混合,并更多的掌握等等。如果你能消除疼痛和成本,并提供相同的数量级少的价格——这就是有很多的潜力。”

拓展到生产创新神经DSP将可能提供一些更多的空间比潜在的限制性吉他音调的世界。“我的意思是,一个马歇尔马歇尔是一个马歇尔,这是一个超过50年,”道格说。“你怎么能创新吗?人们想要一个更加方便的方式来得到这个声音,但他们不想让你重塑。有这位效果有发展空间,但仍:你不会重塑混响或延迟或压缩机。”

但是,仅仅因为神经DSP不需要重新发明轮子,有声的说,这并不意味着四皮层是另一种硬件分析员。“最大的改进的空间是在用户界面上,”道格告诉我们。“我们不能让听起来一样好十倍的东西通用音频分形,他们已经很好,但是是多么容易使用——我们发现有改进的余地。明智的声音,当然,我认为质量是最好的,但,我有偏见。这是我的孩子!”

神经DSP王语气插件
神经DSP语气王插件

信心是关键

虽然造型技术已经变得越来越容易,它仍然是最广泛采用的玩家一定的风格——现代金属适合紧张,听起来能让人联想起控制。但Doug乐观神经DSP的计划扩大其技术较传统的声音——品牌已经与音王为放大器插件,恐慌向导科里黄极其可能的最干净的进入原型插件范围。

“我认为我们有很多的人,也许我们不会首先想到的主意时,解决他们的吉他声音。我的意思是,真正涉及的技术适用于所有风格,甚至超越了吉他。所以我们一直在冒险进入新风格的音乐与新原型插件,和与品牌合作,使放大器没有沉重的东西。”

“对我来说,我是一个沉重的家伙,我听很多东西但70%的我听有真正严重扭曲的吉他和低音。所以我们永远做的事情,”道格补充说,这应该不足为奇神经的插件目录,如果你曾经浏览含有签名原型插件的沉重的艺术家GojiraTosin AbasiPolyphia。也有一些真正的破碎安培,数字游戏等Soldanoslo - 100。

我们问豆豆他现在听什么——他提到他一直痴迷于cloudkick单人项目,并学习吉他(Doug主要是贝斯手),他的踪迹。但他也有一个标准的旋转沉重的经典:“我平常科恩Gojira,Meshuggah,梦想剧场,动物作为领导者。我仍然摇摆这些专辑。很多Polyphia。我觉得我在做植入式广告因为我命名人我们有产品,但我喜欢他们的音乐。之前和他们一起工作我一直在他们的粉丝,然后突然我们业务合作伙伴,这是一个很酷的事。

“我认为Polyphia在自己的类,他们的音乐是如此的美丽,也是最大的flex成为可能。我在听扮演上帝有一天,我三岁大的女儿——她讨厌——她沉重的东西它。她喜欢玩一遍,六次!如果你可以使一个硬东西最喜欢我的生活,一个三岁,讨厌扭曲的吉他爱你到一些东西。

但是并不是每个人都寻求Polyphia modern-math-djent完美一样。“有很多人不想要5150,他们想要一个dumble,语气王之类的。所以我们要确保提供足够的在我们的目录对那些玩各种各样的风格。”

我们好奇神经打算如何解决传统偏见的球员,这是不可否认的,守旧的吉他声音最狂热的追求者,你会更容易说服他们自己的吉他插入现场电源插座比数字分析员。“有一定比例的人将永远不会使用数字的东西,这很好,”道格说,“但这数量减少很多,技术的本质——我们每年有更好的和更好的产品,成本下降。

“10年前你不能得到一个世界级的吉他音从100美元的插件,它就不存在。直到分形的音频出来,你不能得到它在硬件单元——我认为分形在这方面改变了游戏规则,并打开Kemper和螺旋的方式等等。”

四叶
四叶

未来的未来

神经DSP的下一步计划是什么?“目前,我们专注于持续释放惊人的插件,并使QC的最佳设备。我们越来越多的团队我们可以做更多的事,做得更快。还有事情之前我们需要完成与QC退后一步,做其他的事情。不仅仅是设备,它的应用,生态系统。总是有研究和想法,但这都是处于超早期阶段。”

很明显,尽管他决心继续工作在四皮层,它成为一个真正的,有形的产品有点超现实的道格。“我有一些早期的图纸从2010年代——纸和笔。我一直在思考这个问题,八年。两年之后,第一个想法,这燃烧的困扰,我们不得不开始另一家公司来做。有一段时间,我都跑着去Darkglass和神经在同一时间。这是艰苦的。但在那个时候,我只是想到一件事,这是使QC发生。

“过去四、五年,有什么在我的脑海中——没有其他重要除了让这种事发生。我读的每一本书,每一个电话,就是我们可以确保该设备的存在在某种程度上,我们是这样做的。这是一个非常强烈的生活方式。单点集中。有时你可以疯狂,我们认为也许我们可以让气体后一点出来。当然,还有其他需求,和人民的期望,在某种程度上,它加剧一旦它。”

”的心理影响运行一个公司像神经,一个日益增长的,是艰难的,大部分的时间花在“生存危机”模式下,燃烧在你的核心的困扰。”

但是努力工作得到了回报——四皮层是真实的,尽管艰难的几率小,下层社会群AI工程师站的最大的音频公司在这个星球上,他们做到了,不管里面的帮助下难以捉摸,黑盒。

我们问:四皮层会真正完成吗?“也许在某种程度上,”道格回答道。“但对我来说很难看到,很快发生!”

关于神经DSP的更多信息,点击这里