こんにちは、是永レンです。

今日は、僕がMIX師として活動を始めたころからもずっと議論されている、ちょっと根の深い話を取り上げます。コンプレッサーのアタックタイムの定義についてです。

DTMの解説本やYouTube、X(旧Twitter)を眺めていると、同じ「アタックタイム」という言葉に対して、まったく違う説明をしている人がいることに気づくと思います。

  • ①スレッショルドとレシオで指定された音量に到達するまでの時間(信号が閾値を超えた瞬間から効き始め、設定したゲインリダクション量に達するまで)
  • ②コンプレッションが開始されるまでの時間(指定した時間だけ何もせず、その直後から音量が下がり始める)

ベテランのエンジニアでも、人によって説明が割れます。初心者の方が混乱するのは当然の話で、僕自身も最初は②だと思い込んでいた時期がありました。今日はこの論争に、歴史と回路の話、そして学術文献まで遡って、できるだけフェアに答えを出してみたいと思います。

まず結論から

最初に結論だけ書いておきます。技術的・歴史的に正しいのは①です。②は、コンプレッサーの聴感上の挙動から生まれた、わかりやすいけれど厳密には誤った解釈です。

ただし、これだけでは納得しにくいと思うので、なぜ①が正しいのか、なぜ②という解釈が広まったのか、そして有名な反例とされるMeldaProductionのMCompressorは本当に②なのか、という話を順番にしていきます。

アタックタイムは「遅延」ではなく「到達速度」

まず、①の定義を学術的なソースで確認しておきます。

オーディオ工学会誌(JAES)に2012年に掲載された、コンプレッサー設計のチュートリアル論文として広く参照されているGiannoulis, Massberg, Reissの論文には、こう書かれています。

"The attack time defines the time it takes the compressor to decrease the gain to the level determined by the ratio once the signal overshoots the threshold."

訳すと「アタックタイムとは、信号が閾値をオーバーシュートしてから、コンプレッサーがレシオで決められたレベルまでゲインを下げるのにかかる時間」です。

Wikipediaの「Dynamic range compression」の項目でも、ほぼ同じ説明がされています。MATLABの公式オーディオ処理ライブラリでは、もう少し具体的に「最終ゲイン値の10%から90%まで上昇するのに要する時間」と定義されていて、これも先ほどのJAES論文を引用元にしています。

つまり、学術と実装の世界では①で完全に統一されているということです。

ここで大事なのは、「コンプは閾値を超えた瞬間から動き始めている」という点。アタックタイムが100msに設定されていても、何もせず100ms待っているわけではありません。閾値を超えた瞬間からゲインリダクションは始まっていて、ただその「下がりきるまでの時間」が100msかかる、ということです。

赤信号で停まっている車に例えると、わかりやすいかもしれません。青になった瞬間にアクセルは踏みます。これは速いアタックでも遅いアタックでも変わらない。違うのは、アクセルを踏み込む強さです。速いアタックはベタ踏みでガツンと加速、遅いアタックはじわっと踏んで、目標スピードに達するまで時間がかかる。発進そのものは、どちらも信号が変わった瞬間です。

なぜ「②(遅延)」という誤解が広まったのか

ここからがちょっと面白いところで、②の解釈もまったく根拠がないわけではないんです。

たとえば1176のアタックを一番遅く(ノブを左いっぱい)に設定すると、ボーカルやスネアに「スコンッ」というアタック感が乗ります。あれを体感すると、誰でも「最初は何もしないで、トランジェントの後から効いてるんだな」と感じます。
Youtubeなどでも似たような話をされているかたがいました。

でも実際には違って、コンプは閾値を超えた瞬間から効き始めているけれど、ゲインリダクションが深くなるまでに時間がかかるので、トランジェントの頭の部分は通り抜けてしまう、というのが正しい説明です。

マスタリングエンジニアのFriedemann Tischmeyer氏は、自著で②寄りの解釈を採用してしまっていたことを後に「罠にはまった」と認めた上で、こう訂正しています。

"The smack, created by a long attack time, does not come from an offset. It is created, because the gain of the incoming transient rises very fast while the gain reduction response curve pops in instant but usually gently and increases gain reduction stronger over time."

"アタック時間が長いことによって生じる「スマック」は、オフセットに起因するものではありません。これは、入力されるトランジェントのゲインが急激に上昇する一方で、ゲインリダクションの応答曲線が瞬時に、しかし通常は緩やかに立ち上がり、時間の経過とともにゲインリダクションがより強く増加していくために生じるものです。

トランジェントの「スコン」は遅延(offset)から生まれているのではなく、入力のゲインが急上昇する一方で、ゲインリダクションは即座に始まるけれど穏やかに深くなっていく、その時間差から生まれている、ということです。

「②の説明のほうが結果としてのサウンドを直感的にイメージしやすい」というのが、誤解が広まった一番の理由だと僕は思っています。

アナログ回路を見れば①しかありえない

歴史を遡ると、もっとはっきりします。

初期のコンプレッサー(Fairchild 660/670、Teletronix LA-2A、UREI 1176など)はすべてアナログ回路で実装されていました。アタックタイムとリリースタイムは、コントロール電圧を生成する整流回路の後ろに置かれたRC回路(抵抗とコンデンサの組み合わせ)の時定数 τ=RC として実装されています。

RC回路の動作は、電子工学の基本中の基本で、こうなっています。

経過時間 最終値への到達率
約63.2%
約95%
ほぼ100%

つまり、コンデンサは電圧がかかった瞬間から充電を始めて、指数関数的に最終値へ近づいていきます。「指定した時間だけ待ってから一気に充電する」という動作は、回路の物理として不可能なんですよ。これがアナログコンプの動作原理である以上、アタックタイムは①でしか定義できないわけです。

LA-2Aの場合

LA-2Aは1965年に登場した、エレクトロルミネセント(EL)パネルとフォトセルを組み合わせた電子光学式のコンプレッサーです。ELパネルが光って、その光を受けたフォトセルの抵抗値が下がることでゲインリダクションが行われます。Universal Audioのマニュアルにはこう書かれています。

"The LA-2A was the first electro-optical compressor to use an electro-luminescent panel for the light source. Previous attempts at electro-optical compression employed either neon or incandescent lights. Both of these took time to light up, and this delay resulted in slow attacks."

「ネオン管や白熱電球は点灯までに時間がかかり、結果としてアタックが遅くなっていた」という記述があるのが面白いところで、ここでいう「遅くなる」というのは「点灯までに待ち時間がある」ではなく「点灯しきるまでに時間がかかる」という意味です。LA-2Aの平均アタックタイムは約10msとされていますが、これは「光り始めるまで」ではなく「ゲインリダクションが目標値に達するまで」の時間です。

1176の場合

1176は1967年に登場した、FET(電界効果トランジスタ)をゲインリダクション素子に使った史上初のオール・トランジスタ・ピークリミッターで、アタックタイムは20μs〜800μs(マイクロ秒)と非常に高速です。Universal Audioの2-1176マニュアルでは「incoming signal に応答してゲインリダクションを開始するまでの時間」という表現を使っていますが、内部回路はやはりRC時定数で構成されていて、実装としては①の動作になります。

CCIR/ITUの国際標準

歴史的な国際標準としては、CCIR(現ITU-R)が「12dBオーバーシュートを4dB減衰させるまでの時間」をアタックタイムと定義しています。これは放送機器(テレフォニー)の世界の規格でプロオーディオ業界に直接適用されているわけではありませんが、この定義も「減衰が完了するまでの時間」を測るもので、考え方は①の系譜です。

業界統一規格は実は存在しない

ここで一つ、正直に書いておかないといけないことがあります。

「①が正しい」と書きましたが、①の中での測定基準は業界で統一されていません。Wikipediaにも「There is no industry standard for the exact meaning of these time parameters.(これらの時間パラメータの厳密な意味について業界標準は存在しない)」とはっきり書かれています。

各メーカー・各規格でこれだけバラついています。

基準 採用例・出典
RC時定数 τ(63.2%到達) アナログ機の回路設計
最終GR値の2/3(約66%)到達 Kush Audio / Tischmeyer解釈
10%→90%到達時間 MATLAB / Giannoulisら
9dB GR到達 Worship Sound Guy ほか教則系
86% または 95% 到達 RANE社の技術ノート
12dBオーバーシュート→4dB減衰 CCIR/ITU標準(放送)

なので、同じ「アタック10ms」と書かれていても、メーカーが違えば実際の挙動は全然違う、ということが普通に起こります。これは初心者がプラグインを乗り換えたときに「あれ、同じ数字なのに効き方が違う」と感じる原因の一つでもあります。耳で判断する習慣が大事になるのは、こういう背景があるからです。

「②の挙動をする」と言われるMCompressorは本当に②なのか

質問を受けることが多いので、MeldaProductionのMCompressorについても触れておきます。「MCompressorは②の挙動をする」と言われることがありますが、これは半分正しくて半分誤解です。

公式マニュアルの記述を見てみます。

"Attack defines the attack time, that is how quickly the level detector increases the measured input level. When the input peak level is higher than the current level measured by the detector, the detector moves into the attack mode, in which the measured level is increased depending on the input signal. ... Once the measured level exceeds the Threshold then the dynamics processing (compression, limiting, gating) will start."

ここに書かれているのは、MCompressorの動作はこういう流れだ、ということです。

  1. 入力信号が来ると、まずレベルディテクター(エンベロープフォロワー)が「測定レベル」を作る
  2. この測定レベルが上昇していくスピードがアタックタイム
  3. 測定レベルが閾値を超えた瞬間に、コンプレッション処理が始まる

ポイントは、閾値判定の対象が「入力信号のピークそのもの」ではなく「平滑化された測定レベル」になっていることです。アタックを長く設定すると、測定レベルが閾値に到達するまで時間がかかるので、外から見ると「閾値を超えた信号が来ているのに、しばらくコンプが効かない」ように見えます。

つまり、純粋な②(遅延型)ではないけれど、見た目には②に近い挙動になる、という設計です。普通のRC時定数型ともFabFilter Pro-Cのような①直系ともちょっと違う、エンベロープディテクター先行型と呼べる方式ですね。

MeldaProductionのフォーラムでも「ハードウェアの制約に縛られていないので、1176やLA-2Aのようには素直に動かない。狙ってその挙動を作ることはできるけれど、わかってないと難しい」というコメントが見られます。

ハードウェアの物理制約に縛られないデジタルだからこそできる設計、と理解しておくと、MCompressorの個性を活かしやすくなると思います。

初心者の方へ、結局どう考えればいいのか

ここまで読んでくれた方に、現場目線で実用的なまとめを書いておきます。

まず原則として、アタックを動かすときは「コンプが効き始めるタイミングをずらしている」のではなく「効きの深まり方をコントロールしている」と意識すること。これだけで設定の感覚がガラッと変わります。

たとえばボーカルにFETタイプ(1176系)でアタック速め・リリース速めをかけるとき、「子音の頭を残したい」場合は、アタックを少しゆっくりにします。これは「子音の間はコンプが寝ている」のではなく、「子音の間にコンプは動き始めているけれど、まだ深くゲインリダクションが入っていない」状態を作っている、と捉えてください。

逆に、サ行のキツさを抑えたいときに「アタックを速くしてもサ行に効かない」と感じることがあれば、それは①の感覚で考えるとよくわかります。アタックを最速にしても「下がりきるまでの時間」は0にはならないので、本当に瞬間的な高周波には追いつかない。だからディエッサーという別の道具が要る、という流れで理解できます。

数値はあくまで出発点で、最終的には耳で判断するしかありません。これはアタックタイムの定義に業界標準がない以上、どうしようもない部分です。同じ「アタック3ms」でも1176とLA-2AとMCompressorではまったく違う音になります。数字を信じすぎず、ゲインリダクションメーターの動きと耳の両方を使ってください。

参照したソース

今回の記事で参照した主なソースを挙げておきます。気になる方は元の文献を当たってみてください。

  • Giannoulis, Massberg & Reiss, "Digital Dynamic Range Compressor Design—A Tutorial and Analysis," Journal of the Audio Engineering Society, Vol.60, No.6, 2012
  • Universal Audio LA-2A Manual / 2-1176 Manual
  • MeldaProduction MCompressor User Manual および公式チュートリアル
  • Wikipedia「Dynamic range compression」「LA-2A Leveling Amplifier」
  • MathWorks MATLAB Audio Toolbox Documentation
  • RANE「Dynamics Processors -- Technology & Applications」
  • Friedemann Tischmeyer「Understanding Compressor's Parameters」(Mastering Academy)

10年MIX師をやってきて思うのは、こういう基礎概念ほど、ふんわりした理解のまま放置されがちだということです。アタックタイムを①として捉え直すだけで、コンプを触る感覚は確実に一段クリアになります。今日の話が、みなさんの耳と手の判断材料を少し増やせていれば嬉しいです。