歌ってみたのMIXを依頼するとき、MIX師から「24bit/48kHzで提出してください」と言われることが多いと思います。でも、なぜその数字なのか、もっと大きい数字のほうが音質も良いんじゃないか、と疑問に感じている人は少なくないはずです。
僕も依頼を受ける側として、この質問はよくもらいます。今日は「なぜ24bit/48kHzなのか」、そして「32bitや96kHzにしなくていいのはなぜか」を、できるだけかみ砕いて話していきます。最後に、オケのサンプルレートがバラバラだったときの録り方も一緒に整理します。
そもそもビット深度とサンプルレートって何の話?
数字の話に入る前に、この2つが何を表しているのかだけ軽く触れておきます。
ビット深度(bit) は、音の大きさをどれだけ細かく記録できるかを表すものだと思ってください。数字が大きいほど、小さい音から大きい音までを余裕を持って扱えます。16bitより24bitのほうが余裕がある、というイメージです。
サンプルレート(kHz) は、1秒間に何回音をサンプリング(記録)するかという数字です。44.1kHzなら1秒間に4万4100回、48kHzなら4万8000回ですね。こちらは扱える音の高さ(周波数)の上限に関わってきます。
この2つは別々の話なので、分けて考えるとすっきりします。ここを混同すると一気にわかりにくくなるので、まずはここだけ押さえておいてください。

なぜ24bitなのか — 32bitにしなくていい理由
歌ってみたの録音は16bitでも音は出ますが、MIXのことを考えると24bitがおすすめです。
理由はシンプルで、ボーカルにはコンプやEQ、ピッチ補正、リバーブと、いくつもの処理を重ねていくからです。このとき元の音に余裕があるほど、処理を重ねても破綻しにくくなります。16bitだと小さい音量の部分、たとえばブレスや語尾の消え際あたりで、編集を重ねるうちにノイズや粗が目立ってくることがあります。24bitなら余裕があるので、後からゲインを持ち上げたり補正で引き伸ばしたりしても安心して扱えます。
では「もっと大きい32bitにすればさらに良くなるのでは?」と思いますよね。ここが面白いところで、答えは「ほぼ変わりません」です。
音をマイクからデジタルに変換しているのはオーディオインターフェースの中のチップなのですが、このチップが実際に扱える性能には物理的な限界があります。その実力は、すでに24bitですら使い切れていないくらいなんです。つまり32bitで録っても、その上乗せされた部分には実質的にノイズが記録されているだけで、音質的な意味はほとんどありません。器を大きくしても、注ぐ中身がそこまで届いていない、という感じですね。
そのうえで32bitはファイルサイズだけは確実に重くなります。得るものがほぼないのに容量と負荷だけ増えるので、わざわざ選ぶ理由が薄いわけです。
「数字が大きい=高音質」とは限らない、というのはこの先もずっと付いてくる考え方なので、頭の片隅に置いておいてください。
なぜ48kHzなのか — 96kHzにしなくていい理由
サンプルレートが48kHzなのは、歌ってみたの事情とよく噛み合っています。
歌ってみたは、必ず元のオケ(カラオケ音源)に歌を合わせる作業です。そして動画コンテンツの世界、YouTubeやニコニコ動画などの音声は伝統的に48kHzが標準になっています。最終的に動画として公開するなら、そこに合わせておくのが一番素直なんですね。
ここで「じゃあ96kHzで録ればもっと高音質では?」という疑問も出てきます。理屈の上では、制作途中の処理精度がわずかに有利になる場面はあります。ただ、最終的に動画にする時点で48kHzに変換してしまうので、その差はほとんど消えてしまいます。代わりにファイルサイズとパソコンへの負荷は約2倍になります。
歌ってみたという用途では、96kHzにする労力に見合うリターンはまず得られません。素直に48kHzで録るのが合理的です。
ここまでをいったん表にまとめておきます。
| 設定 | 推奨 | 理由 |
|---|---|---|
| ビット深度 | 24bit | 編集に十分な余裕がある。32bitは容量増だけで意味が薄い |
| サンプルレート | 48kHz | 動画の標準に合う。96kHzは負荷2倍で差はほぼ消える |
オケのサンプルレートがバラバラだったときは?
ここからが実は一番つまずきやすいところです。配布されているオケが、いつも48kHzとは限りません。24bit/44.1kHzだったり、16bit/44.1kHzだったりすることもよくあります。
このとき大事なのは、サンプルレートとビット深度で対応が違うという点です。
サンプルレートは「オケに合わせて統一」する
サンプルレートは、変換を通すたびにごくわずかですが音質に影響します。だから変換の回数はできるだけ減らしたい。そして、すでにあるオケはMIXの土台、いわば主役です。主役をわざわざ変換するメリットはありません。
なので、オケが44.1kHzなら、DAWのプロジェクトも44.1kHzに設定して、オケはそのまま読み込み、歌も44.1kHzで録るのがきれいなやり方です。こうすれば制作中はずっと変換なしで進められます。
「でもYouTubeは48kHzなんじゃ?」と心配になりますよね。それは大丈夫で、最後に動画として書き出すときに一度だけ48kHzに変換すれば十分です。変換は終盤の1回だけ、というのが理想的な形になります。
ビット深度は「揃えなくてOK」
一方、ビット深度はサンプルレートと違って、トラックごとにバラバラでも全く問題ありません。
DAWは読み込んだ音を内部で高い精度で処理しているので、16bitのオケと24bitの歌が同じプロジェクトに混在していても、ちゃんと一緒に扱えます。なので、オケが16bitでも、それに合わせて歌まで16bitにする必要はありません。歌は素直に24bitで録ってください。録音段階の24bitの余裕は、編集のしやすさにそのまま生きてきます。
オケのパターンごとにまとめると、こうなります。
| オケの形式 | プロジェクト設定 | ボーカル録音 |
|---|---|---|
| 24bit/48kHz | 48kHz | 24bit/48kHz |
| 24bit/44.1kHz | 44.1kHz | 24bit/44.1kHz |
| 16bit/44.1kHz | 44.1kHz | 24bit/44.1kHz |
覚え方としては、「サンプルレートはオケに合わせて統一、ビット深度は混在OKで歌はいつも24bit」とセットにしておくと、どんなオケが来ても迷わなくなります。

最後に
ここまで数字の話をしてきましたが、24bit/48kHzというのは「これが正解の絶対値」というより、全員が確実に出せて、編集に十分で、動画とも噛み合う、一番事故が少ない落としどころだと考えてもらうのがちょうどいいです。
数字を大きくすれば良くなる、という感覚はつい持ってしまいがちですが、実際にはボトルネックは録音環境やマイク、歌そのものにあることがほとんどです。フォーマットで悩む時間があったら、その分を録音環境の見直しや歌い込みに回したほうが、仕上がりはずっと良くなります。
まずは24bit/48kHz、オケが違うサンプルレートならそれに合わせる。この基本だけ押さえておけば、提出でつまずくことはなくなるはずです。