音声圧縮形式の種類とその特徴について解説。各形式の検証もあり。
どんな種類があるんだろう?
音声圧縮形式はメジャーなもので「MP3」「WMA」「RealAudio」「ATARAC3」、ついで「OggVorbis」「Monkey'sAudio」「FLAC」などがあります。
WAVE
圧縮されていない元の音声ファイルは「WAVE」です。これはWindows標準の音声形式で、システム音などはWAVEファイルが使われています。1分間の録音に10MBほどの容量を要します。
MP3
「MP3」は昔から有名な圧縮形式でインターネットでの音楽配信や販売等で昔から使われてきた形式です。標準的なフォーマットであるCBR 128Kbpsで保存するとWAVEファイルの10分の1で保存することが可能で1分1MBですみます。CD-Rに640分から700分ほどのMP3を記録することができ、MP3再生に対応したオーディオプレーヤで再生可能です。一曲を4分とすると百数十曲録音できます。「MP3」にはライセンス料が存在し、実はOS等にもライセンス料が含まれています。知らない間にライセンス料を払っている現実があるのです。
WMA
「WMA」、特に「WMA9」は比較的新顔ながら、Windowsに始めからインストールされている「Windows Media Player 9」で再生可能なため、MP3に並び普及率も高い形式です。フォーマットも多彩で、可逆などニーズに合わせた圧縮が可能です。MP3と同じく、WMAが再生可能なオーディオプレーヤも売られています。
RealAudio & ATARAC3
「RealAudio」はストリーミング放送等で有名な形式。実はソニーの「ATARAC3」を用いて圧縮されています。「ATARAC3」はソニーのネットワークウォークマン等で使われている形式で、もともとはMDの音楽圧縮技術だった「ATARAC」を進化させたものです。
OggVorbis
「OggVorbis」はだんだん認知されてきている形式で、Windows Media Playerは対応していませんが、コーデックをインストールすることで再生も可能。Winampなどの多くのプレーヤでは再生可能になっており、その普及率を高めています。音質もMP3より良いといわれています。「OggVorbis」は完全にフリーな形式でオープンソースとなっています。MP3に変わる次世代定番コーデックともいわれています。
Monkey'sAudio & FLAC
「Monkey'sAudio」「FLAC」は可逆式の音声圧縮形式で、元の音質を保ったまま容量を小さくできます。普及率はまだ低く、再生できるソフトもまだ限られています。
各音声圧縮形式の注意点と用途
WAVEファイルは圧縮されず、劣化しないため音楽CDを作成するために一時的に音声を保存したり、録音した音声を編集するのに向いています。しかし、容量は非常に大きく、1分録音するのに10MBも必要なため、例えば一時間の音楽CDを録音するために600MBほどの容量が必要になります。そのため、WAVEファイルは一時的な保存や数秒程度の音声を保存するのに使いましょう。
MP3やWMA、OggVorbisなどの圧縮形式はWAVEファイルの10分の1の容量でほぼ同等の音質を保てるため、音楽CDの録音やインターネットの音楽配信などに使われます。しかし、これら形式の圧縮は不可逆式で、元の音から削っても大きく影響しない音を削って容量を抑えるという圧縮方法をとっています。例えば聞き取りにくい高音、低音、小さくて他の音にかき消され聞き取りにくい音が削られます。普通に聞いている分には違いを感じることは少ないですが、曲によっては違いがはっきり分かる場合もあります。また、大きな音で聞いたり、高性能なスピーカで聞いた場合、違いがはっきり分かることもあります。
WMAの可逆やMonkey'sAudio、FLACは可逆形式で元の音をそのまま残し、容量を2分の1程度に圧縮できます。実際に音楽CD1枚を録音してみたところ、約640MBの音楽を約340MBに圧縮できました。ディスクの容量に余裕がある場合や音質にこだわりたい人は可逆を選択すると良いでしょう。
各音声圧縮形式の癖を探ろう
それでは、それぞれにどんな特徴があるのか見てみましょう。
なお、市販の音楽CDからデジタル録音したWAVEファイルを元に計測しました。(4分39.253秒, 44100Hz, 16bits, stereo)
変換ソフトは「AudioEncoder」(Kazuki-hp)、スペクトラムアナライザーは「WaveSpectra」(efu's page)を利用。
今回調べるのは「AudioEncoder」で変換可能な「WAVE」「MP3」「WMA」「OggVorbis」「Monkey'sAudio」「FLAC」。
変換したものを再度WAVEファイルに変換し、周波数成分を解析したグラフをとりました。
グラフの赤線は最初から最後まで再生した間のピーク値です。容量にはタグ情報も含まれます。結果はほんの一例です。
WAVE | ||||
---|---|---|---|---|
フォーマット | 容量 | % | 変換時間 | グラフ |
- |
49,260 KB |
100% | - |
![]() |
元のファイル。無圧縮、劣化無し。 | ||||
このファイルを各形式に変換した。 | ||||
MP3 | ||||
フォーマット | 容量 | % | 変換時間 | グラフ |
CBR 128 Kbps |
4,457 KB |
9% | 32.1秒 |
![]() |
17kHzのあたりからばっさりと切れられているのが分かる。高音がほとんど記録されていない。 | ||||
VBR 32-256 Kbps |
6,731 KB |
14% | 57.2秒 |
![]() |
容量の割にはほとんど変化がない。18kHzまで記録。 | ||||
ABR 64-128-320 Kbps |
4,985 KB |
10% | 34.7秒 |
![]() |
CBRとほとんど違いがない。容量は少し大きい。 | ||||
ばっさり高音を削って容量を抑えるのが特徴。 | ||||
WMA | ||||
フォーマット | 容量 | % | 変換時間 | グラフ |
CBR 128 Kbps |
4,496 KB |
9% | 19.6秒 |
![]() |
MP3と違い、高音が少しだけ記録されている。17kHzの終わりあたりから丸く切り取られている。 | ||||
CBR 64 Kbps |
2,261 KB |
5% | 16.8秒 |
![]() |
登場当初は「MP3の半分の容量で同等の音質」が売りだった。高音が記録されている分だけ良。MP3の64Kbpsは11kHzでばっさり切られている。 | ||||
2-Pass CBR 128 Kbps |
4,496 KB |
9% | 53.3秒 |
![]() |
音質も容量もCBRと変わらなかった。 | ||||
品質設定 VBR 98% |
9,706 KB |
20% | 17.4秒 |
![]() |
容量は2倍以上になったが大部分の音がそのまま残っている。 | ||||
VBR 128 Kbps |
4,515 KB |
9% | 38.8秒 |
![]() |
CBRと変わらなかった。 | ||||
ピーク指定 VBR 128-256 Kbps |
4,515 KB |
9% | 39.5秒 |
![]() |
容量も音質もVBRと変わらなかった。 | ||||
可逆 |
33,116 KB |
67% | 21.0秒 |
![]() |
WAVEと全く同じ音質。16MBほど小さい。 | ||||
MP3に比べ高音を少し残した形式。多くのフォーマット有。Windows Media Player 9で再生可能なV9で調査。 | ||||
Ogg Vorbis | ||||
フォーマット | 容量 | % | 変換時間 | グラフ |
品質設定 4.00 128 Kbps |
4,523 KB |
9% | 35.1秒 |
![]() |
MP3、WMAの128Kbpsと変わらない容量ながら20kHzまで記録されている。 | ||||
品質設定 0.00 64 Kbps |
2,263 KB |
5% | 35.8秒 |
![]() |
WMAより高音をしっかり記録している。 | ||||
ABR 0-128-128 Kbps |
4,265 KB |
9% | 86.6秒 |
![]() |
音質は128Kbpsと変わらない。容量は少し小さい。 | ||||
CBR |
4,523 KB |
9% | 35.1秒 |
![]() |
品質設定の方とほとんど変わりない。 | ||||
CBR |
2,263 KB |
5% | 35.5秒 |
![]() |
品質設定の方とほとんど変わりない。 | ||||
不可逆式で最も良い音質が期待できる。高音があまり削られない。 | ||||
FLAC | ||||
フォーマット | 容量 | % | 変換時間 | グラフ |
level0 |
36,536 KB |
74% | 15.6秒 | 可逆のため割愛(WAVE・WMA 可逆を参照) |
WAVEと同じ音質。早いが大きめ。 | ||||
level4 |
33,925 KB |
69% | 19.3秒 | 可逆のため割愛(WAVE・WMA 可逆を参照) |
WAVEと同じ音質。レベル0に比べ2.5MBほど小さい。 | ||||
level8 |
33,821 KB |
69% | 40.4秒 | 可逆のため割愛(WAVE・WMA 可逆を参照) |
WAVEと同じ音質。レベル4の2倍時間を要したが、ファイルサイズに大きな違いはない。 | ||||
WMAやMonkey'sAudioに比べ低速、低圧縮。 | ||||
Monkey's Audio | ||||
フォーマット | 容量 | % | 変換時間 | グラフ |
高速 |
33,522 KB |
68% | 20.4秒 | 可逆のため割愛(WAVE・WMA 可逆を参照) |
WAVEと同じ音質。FLACに比べ高速で小さい。 | ||||
標準 |
33,088 KB |
67% | 23.2秒 | 可逆のため割愛(WAVE・WMA 可逆を参照) |
WAVEと同じ音質。高速に比べ500KBだけ小さい。 | ||||
最高圧縮 |
32,506 KB |
66 | 33.0秒 | 可逆のため割愛(WAVE・WMA 可逆を参照) |
WAVEと同じ音質。高速に比べ1MB小さい。可逆の中で最小。 | ||||
紹介して可逆式で最も優秀。高速で高圧縮。 |