音声圧縮について

メイン > もっと詳しく、楽しく > 音声 > 音声圧縮について


Warning: include() [function.include]: URL file-access is disabled in the server configuration in /home/users/2/chicappa.jp-masar/web/isw/archives/detail/sound/post_80/index.php on line 63

Warning: include(http://infosenderweb.jp/info.php) [function.include]: failed to open stream: no suitable wrapper could be found in /home/users/2/chicappa.jp-masar/web/isw/archives/detail/sound/post_80/index.php on line 63

Warning: include() [function.include]: Failed opening 'http://infosenderweb.jp/info.php' for inclusion (include_path='.:/usr/local/php/5.2/lib/php') in /home/users/2/chicappa.jp-masar/web/isw/archives/detail/sound/post_80/index.php on line 63

音声圧縮形式の種類とその特徴について解説。各形式の検証もあり。

どんな種類があるんだろう?

音声圧縮形式はメジャーなもので「MP3」「WMA」「RealAudio」「ATARAC3」、ついで「OggVorbis」「Monkey'sAudio」「FLAC」などがあります。

WAVE

圧縮されていない元の音声ファイルは「WAVE」です。これはWindows標準の音声形式で、システム音などはWAVEファイルが使われています。1分間の録音に10MBほどの容量を要します。

MP3

「MP3」は昔から有名な圧縮形式でインターネットでの音楽配信や販売等で昔から使われてきた形式です。標準的なフォーマットであるCBR 128Kbpsで保存するとWAVEファイルの10分の1で保存することが可能で1分1MBですみます。CD-Rに640分から700分ほどのMP3を記録することができ、MP3再生に対応したオーディオプレーヤで再生可能です。一曲を4分とすると百数十曲録音できます。「MP3」にはライセンス料が存在し、実はOS等にもライセンス料が含まれています。知らない間にライセンス料を払っている現実があるのです。

WMA

「WMA」、特に「WMA9」は比較的新顔ながら、Windowsに始めからインストールされている「Windows Media Player 9」で再生可能なため、MP3に並び普及率も高い形式です。フォーマットも多彩で、可逆などニーズに合わせた圧縮が可能です。MP3と同じく、WMAが再生可能なオーディオプレーヤも売られています。

RealAudio & ATARAC3

「RealAudio」はストリーミング放送等で有名な形式。実はソニーの「ATARAC3」を用いて圧縮されています。「ATARAC3」はソニーのネットワークウォークマン等で使われている形式で、もともとはMDの音楽圧縮技術だった「ATARAC」を進化させたものです。

OggVorbis

「OggVorbis」はだんだん認知されてきている形式で、Windows Media Playerは対応していませんが、コーデックをインストールすることで再生も可能。Winampなどの多くのプレーヤでは再生可能になっており、その普及率を高めています。音質もMP3より良いといわれています。「OggVorbis」は完全にフリーな形式でオープンソースとなっています。MP3に変わる次世代定番コーデックともいわれています。

Monkey'sAudio & FLAC

「Monkey'sAudio」「FLAC」は可逆式の音声圧縮形式で、元の音質を保ったまま容量を小さくできます。普及率はまだ低く、再生できるソフトもまだ限られています。

各音声圧縮形式の注意点と用途

WAVEファイルは圧縮されず、劣化しないため音楽CDを作成するために一時的に音声を保存したり、録音した音声を編集するのに向いています。しかし、容量は非常に大きく、1分録音するのに10MBも必要なため、例えば一時間の音楽CDを録音するために600MBほどの容量が必要になります。そのため、WAVEファイルは一時的な保存や数秒程度の音声を保存するのに使いましょう。

MP3やWMA、OggVorbisなどの圧縮形式はWAVEファイルの10分の1の容量でほぼ同等の音質を保てるため、音楽CDの録音やインターネットの音楽配信などに使われます。しかし、これら形式の圧縮は不可逆式で、元の音から削っても大きく影響しない音を削って容量を抑えるという圧縮方法をとっています。例えば聞き取りにくい高音、低音、小さくて他の音にかき消され聞き取りにくい音が削られます。普通に聞いている分には違いを感じることは少ないですが、曲によっては違いがはっきり分かる場合もあります。また、大きな音で聞いたり、高性能なスピーカで聞いた場合、違いがはっきり分かることもあります。

WMAの可逆やMonkey'sAudio、FLACは可逆形式で元の音をそのまま残し、容量を2分の1程度に圧縮できます。実際に音楽CD1枚を録音してみたところ、約640MBの音楽を約340MBに圧縮できました。ディスクの容量に余裕がある場合や音質にこだわりたい人は可逆を選択すると良いでしょう。

各音声圧縮形式の癖を探ろう

それでは、それぞれにどんな特徴があるのか見てみましょう。
なお、市販の音楽CDからデジタル録音したWAVEファイルを元に計測しました。(4分39.253秒, 44100Hz, 16bits, stereo)
変換ソフトは「AudioEncoder」(Kazuki-hp)、スペクトラムアナライザーは「WaveSpectra」(efu's page)を利用。
今回調べるのは「AudioEncoder」で変換可能な「WAVE」「MP3」「WMA」「OggVorbis」「Monkey'sAudio」「FLAC」。
変換したものを再度WAVEファイルに変換し、周波数成分を解析したグラフをとりました。
グラフの赤線は最初から最後まで再生した間のピーク値です。容量にはタグ情報も含まれます。結果はほんの一例です。

WAVE
フォーマット 容量 % 変換時間 グラフ
- 49,260
KB
100% -
元のファイル。無圧縮、劣化無し。
このファイルを各形式に変換した。
MP3
フォーマット 容量 % 変換時間 グラフ
CBR
128
Kbps
4,457
KB
9% 32.1秒
17kHzのあたりからばっさりと切れられているのが分かる。高音がほとんど記録されていない。
VBR
32-256
Kbps
6,731
KB
14% 57.2秒
容量の割にはほとんど変化がない。18kHzまで記録。
ABR
64-128-320
Kbps
4,985
KB
10% 34.7秒
CBRとほとんど違いがない。容量は少し大きい。
ばっさり高音を削って容量を抑えるのが特徴。
WMA
フォーマット 容量 % 変換時間 グラフ
CBR
128
Kbps
4,496
KB
9% 19.6秒
MP3と違い、高音が少しだけ記録されている。17kHzの終わりあたりから丸く切り取られている。
CBR
64
Kbps
2,261
KB
5% 16.8秒
登場当初は「MP3の半分の容量で同等の音質」が売りだった。高音が記録されている分だけ良。MP3の64Kbpsは11kHzでばっさり切られている。
2-Pass CBR
128
Kbps
4,496
KB
9% 53.3秒
音質も容量もCBRと変わらなかった。
品質設定 VBR
98%
9,706
KB
20% 17.4秒
容量は2倍以上になったが大部分の音がそのまま残っている。
VBR
128
Kbps
4,515
KB
9% 38.8秒
CBRと変わらなかった。
ピーク指定 VBR
128-256
Kbps
4,515
KB
9% 39.5秒
容量も音質もVBRと変わらなかった。
可逆 33,116
KB
67% 21.0秒
WAVEと全く同じ音質。16MBほど小さい。
MP3に比べ高音を少し残した形式。多くのフォーマット有。Windows Media Player 9で再生可能なV9で調査。
Ogg Vorbis
フォーマット 容量 % 変換時間 グラフ
品質設定
4.00 128
Kbps
4,523
KB
9% 35.1秒
MP3、WMAの128Kbpsと変わらない容量ながら20kHzまで記録されている。
品質設定
0.00 64
Kbps
2,263
KB
5% 35.8秒
WMAより高音をしっかり記録している。
ABR
0-128-128
Kbps
4,265
KB
9% 86.6秒
音質は128Kbpsと変わらない。容量は少し小さい。

CBR
128
Kbps

4,523
KB
9% 35.1秒
品質設定の方とほとんど変わりない。

CBR
64
Kbps

2,263
KB
5% 35.5秒
品質設定の方とほとんど変わりない。
不可逆式で最も良い音質が期待できる。高音があまり削られない。
FLAC
フォーマット 容量 % 変換時間 グラフ
level0 36,536
KB
74% 15.6秒 可逆のため割愛(WAVE・WMA 可逆を参照)
WAVEと同じ音質。早いが大きめ。
level4 33,925
KB
69% 19.3秒 可逆のため割愛(WAVE・WMA 可逆を参照)
WAVEと同じ音質。レベル0に比べ2.5MBほど小さい。
level8 33,821
KB
69% 40.4秒 可逆のため割愛(WAVE・WMA 可逆を参照)
WAVEと同じ音質。レベル4の2倍時間を要したが、ファイルサイズに大きな違いはない。
WMAやMonkey'sAudioに比べ低速、低圧縮。
Monkey's Audio
フォーマット 容量 % 変換時間 グラフ
高速 33,522
KB
68% 20.4秒 可逆のため割愛(WAVE・WMA 可逆を参照)
WAVEと同じ音質。FLACに比べ高速で小さい。
標準 33,088
KB
67% 23.2秒 可逆のため割愛(WAVE・WMA 可逆を参照)
WAVEと同じ音質。高速に比べ500KBだけ小さい。
最高圧縮 32,506
KB
66 33.0秒 可逆のため割愛(WAVE・WMA 可逆を参照)
WAVEと同じ音質。高速に比べ1MB小さい。可逆の中で最小。
紹介して可逆式で最も優秀。高速で高圧縮。

投稿日: 2006年10月20日 23:06 | 更新日:2007年03月26日 12:57
パーマリンク | 音声 | コメント (0) | トラックバック (0)

トラックバック

このエントリーのトラックバックURL:
http://masar.jp/cgi/mt/mt-tb.cgi/648

コメントを投稿

この記事に対するご意見、ご感想、ご要望をお気軽にお寄せくださいm(__)m
なお、お送りいただいたコメントの掲載は、管理人が確認した後になりますので、お待ちください。



ソースネクスト