ファイルの圧縮実験

様々なファイルを様々な圧縮形式で圧縮し、比較してみました。

圧縮形式の説明

ここでまず、今回の実験に使ったさまざまな圧縮形式の説明をします。

ZIP ――― Phil Katz Zip

開発者
Phillip W. Katz(1962-2000 アメリカ合衆国)、通称 Phil Katz
公開年
1989年
アルゴリズム
DEFLATE
暗号化
形式
Lv0 - Lv9
拡張子
.zip
MIME
application/zip
備考
世界的にメジャーなフォーマット。本家はシェアウェアだが、互換性のあるフリーウェアもある。

LZH ――― LZSS(Lempel Ziv Storer Szymanski) Huffman Archive

開発者
吉崎栄泰 (1955- 日本)
公開年
1988年
アルゴリズム
LZHUF
暗号化
不可
形式
LH0 / LH1 / LH4 / LH5 / LH6 / LH7
拡張子
.lzh / .lha / .lhz
MIME
application/x-lzh-compressed, application/x-lzh
備考
国内では最もよく使われていたが最近は、ZIPに押され気味。本家もフリーウェア。LH6, LH7形式はテスト版とされているため配布すべきでないとされている。

CAB ――― Cabinet

開発者
Microsoft(アメリカ合衆国)
公開年
1995年頃
アルゴリズム
DEFLATE, Quantum, LZX
暗号化
不可
形式
MSZip, LZX1 - LZX21
拡張子
.cab
MIME
application/vnd.ms-cab-compressed
備考
Windows95以降、Microsoftのソフト配布に採用されている。

BH ――― BlakHole

開発者
ZipTV (アメリカ合衆国)
公開年
1997? ※サイトの著作権表示から推定
アルゴリズム
?
暗号化
不可
形式
?
拡張子
.bh
MIME
application/x-bh-compressed ?
備考
ライセンスは有償。

GZ ――― GNU zip

開発者
Jean-loup Gailly, Mark Adler
公開年
1992
アルゴリズム
DEFLATE
暗号化
不可
形式
?
拡張子
.gz ※単体
.tgz, .tar.gz ※TARで固めた場合
MIME
application/x-gunzip, application/x-tar-gz
備考
UNIXでよく使われる圧縮形式。GNU。
複数ファイルを圧縮する場合、TARで固める必要がある。

BZ2 ――― bzip2

開発者
Julian Seward(イギリス)
公開年
1996
アルゴリズム
バロウズ-ホイラー変換, MTF法, ハフマン符号化法
暗号化
不可
形式
?
拡張子
.bz2 ※単体
.tbz, .tar.bz2 ※TARで固めた場合
MIME
application/x-bz2-compressed
備考
GZに代わる新しい圧縮形式。オープンソース。
複数ファイルを圧縮する場合、TARで固める必要がある。

RAR ――― Roshal ARchive

開発者
Eugene Roshal(1972- ロシア)
公開年
1996
アルゴリズム
?
暗号化
形式
?
拡張子
.rar
MIME
application/x-rar-compressed
備考
圧縮ソフトはシェアウェアだが、解凍ソフトはフリーウェアもある。

圧縮実験

次に、様々な形式のファイルを圧縮比較しました。

比較に使用したソフト・設定

動画ファイル(無圧縮)

ファイルタイプ
無圧縮AVI, PCM音源
ファイル数
1
ファイルサイズ
444,299,264 bytes
形式 オプション 使用プログラム 圧縮後サイズ 圧縮効率 グラフ
AVI -- -- 444,299,264 100.00000% red.png(140 byte)
7Z 超圧縮 7-Zip 4.42 122,353,492 27.53853% red.png(140 byte)
7Z 標準 7-Zip 4.42 127,643,222 28.72911% red.png(140 byte)
RAR 最高圧縮 WinRAR 3.51 130,042,147 29.26904% red.png(140 byte)
RAR 標準 WinRAR 3.51 134,506,116 30.27377% red.png(140 byte)
CAB LZX21 +Lhaca 1.20 141,070,675 31.75127% red.png(140 byte)
BZ2 -- Lhaplus 1.52 151,155,909 34.02119% red.png(140 byte)
CAB MSZIP Lhaplus 1.52 173,122,838 38.96537% red.png(140 byte)
CAB LZX 21 Lhaplus 1.52 173,122,838 38.96537% red.png(140 byte)
CAB MSZIP +Lhaca 1.20 173,123,106 38.96543% red.png(140 byte)
ZIP 圧縮優先 Lhaplus 1.52 173,792,889 39.11618% red.png(140 byte)
ZIP Lv9 +Lhaca 1.20 174,008,303 39.16466% red.png(140 byte)
BH -- Lhaplus 1.52 174,973,438 39.38189% red.png(140 byte)
GZ -- Lhaplus 1.52 176,222,897 39.66311% red.png(140 byte)
ZIP 標準 Lhaplus 1.52 176,222,982 39.66313% red.png(140 byte)
ZIP Lv6 +Lhaca 1.20 176,599,445 39.74786% red.png(140 byte)
LZH -- Lhaplus 1.52 177,215,208 39.88645% red.png(140 byte)
ZIP -- WindowsXP標準搭載 179,056,240 40.30082% red.png(140 byte)
LZH LH7 +Lhaca 1.20 180,238,565 40.56693% red.png(140 byte)
LZH LH5 +Lhaca 1.20 186,671,584 42.01483% red.png(140 byte)

コメント
7-Zipが3割を切りトップになった。次に、RAR、CAB(LZX21)、BZ2と続いた
WindowsXP標準搭載の圧縮フォルダとLZHは余りいい結果ではなった。
LhaplusのCABはなぜかMSZIP、LZX21共に同じ値になった。

動画ファイル(圧縮済)

ファイルタイプ
MPEG2
ファイル数
1
ファイルサイズ
259,114,087 bytes
形式 オプション 使用プログラム 圧縮後サイズ 圧縮効率 グラフ
MPEG2 -- -- 259,114,087 100.00000% red.png(140 byte)
7Z 超圧縮 7-Zip 4.42 241,258,880 93.10913% red.png(140 byte)
7Z 標準 7-Zip 4.42 243,693,171 94.04860% red.png(140 byte)
CAB LZX21 +Lhaca 1.20 244,626,990 94.40899% red.png(140 byte)
CAB LZX21 Lhaplus 1.52 244,626,990 94.40899% red.png(140 byte)
BZ2 -- Lhaplus 1.52 245,704,693 94.82491% red.png(140 byte)
RAR 最高圧縮 WinRAR 3.51 246,096,936 94.97629% red.png(140 byte)
RAR 標準 WinRAR 3.51 246,116,854 94.98397% red.png(140 byte)
BH -- Lhaplus 1.52 248,905,007 96.06001% red.png(140 byte)
ZIP Lv9 +Lhaca 1.20 249,040,701 96.11237% red.png(140 byte)
ZIP Lv6 +Lhaca 1.20 249,041,082 96.11252% red.png(140 byte)
CAB MSZIP +Lhaca 1.20 249,124,626 96.14476% red.png(140 byte)
CAB MSZIP Lhaplus 1.52 249,124,627 96.14476% red.png(140 byte)
LZH -- Lhaplus 1.52 249,173,120 96.16348% red.png(140 byte)
ZIP 圧縮優先 Lhaplus 1.52 249,274,069 96.20244% red.png(140 byte)
GZ -- Lhaplus 1.52 249,274,346 96.20254% red.png(140 byte)
ZIP 標準 Lhaplus 1.52 249,274,440 96.20258% red.png(140 byte)
ZIP -- WindowsXP標準搭載 249,314,187 96.21792% red.png(140 byte)
LZH LH7 +Lhaca 1.20 249,583,896 96.32201% red.png(140 byte)
LZH LH5 +Lhaca 1.20 249,684,430 96.36081% red.png(140 byte)

コメント
やはり7-Zipがトップだったが、どの圧縮でも9割を切ることは無かった。ちなみに7-Zipの超圧縮はメモリが700MB以上も必要なので、1GBのメモリが無いと辛い。

特殊なファイル(全て0)

ファイルタイプ
全てNULL文字
ファイル数
1
ファイルサイズ
1,048,576 bytes
形式 オプション 使用プログラム 圧縮後サイズ 圧縮効率 グラフ
binary -- -- 1,048,576 100.00000% red.png(140 byte)
BZ2 -- Lhaplus 1.52 45 0.00429% red.png(140 byte)
RAR 最高圧縮 WinRAR 3.51 187 0.01783% red.png(140 byte)
7Z 超圧縮 7-Zip 4.42 347 0.03309% red.png(140 byte)
7Z 標準 7-Zip 4.42 347 0.03309% red.png(140 byte)
LZH -- Lhaplus 1.52 562 0.05360% red.png(140 byte)
LZH LH5 +Lhaca 1.20 570 0.05436% red.png(140 byte)
LZH LH7 +Lhaca 1.20 570 0.05436% red.png(140 byte)
BH -- Lhaplus 1.52 574 0.05474% red.png(140 byte)
RAR 標準 WinRAR 3.51 601 0.05732% red.png(140 byte)
GZ -- Lhaplus 1.52 1,067 0.10176% red.png(140 byte)
ZIP 圧縮優先 Lhaplus 1.52 1,161 0.11072% red.png(140 byte)
ZIP 標準 Lhaplus 1.52 1,161 0.11072% red.png(140 byte)
ZIP -- WindowsXP標準搭載 1,161 0.11072% red.png(140 byte)
ZIP Lv6 +Lhaca 1.20 1,187 0.11320% red.png(140 byte)
ZIP Lv9 +Lhaca 1.20 1,187 0.11320% red.png(140 byte)
CAB LZX21 Lhaplus 1.52 1,476 0.14076% red.png(140 byte)
CAB LZX21 +Lhaca 1.20 1,476 0.14076% red.png(140 byte)
CAB MSZIP +Lhaca 1.20 1,930 0.18406% red.png(140 byte)
CAB MSZIP Lhaplus 1.52 1,930 0.18406% red.png(140 byte)

コメント
通常でも割合よい成績のBZ2がトップになった。なんと1MBのファイルがたった45Bに圧縮できた。
他も軒並み3000〜500分の一に圧縮された。
CABやZIPが大きくなったのはヘッダのせいだろうか。

特殊なファイル(全てA)

ファイルタイプ
全てA
ファイル数
1
ファイルサイズ
1,048,576 bytes
形式 オプション 使用プログラム 圧縮後サイズ 圧縮効率 グラフ
ASCII -- -- 1,048,576 100.00000% red.png(140 byte)
BZ2 -- Lhaplus 1.52 48 0.00458% red.png(140 byte)
RAR 最高圧縮 WinRAR 3.51 187 0.01783% red.png(140 byte)
7Z 超圧縮 7-Zip 4.42 349 0.03328% red.png(140 byte)
7Z 標準 7-Zip 4.42 349 0.03328% red.png(140 byte)
LZH -- Lhaplus 1.52 564 0.05379% red.png(140 byte)
LZH LH5 +Lhaca 1.20 573 0.05465% red.png(140 byte)
LZH LH7 +Lhaca 1.20 573 0.05465% red.png(140 byte)
BH -- Lhaplus 1.52 576 0.05493% red.png(140 byte)
RAR 標準 WinRAR 3.51 603 0.05751% red.png(140 byte)
GZ -- Lhaplus 1.52 1,069 0.10195% red.png(140 byte)
ZIP 圧縮優先 Lhaplus 1.52 1,164 0.11101% red.png(140 byte)
ZIP 標準 Lhaplus 1.52 1,164 0.11101% red.png(140 byte)
ZIP -- WindowsXP標準搭載 1,164 0.11101% red.png(140 byte)
ZIP Lv6 +Lhaca 1.20 1,190 0.11349% red.png(140 byte)
ZIP Lv9 +Lhaca 1.20 1,190 0.11349% red.png(140 byte)
CAB LZX21 Lhaplus 1.52 1,477 0.14086% red.png(140 byte)
CAB LZX21 +Lhaca 1.20 1,477 0.14086% red.png(140 byte)
CAB MSZIP +Lhaca 1.20 1,963 0.18721% red.png(140 byte)
CAB MSZIP Lhaplus 1.52 1,963 0.18721% red.png(140 byte)

コメント
順位はNULL文字と変わらず。しかし若干ファイルサイズが増えた。

特殊なファイル(全て凸)

ファイルタイプ
全て凸
ファイル数
1
ファイルサイズ
1,048,576 bytes
形式 オプション 使用プログラム 圧縮後サイズ 圧縮効率 グラフ
Shift_JIS -- -- 1,048,576 100.00000% red.png(140 byte)
BZ2 -- Lhaplus 1.52 77 0.00734% red.png(140 byte)
7Z 超圧縮 7-Zip 4.42 352 0.03357% red.png(140 byte)
7Z 標準 7-Zip 4.42 352 0.03357% red.png(140 byte)
LZH -- Lhaplus 1.52 567 0.05407% red.png(140 byte)
LZH LH5 +Lhaca 1.20 575 0.05484% red.png(140 byte)
LZH LH7 +Lhaca 1.20 575 0.05484% red.png(140 byte)
BH -- Lhaplus 1.52 579 0.05522% red.png(140 byte)
RAR 標準 WinRAR 3.51 605 0.05770% red.png(140 byte)
RAR 最高圧縮 WinRAR 3.51 662 0.06313% red.png(140 byte)
GZ -- Lhaplus 1.52 1,071 0.10214% red.png(140 byte)
ZIP 圧縮優先 Lhaplus 1.52 1,166 0.11120% red.png(140 byte)
ZIP 標準 Lhaplus 1.52 1,166 0.11120% red.png(140 byte)
ZIP -- WindowsXP標準搭載 1,166 0.11120% red.png(140 byte)
ZIP Lv6 +Lhaca 1.20 1,192 0.11368% red.png(140 byte)
ZIP Lv9 +Lhaca 1.20 1,192 0.11368% red.png(140 byte)
CAB LZX21 Lhaplus 1.52 1,481 0.14124% red.png(140 byte)
CAB LZX21 +Lhaca 1.20 1,481 0.14124% red.png(140 byte)
CAB MSZIP +Lhaca 1.20 2,059 0.19636% red.png(140 byte)
CAB MSZIP Lhaplus 1.52 2,059 0.19636% red.png(140 byte)

コメント
ほとんどはAと比べて若干サイズが増えただけ。しかしRAR(最高圧縮)の性能が低下してRAR(標準)以下になった。

特殊なファイル(ランダムバイナリ)

ファイルタイプ
ランダムなデータ(0x00-0xFF)
ファイル数
1
ファイルサイズ
1,048,576 bytes
形式 オプション 使用プログラム 圧縮後サイズ 圧縮効率 グラフ
binary -- -- 1,048,576 100.00000% red.png(140 byte)
BZ2 -- Lhaplus 1.52 1,044,756 99.63570% red.png(140 byte)
LZH -- Lhaplus 1.52 1,048,618 100.00401% red.png(140 byte)
LZH LH5 +Lhaca 1.20 1,048,626 100.00477% red.png(140 byte)
LZH LH7 +Lhaca 1.20 1,048,626 100.00477% red.png(140 byte)
BH -- Lhaplus 1.52 1,048,630 100.00515% red.png(140 byte)
RAR 標準 WinRAR 3.51 1,048,652 100.00725% red.png(140 byte)
RAR 最高圧縮 WinRAR 3.51 1,048,652 100.00725% red.png(140 byte)
ZIP Lv6 +Lhaca 1.20 1,048,894 100.03033% red.png(140 byte)
ZIP Lv9 +Lhaca 1.20 1,048,894 100.03033% red.png(140 byte)
GZ -- Lhaplus 1.52 1,048,932 100.03395% red.png(140 byte)
ZIP 圧縮優先 Lhaplus 1.52 1,049,028 100.04311% red.png(140 byte)
ZIP 標準 Lhaplus 1.52 1,049,028 100.04311% red.png(140 byte)
ZIP -- WindowsXP標準搭載 1,049,028 100.04311% red.png(140 byte)
CAB MSZIP Lhaplus 1.52 1,049,134 100.05322% red.png(140 byte)
CAB MSZIP +Lhaca 1.20 1,049,134 100.05322% red.png(140 byte)
CAB LZX 21 Lhaplus 1.52 1,049,188 100.05836% red.png(140 byte)
CAB LZX 21 +Lhaca 1.20 1,049,188 100.05836% red.png(140 byte)
7Z 標準 7-Zip 4.42 1,060,837 101.16930% red.png(140 byte)
7Z 超圧縮 7-Zip 4.42 1,061,204 101.20430% red.png(140 byte)

コメント
ランダムなデータだったため、ほとんどは圧縮前よりファイルサイズが大きくなった。
特に、普段はいい結果を出す7Zは101%を超え最下位になった。
BZ2だけは100%を割り圧縮された。

[BACK]

[HOME]


最終更新日:2006年08月04日