2021年9月23日木曜日

データ圧縮の仕組みと種類・形式

データ圧縮とは

 データ圧縮とは、ファイルのデータを再エンコードして元のファイルよりも少ないビット数で保存し、ファイルのサイズを小さくするプロセスのこと。
 データ圧縮の基本的なステップは、元のファイルを転送または保存し、再作成し、後で解凍と呼ばれるプロセスを通じて使用するというものである。
 

データ圧縮の大まかな歴史 

 1970 年代にインターネットが出現すると、ファイルサイズと転送速度との関係が明白になった。
 世界中の数学者が長年にわたってこの問題に取り組んできたものの、実際の成果が現れたのは、1980年代半ばにLempel-Ziv-Welch(LZW)ユニバーサル可逆圧縮アルゴリズムが登場してからのことである。
 LZW圧縮はコンピュータに実装され広く普及した初の圧縮方法であり、現在でもさまざまなバージョンが使われています。通常、LZW圧縮を使うと、サイズの大きい英語のテキストファイルであれば、元のサイズの半分ほどに圧縮される。

 

1838年に発明されたモールス信号はデータ圧縮の最古の例です。
英語で最もよく使われる文字(
e t)には短い符号が割り当てられている。 

一般的なデータ圧縮アルゴリズムは以下のとおりである。

  • Zip
  • bzip2
  • 7-zip
  • jpeg
  • mpeg