情報を圧縮する技術は「符号化(encode /エンコード)」とも呼ばれます。圧縮したい入力データに含まれる情報を、一定の操作の下に新たな情報(符号)に変換することを指し、また、符号化したデータを元に戻す操作を「復号(decode /デコード)」と呼びます。
「情報の圧縮」という概念そのものは、いかに少ない表記で多くの情報を伝達するか、という効率の観点に大きく影響されており、そのため変換後の符号の長さの総和が変換前の情報量に比べてどれだけ小さくなったか、これが「情報の圧縮」の評価のポイントです。今回は圧縮の基本となる考え方の紹介と、良く知られた符号化方式のひとつであるモールス信号の紹介。そして各種画像フォーマットの特徴と、それぞれに適した利用シーンについて解説をします。
モールス信号は電信技術が勢いよく発達する遠距離通信の黎明期、1840 年頃に米国のサミュエル・モールスらにより発明されました。より実用的な遠距離通信手段として、情報の効率的な伝達方式と使いやすさを兼ね備えたシステムが求められていました。モールスは符号化方式に加え、信号を音に変換するスピーカーがついた装置を考案することにより、送信者が送り出した情報を受信者が音で聞き取れるようにしました。通信効率と利便性が両立されたこの方式は広く普及することになりました。
表1に示すモールス符号は、元のシンボル情報(アルファベット・数字・記号)を点(・)と線(━)を組み合わせた符号で表現する方式です。モールス信号は音だけでなく、電流、電波、光など、オンとオフを切り替えられる手段があれば情報を伝達することができます。音を用いる場合は点と線を区切るために、適宜無音時間(スペース)を設ける必要があります。この場合、点(・)を1拍として、線(━)を3拍、同一シンボル中のスペースを1拍、異なるシンボル間のスペースを3拍、異なる単語間のスペースを7拍とすることが標準的とされています。例として、長年遭難信号の略号として用いられた SOS は、「・・・━ ━ ━・・・」と表すことができます。
表1:国際モールス符号
(各種シンボル情報を点と線の組み合わせ符号で表現する方式)
表1から分かるように、モールス信号はシンボルごとに割り当てるモールス符号の長さを変えていますが、これはより効率的に情報を伝達するための工夫と言えます。一般に、文書に含まれる文字の出現頻度には偏りがあり、英文の場合、出現頻度が高い文字は e, t, a, ... の順であることが知られています。
文書を効率的に圧縮するためには全体の符号長が短くなれば良いので、出現頻度の高いシンボルほど短い符号長を与える(例:「e」は「・」だけ、「t」は「ー」だけ)ことが有効になります。これは、現在に至る圧縮の基本的な考え方の1つであり、モールス信号においてもその原則に基づいてモールス符号が割り当てられています。
このように、シンボルに応じて割り振る符号の符号長を変える方式を「可変長符号」と呼びます。一方、全てのシンボルに対して等しい(固定した)長さの符号長を与える方式を「固定長符号」と言います。符号化対象となる情報の種類がいつも決まっているのであれば、一般的に可変長符号の方が最適な符号長を割り当てられるため圧縮効率は高くなります。
圧縮の対象は幅広く、文書、音、映像など、コンピューターで表現されるあらゆる情報が符号化の対象となり得ます。任意のファイル形式を圧縮する方式として ZIP、LHA などが知られており、静止画像に特化した圧縮方式として JPEG、GIF、PNG などが知られています。
工業界において関わりが深いのが、画像の圧縮方式です。下の表2と3が、各種画像フォーマットの特徴と画像圧縮を用いる利用シーンです。
表2:画像フォーマットの特徴
表3:利用目的ごとに適した選択肢
近年、検査画像の全てを保存したいという全数保存の要求が高まってきています。しかし、実際の検査では、同一ステージで照明を切り替えて3回撮像するというような事態もよくあり、データサイズ増大が問題となっています。もしそのまま画像を保存しようとすればそれに見合う容量の大きなディスクが必要になったり、頻繁にディスクの交換が必要になったり、ディスクの保管場所を確保する必要があったりなどと、いずれにせよ高コストが懸念されます。こうした負荷を少しでも軽減する有効な手段として「データ圧縮」が活用されます。
トレーサビリティーの一貫として画像を保存する目的には、以下の2つが挙げられます。1つは NG 品の検証や検査タスクの調整など、撮像時の状態を完全に再現した上で再検査したい場合。もう1つは、過去に遡り、検査段階での製品の検査画像を人が目視で確認し、問題が無いかをチェックしたい場合です。前者では劣化しない画像フォーマットを用いることが必須となりますが、後者では少し劣化した画像でも十分に役割を果たすことが出来るという違いがあります。
他には、蓄積したデータを機械学習用の訓練データとして活用することも想定できます。訓練データとして用いる画像には、劣化していない画像フォーマットが適していると考えられます。ただし、一般的に機械学習の訓練には相当な枚数の訓練用画像が必要になります。そのため、1枚当たりのデータサイズが小さいことと、画像を圧縮・保存する処理速度が検査のタクトタイムに影響を与えないことが重要です。しかしながら、一般的な画像フォーマットで劣化しない・サイズが小さい・処理速度が速いという3拍子揃ったものはありません。既存のフォーマットの中では PNG が有力な候補ですが、処理速度がネックになっています。この点は、画像圧縮の今後の課題として認識されているものです。
圧縮方式についてより詳しく説明します。圧縮後のデータから元の情報を完全に復元できる方式を「可逆圧縮」と呼び、完全には復元できない方式を「非可逆圧縮」と呼びます。表 4 にこれらの特徴と代表的な画像のファイル形式を示します。
表4:可逆圧縮と非可逆圧縮
可逆と非可逆とで、それぞれにメリット/デメリットがあります。可逆方式は、圧縮したデータから元のデータを完全に復元できる一方、圧縮率は高くなく、従ってデータサイズもそこまで小さくはなりません。非可逆方式は、元のデータを完全には復元することは出来ませんが、元のデータに比べて著しくデータサイズを小さくできる点に価値があります。以上のような特徴があるため、用途に応じた使い分けも可能となります。
>ヴィスコの外観検査 "丸わかり" 特設ページはこちら私たちは、外観検査・画像処理検査に関するエキスパート集団です。単なるメーカーではなく、画像処理アルゴリズム、光学技術、電気・機械の知識と経験を兼ね備える外観検査・画像処理検査装置メーカーとして、総合的なコンサルティングも可能とする、開発型エンジニアリング企業です。