スキャン画像のファイル容量の概算

先日行ったワークショップで気になったので、ちょっと計算したくなった。


その前にスキャン画像のファイル容量の計算方法について整理してみる
(自分でもよく忘れるので)。
まず、基本情報。

  • dpi:dot per inch, 1インチ(2.54cm)の幅にいくつドットを表現するかを表わす
  • A4:210mm×297mm(8.27インチ×11.7インチ)
  • モノクロの場合は、1ドット(1画素)を1ビットで表せる(白か黒の2つなので)
  • 16諧調グレースケールだと、1ドット8ビットで表せる。(白から黒までの16段階なので)
  • (一般的には)8ビット=1バイト


基本情報がでそろったところで、400dpiのA4用紙を400dpiでモノクロでスキャンインしたときの非圧縮のファイル容量を計算してみましょう。


まず、A4用紙の画素数(一体何個の点を使って表現するか)の計算です。
A4用紙は8.27インチ×11.7インチで、400dpiでスキャンインするのですから、


A4を400dpiであらわしたときの画素数(ドットの数)
= (400 * 8.27) * (400 * 11.7) = 15481440画素
となりますね。


モノクロでスキャンインするので、
15481440 * 1 = 15481440ビット となります。
ビットじゃあわかりにくいので、バイトに直すために8で割ると
15481440 / 8 = 1935180バイト = 1935.18KB = 1.93518MB
つまり、約2MBですね。


じゃ、モノクロじゃなくて16諧調グレースケールだと
15481440 * 8 = 123851520ビット となります。
ビットじゃあわかりにくいので、バイトに直すために8で割ると
123851520 / 8 = 15481440 バイト = 15481.44KB = 15.48144MB
つまり、約15.5MBですね。


じゃ、ついでにこんなシュミレーションしてみましょう。
(妙にリアルだという突っ込みはなし)


例:4万冊を400dpiのモノクロ、2万冊を400dpiの16諧調のグレースケールでスキャンインしたときのファイル容量は? 1冊平均30コマ、1コマはA4サイズだとする。


(40000冊 * 30コマ * 2MB) + (20000冊 * 30コマ * 15.5MB)
= 2.4TB + 9.3TB
= 11.7TB


もし、1/10に圧縮できたとしたら、1.17TB。
もし、1/2に圧縮できたとしたら、5.85TB。


そうか。これくらいかあ。
ふーむ。


あとは、圧縮フォーマットのベンチマークだな。
1/10くらい圧縮できたらかなりマイグレートが楽だなあ。