このエントリー
をはてなブックマークに追加
published on in Graphics
tags: FCBI SuperResolution

エッジ判定型超解像アルゴリズム FCBI (Fast curvature based interpolation) 前編:デモプログラムの使い方

はじめに

インターフェース誌2015年6月号「超解像アルゴリズム」の記事を元に JavaScript で FCBI のデモを実装したので、今回はその使い方の解説です。(次回はアルゴリズム詳解の予定)

あと、エッジ判定型の超解像だと ICBI や iNEDI といったより良い手法もありますが、とりあえず今回は FCBI です。アルゴリズムが単純なのでソースコードを読むには良いと思います。

追記

続きを書きました。

デモ

仕様: (w) x (h) サイズの画像を (2w-1) x (2h-1) にします。例えば100x100画像は 199x199に拡大します。

制限事項: 画像の一片は maxWidthHeight で指定できますが、 その最大値を 1000px 制限してます。そのうち上限を増やすかも。

使い方

(1) 画像をドロップして渡す

ブラウザに PNG, JPEG, GIF あたりの画像をドロップすると、とりあえず変換されます。

初期状態では画像の一片を320pxに制限しています。

(2) edge モードで TM 値を調整

輪郭が期待通りに出るよう TM 値を調整します。 イラストだと大抵は小さい値にすれば良いのですが、自然画だと丁度良い値を探すのが難しいです。

(3) maxWidthHeight を最大値にする

大きなサイズの画像は320以下に制限しているので、その制限値を引き上げます。 輪郭が期待と違っている場合は TM を再調整します。

(この例だと元々、小さい画像なので意味はないです)

(4) edge を外して完成

既存のリサイズ手法と比較

ドット絵とイラスト絵で実験しました。

ドット絵

% convert Opaopa.png -filter box      -resize 400%x400% Opaopa-box.png # N-Neighbor
% convert Opaopa.png -filter triangle -resize 400%x400% Opaopa-triangle.png # Bi-Linear
% convert Opaopa.png -filter cubic    -resize 400%x400% Opaopa-cubic.png
% convert Opaopa.png -filter lanczos  -resize 400%x400% Opaopa-lanczos.png
% convert Opaopa.png -filter mitchell -resize 400%x400% Opaopa-mitchell.png

ちなみに ImageMagick の -resize 拡大のデフォルトは Mitchell フィルタです。

Nearest-Neighbor Bi-Linear Bi-Cubic (B,C = 1,0)
Lanczoz (lobes:3) Mitchell FCBI (TM:4 で2回拡大)

線がいい感じにつながってます。

イラスト絵

ドット絵だと極端なので、実際のイラスト絵でも比較してみます。

こちらから拝借して、目に注目して拡大。

% convert Kyo.png -filter box      -resize 200%x200% Kyo-box.png # N-Neighbor
% convert Kyo.png -filter triangle -resize 200%x200% Kyo-triangle.png # Bi-Linear
% convert Kyo.png -filter cubic    -resize 200%x200% Kyo-cubic.png
% convert Kyo.png -filter lanczos  -resize 200%x200% Kyo-lanczos.png
% convert Kyo.png -filter mitchell -resize 200%x200% Kyo-mitchell.png
Nearest-Neighbor Bi-Liner Bi-Cubic (B,C = 1,0)
Lanczoz (lobes:3) Mitchell FCBI (TM:20)

FCBI の方がドット感が消えて線が自然に繋がっているように見えます。

最後に

レベル補正で正規化したピクセルを元にエッジ判定すれば、TM はもう少し適当で良いかもしれません。

Bi-Cubic や Lanczos はパラメータで色々特徴を変えられるので、そこまでしないと実はフェアじゃない。今回は ImageMagick のデフォルト値をそのままで手抜きしてます。

次回で、自分なりにアルゴリズムを解説し直す予定です。インターフェース誌の解説だと多分、慣れてる人じゃないと l (エル変数) って具体的に何?テンソル積記号出てきたけどどうすれば良いの?で止まるはずで。その辺りの補足説明を考えています。

続き

続きがあります。

参考