卒業論文研究です.
マウスなどで短時間で大まかに描いたカラースケッチに基づいて,データベースにある同じ構図のキャラクターのイラストを検索するモデルです.語句による検索のできない構図の指定ができて,検索の幅が広がります.
卒論の時間の関係で,CNNの学習には1000枚のイラスト(dataset from:nico-opendata)しか使用していません.
- DenseNetをベースにしている
- 特徴抽出のために局所平均プーリングを使っている
- 特徴を2進数に変換し,ハミング距離で類似度を比較する
- 準備段階:CNN の学習とデータセットにあるイラストの特徴ベクトルの保存
- 第一段階:推定ラベルによる検索範囲の絞り(coarse-level 検索)
- 第二段階:特徴ベクトルの類似度による順位付け(fine-level 検索)
- 1000枚のデータセットから20枚のイラストを目標イラストとして選び出す.
- 目標イラストを検索するためのクエリスケッチをユーザに描いてもらう.
- 計500枚のクエリスケッチを提案モデルで検索し,目標イラストがTOP3(またはTOP5、TOP10)に入っていましたら「正解」とカウントする.
- 正解率を計算する.