研究ブログ

タグ:くずし字

インフォメーション KogumaNetくずし字認識サービスを使ってみた

ROIS-DS人文学オープンデータ共同利用センターが提供しているKogumaNetくずし字認識サービス(一文字)を使ってみました.私が関わっているみんなで翻刻からも使わせていただいているサービスです.KogumaNetをふくむAIによるくずし字認識については,みんなで翻刻サミットでも開発者のタリンさんから話題提供していただき,みんなでワクワクしました.

サービスのサイトの説明を読めばだいたい分かると思うのですが,はじめて使うという方には画面キャプチャがあったほうが分かりやすいかと思ったので,つけておきます.ここでの説明以上の詳しいことは,開発元のROIS-DS人文学オープンデータ共同利用センターにお問い合わせください.

例として,新日本古典籍データベースより「安政見聞録」(新潟大学附属図書館 国文学研究資料館)を用いました.

まず,記載されているリンクから,KogumaNetくずし字認識ビューアを表示します.CODHで開発されているIIIF Curation ViewerでKogumaNetくずし字認識が使えるようになっているものです.右上の「ログイン」あるいはログイン済の場合はアカウント名の表示がありますが,このサービスはログインしていてもしていなくても使えるようです.

ブラウザの別のタブやウィンドウで,くずし字認識を試したい資料を表示します.IIIFマニフェストのリンクを探してください.たとえば,「安政見聞録」(新潟大学附属図書館 国文学研究資料館)の場合は,画像ビューアのインフォメーションのアイコンをクリックするとマニフェストへのリンクが表示されます.

このマニフェストを先に開いていたKogumaNetくずし字認識ビューアにドラッグアンドドロップしましょう.あるいはhttp://codh.rois.ac.jp/char-shape/app/icv-kuzushiji/?manifest=https://kotenseki.nijl.ac.jp/biblio/100292635/manifestのようにアドレスバーに入力しても同じことです.以下のように,対象の資料がKogumaNetくずし字認識ビューアで表示されれば準備OKです.

次に,目的のコマを表示しましょう.左上に「次」「前」のアイコンがあります.読みたい文字のあるコマに移動しましょう.適宜拡大縮小や画像の移動をしてください.マウス操作で拡大縮小移動したり,左上のズームアイコンで操作したりというのは,地図アプリの操作感と似ていると思います.

右上の「■」のアイコンをクリックすると,領域を囲めるモードになります.クリックしながらマウスを動かして囲みます.

下の図のように,KogumaNetくずし字認識を試したい文字を囲みましょう.新聞や週刊誌の記事を切り抜く感覚ですね.

囲んだ青い部分をクリックすると,KogumaNetくずし字認識が起動されます.

しばらく待つと,はい! 最初に試すときは,モデルの読み込みにしばらく時間がかかります.その旨表示されますので,少しだけ待ちましょう.

KogumaNetくずし字認識が候補を挙げてくれます.必ずしも上位のものが正解とはいえないと思います.どの読みがいいか,あるいは,違う読みもありそうだなどと考えてみてください.

いろいろ試すと,KogumaNetくずし字認識にも得意不得意があることがわかったりします.

AIの助けを借りて,ご自身で読むのも楽しいですが,もしみんなで読んでみたい,ほかの人にも読んでもらいたい,という資料があったら,みんなで翻刻へのプロジェクト登録もご検討いただければと思います.

0