タグ:みんなで翻刻
KogumaNetくずし字認識サービスを使ってみた
ROIS-DS人文学オープンデータ共同利用センターが提供しているKogumaNetくずし字認識サービス(一文字)を使ってみました.私が関わっているみんなで翻刻からも使わせていただいているサービスです.KogumaNetをふくむAIによるくずし字認識については,みんなで翻刻サミットでも開発者のタリンさんから話題提供していただき,みんなでワクワクしました.
サービスのサイトの説明を読めばだいたい分かると思うのですが,はじめて使うという方には画面キャプチャがあったほうが分かりやすいかと思ったので,つけておきます.ここでの説明以上の詳しいことは,開発元のROIS-DS人文学オープンデータ共同利用センターにお問い合わせください.
例として,新日本古典籍データベースより「安政見聞録」(新潟大学附属図書館 国文学研究資料館)を用いました.
まず,記載されているリンクから,KogumaNetくずし字認識ビューアを表示します.CODHで開発されているIIIF Curation ViewerでKogumaNetくずし字認識が使えるようになっているものです.右上の「ログイン」あるいはログイン済の場合はアカウント名の表示がありますが,このサービスはログインしていてもしていなくても使えるようです.
ブラウザの別のタブやウィンドウで,くずし字認識を試したい資料を表示します.IIIFマニフェストのリンクを探してください.たとえば,「安政見聞録」(新潟大学附属図書館 国文学研究資料館)の場合は,画像ビューアののアイコンをクリックするとマニフェストへのリンクが表示されます.
このマニフェストを先に開いていたKogumaNetくずし字認識ビューアにドラッグアンドドロップしましょう.あるいはhttp://codh.rois.ac.jp/char-shape/app/icv-kuzushiji/?manifest=https://kotenseki.nijl.ac.jp/biblio/100292635/manifestのようにアドレスバーに入力しても同じことです.以下のように,対象の資料がKogumaNetくずし字認識ビューアで表示されれば準備OKです.
次に,目的のコマを表示しましょう.左上に「次」「前」のアイコンがあります.読みたい文字のあるコマに移動しましょう.適宜拡大縮小や画像の移動をしてください.マウス操作で拡大縮小移動したり,左上のズームアイコンで操作したりというのは,地図アプリの操作感と似ていると思います.
右上の「■」のアイコンをクリックすると,領域を囲めるモードになります.クリックしながらマウスを動かして囲みます.
下の図のように,KogumaNetくずし字認識を試したい文字を囲みましょう.新聞や週刊誌の記事を切り抜く感覚ですね.
囲んだ青い部分をクリックすると,KogumaNetくずし字認識が起動されます.
しばらく待つと,はい! 最初に試すときは,モデルの読み込みにしばらく時間がかかります.その旨表示されますので,少しだけ待ちましょう.
KogumaNetくずし字認識が候補を挙げてくれます.必ずしも上位のものが正解とはいえないと思います.どの読みがいいか,あるいは,違う読みもありそうだなどと考えてみてください.
いろいろ試すと,KogumaNetくずし字認識にも得意不得意があることがわかったりします.
AIの助けを借りて,ご自身で読むのも楽しいですが,もしみんなで読んでみたい,ほかの人にも読んでもらいたい,という資料があったら,みんなで翻刻へのプロジェクト登録もご検討いただければと思います.
I-URIC フロンティアコロキウム勉強会での発表のリンク集
I-URIC フロンティアコロキウム勉強会にお招きいただき,話題提供しました.そのときのリンク集です.
- みんなで翻刻 https://honkoku.org/
- 震災予防調査会報告,第1号(1893)国立国会図書館デジタルコレクション https://dl.ndl.go.jp/info:ndljp/pid/831452
- 東京大学地震研究所特別資料データベース「コレクション名」 http://wwweic.eri.u-tokyo.ac.jp/tokubetsu/searchCollectionNameList.php
- 日本付近のおもな被害地震年代表 日本地震学会ホームページ https://www.zisin.jp/publications/document05.html
- 日本被害地震総覧 599-2012 東京大学出版会 http://www.utp.or.jp/book/b306587.html
- Matsu’ura (2017) A short history of Japanese historical seismology: past and the present https://doi.org/10.1186/s40562-017-0069-4
- 地震調査研究推進本部 (2014)「相模トラフ沿いの地震活動の長期評価(第二版)について」https://www.jishin.go.jp/main/chousa/14apr_sagami/
- 加納靖之 (2017) 1831年(天保2年)佐賀の地震記録が会津の地震のものである可能性 https://doi.org/10.4294/zisin.2016-16
- みんなで翻刻の登録資料 https://www.dheq.org/honkoku/
- みんなで翻刻してみた https://ch.nicovideo.jp/honkoku
- 地殻変動ブロマイド記録 https://www.dheq.org/repo/s/bromide/
- Omeka https://omeka.org/
- 京都大学阿武山観測所 https://abuyama.com/NEW/
- 田中寅夫 (1981) 紀州鉱山における土地傾斜観測 https://doi.org/10.11366/sokuchi1954.27.1
- Kano and kano (2019) Possible slow slip event beneath the Kii Peninsula, southwest Japan, inferred from historical tilt records in 1973 https://doi.org/10.1186/s40623-019-1076-9
- 和歌山観測所観測点ぺん書き記録画像DB 東京大学地震研究所 https://wwweic.eri.u-tokyo.ac.jp/wakayama/
- Historical Seismograms, SRL Focus Section https://pubs.geoscienceworld.org/srl/issue/91/3
- 日本地震学会2019年度秋季大会 特別セッション S23 「オープンデータと地震学」 http://www.eri.u-tokyo.ac.jp/people/ykano/od4s/
- Evans et al., 2015, EOS, https://doi.org/10.1029/2015EO036971
UTDHアンカンファレンスでの発表に関するリンク集
UTDHアンカンファレンス(2020年4月26日(日)13:30よりZoomでオンライン開催予定)での発表に関するリンク集です.
みんなで翻刻関連
- 発表スライド(PDF)
みんなで翻刻関連
- みんなで翻刻 https://honkoku.org/
- ニコニコチャンネル「みんなで翻刻」https://ch.nicovideo.jp/honkoku
- ニコニコ生放送 超みんなで翻刻してみた2020[4/15] https://live.nicovideo.jp/watch/lv325270910
- ニコニコ生放送 超みんなで翻刻してみた2020[4/19] https://live.nicovideo.jp/watch/lv325355423
- ニコニコ超会議 https://chokaigi.jp/
- みんなで翻刻サーチ https://honkoku.dhii.jp/search/?url_key=%E5%9C%B0%E9%9C%87
- 化物七段目(現代語訳付き) (珍獣の館文庫) Kindle版 https://www.amazon.co.jp/dp/B085SVCXYX
- 時代と分野を越えて「読む」 | ドキュメンタリー | K.U.RESEARCH http://research.kyoto-u.ac.jp/documentary/reading/
自然科学記録のデジタルアーカイブ関連
- 地殻変動ブロマイド記録 https://www.dheq.org/repo/s/bromide/page/timeline
- Omeka https://omeka.org/
- Kano and Kano (2019) Possible slow slip event beneath the Kii Peninsula, southwest Japan, inferred from historical tilt records in 1973 https://doi.org/10.1186/s40623-019-1076-9
- 和歌山観測所観測点ぺん書き記録画像DB http://wwweic.eri.u-tokyo.ac.jp/wakayama/