共同研究・競争的資金等の研究課題

2018年4月 - 2023年3月

統合史資料画像データの生成と駆動方式の確立による人文科学研究基盤の創出

日本学術振興会  科学研究費助成事業 基盤研究(A)
  • 山田 太造
  • ,
  • 本郷 恵子
  • ,
  • 尾上 陽介
  • ,
  • 金子 拓
  • ,
  • 井上 聡
  • ,
  • 永崎 研宣
  • ,
  • 山家 浩樹
  • ,
  • 久留島 典子
  • ,
  • 馬場 基
  • ,
  • 伴瀬 明美
  • ,
  • 高田 智和
  • ,
  • 後藤 真

課題番号
18H03576
配分額
(総額)
42,510,000円
(直接経費)
32,700,000円
(間接経費)
9,810,000円

本研究では史資料における多様な史資料データをアーカイブされた史資料画像を中核に据えて構造化していく統合史資料画像データの生成に向けて,おもに以下の3つの課題を解決していく.
1.統合史資料画像データ生成手法の確立:汎用かつ有用な史資料画像データ統合基盤を確立するため,以下の2つに取り組んだ.
a.文字画像データ:東京大学史料編纂所(以下史料編纂所)歴史情報処理システムにおけるデータベースSHIPS DB「電子くずし字字典DB」および奈良文化財研究所「木簡庫」との連携検索システムを拡張し,他機関の文字データベースの参入を可能にしつつ,文字画像データを中心とした新たな連携検索システムのシステム基盤を,JSPS科研費(18H05221)との共同により,検討した.
b.古文書・古記録等の文献資料画像:『上井覚兼日記』および天正・慶長期の島津家に関連する史資料について宮崎県都城島津邸および宮崎県総合博物館所蔵の史資料を中心に行った.
2.統合史資料画像データ管理システムの構築:史料編纂所前近代日本史情報国際センターとの共同により,史料編纂所における画像データに対し利用条件設定を行い,SHIPS DB「所蔵史料目録DB」に対し,IIIF Presentation APIを設置し,新たにmiradorと呼ばれるIIIF Presentation APIを利用できる画像ビューアを導入した.また史料編纂所が編纂・出版した史料集の版面画像ギャラリーである「史料集版面ギャラリー」を公開した.
3.潜在的関連史資料の検出:1および2の成果に基づき,Latent Dirichlet Allocation(LDA)に代表されるトピックモデルの適用を検討し予備実験を開始した.その上で『上井覚兼日記』における本文データ構造の再構成を行った.