論文

査読有り
2012年

深層ウェブの実態とその要因 : 機関リポジトリに登録された文献を用いた調査

日本図書館情報学会誌
  • 宮田 洋輔
  • ,
  • 安形 輝
  • ,
  • 池内 淳
  • ,
  • 石田 栄美
  • ,
  • 上田 修一

58
2
開始ページ
97
終了ページ
109
記述言語
日本語
掲載種別
DOI
10.20651/jslis.58.2_97
出版者・発行元
日本図書館情報学会

ウェブの規模が増大するにつれ,検索エンジンからアクセスできない状態,すなわち深層ウェブも増大していることへの関心が高まっている。マッカウンら(2006)とハーゲドーンとサンテッリ(2008)は,深層ウェブの規模をOAI-PMHを用いて収集した機関リポジトリに収録された文献のメタデータを用いて計測した。本研究では,2009年9月に,先行研究の手法を応用し,日本の機関リポジトリから収集した全文PDFファイルのURLを用いて,より大規模に深層ウェブの比率を計測した。その結果,Google, Yahoo!, Bingの3つの検索エンジンから検索できるウェブは72.0%に過ぎず,28.0%が深層ウェブとなっていることが分かった。1つの検索エンジンでは,最高でもGoogleの53.2%であった。また,PDFファイルとURLの特徴の調査から,動的なURLや長いURLが深層ウェブとなる要因であることが分かった。

リンク情報
DOI
https://doi.org/10.20651/jslis.58.2_97
CiNii Articles
http://ci.nii.ac.jp/naid/110009479379
CiNii Books
http://ci.nii.ac.jp/ncid/AA11333306
ID情報
  • DOI : 10.20651/jslis.58.2_97
  • ISSN : 1344-8668
  • CiNii Articles ID : 110009479379
  • CiNii Books ID : AA11333306
  • identifiers.cinii_nr_id : 9000006088958

エクスポート
BibTeX RIS