2012年
深層ウェブの実態とその要因 : 機関リポジトリに登録された文献を用いた調査
日本図書館情報学会誌
- ,
- ,
- ,
- ,
- 巻
- 58
- 号
- 2
- 開始ページ
- 97
- 終了ページ
- 109
- 記述言語
- 日本語
- 掲載種別
- DOI
- 10.20651/jslis.58.2_97
- 出版者・発行元
- 日本図書館情報学会
ウェブの規模が増大するにつれ,検索エンジンからアクセスできない状態,すなわち深層ウェブも増大していることへの関心が高まっている。マッカウンら(2006)とハーゲドーンとサンテッリ(2008)は,深層ウェブの規模をOAI-PMHを用いて収集した機関リポジトリに収録された文献のメタデータを用いて計測した。本研究では,2009年9月に,先行研究の手法を応用し,日本の機関リポジトリから収集した全文PDFファイルのURLを用いて,より大規模に深層ウェブの比率を計測した。その結果,Google, Yahoo!, Bingの3つの検索エンジンから検索できるウェブは72.0%に過ぎず,28.0%が深層ウェブとなっていることが分かった。1つの検索エンジンでは,最高でもGoogleの53.2%であった。また,PDFファイルとURLの特徴の調査から,動的なURLや長いURLが深層ウェブとなる要因であることが分かった。
- リンク情報
-
- DOI
- https://doi.org/10.20651/jslis.58.2_97
- CiNii Articles
- http://ci.nii.ac.jp/naid/110009479379
- CiNii Books
- http://ci.nii.ac.jp/ncid/AA11333306
- ID情報
-
- DOI : 10.20651/jslis.58.2_97
- ISSN : 1344-8668
- CiNii Articles ID : 110009479379
- CiNii Books ID : AA11333306
- identifiers.cinii_nr_id : 9000006088958