研究ブログ
日本語のローマ字表記論(1)
ヘボン式は妥当な日本語ローマ字表記か?(1)
令和3年度「国語に関する世論調査」(文化庁、概要リンク)において、日本語のローマ字表記の実際ではヘボン式が浸透している旨伝えられたが(朝日新聞デジタル)、この結果そのものは、パスポート表記における強制などを通じた「教化」によるところが大きいやもしれず、表記そのものへの愛好はもとよりその妥当性をかならずしも支持するものとはいえないであろう。
文化審議会がローマ字表記に関する検討を行うとしているところもあり(目下、文化審議会国語分科会国語課題小委員会事項)、かねがねとりわけヘボン式に疑問をもってきた拙者としては、いよいよみずからの考え方を整理するように迫られているように思う。
現状論的には、文化審議会の資料の検討から進めるのが便宜であろうけれども、そのためにする議論でもないから、発想赴くままにまずはメモしていくのが研究者としての常道だろう。
そうすると、ヘボン式がもつ根本問題と、それに対抗した田中館愛橘のことを取り上げるのが嚆矢ではあるまいかと思い至る。まずは、その出発点だけを記しておく。
現行ヘボン式前史
今日のパスポート発行で強制される現行ヘボン式(と仮に称する。)の源流を尋ねると、平文(ゼー・シー・ヘボン)『和英英和語林集成』第3版、1886年に遡るとされる(「旧ヘボン式」Wikipedia, 2022/12/24)。
(J.C.ヘボン『和英語林集成』松村明解説、講談社、1980年によると、ヘボン著『和英語林集成』の初版は、1867年(慶応3年、上海印刷、横浜刊行)、再版は、1872年(明治5年、印刷・刊行同様)。1886年(明治19年)のは、その第3版で、従来のものの「改正増補」、丸善商社刊行とされる。このへんの書誌、および再刊本については、同解説参照。なお、国立国会図書館デジタルコレクションに、同書、改正増補、丸善商社書店、1894年(明治27年)5がある。その奥付によると、1886年は「版権免許」とあり、初版は「明治21年」(1888年)。CiNii では、「和英英和語林集成」あるいは「和英・英和語林集成」で取れるが、いずれも刊行年を「1886年」として「改正増補」だとしている。これらの諸本の刊行年を点検するには結構なコストがかかる。18872(reprint)は、Google National Library of the Netherlands。18863(reprint)は、Google ハーバード大学。18884は、Google ニューヨーク公共図書館。ただし、中表紙に版数はあるが、奥付にはない。19109は(中表紙には "seventh edition" とあるが奥付では「明治43年、9版」)、Google バージニア大学。いずれも「改正増補」。明治学院大学図書館のものがある。原稿レベルでは、ジェームズ・カーティス・ヘボン『J.C.ヘボン和英語林集成手稿 翻字・索引・解題』木村一・鈴木進編、三省堂、2013年。そのほか諸本については、前記松村解説参照のこと。これは詳細な書誌解説であって、研究文献も記され、おおいに裨益される。なかでも、書誌に関しては、『和英語林集成—復刻版—』(初版復刻版、1966、北辰)「解説」参照とされる(目下未見)。この場でのこれ以上の摘要は僭越であろう。今後必要に応じて、参照時に適示する。 )
まずは、ここまでで一記事とする。(先行研究豊かな、結構大きい論題になることに、愕然とする…。)
句読点論(1)
読点の置きどころ
出発点としての本多勝一『日本語の作文技術』
標記論題を考えるためには、本多勝一『日本語の作文技術』(朝日新聞出版)、『実践・日本語の作文技術』(同)を出発点とするのが肝要だと思う。(これらの書の成り立ちについては、その「あとがき」にゆずり、ここでは穿鑿しない。また、前書については、朝日文庫版にフランス文学者多田道太郎の「解説」があり、そこでは、「ちゃんとした日本語を書こうと思ったら、まず、勉強に本多勝一氏の『日本語の作文技術』を読め、これが私の持論である。」とされている。)にもかかわらず、国語学会、国語教育学会筋で真剣に取り上げられていないのは、学術進歩の観点からして遺憾の極みである。
読点(テン)のうち方は、論理的であるべきであって、「息継ぎ」指示(その俗説性については、前掲書150頁以下参照)のためのものでないことは、明白だ。
とはいえ、読点をうつ原点はどこにあるか。ここいらへんになってくると、やはり国語学的な研究成果を参照したくなってくる。もっとも、それはこの筋の常識かもしれないから、門外漢の不明を恥じるのみである。(ゆえに、拙稿水準は、Wikipedia「句読点」記事にも及ばない。)
読点にかんする本多勝一の要論は、その「テンの二大原則」、すなわち「長い修飾語の原則」と「逆順の原則」の指摘にある。この簡明さは、とくに門外漢には願ってもないものだ。
明治の『師範教科 国語典』
ところで、その「二大原則」に関するかぎり、師範教育ひいては学校教育の原点にあった、と思わせる明治の文献がある。すなわち、教育学術研究会編纂『師範教科 国語典』上・下(東京 同文館、修正二版、明治三七年)である。これは、国立国会図書館でインターネット公開されている(「上・下」にリンク)。
その下巻「第十四課」に、単文における読点の置きどころが示される。すなわち、
「右の文によりて読点は、次の場合に於て置くべきものなることを知るべし。すなはち、
一、主部の終り。
二、叙述部中、説明語の副詞が、主部のすぐ下に在りて、客語・補足語を隔てたる時は、その副詞の終り。
三、顚倒せる客部・補足部・説明部の終り。
などの如し。」(下九三頁)
ここでは、本多が不要と主張する「主部の終り」が第一に掲げられるのだが、第二、第三は、本多のいう「長い修飾語の原則」、「逆順の原則」に対応するであろう。
このさい、「主部の終り」については、つぎのような「注意」「2」が付されている。
「客部・補足部を有せざる叙述部に対しては、主部の終りに読点を置かず。但、説明語とその修飾語とを有する叙述部に対しては便宜に従うべし。」(下九四頁)
とあって、軟弱・換骨奪胎である。この延長線上には、「主部の終り」にテンをうつことが原則から消失することが見込まれる。
さらに、下巻「第十八課」では、複文・重文についての読点のうちどころが示される。すなわち、
「右の例によりて、複文・重文における読点の置き方の大要を悟るべし。すなはち、複文にては、
主節・修飾節の終り。
重文にては、
独立節の終り。
などなり。」(下一一九頁以下)
これだけである。
ここでいう「主節・修飾節の終り」は――とくにその「修飾節」については――、本多のいう「長い修飾語の原則」に通じるであろうし、「重文」の「独立節の終り」は、本多の場合この原則に収斂する。
もっとも、先の「大要」には「注意」書きがあって、その「1」に、
「顚倒せる客節・補足節につきては、顚倒せる客語・補足語の場合に準ず。」(下一二〇頁)
とある。これは、本多のいう「逆順の原則」であろう。
修飾関係と顚倒の明確化が読点の必要性
以上要するに、明治の教育にあっては(もっとも実態は「研究会レベルでは」なのだろうが…)、ほぼ本多の所説通りのテンのうち方教育がなされていた、といってよいように思えるのだが、どうか…。
「いい人」(すなわち悪人)論構想(序文4)
「物」と「人」との外面的差異について
前稿(序文3)では、「外面人」は「物」と同様に扱いうると指摘した。だとすれば、「外面人」論は「物」論に解消しうるのか、というのが、思案のしどころである。思想史的には、人間論をやるために物体論を先立たせた経験がある。そして、その物体論の核心的な部分を人間論にも適用して、人間論の物体論的解消からさらに物体論的本質還元へと進行する。まあ、伝統的な考え方の一つだから、これでも良しとするか、というのも一案だが、あまり楽しくない話になりそうだ。美味しい(外面を具えた)リンゴは齧ってもよさそうだが、「人」を齧ると、齧り返されるか、カニバリズムに陥るか、するだろう。
デカルトは、外面上の話として、「人」と「アンドロイド」の無差別を想定した、としてよいだろう(『省察』)。このような言い方は、あたかも、「人」のことが分かり、「アンドロイド」のことが分かっているふうのものだし、また両者の差異・区別をつかんでいるふうでもあるので、やめておいた方がいいかもしれない。
しかし、「人」と「物」が無差別だとするなら、「齧る」という(実践的な)行為に至って、しかもその行為の結末に至ってしか、両者の区別をすることができないということになるのか。
むしろ、出発点として、「齧る」以前の「見る」などの、あるいはそうした感性が欠如した場合なども含めての、なんらかの前実践的な理論的把握による区別が不可欠なのではないか。でなければ、「齧る」といった侵襲的理解のコストは高くつきそうだ。
とはいえ、こうした侵襲的理解は、歴史で嫌なほど繰り返されてきたし、現在でもいろいろな「人」なるものの関係で発生しているといわざるをえないのではないか。火傷して懲りればいいのだが、そうならないのが悲しいところだと思う。
「人」と「物」を区別するさいの実践的次元はある程度予想が立つが、理論的次元のそれはどう立つだろうか。「アンドロイド」もバージョンが低ければ、その粗製の点で「人」との区別は一目瞭然である、ということができるとするときの理論でもあるが、精密・精巧を極めた「人」様の「物」が、「人」ではなく「アンドロイド」であるとする、その外面性がどこで理解されるのか、という問題になってくるのだろう。
デカルトの時代は、人形もその極限の精密・精巧さは時計程度の水準でしか想定できなかったであったろうが、今日では、機械仕掛けも「物」的水準を超えたレベルの極限で考えなければならない。
これが精粗といった量的区別の解消と見たとき、その量的無差別のなかで質的な差異・区別を取り出すことができるか、が、一つの鍵になるかもしれない。
「いい人」(すなわち悪人)論構想(序文3)
まず、「外面人」は「物」と同様に扱いうること
前項(序文3)では、議論が次の二つに収斂した。すなわち、
(1)「人」と「外面」との関係、すなわち「外面人」とは何か、の問い。
(2)それに対する評価として、「いい」がいかなる事態か、という問い。
(1)について、「外面人」は、それ自体としては「人」として扱わなければならないとされるかもしれないが、このばあいは、「人」としての「内面」との関係を入れ込んで考えてみなければならなくなりそうだから、ここから議論を始めるのは、厄介である。だから、方法論的に、「外面人」の「人」固有の――「人」以外のものと本質的に区別されるなにものかの――あり方を捨象しておくのが都合がよい。このことは、さしあたり方法論的だが、しかし、「外面人」のかならずしも「外面」のみならざる「人」固有のあり方を浮かび上がらせることなるかもしれない。その意味では、この方法論は、なにかしら本質論的なものに触れる可能性がある。というか、たんなる「外面」ではなく「外面人」を問題にするのだから、そうならないと困るだろう。
とはいえ、「外面人」を「人」として扱う必要がないのであれば、それは「物」と同様だということになろう。
すると、(2)の「いい」が「外面人」の評価として与えられるとは、「いい」が「物」の評価として与えられる、という事態と同様である。
こうした方法論的抽象は、「人間を物扱いする」という短絡的な通俗人道的批難とは無縁である。むしろ、「人間を物扱いする」現実があるとすると、それがいかなる事態かということを暴き出すものとなるだろう。その事態が人道性とどう関係するかは、当面は主題化されないが、いずれ「物」が「人」であることへと立ち戻ったときに、議論の俎上にのぼる。
「いい人」(すなわち悪人)論構想(序文2)
「いい人」の存在次元
「いい人」は、言語分析的に、「いい」(形容詞)と「人」(名詞)の二つの要素からなる。
ただ、ここでの「いい人」は、さしあたり外面態とするしかないので、暗黙裡に「(外面的に)いい人」ということになる。したがって、「外面」という要素が加わらざるをえない。
これ以上の構成要素があるかもしれないが、まずはこれら三要素、すなわち、「いい」、「人」、「外面」で始めるのが、我々の(すくなくとも私の)想像力には適切だ。これ以上に要素を加えるとすれば、それぞれの要素の下位要素か、まったく独立的な別要素との出会いとなるだろうが、いまはここで予断しない。なお、おそらく、変化を想定した場合、たとえば、「いい」が「わるい」になるとか、「人」が「¬人」になるとか、「外面」が「内面」になるとかの変化を想定するときには、その論理性のみならず、「時間」を要素として加えなければならないかもしれない。しかし、これは、まだ、議論の射程から外れているとしておこう。
「いい」、「人」、「外面」らの要素の包摂関係を考えると、
(1)「いい」は「人」への述語となる、というのが分かりやすい判断だ。
このさい、「人」が「いい」への述語となる、すなわち、「いいのは、人だ。」ということもありえるところで、このときには、「いいのは、人でない。」というのが同時に議論対象となる。これも、きわめて興味深いことだが、「いい人」についての議論の出発点としては、紛れというべきだろう。
(2)「外面」は「いい」への述語となる、というのも、同様だろう。
このさいも、「いい」が「外面」への述語となる、すなわち、「外面は、いい。」ということもありうるが、これは、「外面は、よくない」事態を論理的に想定せざるをえず、そうすると、「外面」と対比されるものが要求される。一番手っ取り早いのは、「内面」との比較だ。しかし、これも、議論の出発点としては、紛れる。
(3)以上のかぎりでは、「人」>「いい」>「外面」の序列になるのだが、「人」と「外面」とはどうか。「人は、外面である。」も、「外面は、人である。」も言えそうだ。となると、前項にかかわらず、「人で外面としてあるかぎりのそれ」、あるいは、「外面として人であるもの」を意味する複合概念として「外面人」を導入し、「外面人」>「いい」とするのが、出発点としては、分かりやすい。もっとも、これが「もともとの」問いの対象であった。
とはいえ、すでに、ここで、人間の「外面」と「内面」との区別が事態を考察するさいの紛糾となるかもしれないという予感を粟立たせる。
まあ、でも、「外面」と「内面」のどちらから始めなければならないとすれば、経験的にも概念的にも、「外面」のほうが直接的であろう。
そこで、議論は、
(1)「人」と「外面」との関係、すなわち「外面人」とは何か、の問いと、
(2)それに対する評価として、「いい」がいかなる事態か、という問いに、分かれることになるだろう。
「いい人」(すなわち悪人)論構想(序文1)
「いい人」とは何か? の問い
世は「いい人」で満ち溢れている。でなければ、世は成立しないだろう。というか、そもそも人類は存在しえなかった、というのが、ルソーの断案である。もっとも、ルソーは、「世」ではなく、「非世」としての自然を語ったのだが…。
「いい人」は、自画自賛ではなく、世評である。もっとも、自分で「いい人」と標榜することは、口封じでもしないかぎり拒めない。
自己点検・評価は、「いい人」を標榜する。しかし、それは評価機関(第三者なるもの)に点検されて評価が下される。だから、自己点検・評価は、あくまで暫定的なものである。ただし、第三者評価は、同僚評価(ピア・レビュー)と位置づけられながらも、認証(アクレディテーション・公認)としての権威を有し、さらにはそれが法定されるからには、標榜者にとっては本質的に超越的である。とはいえ、この超越性をどの認証機関に求めるかは任意とされるから、その実態は「内輪ぼめ」の次元だと割り引いてもよいわけだが、認証してくれる「内輪」がなければ(どこでも認証されなければ)、たんなる自己満足、と批判されても甘受するしかない。すなわち、自分では「いい人」のつもりでも、他者にとっては「悪人」となる、といった、顚倒が生じうる。
もっとも、自己点検・評価は、個人に対するものではなく、組織に対するものなのだから、「いい人」を論ずるにあたり、それを類推適用することには意味がない、という反論もありうるだろう。この点については、さしあたり、プラトンの『国家』編における個人の魂と国家との関係を想起し、組織的(集団的・社会的)なものが個人的なものを概念的に明確化しうる、と指摘しておくにとどめよう。
肝腎なことは、「いい人」は世評による以外に生じない、という一点である。
だが、しかし、自画自賛と世評とがずれて、「いい人」が「悪人」ともなりうることを思い遣ると、他者とは切り離された自画自賛の成り立ちも考えなければならず、むしろ、これを論ずる方が基礎的なのかもしれない。
――
ということで、今後どのような展開になるか分からないが(また頓挫するかもしれないが)、「いい人」とは何か、について、考えたことを備忘する。
Visual Studio Code のカーソルが重くなるときの対処法(2. 既知の問題:拡張機能をオフにする)
VS Code を使うさいに導入した拡張機能をすべてオフにしたら、
- Debugger for Firefox
- VSCode TSV
がオフになった。(Japanese Language Pack for Visual Studio Code は、オフにならなかった。アンインストールすればよいのだろうが。)
このことによって、劇的に軽量化する。
これは、次のページからの示唆。
【参考】
Visual Studio Code Intellisenseが非常に遅い-できることはありますか?
Visual Studio Code のカーソルが重くなるときの対処法(1. 経験的発見:ステータスバーを非表示に)
Visual Studio Code を使ってカーソルが重くなる現象に突き当たり、いかがしたものか、と試行錯誤したところ(結構時間がかかった)、
1. 行数が増え、ステータスバーを表示していると起こる、
2. この場合、拡張機能 Vim に依存しない、
3. また、カーソルの smooth 云々にも依存しない、
という経験則にたどり着いた。
したがって、さしあたり、たんに1.に対処すれば良く、
A. 必要以外はステータスバーを表示しないのが得策で、
B. ファイルを分割するのは、VSCode に振り回されている感があり、愚策である、
との断案に至る。
思うに、ステータスバーには「行・列」表示があるので、行数が増えれば、その表示のための計算に手間取るのだろう。しかし、たんにテキストボックスの「行・列」取得であれば、さほどのステップは必要ないわけだから、それ以上に、高性能エディタとしての「行・列」管理、さらには編集支援のためのさまざまな点検ステップが、その計算に災いしているのかもしれない。もっとも、ステータスバーを非表示にして編集支援が無効になるわけではないから、それは邪推で、むしろ、ステータスバーの「行・列」を更新するルーチンとカーソルを移動させるそれとの(相互に独立させるために冗長性を生むといった)依存性があるのかもしれない。的外れかもしれないが、素人には、これくらいの穿鑿しかできない。■
【参考】
(補遺)
最初のファイル読み込み時は、ステータスバー非表示でも、長いファイルではカーソルの動きが重い。おそらく、バックグラウンド処理のせいであろう。(2021/6/14)
書誌データ構造管見(6. tsv 形式フィールドの並べ替え)
「書誌データ構造管見(5. tsv形式フィールド「掲載誌情報」「出版年月日等」)」では、とくに国会図書館から得られる「掲載誌情報」と「出版年月日等」の構造の分析を行った。そして、その「掲載誌情報」がいくつかの要素からなる併合データである模様なこと、また、「出版年月日等」が W3CDTF によらない、たとえば和暦用途のものである可能性が高いことを推測した。
国会図書館と CiNii とで取る tsv 形式のデータでは、書き出されるフィールドの順序が異なるので、得られたデータを構わず一つの Excel シートに放り込んでいくと、かならずや収拾がつかなくなる。これらは、取得源ごとに分別してそれぞれのシートに分けたい。(「分ければ資源」である。)
そして、その分けたシートのデータを併合したいとき、そのときにデータが揃うよう、事前の準備もしておきたい。
■ 並べ替えの最終形(目標)
まず、目標となる揃え順を考えておこう。
このさい、項目は極力動かさないことでありたい。とはいえ、研究者が書誌データを並べる通念にも従いたい。
しかしながら、そもそも、書名が先に来るか、著者名がそれかで、のっけから、国会図書館と CiNii とでは真逆である。匿名出版、無題出版はあるとしても、無題出版には、著者以外の誰かがいわゆる通称を与えたり、便宜的な資料名を与えたりしないと、戒名もないまったくの無縁仏に帰する。だから、書名を先に掲げるのが資料整理にとって不可欠の第一のものだ、という考え方は、筋にかなっている。国会図書館の並びがそうであるし、日本の図書販売のサイトでも、書名がまず掲げられて、その著者が次に来る、というのがほとんどだ。
ただ、研究的にはどうだろうか。書名にせよ論文名にせよ、最重要キーワードがそれらの冒頭に来ることは、まずない。それで機械的にソートしても、あまりいい結果は生まれないはずだ。むしろ、著者から入る、というが分かりやすいかたちであろう。私はあまり使わないが、「著者名、刊行年」形式の参照指示も出回っている。とすれば、少なくとも、著者名が第1項目に来るべきなのだろう。
論文(雑誌記事)の場合は、論文名が先で掲載誌がそれに続く、というのが筋だ。国会図書館は、「掲載誌情報」が「出版者」「出版年月日等」のあとに来て、頓珍漢なことになっている。「掲載誌情報」に「巻」「号」の情報が含まれるのは当然で、CiNiiは、これを分断していて、よろしくない。
こう考えてくると、結構な入れ替えになり、手間なのかもしれないが、データのベタ入力とその校正の手間とを考えれば、「しばらくたって、暇なときにでも整理する」という姿勢で臨めば、負担感は激減するのではないかと思うが、どうか。
さて、こうした基本的な考え方にしたがい、経済主義的自然主義により項目を並べ替えるとすると、次表のようなあり方がいいかな、というのが私のセンスだ。
A | B | C | D | E | F | G | H | I | J | K | L | M | ||
BibTeX | author | title | edition | series | journal | volume | number | pages | publisher | year | ISBN | ISSN | URL | |
tsv CiNii |
図書 | 著者名 | 書名 | 版表示 | シリーズ名 | 番号 | 出版者名 | 出版年 | ISBN | ISSN | URL | |||
1 | 2 | 3 | 6 | 7 | 4 | 5 | 8 | 9 | 10 | |||||
雑誌記事 | 著者名 | 論文名 | 雑誌名 | 巻 | 号 | ページ | 出版者名 | 出版日付 | ISSN | URL | ||||
1 | 2 | 3 | 7 | 8 | 9 | 5 | 6 | 4 | 10 | |||||
tsv NDL |
図書・雑誌記事 | 著者 | タイトル | シリーズ | 掲載誌情報 | 出版者 | 出版年月日等 | ISBN | ISSN | URL | ||||
4 | 2 | 3 | 7 | 5 | 6 | 18 | 19 | 1 |
(注)
- 第1行の [a]~[M] は、列の整理記号。Excel の列標識と見立ててもいいかもしれない。
- 第2行に BibTeX のフィールド名を置いたのは、方言を整理して分かりやすくするためである。[year] のところは、前回検討したように、tsv とは、表示が期待どおり揃わないことがある。
- tsv のフィールドの下にあるイタリックの数字は、もとの列の並び。なお、NDL で [ISBN], [ISSN] の数字が 18, 19 となっているのは、それまでの間にある学位論文に関わるフィールド(列)を無視したことによる。(その要不要は、判断だが、CiNii との揃えを考えると、要の場合、[ISSN]のあとに位置させるのが適当か。)
- 網掛け部分は、列移動の操作順。CiNii では図書1操作、雑誌記事2操作、NDL では3操作必要となる。
- 空きの部分は、併合する「前に」列を追加するとよい。併合の「後に」すると、面倒である。
■ 手作りデータベースならこれで十分
書誌データを何千件も即座にダウンロードして、それで文献が揃った、と考えるまともな研究者など、いないであろう。研究テーマに本当の意味で関係するか、あるいはその周辺に位置するか、などなどの吟味もせずに書誌データを引き寄せれば、かえって焦点が定まらず、なにをしているのか自分でも分からなくなるはずだ。それに、図書館の検索のみで必要な文献が即座に分かることなどは、じつは稀で、それがあくまで出発点にすぎないことのほうが多い。真の当たりは、きちんとした文献指示のある図書や雑誌記事を読んでこそ得られるのだと思う。
そう考えると、書誌データの蓄積は、個別の研究者にとってはぼちぼちした歩みであるのが実相で、その記録は、各回数件~数十件程度の単位でしかないのではないか、と思う。だとすると、書誌データ整理のために特殊なソフトを利用するなどということは、ほぼ現実味のないことだ。なのに、こうしたことをするよう誘導する(国会図書館や CiNii を筆頭とする)図書館がいかに多いことか。すくなくとも、学生には絶対に推奨したくない手法である。
そのことによる産業振興効果については、この場の議論ではない。しかし、事の真相が分かれば、ほとんど経済価値を生み出さないものであることに間違いはない。「事の真相」、それは、書誌データ構造のあり方にほかならない。それを、どこかに秘蔵するのでなくすくさま参照可能にして、正面から分かりやすく説明することこそが、図書館たるものの使命であるはずだ。
書誌データ構造管見(5. tsv形式フィールド「掲載紙情報」「出版年月日等」)
「書誌データ構造管見(4. tsv形式データのExcel貼り付け)」においては、tsv形式を選択すれば、エクセルへの貼り付けがきわめて簡易であると痛感された。しかし、国会図書館と CiNii とでは、データの吐き出し順序が異なるため、両者が混在するときには、整理が(セルの移動とかによって)きわめて煩雑になることも指摘しておいた。
さて、どうしようか、という段であるが、「分ければ資源、混ぜればゴミ」というエコ通念をここにも適用したいと思う。本質的には同じであっても、様態が現象的に異なるものをなんの条件も課さずに混合すれば、エントロピーは増大し、すなわち無秩序度が高まって、収拾がつかなくなる方向に動く、というのは、自然の鉄則であって、これは、同時に人文・社会においても、自然が作用するときには同様である。
国会図書館と CiNii とが折り合いをつける、ということも期待したいが、かなりの揉め事になるだろう。(期待するとはいっても、変な仕方で妥協されても困る、というのもある。書誌情報のデータベースの仕様は、いまや国境を超えたものにまでなっているので、たんにそれら二者間の合意だけでは納得できないところにまで来ているからだ。)
私の素人的な眼鏡からすると、国会図書館の tsv データの吐き出し方には、歴史の重みがあるように思う。これは、その tsv 形式と BibTeX 形式の違いを考えることで、次第に感じられてくる。
■ 国会図書館の tsv 「掲載誌情報」の構造(推測)
tsv 形式にせよ BibTeX 形式にせよ、あくまで元帳となるデータベース(NDL サーチ)から吐き出された文字列であろうから、そのサーバによってなにをどのように表現したのか、というプログラムの内部構造が分からないと、正確なことは言えない(それが公開されているなら、ご存知の方はせひご教示いただきたい。)。だから、素人ユーザーは、データの外形からなにがなされているか、経験的に推測するしかない。
そうした制約のなかで考えるに、国会図書館の tsv 「掲載誌情報」は、いくつかの書誌情報を合成してできていると思われる。それは、BibTeX 形式で出されたフィールドと比較することで、おおむね次のような形式によっているのではないか(BibTex のフィールド名でこれを [ ] で記す。)。
[journal] [volume] [number] [volume]([number]):[year].[month] p.[pages]
もっとも、NDL Online WEB での「掲載誌」情報は、
[journal] [volume]([number]):[year].[month] p.[pages]
の形式になっているから、tsv での「掲載誌情報」の表現は、なにか理由あっての冗長があるのかもしれない。(いらぬ重複があるという点では、バグと言っていいだろう。)
BibTex のフィールドと「DC-NDL(RDF)フォーマット仕様 ver.2.0」とを対照すれば、次のような関係だろうか。
BibTeX | RDF タグ名 | 内容 |
journal | dcndl:publicationName | 掲載誌名 |
volume | dcndl:publicationVolume | 掲載巻 |
number | dcndl:number | 掲載号 |
year | (??)dcterms:issued と関係するか | 出版年月日 (W3CDTF) |
month | (??)dcterms:issued と関係するか | 出版年月日 (W3CDTF) |
pages | dcndl:pageRange | 掲載ページ |
■ 国会図書館の tsv 「出版年月日等」は BibTeX の [year] とは違うのだろう
[year], [month] に関係する RDF タグは、別に[出版年月日等]と説明される dcterms:date があり、その表現例に和暦が記されているから、おそらく、こちらのほうは、[year] を出すさいに使われていないのではないかと推測する。和暦が WEB で示される図書などの BibTeX 形式をとってみても、[year] でそれが表現されることがない。しかし、tsv の[出版年月日等]では、和暦が示される。だとすると、国会図書館のデータでは、tsv の[出版年月日等]と BibTeX の [year] を同列にしてはならない、ということになる。
いずれにしても、表現(外部)とデータ(内部)の関係(プログラム)を明示してくれるものがあれば、なんの穿鑿もする必要がないのであるが、他と揃えたいとなると、どうしてもデータの形式を踏まえておきたい、と思うのは、人情である。とくに、日時に関しては、Excel で和暦も示すことができるとはいえ、統一的する方が望ましいに決まっているから、なおさらである。
エコ通念からすると、ゴミになりかねない事態である。(しかし、和暦である。おそらく、併記する以前は、これで十分な歴史があったのだ。)