Researchlog by Noriko Arai

研究ブログ

「心を病んだらいけないの?」(斎藤環、與那覇潤)の修正について

2020年に刊行された、斎藤環さんと與那覇潤さんによる「心を病んだらいけないの?」(新潮社)の9刷が2022年5月に発行される際、一部、修正がありました。私(新井紀子)自身に関係することですので、このブログで報告します。

本書は、與那覇潤さんと精神科医の斎藤環さんの対話という形で進行します。第6章は「人間はAIに追い抜かれるの?」をテーマに話が進みますが、その中で、「ロボットは東大に入れるか」という人工知能プロジェクトを進め、また「AI vs. 教科書が読めない子どもたち」という本を著した人として私のことが話題に上ります。そこには、次のようなくだりがあります。

與那覇 結局私たちは人間主義との縁を切れないようですが、そこで必然的に出てくるのが教育の問題です。教育とは定義上、人を「あるべき姿」へと導く試みですから。
ところがこれがいま、大変残念なことになっています。『AI vs. 教科書が読めない子どもたち』が話題を呼んだのはAI言説への批判に留まらず、教科書を「AIのようにしか読んでいない」生徒が大量にいるというデータを示したからでした。要は「ペリー」という用語が設問文にあったら、「日米和親条約」だと答えればだいたい当たるからそうするけど、実は両者の関係がどんなものか理解していない。日本の中等教育は、そういう悲惨な状況にあるわけです。
だから著者の新井紀子さんはプログラミング教育以前に、しっかり論理的な読解力と思考法を国語教育で鍛えるべきだと主張していて、もちろんぼくも大賛成です。わからないのは、そこから「なぜ論理教育が軽視されてきたのか?国語の中身が文学鑑賞に偏っていたからだ。文学作品を教材から外せ!」みたいな変な動きが出ていて……。


斎藤 私も正直、そこは新井さん自身も暴走気味だと思います。落合さんの「AIはアートだ」路線とは、ちょうど正反対の極端に偏ってしまっているような。

(斎藤環、與那覇潤著「心を病んだらいけないの?」(新潮社)初版~第8刷の180ページより。ただし、下線は新井によるもの。)

斎藤さんの発話に出てくる「そこ」が何を指しているかに曖昧性があるものの、文脈からは「『文学作品を教材から外せ!』みたいな変な動き」を指しており、そのことを「新井さんも暴走気味」と捉えているように読めます。ですが、私(新井紀子)は、書籍は勿論のこと、他の著作物やSNS等においても、「文学作品を教材から外せ!」という主張をしたことがないので、大変驚きました。

「AIに負けない子どもを育てる」(2019年9月19日発行)では「国語とは何か」「論理国語と文学国語」という節を設けて私の主張を比較的丁寧に書きました。そこでは「高校1年生の『現代の国語』では、(指導要領の制約から)基本的に文芸は扱わないのですから、やはり、高校生の間のどこかで文芸に触れる機会はあったほうがよいでしょう」(p.269)と、むしろ(論理国語とともに)文学国語を選択することを勧めています。一方で、同書や日経新聞日曜随想朝日新聞メディア私評等において、各教科書会社の国語教科書に掲載されている教材や書き手の性別に著しい偏りがあることについては問題視してきました。しかし、そのことと「文学作品を教材から外せ!」という主張とは本質的に異なるものです。

「心を病んだらいけないの?」という書籍で、上記のような私について誤解されかねない表現があることを偶然知ったのは、2021年11月のことです。そこで、新潮社の一般窓口からお尋ねし、上記同様にご説明した結果、著者お二人が「誤読されやすい表現だった」と認め、次のような表現に修正されました。

與那覇 (同上)
だから著者の新井紀子さんはプログラミング教育以前に、しっかり論理的な読解力と思考法を国語教育で鍛えるべきだと主張していて、もちろんぼくも大賛成です。わからないのは、それに便乗して「なぜ論理教育が軽視されてきたのか?国語の中身が文学鑑賞に偏っていたからだ。文学作品を教材から外せ!」みたいな変な動きをする人がいて……。


斎藤 論理的な読解力の重視が、文学鑑賞の軽視につながるのは心配です。落合さんの「AIはアートだ」路線とは、ちょうど正反対の極端に偏ってしまっているような。

 (斎藤環、與那覇潤著「心を病んだらいけないの?」(新潮社)第9刷の180ページより。変更部分を太字にしたのは新井によるもの。)

 私の著作ではない本の訂正について、私のブログでお知らせするのは不自然なことです。ただ、新潮社は今回の訂正についてウェブサイト等で公開する予定がない、とのことでした。初版から第8刷までをお読みになられた多くの方々の誤解を解く方法が他に見つからなかったため、この手段を選びました。

以上、ご報告まで。

0

researchmap v.2の開発にあたって (3) インタフェイス編(業績管理)

researchmap v.2の開発にあたっては、研究者のマイポータル特に利用者の最大の関心事である業績管理プラグイン「CV」が果たす役割について、「見せる側」「見る側」「活用する側」の立場に立って、検討を行いました。

<見せる側>

researchmapに登録し、業績を「見せる側」に対しては以下の機能を提供しています。

  1. 重要な業績について、最大50件まで、業績に「重要」マークをつけることで、マイポータルのトップページに優先して表示する機能。例えば、ビッグサイエンスに携わっている研究者はラボも大きく、学生やポスドクとの共著論文も多い傾向があります。単に論文を昇順・降順で表示すると、ご本人が主著や責任著者であるIFの高い論文誌論文が大量の業績に埋まってしまい見えづらくなるでしょう。重要論文には「重要」マークをつけてください。そのことで、当該論文がハイライトされ、マイポータルのトップに掲載されます。
  2. 論文の寄与度について、v.1に比べて細かく設定できるようにしました。たとえば、第一著者、責任著者等です。
  3. 大項目の並び替えができます。理系では論文が何より重要かもしれませんが、トルストイやマルクスの翻訳に研究者人生を捧げる研究者もいますし、インスタレーションや設計した作品で評価される研究者もいます。ですから、自分が重要だと考える大項目を上に並べ、自分には関係がないという大項目には何も書かなければ表示されない(が、不自然に見えない)ようなインタフェイスになるよう心掛けました。
  4. 論文誌や国際会議の名称は、それぞれの業界ごとに「本当の名前よりも、略称のほうが通りやすい」というのがあるようですので、外部フィード源に書かれている正式名称よりも、ご本人が登録した名称を優先しました。
  5. 個性を見せられるように、カバー写真登録機能を提供しました。(画面サイズに合わない場合は自動調整します。ただし、拡大縮小は画像のクオリティを下げるので、行いません。カバー写真は、スマートフォン・様々なサイズの画面で表示されますので、それに耐えうる画像をご用意ください。)

<見る側>

  1. researchmapを見る側には、たとえばJSPSやJST等の競争的資金の審査員、大学・企業等の人事担当者、政策立案担当者、進学する大学院やゼミを検討している学生、専門家を探しているメディア、そして研究の重要なステークホルダーである国民がいます。
  2. researchmapの「見栄えを良くする」ノウハウで競争的資金の審査が左右されるのは望ましいことではないでしょう。マイポータルのトップで重要業績をハイライトする以外には、業績の表示順は昇順・降順のみ、そして表示件数は「見ている人が必要に応じてテンポラリーに変える」方式を導入しました。
  3. 競争的資金の審査をされる方は百以上の申請書を短期間に審査しなければなりません。文字をやや大きく、行の間隔を詰め過ぎないようにして、疲労が和らぐよう配慮しました。
  4. 各業績にはdoi以外にも様々なIDが付与されます。そのうち、リンク先は、(1)論文の本体が無料で見ることができるリンク先が最優先、(2)次は、論文の本体を有償で見ることができるリンク先(3)本体がないリンクはその後、という優先度でリンクを張っています。
  5. ログインする研究者は高々数十万人ですが、非研究者でresearchmapを見る側はその100倍以上いることでしょう。サーバの能力に限りがあることから、非研究者には人名や所属から検索する簡易検索のみを提供します。一方、ログインした研究者にはCVの項目ほぼすべてに関する詳細検索を提供します(2020年度完成予定)。(たとえば数学基礎論分野だったら)「過去3年にJournal of Symbolic LogicかAnnals of Pure and Applied LogicかJounal of Mathematical Logicに論文を出している研究者」のような検索を行い、海外に滞在しているポスドクも含めて声がかかるような公明正大で公平なリクルートが実現されることを願っています。そうすれば、若手は安心して海外修行に出かけられるようになることでしょう。

<使う側:研究者所属機関>

reseachmapにとってもうひとつ重要なステークホルダーは研究者が所属している機関です。機関には、大学、研究所(国立、公立、独立行政法人等)、企業などがあります。特に、税金によって補助されている大学や研究所は、毎年または数年ごとに行われる評価に向けて、所属している研究者の業績をとりまとめなければなりません。公平な評価を行うために、たとえば論文は「査読付き」なのか否か、雑誌に掲載されたのかプロシーディングスなのか、講演が招待講演なのか一般講演なのかポスター発表なのか、などの区分けが求められます。しかも、機関内での重複カウントを禁じられているので、学内での共著かどうかを確認する作業が発生します。大学の事務の評価担当者は3か月くらいこの作業に忙殺されると言われています。そこで、各機関はそれぞれこの業績とりまとめ作業のために数千万円を投じ業績管理システムを構築し、担当者(システム管理者と事務担当者)を雇用し、加えて、数百万円のメンテナンス費を構築業者に支払っている状態がゼロ年代から続いてきました。

一方で、それだけ詳細な項目設定を行っても(行ったせいで余計に)、研究者が業績管理システムにデータを入力してくれない、という壁にもぶつかっているようです。私が知る限り、多くの機関において、業績管理システムに完全入力している研究者はごくわずかで、多くはメインの論文だけ入力することで済ましているようです。業績管理を行う事務担当者には「これが教員の業績の全部かどうか」を判断する手段がないので、入力されたものをすべてと考えざるを得ないのが現状かと思います。ですが、こうした研究者の行動は無理からぬことのように思います。所属機関が栄えること願わない研究者は稀でしょう。しかし、研究者本人にとって最大の関心事はまさに、自らの研究教育活動です。そして、研究者は20世紀とは比べ物にならないくらい厳しい国際競争にさらされています。一分一秒を惜しんで研究をし、研究室の大学院生を指導し、成果を上げる必要に迫られています。学内の業績システムに学生やポスドクとの共著論文や口頭発表まで詳細な分類を手入力するインセンティブは、わかないだろうと思います。研究者の流動性が高まれば、そのインセンティブはさらに低下することでしょう。

文部科学省内では、大学と研究所は所管している部署が異なります。加えて、国立大学の評価は、独立行政法人 大学改革支援・学位授与機構が行っており、私立大学の評価は複数の民間の評価団体が行っています。そして、それぞれが異なるフォーマットで業績の提出を義務付けています。

文部科学省では、2010年ごろから研究者の多忙感が研究を阻害する大きな要因になっているとの認識が広がっていました。にもかかわらず、文科省の各局や各課において、事務担当者がそれぞれ何気なく異なる様式で業績フォーマットを決めてしまったことは大変残念なことでした。機関の業績取りまとめ担当部署に対して、researchmapとしてできる限りの支援をしたいと考えています。それは、私が所属している情報・システム研究機構の共同利用機関としての使命のひとつでもあると考えています。加えて、機関がresearchmap利用を決めない限り、研究者は機関の業績システムとresearchmapへの二重入力から解放される日が来ないからです。

researchmap v.2は機関に対して、以下のような機能を提供します。

  1. 機関担当者権限という新たな権限を設け、その権限で、所属担当者の情報を修正する権限を付与します。これは、主として所属研究者の異動があったときに、研究者が自ら変更が怠ったり・できなかったりした場合に、機関担当者が代わって修正を行うためです。これにより、researchmapから吸い上げるべき研究者の範囲を正確に限定することができます。
  2. 研究者の所属機関・部署・肩書・雇用形態・エフォート率・性別等を機械可読な形で必須入力にしました。これによって、対象となる研究者の業績を機械処理可能な形で入手できうようになりました。
  3. 機関担当者は機関に所属している研究者の業績データを完全な形でAPIを経由して吸い上げることができます。また検索APIも提供します。
  4. v.1に比べて(AIが書誌情報を訂正・追加するため)重複データの発見が圧倒的に容易になりました。
  5. 書誌情報等のバリデーションを厳格にしたことにより、表記ゆれなども減りました。

これを機会に、多くの機関がresearchmapをプライマリーデータベースとして活用し、研究者はresearchmapにさえ入力しておけば、機関はそこからAPIでデータを取得し、研究者総覧や業績管理に利用するという流れが定着することを願っています。外部フィード源からデータ入力の支援がある上、科研費の審査にも利用されるため、研究者にはresearchmapに入力するインセンティブがあります。その結果、自前の業績管理システムからresearchmapのAPI利用に舵を切ったことで、集約される業績が10%から30%も増えたという機関もありました。

 

<活用する側:競争的資金配分機関>

日本には民間も含め様々な競争的資金配分機関が存在します。それらは皆、異なる申請フォーマットを用いています。その中で日本最大の競争的資金配分機関であるJSPSが2019年度から申請時の業績リスト提出を不要とし、researchmapに記載されているCVを参考にする旨の発表をしました。JSTも同様の方向のようです。これは、研究者だけでなく、審査書類用紙の大幅削減にもなり、環境にやさしいことでしょう。このような決断をしてくださった競争的資金配分機関に感謝するとともに、その信頼に対して開発責任者として精一杯応えていきたいと思っています。

まず、researchmap v.2から研究業績を競争的資金の課題に紐づける機能がつきました。たとえば、科研費の場合は、KAKENから自分が代表者・分担者・協力者として関わっている課題をフィードすることができます。登録した業績にはそれぞれどの課題からサポートされているかを「紐づける」項目があり、そこから登録済みの競争的資金等の研究課題から選択できるようになっています。この紐づけ機能により、報告書を提出した後も、当該の研究資金でサポートされた業績を追跡することができるようになります。

さて、競争的資金には、報告書がつきものです。そして、その報告書には当然ながら、その競争的資金で上げられた研究成果のリストが添付される必要があります。その際、上記の「紐づけ機能」を活用して、研究代表者が競争的資金の成果を容易かつ完全に集約できるプラグインを遠くない将来提供したいと考えています。イメージはCVに近いですが、個人のCVではなく、特定の競争的資金の業績一覧が表示されるプラグインです。これは競争的資金の代表者(およびその代理人)のみが使うことができます。どこに設置していただいても構いませんが、researchmapにはコミュニティを作成する機能がありますので、競争的資金課題名でコミュニティを作成していただき、そこに設置していただくのが一番ふさわしいでしょう。そのうえで、研究分担者に対して、次のようなメールを送信します。

「本課題の成果として発表した業績については、必ずresearchmap上で、本課題に『紐づけ』してください。そして、そのことを本課題で雇用しているポスドクや学生にも徹底してください。」

そして、研究分担者は同じメールをポスドクや学生に送信します。

そうすると、紐づけされた業績が、その競争的資金課題のCVに表示されるようになる、という仕組みです。研究代表者は、それをJSONなりCSVなりテキストなり、必要な形式でダウンロードした上で、報告書を作成すれば済むようにしたいと思います。どうですか?楽ではありませんか?

研究代表者の先生方には、ぜひとも報告書のための業績リスト作成のような仕事はresearchmapのツールに任せて、研究総括のお仕事に専心していただきたいと考えています。

 

0

researchmap v.2の開発にあたって (2) AI編

researchmap v.2からAIが搭載されています。

researchmap v.2に搭載されたAIの研究開発は、情報・システム研究機構の概算要求事項である「研究IRハブ実現のための関連施策パッケージ」でサポートされています。事業の期間は2017年から2022年です。つまり、researchmap v.2リリースは事業のちょうど中間地点にあたります。

 

<AIについて>

researchmap v.2に搭載するAIは主として3種類。(1)2つの業績が同一か否かを判定する業績名寄せ、(2)業績をresearchmapに登録している研究者に割り当てる業績割り当て、(3)2つの研究者名が同じ研究者を指しているかどうかを判定する研究者名寄せ、です。その前処理や後処理として、他の様々な機能が搭載されています。

researchmap v.1に入力していただいたデータは、人間にはわかりやすくても、機械可読性が極めて低いものでした。それは、2011年にresearchmapがReaDと合併しなければならなかったという経緯にも関係しています。ReaDには各項目に備考欄がなかったため、論文タイトルや著者欄に但し書きを書く研究者が少なくありませんでした。しかし、今回、AIの誤認識を防止するために、(ReaDのデータを吸収するために許容した)データの自由度を下げ、バリデーションを厳格化しました。※1

(1)~(3)について、自動判定を任せられるほどの精度が出るAIは存在しません。※2 よって、自動判定精度のインクリメンタルな向上を目指すのではなく、研究者に「本人だからこそできること」で、ほんの少しだけAIを支援していただくことで、これまでの技術では実現できなかった精度を達成したいと考えています。
researchmapの業績一覧は、今や、競争的資金獲得のための公的な文書の色彩も帯びていることから、誤って他人の業績が掲載されることは望ましくありません。ですから、AIによる自動研究者割り当ては保守的に動かすとともに、登録されている業績が本人が承認したものか、未承認のものか、区別できるような見ばえになるよう設計しました。※3
(1)で最も難しいのは、単著で、論文のタイトルが限りなく近いもの(私の場合、「Tractability of cut-free Gentzen type propositional calculus with permutation inferences I」と「Tractability of cut-free Gentzen type propositional calculus with permutation inferences II」。単著で論文誌も同じですが、内容は全く異なります。)。これを見分けるのは至難です。一方、複数の学会が共催した国際会議で、どちらの学会も同じ論文を別々に登録している場合。doiが異なるのに、同一論文だったりするのです。※4 ※5
以上のようなサンプルデータにのけぞり、ここには書けないような言葉で罵りながら考えました。そうして、researchmapの中で共著者グラフ(researchmapのID間の共著関係)を先に構築するほうが、効率よく、AIの精度を上げられるに違いない、という結論に達しました。

researchmap v.2に初めてログインし、基本データを入力すると、「共著者を選んでください」というウィザードが表示されます。面倒かもしれません。「今、そういうことをしたいわけじゃないんだよ!」と舌打ちしたくなるかもしれません。ですが、この画面でできるだけ多く、「過去に共著論文・共著書籍・共著発表」をした研究者を「共著者」に登録してください。そして、「過去に何も一緒に仕事をしたことがない」研究者については、「共著者」から外してください。(その時点で、将来一緒に仕事をする可能性については、考えなくて結構です。その時が来たら、AIがあなたに改めてお尋ねします「この方は共著者ですか?」と。)ほかにもresearchmapのインタフェイス上のあちこちで共著者かどうかを尋ねるのはそういうわけなのです。※6

researchmapで動かしているAIが挑んでるタスクは、トランプの「神経衰弱」に似ています。しかも一億枚以上のカードでの神経衰弱です。あるカード(論文)を別のカード(同一論文や、人)に割り当てるための。神経衰弱の最初の一手から当てられたら奇跡かインチキです。すでにカードが十分に開いていて(皆さんがそれなりに自分のresearchmap上のCVを整備していて)、情報が十分にある(共著者が誰かがわかっている)ときに、次の一手で当てられる可能性がぐんと高まります。

まだ論文数が多くない若手研究者や常に単著論文を書く方、は手掛かりが少ないので、なかなかAIの割り当て精度が上がりません。でも、きっと職を求めている若手研究者はAIが支援するより前に、きっとご自身で入力してくださることでしょう。

それでも難しかったのが、「鬼籍に入られた著名研究者と同姓同名の研究者」と「海外に同姓同名の研究者がいる研究者」の業績割り当て、でした。鬼籍に入られた方、海外にいらっしゃる方、どちらもresearchmapに登録をされていないので、AIはそれらの業績をどうしても、researchmapのIDをお持ちの方に割り当てようとしてしまうのです。それでも、チューニングを繰り返して、利用者にご迷惑にならない程度に落ち着いてきたのではないかと感じています。※7

もうひとつ、私たちをたじろがせたのは、この世に存在する、デジタル化が終了している膨大すぎる論文の数です。1億以上の論文の海の中で論文名寄せを動かすのは、スパコンの時代にあっても、あまりに愚かな行為です。※8 出版年ごとにスライスして、$n$の(十進数表示での)桁を2つ減らそうと目論んだわけですが、そこで目にしたのが、(どの大学でも購入している)高額な論文データベースの信頼性の低さでした。出版年が3年も間違ってデータベースに登録されている論文がゴロゴロあったのです! 正確性を求めても、ソフトウェアが動かなければ話は始まらないので、「どこで妥協するか」の決断を迫られました。

というような山谷を超えてresearchmap v.2はリリースの日を迎えました。

AIにとって、リリースはゴールではありません。これから研究者のみなさんが「うん、そうそう」と思いながら、(あるいは「舌打ちをしながら」?)、入力してくださるひとつひとつを学習しながら、精度を上げていく出発の日です。

 AIは意味や状況を理解できません。AIからあなたに歩み寄ることは「能力的に」できないのです。最初は手間がかかりますが、どうかあなたの側から、AIに歩み寄ってやってください。

Physical Review Bと書くよりも、PysRev Bと書いた方がプロっぽいことはわかっています。が、できれば、Physical Review Bと書いてくださるほうが、「AIに優しい」です。キャリアの途中でLast Nameが変わった方は、「論文上の記載著者名」として、両方の名前を登録してください。※9  

 AIにうそを教えれば、あなたのresearchmapは混乱したものになるでしょう。

一方、AIに真実を教えれば、24時間365日、あなたのために精度を向上させ続けます。珍しいお名前ならば1年後、比較的ありふれたお名前でも数年後には、あなたのresearchmapはバディのようにあなたに寄り添い、何もしなくてもdoiつきの正しい論文データを知らないうちに入力してくれるようになるはずです。(たぶん。)

(愚痴):

それにしても、世の中というのは、なぜこうも機械に優しくないのでしょう!たとえば、論文の著者欄で「カンマを二重の意味で使う業界」というのがあるのです。例えば、「ARAI, N. H, ARAI, T, YAMADA, Y」とか。こんなの人間でなくては読み分けられません。しかも、同じ研究者が、別の論文には「Noriko H. Arai, Toshiyasu Arai, Yoji Yamada」のような著者記載をしていたり。え?カンマが奇数か偶数で見ればよい、ですって?残念でした。それではダメな例がいろいろとあるのです。まず手入力による誤りがあります。(下に例を挙げました。)数百以上の著者が参加していて、途中にet.alを入れないと著者欄に入りきらない論文もあります。それでも、意味がそれなりにわかる「人間って偉大だな」と(AI的には)思います(AIは思わないけど)。どうか「PDFからコピペしたものをそのまま入力する」というような無謀なことはしないでください。そういうことをすると、例えば、こんな著者欄になってしまうのです。(以下は某大学の某研究者総覧のとある論文の著者欄からそのままコピーしてきたものです。)

Sukanya ThongratsakulThaweesak Songserm, Chaithep Poolkhet,SachikoKondo,Hiroazu,Yagi,Hiroaki Hiramatsu6, MasatoTashiro,HarueOkada, Koichi Kato Yasuo Suzuki

…こういう入力はご遠慮願えれば幸いです。

 

 

※1 バリデーションを厳しくした結果、これまで大学の業績総覧からresearchmapにデータを「現状のまま」インポートしようとすると、バリデーションエラーになる、ということが頻発しているかと思います。ですが、私たちが目指しているresearchmapは単なる「日本の研究者総覧のとりまとめ」ではないのです。研究者のインフラです。どうかご理解ください。

※2 が真実であることの証として、doiをすべての論文につける活動や、Orcidのように(1)~(3)を研究者に「クラウドソーシング」する活動が現に行われているということが挙げられるでしょう。

※3 ここがGoogle ScholarやOrcidとresearchmapの決定的に違う点です。

※4 「doiが異なる→異なる論文に決まってるだろ!」という批判は必ずしも当たらない、ということをご理解いただければ幸いです。

※5 v.1ではdoiの入力について、研究者を信頼し、バリデーションをかけませんでした。結果的に、手入力されたdoiの1/3はそもそも形式から間違っていました。URLとdoiを勘違いしている方、但し書きを書く方…いろいろいらっしゃいました。入力しようという、そのお気持ちには感謝します。ただ、「doiで論文を見分ける」という期待される機能がv.1部分はほぼ使えなくなりました。このことからも、人間に入力していただく、というのはリスクが大きいことが改めてわかりました。外部フィード源から機械可読な形式で入力した上で、人間には「自分の論文かそうでないか」だけを判断していただくのがミスが少ない方法かと思います。

※6 「あの共著者のことは思い出したくもない」場合でも、共著者として登録はしてください。思い出したくない方のために、「マイポータルに表示しない」という設定もご用意しております。

※7 「研究キーワードや分野を見ればいいじゃないか」というご意見があるのはわかります。でも、researchmapに登録している研究者の研究キーワードを見るとわかります。そんなに簡単に分類できません。それに、NatureやScienceはどの分野の論文誌でしょうか?なんとも言えません。私たちは開発をするときに、ひとりの研究者ひとつの分野に向けて開発をしているのではありません。常に動き続ける「研究」の動向を見ながら、「みんなが乗れる船」を設計するよう心がけています。

※8 「$n$個のものから2つのものを選んで見比べる」のに、どれくらいの計算量が必要か考えれば、「京」だけでなく「富岳」にも無理であろうことがわかります。念のため、私たちは富岳のチームに本案件の相談をしました。そして「無理ですよね?」「それは無理ですね」で、意見交換は終了(苦笑)。しょうもない相談に乗ってくださった心優しい富岳のチームに心から感謝します。

※9 論文そのものに記載する名前がNoriko Araiであっても、論文リストにARAI, N.と書きたい場合は、念のため、それも「論文上の記載著者名」に登録しておいてください。

0

researchmap v.2の開発にあたって (1) 概要

researchmap v.2の開発責任者として、researchmap v.2の開発の経緯と仕様策定のコンセプトについて、書いておきたいと思います。

researchmapの開発の主眼は、2009年のスタート時から一貫して「研究者の多忙感を減らす」ことにあります。研究者は様々なシーンで、研究業績を提出する必要に迫られます。個人の業績もあれば、共同研究の報告書など複数の研究者の業績をとりまとめる場合もあります。その形式は、提出を求める主体ごとにバラバラです。そのことが、研究者の事務仕事をどんどん膨らませています。しかも活発に活動する第一線の研究者ほど多忙になる、職を求める若手研究者ほどつらくなる、という状況です。researchmapに研究業績はとりまとめてあるので、そのURLを送ればよい、各大学や機関はresearchmapからAPIで吸い上げればよい、という世界が実現されることを心から願って設計をしています。

次に、各大学や機関には、researchmapから取得した自大学・機関の研究者の業績を分析した上で、よりよい大学になるための戦略を練ることに時間やお金をかけてほしいと思っています。2020年の3月現在、まだ多くの大学(特に国立大学)が独自に研究者業績データベースを構築・メンテナンスしています。その主たる入力方式は、未だに手入力です。手入力はミスが生じやすく、何よりも研究者にとって負担が大きい。そのためでしょうか。各大学の研究者総覧等を眺めると、中途半端にしかデータが入力されていないことが少なくありません。研究者の中には、主要な論文は入力しても、自分が主著ではない論文(学生やポスドクが主著の共著論文など)は入力しないかもしれないし、学生が多い研究室では論文の存在自体を忘れていたりすることもあるでしょう。欠損した研究業績一覧では十分な分析ができないので、結局海外のデータプロバイダーからデータを購入している大学も少なくありません。それでは二重の意味で無駄遣いです。過去の経緯にとらわれず、researchmapを活用することで、限られた運営交付金を有効に使ってほしいと思います。

researchmapに集約された研究者の業績は所属機関にAPIで提供しています。これにより、所属機関が独自に構築してきた研究者データベースは不要になり、各大学で年間数百~数千万円かかっていた費用を節約できるでしょう。そうして生まれた予算が、より意義のある目的のために使われることを願っています。

私がかねがね、海外発のベンチマーキング(Times Higher Education、トップ1%研究者率等)の動向にメディアや政治が右往左往することで、人文社会系の研究者の研究がないがしろにされたり、日本固有の課題解決に勤しんでいる研究者が不当に低く評価されることを大変残念に思ってきました。researchmapという場で、全研究者が協力してデータベースを構築し、それに基づいて科学技術政策研究所(NISTEP)等が分析することにより、日本の大学、研究活動の有用性を国民に主張する根拠データを収集できることが期待できます。もしも、どこかに課題があれば、その原因がオープンかつフェアに議論され、場当たり的でない、科学的な科学技術政策がなされることを期待しています。

20世紀は、助手として雇用された大学で教授として定年を迎えるのが主流だったように思います。けれども21世紀になり、それはレアケースになりました。研究者がいくつもの機関の間を異動するのが普通のことになったのです。今後は、クロスアポイントメントや、産学官の兼務なども増加していくことでしょう。各大学は独自の研究業績管理システムを使っているので、異動するときに、それまでに入力したデータを異動先に持っていくことができません。(そのことも、大学の研究業績管理システムに入力するモチベーションがわかない原因のひとつでしょう。)researchmapは、研究者が異動したり兼業したりすることを前提として、生涯研究者に寄り添っていく研究者業績システムとして安定したサービスを提供し続けていきたいと考えています。

最後に、私はresearcmap v.1の画面がいつまでも「黒い」ままであることを極めて残念に思っていました。黒い=リンクがない=当該の論文や特許やソフトウェアにたどりつけない、ということを意味します。それでは、単に「リスト」でしかありません。researchmapを見る側・使う側にとってメリットはたいしてないでしょう。researchmapは研究者コミュニティのためのものでもありますが、国民は重要なステークホルダーです。researchmapにログインしない学生や国民にも、この場が有用であってほしいのです。それに、論文は読んでもらって、特許やソフトウェアは使ってもらってなんぼのもん、ではありませんか。v.2では、マイポータルが真っ青(リンク先がある)になり、論文には著者最終稿のPDFが添付されることを願ってやみません。

以上が、researchmap v.2を開発するにあたって2017年に掲げた目標であり、文部科学省総合政策特別委員会の議事録にも残っています。※1

研究者の多忙感を減らさなければいけない、というのは、文部科学省もFunding Agencyも大学も、当然共有していた問題意識です。ただ、安心して乗る船がこれまで存在しなかったことが、申請書ごとに異なる形式の乱立を招いていたのだと思います。この状況を打開するために、JSPSやJSTなどのFunding Agencyが研究業績リストの参照先としてresearchmapの活用を打ち出してくださったことに心から感謝しています。

 

 

※1 https://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu22/gijiroku/1409245.htm

 

0

お祝い researchmap v.2にようこそ

researchmapプロジェクトが始まってから10年目になりました。お蔭様で30万人超の研究者にアクティブにご利用いただき、蓄積された業績も3千万件を超えました。ソフトウェア開発責任者として、日頃からのご愛顧に心より御礼申し上げます。

2011年のブログに「researchmap登録者が5千人を超えました!」という記事を書いていたことを見つけ、感慨ひとしおです。このたびリリースしましたresearchmap v.2にはWeb of ScienceやScopus、Pubmed等の外部フィード源や、共著者が登録した業績からAIが「あなたの業績ではありませんか?」と推薦したり、確信度が十分に高い場合には自動で業績リストに追加する等の機能を搭載しています。論文に用いる際の氏名表記や所属を正確に登録していただき、また、共著者を正しく登録していただくとAIの精度が向上します。

researchmapの業績リストは、競争的資金において業績の参考資料としても活用されていることから、AIは安全寄りで運転します。最初はサジェスト数が少なく物足りなくお感じになるかもしれませんが、皆様がresearchmapを忘れてお過ごしの間も、AIはせっせと学習をいたしますので、時間をおいて数か月後、一年後の成長を見守っていただければ大変有難く存じます。

まだまだ至らぬ点もあろうかと思います。お気づきの点等ございましたら、トップページの問い合わせ窓口よりお知らせください。

今後ともresearchmapをどうか宜しくお願いいたします。

0

数理論理学I中間試験について

数理論理学Iの受講生へ。
先週の宿題の解答にミスがありましたので、訂正して「資料公開」のページにアップしました。
また、来週の中間試験の対策問題を「資料公開」のページにアップしました。
いつものダウンロードパスワードを使ってダウンロードしてください。
0

講義質問への回答

本日の授業に関して、「$\sqrt{2}$は無理数である」を自然数の言語の中で、どのように数訳するか、について質問がありましたので、お答えします。

これは、「どんな自然数の組x,yによっても、$\sqrt{2}$$\frac{x}{y}$の形で表せない(但し$y\neq 0$)」、つまり、「どんな自然数xと0でないyについて、$\sqrt{2}$$\frac{x}{y}$に等しくない」と書きたいわけです。ただし、$\sqrt{2}$は直接自然数の言語に含まれないので、
$\forall x \forall y(y\neq 0 \rightarrow x^2\neq 2y^2)$
$\neq$を使いたくない場合には、たとえば
$\forall x \forall y (y=0 \vee \neg x^2 = 2y^2)$
のように書けばよい、ということになります。
0

講義資料

数理論理学I(夏学期)を受講しているみなさんへ。
5月13日は出張のため、講義は休講とします。代わりに、自習用プリントを作成しました。
「資料公開」ページのトップにある「数理論理学I 宿題1」をダウンロードし、5月19日までに数学統計学教材準備室に提出してください。(パスワードは授業中にお知らせします。)
数学統計学教材準備室にもハードコピーを置いておきますので、ダウンロードできなかった方は、そちらに取りに行って下さい。

答えは5月20日に配布します。

予定通り、中間試験は5月27日に実施します。
0

「ロボットは東大に入れるか」ボツQ&A集

「ロボットは東大に入れるか」に関連して、昨年から数十のメディアからインタビューを受けました。文字の制約等もあり、丸ごとボツになるコメントのほうが圧倒的に多いです。そこで、自分を慰めるためにここにボツQ&A集を公開したいと思います。(徐々に増やす・・・かもしれません)

Q:東大に合格するロボットの開発を目指しているんですよね?
A:いいえ、ちがいます。「センター入試(や東大入試)を解くソフトウェア」を作ったとしても、それ自体が社会に有用だとは思いません。そんなものが売れる気もしませんし。
「ロボットは東大に入れるか」という問いに対して、工学的実現を含めてまじめに取り組む中に、どうしても突破しなければならない本質的な課題がいくつもあるし、今は認識されていない課題もいくつも発見されるでしょう。そのことに、このプロジェクトの最大の意義があると考えています。

Q:2022年までに東大に合格する見込みはどれくらいでしょうか?
A:2022年という具体的なゴールの設定は、このようなタイプのAIチャレンジに対して10人を超える研究者が真面目に考え、しかもその研究者のアイデアをサポートする十分な技術スタッフがいるとき、10年で目途がつかないのであれば、その時点の理論および技術では突破できる見込みがない、ということを意味すると私は思います。理論が不十分なのに、「頑張ればどうにかなる」ということは、あり得ません。ですから、理論が整うまでまた数十年寝かしておかなければならないと考えるのが妥当ではないでしょうか。成功したとしてもそうでなかったとしても、現在のAIの実力を知り、次の30年に進むために誰かがリスクをとってチャレンジすべき課題だと思っています。
ただし、現在は予算の関係上、上述したようなハッピーな研究環境を、参加している研究者に提供できているとは到底言い難く、プロジェクトディレクタとして申し訳なく思っています。

Q:2022年には東大に合格しますか?
A:その質問に今の時点で答えられるとするならば、それは研究ではなく、実装に過ぎないので、本質的なチャレンジではないと思います。

Q:脳科学によって人間が考える仕組みが解明されたとき、人間と同じように考える人工知能は実現されるでしょうか?
A:論理的には、できないと思います。まず、「人間と同じように考える人工知能」の前提として、実際に人間の考えている状態をモニターすることができる観測機があり、その観測結果と、作成した人工知能の出力がほぼ一致する、ということによって「同じように」を初めて主張できるはずだと思いますが、「人間の考えている状態をモニターする」とはなんでしょうか。たとえば、今私が「「緑色をしたさかさ狸とよめなぐさにまつわる100のエピソードに関する妥当性の証明をする計算機」について考えている、とこの記者に言ったらどうなるだろうか、ということ」をぼんやり考えていた場合に、それを何らかの観測装置によって観測し得るということの妥当性を16世紀以降の科学的手法で主張することができる気が私にはしません。きっと、私自身も、そのことをこうして口に出して記号列にするまでは、まさか自分で「「緑色をしたさかさ狸とよめなぐさにまつわる100のエピソードに関する妥当性の証明をする計算機」について考えている、とこの記者に言ったらどうなるだろうか、ということ」を考えているだなんて、思いもしないでしょうし、しかも、私は同時に「お腹が減ったなぁ」とか「この記者は今、なんだか腑に落ちないというような顔をしているなぁ」というようなことも記号にせずに考えているのでしょうから、結局のところ、私が今何を考えているか、は私自身もモニターできないわけです。そこに人間全般に関する一般論が存在し得るのかどうかさえ、検証しようがないように私には思われます。ですから、「人間が考える仕組み」を「解明した」と主張し得るという考えが、そもそも私には理解しがたいです。

Q:AIは人間の能力を超えますか?
A:それは比較の問題ですから、論理的には、それはAI単体で決まるのではなく、人間が実際のところ、今どんな能力を持っているかに依存します。また、そこでいう「人間の能力」は、個体にもよるし、時代によっても変化します。ですから、一般論は述べたくありません。ただ、このプロジェクトにおいては、開発する機械の能力を2021年における大学受験生と比較することになるでしょう。私は、教育者として、人間の側に勝ってほしいと心から願っていますが、過去に数学基本調査を行って答案の採点をした感触や、昨年代ゼミ模試タスクで出た結果から、あまり楽観していません。

Q:やはり数学は機械にとってやさしいですか?
A:どの科目が機械にとってやさしいか、ということは現段階でわかりません。ただ、数学は、後段の「問題文が形式的命題で記述されたと仮定したとき、それを自動に解き得るか」についての数学的な理論や技術の蓄積が他の分野より厚いため、解ける問題の範囲やその道筋が、比較的はっきりしているとは言えると思います。2013年の代ゼミ模試で解けたのは実閉体の理論に落とし込める問題で、しかもその問題の複雑度がCADというアルゴリズムで実時間で解けるようなもの、に限られています。さらには、自然数の問題に対しては万能なアルゴリズムが存在しないことがわかっていますから、実閉体のようにすっきりとした解法は望みようがない、と見るのがふつうでしょう。
一方で、大学入試では、実閉体の問題を外して作問することが極めて困難でしょうから、毎年何問かは解けるだろうとは思います。そのとき、やはり比較の問題として、他の受験生がどれくらい解けているのか、どれくらいまともな答案を書いているのか、ということで合否は決まると思います。

Q:数学の入試問題をコンピュータに解かせて何かの役に立ちますか?
A:後の社会への影響という意味では、位取り記数法の発見よりは役に立たないでしょうが、フェルマーの定理より役に立っても不思議ではないと思います。

Q:ビッグデータの潮流とはどのような関係がありますか?
A:基本的には、あまり関係ないと思います。なにしろ、過去問は全部合わせても比較的スモールデータですので。

Q:機械翻訳によって、英語の学習は不要になりますか?
A:これは機械翻訳そのものの精度というよりは、インタフェイスの提供の在り方や、人間がそのような環境にいかに適応するかということ、さらにはそのような環境が生まれたときに人間の「言葉の質」そのものがどの程度変化(劣化)するか、ということに依存すると思います。機械翻訳には癖がありますが、それが日常生活に満ちあふれ、その癖に人間側が適応してしまえば、(検索エンジンと同様に)機械翻訳で多くの場面で満足するようになることは有り得ると思います。それで文学作品を翻訳し得るのか、という問題は残りますが、そのことは「英語の学習が学校制度の中で、今と同程度の重要性を保ちうるか」という問題とは、(関係するけれども)別の問題だろうと思います。個人的には、機械のする翻訳も、食べログの★も信用しませんし、Amazonの推薦で本を買ったこともありません。機械は全般的に嫌いで、特に電子レンジとスマホは持ちたくありません。

Q:アノテーションされた問題を使うのは不公平ではありませんか?正々堂々と、問題のキャプチャーから始めるべきではありませんか?
A:重要なのは「価値のある研究を正々堂々と行う」ということであって、入試のルールに対して正々堂々としているかどうか、ではないと思います。必要があれば随時目標設定の修正を行い、投資された研究費の最適化を図るのがプロジェクトディレクタの責務だと考えます。

Q:夢のあるプロジェクトですね!
A:夢があるかどうかは、正直よくわかりません。ただ、21世紀前半の世界において、機械がどのような知的タスクをこなすことができるか、どのような知的労働を代替しうるか、という問題に、人類は直面せざるを得ない。その問題をポジティブに乗り越えるには、まずは現実を直視することからだと、私は思っています。

Q:結局のところ、東大には入れそうですか?
A:まずはこの記事の一行目から読み直して、正しく含意関係認識してください。
0

第一回 大学生数学基本調査報告書

2011年に日本数学会が実施した「第一回 大学生数学基本調査 報告書」が、数学通信第18巻第一号に掲載されるとともに、ウェブからダウンロード可能となりました。
多くの皆様にご協力いただき、ここに報告書を提出できたことを、心より感謝しております。本調査とその分析が、教育の方向性を考える上でお役に立つことがあれば幸いです。


***
お蔭さまで10年以上勤めた日本数学会教育委員をこの度満期退任することになりました。
委員長時代は、デジタル教科書騒動が持ち上がったり、大学生数学基本調査をしたり、と目が回るような忙しさでしたが、委員のみなさま、また理事会のみなさまに支えて頂き、なんとか無事に任期を終えることができました。
退任にあたり、数学会の数学通信に巻頭言(17巻4号)を寄せましたので、ここにリンクをはっておきます。
0

なぜ数学嫌いが数学をするようになったか

フォルダを整理していたら、昔書いたらしい文章が出てきました。タイトルがなく、ファイル名からどうやら「数学文化」の巻頭言として書いたもののようです。インタビューを受ける度に「なぜ数学嫌いだったのに数学をするようになったのですか?」と聞かれるので、ここに掲載しておくことにします。

***

今、この文章を書いている研究室の窓の向こうには、皇居の桜が広がっている。桜を見ると、ついランドセルを背負って学校に通っていたころのことが思い出される。

あの頃、私は、算数の苦手な女の子だった。

たぶん、生まれつきおっちょこちょいなせいだと思う。すぐに計算間違いをする。いちおうやり方はわかっている。でも、計算間違いをすると、答案にはバッテンがつく。それがしゃくでならなかった。では、文章題や応用問題は得意か、とたずねられると、そうでもなかった。たぶん、理屈っぽいくせに、落ち着いて考える力がたりなかったせいだと思う。

そういう私は、小学校を卒業して中学校に入学すると同時に、算数が苦手な女の子から数学を恐れる女の子となった。数学の先生はいつも灰色のよれよれのスーツの上に白衣を羽織っていた。授業中に問題がわからない生徒がいると、差し棒でカツカツと黒板をたたき、「なぜわからない」と責めたてた。そうして、中学校の数学の授業に一年間座った結果、数学が大嫌いな女の子になった。受験の季節になった。かんばしくない数学の点数を前に、担任の理科の先生は「大学受験のときには、数学が入試科目にない大学を選べよ」と私に言った。

そういう私が、なぜ大学に入ったら数学が好きになり、法律の道を捨てて数学の道を選んだのか、自分でも不思議だ。ただ、大学に入ると、とつぜん「解ける」よりも「わかる」ことに価値がシフトしたことを強く感じたことは覚えている。高校までの数学の授業では、「わかりました」よりも「解けました」「答えがあっていました」のほうが大事だった。こういうと数学の先生に反論されそうだけれども、授業を受けた生徒の実感としては、圧倒的にそうなのだ。ところが、大学に入ってみると、数学を学ぶ時間の大部分は「わかる」ことに費やされ、「解ける」ことや「計算する」ことよりも、「わかる」のほうが重んじられるようになった。

計算間違いをしたかどうかは自分ではよくわからない。でも、わかったかどうかは、自分でわかる。生分かりのときには、なんだか頼りなかったし、しっかりわかると晴れ晴れとした気持ちになった。だから、わかるかどうかを自分で確かめながら前に進むやり方は、私にはとてもフェアに思えた。それまで問題をすいすい解いていた友人が、実はわかっていないことを知ったりしたことも、多少は痛快だったのかもしれない。

文系から数学に移ってきて、数学の教科書には、哲学や経済学のそれに比べて人名がほとんど出てこない、ということに気づいた。哲学の中にある概念が登場するときには、それを提唱した人とそのいきさつについて詳細に書かれているのが常だった。元素だ、水だ、というときでさえも、タレースの文脈かそうでないか、によって意味が違ってくる。数学では、多くの定理が無名であり、さらには、定義に「誰それの定義」と名づけられていることはほとんどない。そうして、誰もがその定義を「あれは空」「あれは海」という調子で、あたかも自然物を指す言葉のように使っている。では、数学の定義は自然物かというと、どう見たって、そうではない。群の定義などは当然人工物であって、その定義をすることによって、世界をそれまでとはまったく違う観点から見よう、ということなのだから、定理証明以上に数学構築の要なのである。

私は、定理を理解するより、定義が示す世界観を感じることに強く惹かれるようになった。定義とは、何かを「わかる」ために作られた言葉なのだと思った。そうして、幾万もの無名の定義が、何百年も揺るがずに、あたかも自然物のようにそこにあることを尊いことに思った。数学が揺るがないのは、それが神によって祝福されているからではなく、「わかる」ことへの祈りに似た気持ちに普遍性があるからだろうと、私は思う。

「できる」より「わかりたいと思う」が尊い、と、桜をながめながら、あの日の自分を慰めてやりたくなった。

 

 

0

日経 経済教室「コンピュータが仕事を奪う(上)」

5月1日、日本経済新聞の「経済教室」に「コンピュータが仕事を奪う?(上)」というタイトルで寄稿しました。私が担当したのは上回で、下回は東京大学の柳川範之さんが執筆されました。以下、上回の最終版のひとつ前のpreprint版を掲載します。

***

 先月、コンピューターの将棋ソフトとプロ棋士の団体戦「第2回将棋電王戦」において、将棋ソフト側が3勝1敗1分けで勝利した。情報科学者の多くが予想した通りの結果ではあるが、結果を目の当たりにすると感慨深い。
 1997年にチェスの世界チャンピオン、ガルリ・カスパロフ氏が米IBM社のコンピューター「ディープブルー」に敗北したとき「将棋はチェスに比べてルールが複雑。近い将来にプロ棋士と並ぶ能力をコンピューターがもつことは難しいだろう」との楽観論があった。「プロ棋士のひらめきはコンピューターでは凌駕(りょうが)できない」と。
 確かに、コンピューターはひらめきを持ち合わせていないので、指し手を選ぶには合理的な基準が必要になる。どの指し手がどんな結末をもたらすのか、しらみ潰しに調べ始めると、探索すべき指し手はあっという間に全宇宙の観測可能な原子の数を超える。どれほどハードウエアの性能が向上しても効率的な探索は不可能だと考えられていた。
 しかし、その予想は覆された。予想を超えてハードウエアが向上したからではない。「データ」と「機械学習」という手段を将棋ソフトが手に入れたからである。公開されたプロ棋士の対戦の棋譜(データ)を基に、プロ棋士が選んだ指し手こそ価値が高いと認識するような評価指標を自動調整する(機械学習)プログラムの登場である。機械学習技術を用いて飛躍的に精度が向上した分野には、機械翻訳、情報推薦、画像認識、音声合成などがある。
 機械学習の特徴は、コンピューターはなぜその判断が正しいかの根拠を知る必要がないという点にある。過去に下された「正しい判断」を模倣すればよいのだから。
 たとえば、スパムメールの除去処理などが典型的な例だろう。私たちがスパムメールを発見してゴミ箱に移動させたり、スパムメールとして通報したりする行動を教師データとして、それを模倣するプログラムを作ればよい。もちろん、誤って重要なメールをゴミ箱に放り込むこともある。だが、ゴミ箱から救い出す私たちの操作をコンピューターは自動的に学習し、プログラムを日々修正する。
 スパム除去ソフトはメール管理者をスパムメールとの格闘から解放した。では、彼らの仕事は楽になっただろうか。そうではない。結果的に彼らから職を奪ったのである。
 米国や英国では、入試の小論文採点に自動採点システムが導入された。人間が2人1組で採点をするよりも、人間とコンピューターのコンビで採点したほうが低コストで精度が高いことが実証されたからである。10年後には、日本語で話せば、あたかも自分の声で話しているように英語に翻訳してくれるような簡単な機器が登場しても不思議はない。「そこそこ」の知的作業はコンピューターによって急速に代替されつつある。
 一方、新しい職種も生まれつつある。データアナリストはその代表例だ。人間では眺めることすら不可能なエクサバイト(10の18乗)級のデータを対象に、機械学習やシミュレーションを武器にコンピューターを用いてデータを分析し、企業や政府の判断を支援する人々である。3D(3次元)プリンターを活用してニッチな製品を作る工房を構える「メイカーズ」と呼ばれる人々も出現した。21世紀前半は、これまでの数世紀とは比較にならないほどの新しいタイプの職種が生まれ、また絶滅する世紀として記憶に残ることになるに違いない。
 減る仕事もあれば、増える仕事もある。不要になった労働は新産業分野に移動すればよい。特に、少子化する日本では機械による労働の代替は喜ばしいことではないか。そう考える人々もいるだろう。
 だが、話はそれほど単純ではない。理由は3つある。
 ひとつには、機械学習の精度がデータ量に依存するからである。米グーグル社は大がかりな機械学習に関する研究の結果、複雑な機械学習の技術を考えるより、比較的単純な仕組みでデータ量を増やしたほうが効果的だという見解を2010年に表明した。つまり、機械学習は研究対象としては頭打ちで、決め手はデータ量だというのである。それが真実なら、日本企業はデータ量で優位に立つ米国企業に太刀打ちできない。
 かつて日本国内で稼ぎ出していた広告収入のかなりの部分がグーグル社に流れたように、各種の知的作業を米国の情報分析産業が担うようになることが懸念される。しかも、機械学習によってデータから導出された「関数」は他の知的財産と異なり、永遠に非公開でまねされることがない。
 2つ目は、現在の人工知能もロボット技術も進歩したとはいえ極めて未熟なため、人間が完全に労働から解放されることがないからだ。機械にできない仕事は両極端に分かれることが知られている。ひとつは高度にクリエイティブな能力で、もうひとつは、教育を受けなくても誰もが自然にできるような仕事である。
 機械翻訳を例にとると、機械は型通りの製品マニュアルを「そこそこ」翻訳することはできる。だが機械は、小説が書かれた文化背景や心の機微を深く理解した上での翻訳を実現できない。また、初めて見る擬態語やイラストを解釈することも苦手だ。機械に教えるための辞書や註(ちゅう)の作成は、人間がすべき仕事として残るだろう。機械が「そこそこ」の知的労働を代替することで、労働は上下に分断されることになる。
 最大の問題は、機械で代替できない「高度人材」を教育するための効果的な手法が見つからないことにある。
 データアナリストに必要なのは、どのデータを取るべきか、どのデータは何に活用できるかを見抜く洞察力と、数多(あまた)ある数理的手法(機械学習・シミュレーションなど)の中から適切なものを選び出し、それをプログラムとして実現した上で、分析結果を人間がわかるように要約する能力である。「メイカーズ」が市場で生き残るには、コンピューターに搭載されている「最適化計算」とは次元が異なるデザイン力を求められることだろう。どちらにも必要なのは数理や論理を備えた創造力や、限られた経験から深い洞察を得て言語化(プログラミング)する能力だ。
 暗記や計算ばかりでなく、こうした高度能力の育成こそ急務なのではないか――多くの人々がそう指摘してきた。教育学者は様々な新しい教育方法を提案した。しかし、これまでのところ平均的な生徒を高度人材に引き上げるための効果的な教育手法が見つかったとは言い難い。マサチューセッツ工科大学(MIT)など米国の有名校は、相次いで講義や教材をウェブ上に無償公開し、教育を受ける母集団の数を増やして世界中から高度人材を選ぼうとしている。それは、高度人材が確率的にしか発生せず、教育で陶冶するのが難しいことを暗に認めているともいえよう。
 画一的との批判はあったが、20世紀までの学校教育が成功をおさめたのは、教育がプログラム化でき、多くの生徒が訓練さえすれば能力を身につけられたからである。そして、プログラム学習で身に着いた能力が労働市場で十分な付加価値をもったためである。教育はローリスク・ハイリターンな投資だった。だが、プログラム化可能な知識や技能は、機械にも学習しやすかったのである。「そこそこ」知的なコンピューターの出現は、近代教育の意義を根底から揺さぶっている。
2

科学と文学が記述できること・できないこと

瀬名秀明さんの「エヴリブレス」が徳間文庫から刊行されることになり、どういうわけかSF初心者の私が「解説」を依頼されました。「エヴリブレス」のご紹介もかねて、ここに全文を掲載します。

「科学と文学が記述できること・できないこと」

1956年の夏、ダートマス大学において集中的な会合を開くことが提案された。提案者は、後に人工知能の大御所となるジョン・マッカーシー、マーヴィン・ミンスキー、ナザニエル・ロチェスター、クロード・シャノン。彼らは、人間の知的活動とは何か、人間はどのように学ぶのか、その活動はコンピュータによってシミュレート可能か――こうした問いを科学として真っ向から探究することを呼びかけた。このダートマス会議によって、AI(Artificial Intelligence, 人工知能)という分野が誕生し、科学者によってコンピュータと共棲する社会の具体的イメージが「当然起こる未来」として語られるようになったのである。

しかし、人工知能という企ては、何も1956年に突如始まったわけではない。その起源は、近代科学そして近代哲学のスタートまでさかのぼることができる。

ニコラウス・コペルニクスやガリレオ・ガリレオより前の時代、世界は生物に喩えて説明がなされていた。石は元来、大地に属していた。だから、手を放すと、まるで母を慕うように石は地に落ちる。一方、炎は太陽に属していた。だから、煙になると母である太陽を目指して、上へ上へと昇っていく。このような説明が、アリストテレスに始まり、レオナルド・ダ・ヴィンチに至るまで受け継がれた揺るぎなき世界観であった。

ところが、ガリレオはそれとはまるで異なる方法で世界の理を表現した。それは、数学である。「一瞬」のうちに起こる落下という物理現象を、ガリレオが数式で表して見せたとき、「世界はいつかすべて数式で表現できるのではないか」という、近代科学の原動力となるアイデアが生まれた。哲学者で政治学者であったホッブスは「法学要綱」さらに「リヴァイアサン」の中で、理性は計算可能であると述べ、「弱いAI」につながる概念を提示している。ここにおいて、ごく少数の公理と、計算可能な理性によって、人間が本来到達可能なすべての真なる命題に到達することを目指すという近代科学の方法論が明言されたのである。

この近代科学の方法論をイデオロギーにまで膨らました張本人は、ルネ・デカルトであろう。彼は方法序説という80ページに満たない小冊子を発表することで、私たち人類を近代という時代へ、「数学記述主義」ともいえるイデオロギーの中へ放り込んだのである。一方、それに対して、デイヴィッド・ヒュームは論理のもっとも痛いところを次の一文で突いた。「私の指を傷つけるよりも、全世界を破壊する方がましだ、という決断は理性に反するものではない」と。論理的整合性は、皆が同じ結論にたどり着くための十分条件にはなり得ない。

だが、それは哲学における対立にしか過ぎない、と多くの「科学者」は考えた。なにしろ、「科学的である」とは「数学で記述できる」と「実験で確認できる」の二つとほぼ同義語として用いられており、実践者や思想家が科学者に「格上げ」されるには数学記述主義を受け入れるより他なかったからである。

さて、デカルトから始めるイデオロギーを忠実に、しかも無意識に受け継いだ人が、アラン・チューリングである。彼は23歳のとき、現代のコンピュータの原理となるチューリング機械というアイデアを発表した。それはまさに、「(合理的に)わかるとは、何か」に関する計算モデルであった。チューリングのアイデアに基づいて作られた現代のコンピュータとは、その意味で、「数学で世界の理は表現できる」という近代科学のイデオロギーを、忠実に、また極端な形で具現化しようと試みた人工物だといえよう。
となれば、「人工知能は可能か」という問いは、デカルトやホッブスの末裔である近代合理主義と、ヒュームの末裔である経験主義のどちらが「真の世界」に近いのかを三百年の時空を超えて問うテーマだともいえる。


瀬名秀明がBrain Valley以降、一貫してテーマとしてきたのも、まさにそのことだろう。コンピュータの脳であり母語である数学という言語は強靭さと柔軟さを兼ね備え、しかも必要に応じて成長していく。しかし、意外なところに脆さを抱えてもいる。数学が持つこれらの特性は、私たちの未来を、人工知能と共棲する私たちの未来を、どのように形づくるのか。彼は、その具体的なイメージを現在生み出されつつある技術から見定めたいと考えているのだろう。「エヴリブレス」でも近作「希望」でも、声や視野あるいは腕など、身体機能の一部を失い、それを技術によって補う人々が繰り返し登場する。これも、彼が考える「人の機能は機械によって置き換えることが可能か」という問いの立て方の現れではないだろうか。

「コンピュータは自らの意思を持たない」あるいは「コンピュータには真のクリエイティビティはない」と切って捨てて、安全な場所からコンピュータと人間の境界を描くのは易い。あるいは、逆に、「コンピュータは人間と同じく意思と感情を持ちうる」として、それを描くのも易い。瀬名秀明が探り当てようとし、ときに信じ、ときに迷い、それでも描こうとし続けるのは、デカルトやヒュームそして、今、多くの科学者や哲学者が格闘している、「科学が記述できること・できないこと」の境界イメージである。

「デカルトの密室」までは、「なぜ私はそこに境界線があると思うのか」をエビデンス・ベースで硬質に描く傾向があったが、「エヴリブレス」や「希望」ではその緊張感がすっと消えてなくなっているように感じる。自らがこのテーマに対して持つパースペクティブに関して、作者が自信を深めている証しなのではないだろうか。


さて、ここから先はやや雑談である。
友人である「セナさん」とお酒を飲むと、いつも彼の小説のヒロインの話になる。私が「ねぇ、こんなに美人で聡明できれいな心を持っている女性が、10年も20年も音信不通になった主人公を愛して待ち続けるなんて、あり得ないわよ。だって、他の人が放っておかないもの」と言うと、セナさんはやや不服そうな顔をする。「それに、名前がいつも杏子とか真理子とか栞なのね。騒々しくて男にだらしがない明美というヒロインの話も読んでみたい」というと、今度は困った顔をする。
彼はクールなリアリストである一方、根っからのロマンチストなのである。

エヴリブレス (徳間文庫)
瀬名秀明
徳間書店(2012/11/02)
値段:¥ 660

0

大学生数学基本調査

日本数学会では、2011年4月から7月にかけて、全国約50の大学において計6千人の大学生(主として入試直後の大学1年生)を対象に、「大学生数学基本調査」を実施しました。
その調査報告書の概要と調査票、またそれに基づいた理事会からの提言を日本数学会のホームページで公開していますので、ご覧いただければ幸いです。
http://mathsoc.jp/comm/kyoiku/chousa2011/
0

どうして微積分を学ぶのか。

これは、友人である竹山美宏さんのブログ記事に触発されて書いた記事です。竹山さんへコメントとして書こうかしら、と思ったのですが、長くなったので自分のところに書きます。

最近、「なぜ微積分まで勉強しないといけないのですか?」と聞かれて、こんな風に答えました。
昨年の3月11日以降、私たちの世界は変わりました。
それまで私たちはうすぼんやりと、こんな風に考えていたんじゃないでしょうか。
「高邁な精神の科学者」なるものが世の中に存在して、専門性に応じて、正しい科学的判断をしてくれるはず。
ただし、科学者の意見は時にバランスにかけるので、「それをコントロールする能力がある官僚」なるものがいるはず。
さらに法律を通す場合には、専門家による委員会の公平かつ科学的意見を参考に市民の代表である国会議員が十分に検討してくれるはず。
それでも不公平だと感じたときには、裁判所に駆け込めば、どんなことに関しても法と論理に基づいて、公平かつ科学的にきちんと判断してくれるはず。
でも、そんなことはありませんでした。
薄々わかってましたけど。
それなのに、みんな自分の人生に忙しくて、「誰かちゃんとした人が考えてくれるはず」と思って任せてきたんですね。

でも、この事実が白日の下に晒されて、本当に困りました。あなただって、そうでしょう?

だって、近代の民主主義国家とは、国民が最終判断ができる、国民が付託した国会議員が合理的な判断ができる、あるいは、裁判官が公平で合理的な判断ができる、という前提の下ですっかり構築されちゃっているんですから。その出発点となる前提そのものが間違っていたら、今のこの社会、どうすりゃいいの。民主主義に代わるよさそうなものなんて、今のところ見つかりそうに、ないし。

科学の発達は、つまり良き時代の民主主義の基盤を揺るがしているんだろうと思います。

しかも、悪いことに、社会を取り巻くテクノロジーはますます高度化しているわけで。
ということは、私たちが「民主主義」を維持しようと思うのならば、「必要があれば」それらに関して、検討し、反対したり賛成したりしなければならない、ということになります。たぶん、ロックはそのように想定していたと思う。
だとすれば、理論上、やっぱり微積分は、市民のリテラシーとして不可欠なんだろうなぁ、とそう思うのです。
大変ですけど、がんばって微分方程式の最初くらいまでは、勉強しましょうよ、市民として。
私も微積分は苦手ですけど(苦笑)、いっしょに勉強したいと思います。

そうお返事しました。
2

「ロボットは東大に入れるか」プロジェクト

2年前の年明け、私はヒューマノイドロボットの研究者である稲邑哲也さんと七草粥を食べながらロボットの可能性について話をしていました。研究費の申請書に書くための可能性ではなくて、本当の可能性について。(なぜ七草粥だったかというと、その日はたまたま1月7日で、ランチに入った和食やさんでは七草粥がふるまわれたのです。)
私はちょうどそのころ、「コンピュータは仕事を奪う」という本の準備中で、自分が持っている「10年後の労働市場のイメージ」が正しのかどうか確信が持てず、若手研究者を食事に誘っては同じ問いを繰り返していました。

人をロボットが完全に代替することはできないことは明らかだとして。
ロボットは、ホワイトカラーが行う「頭脳労働」と呼ばれている作業のうち、どれくらいを代替できるとあなたは信じている?
高度判断を武器に高給を稼いでいる一握りの「有能な」ホワイトカラーの話じゃなくて、満員電車に揺られる大多数のホワイトカラーに限定したとして。
そういう「愛すべきサラリーマン」をロボットは代替しうると思う?

「ホワイトカラーなんて20年後には生き残らないんじゃないか」という意見もあれば、「かなり初期の段階でフレーム問題でつまずくので、たいして代替されない」という意見もありました。

なぜそれほど意見が分かれるのか。
それは、コンピュータにとって難しいことと、人間にとって難しいことが、なぜこうも違うのか、その本当の理由がわからないからだと思うのです。いえ、もちろん、情報学の研究者であれば、計算の仕組み自体は説明できますし、与えられたタスクを実行するのに必要な数理的な手段は(知られている範囲内では)見当がつきます。あるいは、与えられたタスクが原理的に計算困難かどうかも、大凡わかります(Lower Boundは依然不明だとしても)。
が、現象として、人間が容易く行う作業が、なぜコンピュータにとって困難で有り得るのかがわからないのです。

それは、私たち自身が自分で行っている「知的処理」の仕組みが解明されていない、という脳科学的な問題という以前に、現象として「どんな知的処理を行っているか」さえ、捉えられていないからでしょう。宮尾祐介さんによれば、「『ねぇ、お風呂が沸いたわよ』『今テレビ見ているから』という会話がなぜ成立しうるのか今の自然言語処理の枠組みでは説明できない」ということに代表される問題なのだろうと思うのです。

宇野毅明さんは、こんなことを言いました。「代替しうるか、という問いそのものをどのように書くか、という問題がありますよね。『このタスク』は代替できますか?、と記述できてしまえば、それはある意味純粋に計算の話になってえまう。たとえば工場の流れ作業の中に、『ロボットAが投げた部品をロボットBが受け止める』というのを埋め込んだりするのはいくらでも可能なわけですから」

タスクを予め記述せずに、人間が行う一般的な知的労働を、コンピュータがどれだけ代替しうるかを現象として「見る」にはどうすればよいだろうか。そのことがずっと気になって仕方がありませんでした。
そして、1年後のお正月。廊下で稲邑さんにすれ違ったとき、とっさに口をついて出たのです。

ねぇ、ロボットは東大に入れるかしら。

こうして、国立情報学研究所の「東大入試に迫るコンピュータから見えてくるもの」(略称:人工頭脳プロジェクト)は始まりました。

東大に入れるか、入れないか。
それは正直わかりません。

けれども、ひとつあらかじめわかっていることがあります。

ロボットを東大に入れるために、現在ある様々な人工知能の手法をつぎ込んだとき、そこで私たちが思ってもみなかったような「ささいなこと」が高度に人間的かつ知的であることを発見するだろうということです。逆に、これまで「勉強する(学ぶ)ことの核」として位置づけられてきた活動のいくつかが「コンピュータにとって容易に模倣可能」であることを目の当たりにするだろうということです。

フロイトは、人類は三度、そのプライドに深刻な打撃を受けたと主張します。
一度目はコペルニクスによる地動説、二度目はダーウィンによる進化論、そして三度目はフロイトによる精神分析。
私自身は、フロイトはその前の二度に比べると大したことはないと思っていて、真の三度目はコンピュータによってもたらされると考えています。

けれども、その打撃は、地動説や進化論同様、私たちが受け止めざるを得ない打撃でしょう。
特に、ロボットと共存していかざるをえない21世紀の教育は、それを直視せずには設計できないと思うのです。

「ロボットは東大に入れるか」:プレスリリース
0

20万人のメディア

ReaDの20万件データをResearchmap上に統合する最後の作業に追われています。
データを移すだけでも13時間。果たしてきれいに移行できるのか・・・ま、心配したってなるようにしかならないので、できるだけの準備をしたらあとは、運を天に任せて大人しく寝て待とうと思います。

そうこうしている間に「つながるコンテンツ」のインタビューを担当している池谷瑠江さんが
研究室にやってきました。
「本当に20万人になるんですね」(正確には21万人超ですが。)
だから、1年前に、来年は20万人になるから、と言ったではないの。
「でも、すごいですよ。20万人が使うメディアって、今時、20万部出てる雑誌なんてないですから」
そう言われればそうね。ひょっとして、あのロッキングオンより影響力が大きくなるかもしれないっ!(なんて)
実は、私。
みなさんよりほんの数日早く、20万人のResearchmapを今日試してみました。やっぱり5千人とはまた違う世界でした。
あんまりにも広大で、行けども行けどもResearchmapの中で、なかなか知り合いを見つけられないくらい。

20万人のメディアになったとき、Researchmapでは何が起こるんでしょうね。
では、来週の月曜日、無事に移行作業が終わっていますように。
2