乾健太郎

更新日: 10/05/17 11:12

アバター
研究者氏名
乾健太郎
eメール
inuiecei.tohoku.ac.jp
URL
http://www.cl.ecei.tohoku.ac.jp/~inui/index-j.html
所属
東北大学
部署
大学院情報科学研究科
職名
教授
学位
博士(工学)
 

プロフィール

自然言語処理,情報編集,知識編集の研究に従事.酒好き.

研究分野

 

経歴


2008年
 - 
2009年
奈良先端科学技術大学院大学 情報科学研究科 准教授

2007年
 - 
2009年
奈良先端科学技術大学院大学 情報科学研究科 准教授

2007年
   
 
東京工業大学 大学院・情報理工学研究科 教授

2003年
 - 
2007年
奈良先端科学技術大学院大学 情報科学研究科 助教授

2002年
   
 
九州工業大学 奈良先端科学技術大学院大学・情報科学部・情報科学研究科 助教授

論文


乾健太郎, 浅原正幸
知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics   18(5) 669-681   2006年10月   [招待論文]
平野 徹, 飯田 龍, 藤田 篤, 乾 健太郎, 松本 裕治
自然言語処理 = Journal of natural language processing   13(3) 113-132   2006年7月   [査読有り]
藤田 篤, 乾 健太郎
自然言語処理 = Journal of natural language processing   13(3) 133-150   2006年7月   [査読有り]
藤田篤, 降幡建太郎, 乾健太郎, 松本裕治
情報処理学会論文誌   47(6) 1963-1975   2006年6月   [査読有り]
本論文では,語彙概念構造(LCS)に基づく言い換え生成モデルを提案する.LCSは語彙意味論の体系の一つであり,動詞の様々な統語・意味的な特性に対応する意味述語を組み合わせて動詞の意味を記述する枠組みである.提案するモデルは,LCSが表す意味構造の変形操作および語彙意味論的制約に基づいて言い換えを生成する.本論文では,例題として日本語の機能動詞構文の言い換えを取り上げ,言い換えの生成実験を通じてモデルおよび現存のLCS辞書の性能を検証する.
小林 のぞみ, 乾 健太郎, 松本 裕治, 立石 健二, 福島 俊一
自然言語処理 = Journal of natural language processing   12(3) 203-222   2005年7月   [査読有り]
飯田 龍, 乾 健太郎, 松本 裕治, 関根 聡
情報処理学会論文誌 = Transactions of Information Processing Society of Japan   46(3) 831-844   2005年3月   [査読有り]
飯田龍, 乾健太郎, 松本裕治, 関根聡
情報処理学会論文誌   46(3) 831-844   2005年3月   [査読有り]
日本語における名詞句の同一指示関係を同定するための新しい解析手法を提案する.従来の同一指示解析方法は定名詞か否かを判定する際に局所文脈の情報しか参照していないという問題や, 非照応詞と先行詞候補との関係を訓練事例として抽出していないため, 非照応詞が棄却されることが保証されないという問題が存在する.また, 日本語の場合は, 英語などの言語と比較して冠詞の情報がないため同一指示関係の解析の問題が難しくなると考えられる.そこで, 本稿では, 照応詞の候補に対して先行詞となる可能性のある候補を提示することで, より広い文脈の情報を参照して照応詞か否かの分類問題を解くための手法を提案する.この手法では, 非照応詞に対しても最も先行詞らしい候補を見せることで極端に負例が多くならないという利点もある.この提案手法を用いて日本語名詞句同一指示関係の同定実験を行い, 先行研究の機械学習を用いた手法よ...
乾 健太郎
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence   20(2) 243-244   2005年3月   [招待論文]
徳永 泰浩, 乾 健太郎, 松本 裕治
自然言語処理 = Journal of natural language processing   12(1) 79-105   2005年1月   [査読有り]
乾 健太郎, 藤田 篤
自然言語処理 = Journal of natural language processing   11(5) 151-198   2004年10月   [招待論文]
藤田篤, 乾健太郎, 松本裕治
情報処理学会論文誌   45(4) 1176-1187   2004年4月   [査読有り]
本論文では,語彙・構文的言い換えにおいて頻繁に生じる動詞格構造の不整合を自動的に検出する方法を提案する.我々は,コーパスから獲得した大規模な正例に基づいて格構造の適格さを定量化する確率的言語モデルと,人手で収集した小規模な負例に基づいて格構造の不適格さを定量化するモデルを構築し,これら2つを混合し,正例のみに基づく言語モデルと比較して精度の高い誤り検出器を実現した.また,誤り検出に対して貢献度が高い負例を効率良く収集するために能動学習を試行した.
乾孝司, 乾健太郎, 松本裕治
情報処理学会論文誌   45(3) 919-933   2004年3月   [査読有り]
人間のような深い言語理解能力を工学的に実現することを妨げている1つの原因として,計算機で利用可能な大量の常識的知識をいかに構築するかという問題がある.本論文では,常識的知識のうち,因果関係に関する知識に着目し,大規模な電子化文書集合から因果関係知識を自動的に獲得する方法について論じる.論文では,まず,因果関係に立つ2つの出来事がそれぞれ行為であるか事態であるかに基づき,cause, effect, precond (ition), meansの4つの因果関係を定義した.接続標識「ため」を合む複文からこれら4つの因果関係への自動分類実験を行い,cause, precond, meansの各関係について,80%の再現率で95%以上の分類精度を達成した.また,effect関係については,30%の再現率で90%の分類精度を達成した.さらに,新聞記事1年分の文書集合に本手法を適用することにより...
飯田龍, 乾健太郎
情報処理学会論文誌   45(3) 906-918   2004年3月   [査読有り]
センタリング理論のような言語学的な知見を,機械学習を用いた照応解析に統合する一方法を提案する.従来の照応解析手法は,大きく規則ベースの手法と統計的な手法に分類でき,それぞれ独立に研究がなされてきた.規則ベースの手法では,言語学的知見に基づき人手で規則を記述するが,照応現象を包括的にとらえる規則を書き尽くすことは困難である.一方,機械学習に基づく手法では,人手では扱うことのできない規則の組合せを考慮できるが,言語学的知見を有効に活用していない.これら2つの手法をうまく統合することによって,両者の利点を同時に引き出すことができれば,精度の向上がさらに期待できる.本論文では2つの手法の統合を目指し,具体的な方法として(i)センタリング理論に基づく局所的な文脈を考慮した素性(センタリング素性)の導入,および(ii)先行詞候補間を比較するモデル(トーナメントモデル)の2点を提案する.この提案手...
藤田篤, 乾健太郎
情報処理学会論文誌   44(11) 2826-2838   2003年11月   [査読有り]
本論文では,世界知識や発話の文脈に関係なく言語学的知識で実現可能な語彙・構文的言い換えを対象とし,これらを構文トランスファ方式で実現する際に生じる変換誤りについて述べる.本研究では,次の2段階の調査を行った.(1)まず,先行研究で示されている知識・知見に基づいて構文トランスファによって生じる変換誤りを洗い出し,その種類を整理・分類し,(2)次に,さまざまな種類の構文トランスファ規則を用いて言い換え事例を生成し,事例分析に基づいて,各種変換誤りが生じる傾向を調査した.これらの調査によって,多くの変換誤りが,構文トランスファ規則の種類に依存することなく生じることが明らかになった.また,問題の性質を分析し,解消に向けての課題を整理した結果,まずは頻繁に生じる傾向がある形態的な不適格性,および構文的な不適格性を優先的に解消すべきであるという結論を得た.
乾孝司, 乾健太郎
情報処理学会論文誌   42(12) 3160-3172   2001年12月   [査読有り]
我々はこれまでに, 信頼のおける部分だけを出力し被覆率を犠牲とする代償として正解率を向上させる統計的部分解析手法の調査を進めてきた.本稿では, さらにこの考えに委員会方式という概念を統合した枠組みを提案し, その評価を行った.委員会方式とは, 複数の解析器(委員)の出力解を組み合わせることにより解析精度の向上をはかる手法である.ここでは, 各委員から得られる解析結果に基づき委員会で多数決により統計的部分解析を行うために, 従来の基本的な委員会方式に3つの拡張を施した:(1)解析器(委員)が推定した係り受け確率を票の重みと見なして重みつきの票を投じる確率的投票, (2)委員間での票の重みの信頼性を標準化する重み標準化, (3)各係り文節に対して2位以下の係り先候補にも重みつきの票を投じる多重投票.既存の5つの統計的解析器を用いて, 京大コーパスを対象データとする解析実験を行った.その結...

Misc


村上浩司, 増田祥子, 松吉俊, NICHOLSEric, 乾健太郎, 松本裕治
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   109(142) 31-36   2009年7月
我々は現在,Web情報の信憑性評価を行うために,あるトピックに関するWeb文書集合において,さまざまな視点や角度から述べられる言明を抽出し,それらの間の類似・対立・根拠等の関係を認識して,ユーザに言明と関係の情報を提示する言論マップ生成課題に取り組んでいる.本論文では言論マップ生成のために,Web上に存在する客観的表現や,意見などの主観的表現を扱うためには,どのような種類の意味的関係が必要であるかについて議論する.また,言明間意味的関係コーパスを構築するために我々が必要とする意味的関係を持つような用例対をWeb文書から効率よく収集する方法についても議論する.そして,言明間意味的関係コーパスを構築するためのアノテーション結果について報告し,これまでにアノテーションが終了している約1,500言明ペアについての評価に対する考察を行う.この言明間意味的関係コーパスは,今夏に試用版を公開する予...
松吉俊, 村上浩司, 増田祥子, 松本裕治, 乾健太郎
情報処理学会研究報告. 自然言語処理研究会報告   2008(90) 15-22   2008年9月
あるトピックについて書かれた大量のウェブ文書から、そのトピックについての深い理解を得るためには、それらの文書に記述されている個々の言論の信憑性や有効性を適切に判断し、かつ、暗に存在しているかもしれない言論間の対立関係を発見しようとすることが必要不可欠である。このような作業の支援を目的として、我々は、言論間に存在する類義や対立、根拠などの論理的関係を解析し、それらを言論マップと呼ぶ俯瞰図で明示するための技術の開発に取り組んでいる。本論文では、言論マップの生成に必要な事象間関係知識の整備に関して、既存の2つの言語資源の統合と、下位事象を内包する動詞項構造の記述について報告する。予備実験の結果、整備した事象間関係知識データベースを用いると、約8割の高い精度で言論間の類義関係を認識できることが分かった。
飯田龍, 乾健太郎, 松本裕治
情報処理学会研究報告. 自然言語処理研究会報告   2008(90) 45-52   2008年9月
ゼロ照応解析の問題を結束性と首尾一貫性の観点から検討する.結束性の観点からは,Walkerのキャッシュモデルの実現方法を検討し,統計的機械学習に基づく実装を提案する.このキャッシュモデルを用いて文間ゼロ照応の先行詞候補削減を試み,評価実験を通じて先行詞同定時に解析対象とする先行詞候補を激減できたことを報告する.また,首尾一貫性の観点からは,含意関係認識で利用される推論知識獲得の手法を照応解析の手がかりとすることで解析精度にどのように影響するかについて調査する.新聞記事を対象に先行詞同定の実験を行い,導入した推論規則が解析に有効に働くことを示す.
阿部 修也, 乾 健太郎, 松本 裕治
情報処理学会研究報告. NL,自然言語処理研究会報告   186 19-24   2008年7月
村上 浩司, 松吉 俊, 隅田 飛鳥, 森田 啓, 佐尾 ちとせ, 増田 祥子, 松本 裕治, 乾 健太郎
情報処理学会研究報告. NL,自然言語処理研究会報告   186 55-60   2008年7月
阿部修也, 乾健太郎, 松本裕治
情報処理学会研究報告. 自然言語処理研究会報告   2008(67) 19-24   2008年7月
行為-効果,行為-目的のような事態間の関係を大規模コーパスから自動的に獲得する.文内共起パターンを利用する手法では,事態間でどの項が共有されるかの知識を獲得することが難しい.そこで事態間で共有される名詞(アンカー)を用いて項共有情報を獲得し,文内共起パターンによる事態間関係と組み合わせることで項を必要とする事態間関係を獲得する.このとき2種類の異なるアンカーを用いることで,精度を保ったまま再現率を向上できることを確認した.
村上浩司, 松吉俊, 隅田飛鳥, 森田啓, 佐尾ちとせ, 増田祥子, 松本裕治, 乾健太郎
情報処理学会研究報告. 自然言語処理研究会報告   2008(67) 55-60   2008年7月
Web文書には様々な情報が存在し、あるトピックについて多角的な言論などが述べられていることが多い。こうしたトピックに関わる種々の言論は、単純なクエリ検索だけでは広く網羅することができず、偏在する特定の立場の言論を中心的に捉えてしまう危惧がある.本稿ではWeb情報中の数的に優勢な立場の言論だけでなく、与えられたトピックに関して存在する多様な言論を抽出し、それらの言論間の類似、対立、含意等の論理的関係を解析してマップ化する言論マップ生成課題について論じる。また、述語項構造レベルの言論間の関係解析について、既存の事態関係知識を利用した予備実験について報告し、言論マップ生成のために必要な個々の技術課題について述べる。
阿部修也, 乾健太郎, 松本裕治
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   108(141) 19-24   2008年7月
行為-効果,行為-目的のような事態間の関係を大規模コーパスから自動的に獲得する.文内共起パターンを利用する手法では,事態間でどの項が共有されるかの知識を獲得することが難しい.そこで事態間で共有される名詞(アンカー)を用いて項共有情報を獲得し,文内共起パターンによる事態間関係と組み合わせることで項を必要とする事態間関係を獲得する.このとき2種類の異なるアンカーを用いることで,精度を保ったまま再現率を向上できることを確認した.
村上浩司, 松吉俊, 隅田飛鳥, 森田啓, 佐尾ちとせ, 増田祥子, 松本裕治, 乾健太郎
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   108(141) 55-60   2008年7月
Web文書には様々な情報が存在し、あるトピックについて多角的な言論などが述べられていることが多い。こうしたトピックに関わる種々の言論は、単純なクエリ検索だけでは広く網羅することができず、偏在する特定の立場の言論を中心的に捉えてしまう危惧がある.本稿ではWeb情報中の数的に優勢な立場の言論だけでなく、与えられたトピックに関して存在する多様な言論を抽出し、それらの言論間の類似、対立、含意等の論理的関係を解析してマップ化する言論マップ生成課題について論じる。また、述語項構造レベルの言論間の関係解析について、既存の事態関係知識を利用した予備実験について報告し、言論マップ生成のために必要な個々の技術課題について述べる。

競争的資金


文部科学省: 科学研究費補助金(特定領域研究)
研究期間: 2009年 - 2009年
文部科学省: 科学研究費補助金(特定領域研究)
研究期間: 2007年 - 2008年
文部科学省: 科学研究費補助金(特定領域研究)
研究期間: 2006年 - 2009年
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2006年 - 2008年
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2005年 - 2007年