建石 由佳

J-GLOBALへ         更新日: 16/05/13 11:12
 
アバター
研究者氏名
建石 由佳
 
タテイシ ユカ
所属
国立研究開発法人科学技術振興機構
部署
バイオサイエンスデータベースセンター
職名
研究員
学位
理学博士(東京大学)

研究キーワード

 
 

研究分野

 
 

論文

 
Typed Entity and Relation Annotation on Computer Science Papers
10th edition of the Language Resources and Evaluation Conference (LREC2016)      2016年5月   [査読有り]
Takashi Okumura,Hiroaki Tanaka,Mai Omura,Maori Ito,Shin-ichi Nakagawa,Yuka Tateisi
2014 IEEE International Conference on Bioinformatics and Biomedicine, BIBM 2014, Belfast, United Kingdom, November 2-5, 2014   62-69   2014年   [査読有り]
Panot Chaimongkol,Akiko Aizawa,Yuka Tateisi
Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC-2014), Reykjavik, Iceland, May 26-31, 2014.   3187-3190   2014年   [査読有り]
Yuka Tateisi,Yo Shidahara,Yusuke Miyao,Akiko Aizawa
Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC-2014), Reykjavik, Iceland, May 26-31, 2014.   1423-1429   2014年   [査読有り]
Takashi Okumura and Eiji Aramaki and Yuka Tateisi
IEEE International Conference on Bioinformatics and Biomedicine      2013年12月   [査読有り]
Clinical vocabulary and Clinical finding concepts
Takashi Okumura, Eiji ARAMAKI and Yuka Tateisi
Proceedings of The First Workshop on Natural Language Processing for Medical and Healthcare Fields      2013年10月   [査読有り]
Yuka Tateisi, Yo Shidahara, Yusuke Miyao and Akiko Aizawa
Proceedings of The 7th Linguistic Annotation Workshop & Interoperability with Discourse      2013年8月   [査読有り]
Takashi Okumura,Yuka Tateisi
Proceedings of the 26th IEEE International Symposium on Computer-Based Medical Systems, Porto, Portugal, June 20-22, 2013   197-202   2013年   [査読有り]
Takashi Okumura,Yuka Tateisi
Health Information Science - First International Conference, HIS 2012, Beijing, China, April 8-10, 2012. Proceedings   164-172   2012年   [査読有り]
Toward an Underspecifiable Corpus Annotation Scheme
建石 由佳
COLING 2008 Workshop on Cross-Framework and Cross-Domain Parser Evaluation   17-23   2008年8月   [査読有り]
Oda K, Kim JD, Ohta T, Okanohara D, Matsuzaki T, Tateisi Y, Tsujii J
BMC bioinformatics   9 Suppl 3 S5   2008年4月   [査読有り]
Yuka Tateisi,Yusuke Miyao,Kenji Sagae,Jun'ichi Tsujii
Proceedings of the International Conference on Language Resources and Evaluation, LREC 2008, 26 May - 1 June 2008, Marrakech, Morocco      2008年   [査読有り]
Jian Su,Xiaofeng Yang,Huaqing Hong,Yuka Tateisi,Jun'ichi Tsujii
Ontologies and Text Mining for Life Sciences: Current Status and Future Perspectives, 24.03. - 28.03.2008      2008年   [査読有り]
Linguistic and Biological Annotations of Biological Interaction Events
Proceedings of The Fifth International Conference on Language Resource and Evaluation (LREC 2006   1405-1408   2006年   [査読有り]
Akane Yakushiji,Yusuke Miyao,Tomoko Ohta,Yuka Tateisi,Jun'ichi Tsujii
EMNLP 2007, Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing, 22-23 July 2006, Sydney, Australia   284-292   2006年   [査読有り]
Tomoko Ohta,Yusuke Miyao,Takashi Ninomiya,Yoshimasa Tsuruoka,Akane Yakushiji,Katsuya Masuda,Jumpei Takeuchi,Kazuhiro Yoshida,Tadayoshi Hara,Jin-Dong Kim,Yuka Tateisi,Jun'ichi Tsujii
ACL 2006, 21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics, Proceedings of the Conference, Sydney, Australia, 17-21 July 2006      2006年   [査読有り]
Biome dical Information Extraction with Predicate-Argument Structure Patterns
Proceedings of the First International Symposium on Semantic Mining in Biomedicine   60-69   2005年   [査読有り]
Yoshimasa Tsuruoka,Yuka Tateishi,Jin-Dong Kim,Tomoko Ohta,John McNaught,Sophia Ananiadou,Jun'ichi Tsujii
Advances in Informatics, 10th Panhellenic Conference on Informatics, PCI 2005, Volos, Greece, November 11-13, 2005, Proceedings   382-392   2005年   [査読有り]
Yuka Tateisi,Jun'ichi Tsujii
Proceedings of the Fourth International Conference on Language Resources and Evaluation, LREC 2004, May 26-28, 2004, Lisbon, Portugal      2004年   [査読有り]
Encoding Biomedical Resources in TEI: The Case of the GENIA Corpus
Proceedings of ACL 2003 Workshop Natural Language Processing in Biomedicine
   2003年   [査読有り]
Kim JD, Ohta T, Tateisi Y, Tsujii J
Bioinformatics (Oxford, England)   19 Suppl 1 i180-2   2003年   [査読有り]
GENIA Corpus: an Annotated Research Abstract Corpus in Molecular Biology Domain
Proceedings of the Human Language Technology Conference (HLT 2002)      2002年   [査読有り]
Tools for Ontology-based Corpus Annotation
Proceedings of the sixth Pacific Symposium on Biocomputing (PSB 2001)      2001年   [査読有り]
XML-Based Linguistic Annotation of Corpus
Proceedings of the first NLP and XML Workshop held at NLPRS 2001   47-53   2001年   [査読有り]
Akane Yakushiji,Yuka Tateisi,Yusuke Miyao,Jun'ichi Tsujii
Pacific Symposium on Biocomputing 2001   408-419   2001年   [査読有り]
Building an annotated corpus in the molecular-biology domain
Yuka Tateisi, Tomoko Ohta, Nigel Collier, Chikashi Nobata, Jun-ichi Tsujii
Proceedings of the COLING-2000 Workshop on Semantic Annotation and Intelligent Content   28-36   2000年8月   [査読有り]
Nigel Collier,Hyun Seok Park,Norihiro Ogata,Yuka Tateishi,Chikashi Nobata,Tomoko Ohta,Tateshi Sekimizu,Hisao Imai,Katsutoshi Ibushi,Jun'ichi Tsujii
EACL 1999, 9th Conference of the European Chapter of the Association for Computational Linguistics, June 8-12, 1999, University of Bergen, Bergen, Norway   271-272   1999年   [査読有り]
Extension of a Feature Structure Abstract Machine for Partial Unification
Proceedings of the Pacific Association for Computational Linguistics (PACLING) '97
   1997年   [査読有り]
建石 由佳, 伊東 伸泰
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理   79(5) 687-697   1996年5月
文書画像から論理構造を抽出するために確率文法の枠組みを応用したシステムを作成した. このシステムでは, テキスト中に存在する特定の文字列パターンから各行の属性ラベルを判定(複数あってもよい)し, その妥当性に応じてコストを付与する. 属性ラベルの隣接関係は, (属性付き) 3型文法で記述され, ラベルをノード, その遷移をリンクとするコスト付き解析グラフが作成される. このとき, 文書画像理解の結果, フォントサイズ, マージン, 行間隔などの情報が得られる場合には, それらに応じてコスト...
金子 宏, 建石 由佳, 鳥原 信一
情報処理学会論文誌   35(6) 1111-1118   1994年6月
手書きによる日本語入力システムの補助として,任意のかな漢字交じりの入力を漢字表記に変換する交ぜ書き漢字変換を開発した.これは,かな漢字変換の辞書をかな漢字交じりの検索キーを持てるように拡張して実現した.単純な設計では,辞書の大きさがかな漢字変換の辞書の5倍以上に膨張するところを,漢字に単一の読みを振る「代表読み」と呼ぶ方式によって,辞書検索の対象となる表記に制限を設けることなしに約1.8倍の膨張に抑えた.この辞書を用いた交ぜ書き漢字変換システムを作成し,手書き入力システムに組み込んだ.
Evaluation of Japanese Texts Based on Surface Characteristics
建石 由佳
東京大学      1989年11月   [査読有り]
Yuka Tateishi,Yoshihiko Ono,Hisao Yamada
Proceedings of the 12th International Conference on Computational Linguistics, COLING '88, Budapest, Hungary, August 22-27, 1988   649-654   1988年   [査読有り]

Misc

 
大村 舞, 建石 由佳, 奥村 貴史
知識ベースシステム研究会   103 42-47   2014年11月
情報科学論文のための意味関係検索システム
建石由佳, 宮尾祐介, 相澤彰子
言語処理学会第20回年次大会発表論文集      2014年3月
疾患知識ベースのcommunity-driven currationと診断支援プラットフォーム
奥村 貴史, 荒牧 英治, 建石 由佳
人工知能学会 第30回セマンティックWebとオントロジー研究会      2013年8月
情報科学論文からの意味関係抽出に向けたタグ付けスキーマ
建石由佳,仕田原容,宮尾祐介,相澤彰子
言語処理学会第19回年次大会講演論文集      2013年3月
島広幸, 建石由佳, 小西克巳
情報処理学会全国大会講演論文集   74th(2) 2.273-2.274   2012年3月
生命科学知識を得るために入力される自然言語クエリの構文解析
原忠義, 建石由佳, Jin-Dong Kim, 宮尾祐介
NLP若手の会 第6回シンポジウム      2011年9月
Parsing natural language queries for life science knowledge
Proceedings of BioNLP 2011 Workshop      2011年6月   [査読有り]
星野 翔, 建石 由佳
情報処理学会研究報告. 自然言語処理研究会報告   2011(7) 1-6   2011年5月
インターネット上の英日機械翻訳を行うサービスで統計的機械翻訳をベースとしたものが増えている.英語と日本語の間での翻訳には誤りが多く,翻訳の質に大きく影響しているが,従来用いられてきた評価手法は数値による評価尺度であり,システムのどの部分の誤りが結果に影響しているのか明らかではない.本研究では,インターネット上の英日機械翻訳サービスを使って対訳データを翻訳し,十分な質の文を出力できているのか,またどのような誤りが影響しているのかを人手で分析し,後編集プログラムによる改善を試みた.
野中真生, 奥村貴史, 建石由佳, 谷田和章, 辻井潤一, 辻井潤一, 辻井潤一
言語処理学会年次大会発表論文集   17th (CD−ROM) ROMBUNNO.P3-16   2011年3月
種田憲一郎, 奥村貴史, 緒方裕光, 高橋理, 大曲貴夫, 建石由佳, 陶山恭博, 倉井華子, 鈴木純
今後の難病対策のあり方に関する研究 平成22年度 総括・分担研究報告書   87-107   2011年
建石由佳, 奥村貴史, 野中真生, 谷田和章
厚生労働科学研究成果データベースの検索機能強化に関する研究 平成22年度 総括・分担研究報告書   29-34   2011年
渡辺桂子, 建石由佳
言語処理学会年次大会発表論文集   16th 680-683   2010年3月
島広幸, 建石由佳
言語処理学会年次大会発表論文集   16th 341-344   2010年3月
早藤健, 建石由佳
言語処理学会年次大会発表論文集   16th 330-333   2010年3月
建石由佳, 宮尾祐介, SAGAE Kenji, 大田朋子, 辻井潤一, 辻井潤一, 辻井潤一
言語処理学会年次大会発表論文集   14th 412-415   2008年3月
Subdomain adaptation of a POS tagger with a small corpus
Proceedings of the HLT-NAACL BioNLP Workshop on Linking Natural Language and Biology   136-137   2006年   [査読有り]
大田 朋子, 建石 由佳, 金 進東, 辻井 潤一
情報処理学会研究報告. BIO, バイオ情報学   2005(128) 75-80   2005年12月
生命科学の分野では、分野に関連する論文のアブストラクトが網羅的にMEDLINEデータベースに収録されており、現在約1,500万件の論文アブストラクトが収録されている。この分野の論文アブストラクト中に出現する遺伝子・タンパク質の相互関係は、その名前の表記の多様性に加えて言語学的に多様な表現で記述されている。これらの多様性を解析・学習して、構文解析結果と高度な知識との関係を理解し、認識するシステムの開発を行うためには、システムの学習や評価などに用いる基礎データが必要不可欠である。そこで我々は相...
Tokenization of the GENIA Corpus
ISMB 2005 BioLINK SIG      2005年   [査読有り]
Syntax Annotation for the GENIA corpus
Proceedings of the IJCNLP 2005, Companion volume   222-227   2005年   [査読有り]
Finding Anchor Verbs for Biomedical IE Using Predicate-Argument Structures
The Companion Volume to the Proceedings of 42st Annual Meeting of the Association for Computational Linguistics   157-160   2004年   [査読有り]
薬師寺 あかね, 建石 由佳, 宮尾 祐介, 吉永 直樹, 辻井 潤一
情報処理学会研究報告. 自然言語処理研究会報告   2003(57) 19-24   2003年5月
自然言語処理の分野において、汎用かつカヴァレッジの広い文法を情報抽出などの実用に適用したいという要求がある。しかし汎用かつカヴァレッジの広い文法を人手で開発することは難しい。我々は、正解コーパスの参照と構文解析誤りの蓄積とによって、文法を効率的に改良することを助けるツールwillexを開発した。willexは構文解析結果を正解コーパスと比較し、誤った部分結果を自動的にあるいは手動で取り除くことで結果の曖昧性を減らす。また文法の欠陥部分をデータとして蓄積することで、文法開発者が統計的に文法の...
Akane Yakushiji,Yuka Tateisi,Yusuke Miyao,Naoki Yoshinaga 0001,Jun'ichi Tsujii
ACL 2003, 41st Annual Meeting of the Association for Computational Linguistics, Companion Volume to the Proceedings, 7-12 July 2003, Sapporo Convention Center, Sapporo, Japan   173-176   2003年   [査読有り]
The GENIA Corpus: an Annotated Corpus in Molecular Biology Domain
Proceedings of the 10th International Conference on Intelligent Systems for Molecular Biology (ISMB 2002) poster session      2002年   [査読有り]
GENIA corpus: A Semantically Annotated Corpus in Molecular Biology Domain
Proceedings of the ninth International Conference on Intelligent Systems for Molecular Biology (ISMB 2001) poster session      2001年   [査読有り]
建石 由佳, 大田 朋子, Collier Nigel, 野畑 周, 辻井 潤一
全国大会講演論文集   59(3) "3-113"-"3-114"   1999年9月
大田 朋子, 建石 由佳, Collier Nigel, 野畑 周, 辻井 潤一
情報処理学会研究報告. 自然言語処理研究会報告   99(73) 93-98   1999年9月
情報抽出プログラムのテストデータおよび学習データとして使用するため,医学生物学分野の論文アブストラクトに物質名などをマークアップしたタグ付きコーパスを作成した。タグ付けにあったって,物質の概念モデル(オントロジー)を作成し,それにもとづいたタグセットをSGMLで定義した。 MEDLINEデータベースに登録されたアブストラクト100件をタグ付けして初期コーパスとするとともに,われわれとは独立な研究者にもタグ付けを依頼し,タグの信頼度を検証した。検証の結果,タグ付け作業者間で揺れの大きかった点...
Practical HPSG Parsers
Proceedings of JSPS Symposium on Intelligent Information and Advanced Information Processing   46-50   1999年
実用的なHPSG文法のための二 つの手法:型のCombiningと選言的素性構造のPacking
宮尾祐介, 鳥澤健太郎, 建石由佳, 辻井潤一
言語処理学会第4回年 次大会発表論文集   97-100   1998年3月
Translating the XTAG English Grammar to HPSG
Proceedings of Fourth International Workshop on Tree Adjoining Grammars and Related Frameworks (TAG+4)      1998年   [査読有り]
Packing of Feature Structures for Optimizing the HPSG-style Grammar translated from TAG
Proceedings of Fourth International Workshop on Tree Adjoining Grammars and Related Frameworks (TAG+4      1998年   [査読有り]
建石 由佳, 鳥澤 健太郎, 牧野 貴樹, 西田 健二, 渕上 正睦, 辻井 潤一
情報処理学会研究報告. 自然言語処理研究会報告   97(109) 119-126   1997年11月
Feature-based LTAGによる文法 (XTAG文法) からの変換によってHPSG英文法を作成し, LTAGの木構造および素性構造とHPSGの素性の関係を明らかにした. 文法は素性構造記述言語LiLFeS上に実装した.
建石 由佳
電子情報通信学会ソサイエティ大会講演論文集   1995(0)    1995年9月
文書データベース技術の普及にともなって、検索の利便性からSGMLに代表される論理構造タグ付き文書の作成が重要な課題となっている。このために文書認識装置で読みとった文書およびワープロやテキスト・エディタで作成したテキストに論理構造タグを付加するシステムを開発した。
建石 由佳, 伊東 伸泰
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   94(291) 25-32   1994年10月
文書画像から論理構造を抽出するために確率文法の枠組をを応用したシステムを作成した。このシステムでは、テキスト中に存在する特定の文字列パターンから各行の属性ラベルを判定(複数いってもよい)し、その妥当性に応じてコストを付与する。属性ラベルの隣接関係は、(アトリビュート付き)3型文法で記述され、ラベルをノード、その遷移をエッジとするコスト付き解析グラフが作成される。このとき、文書画像理解の結果、フォントサイズ、マージン、行間隔などの情報が得られる場合には、それらに応じてコストを修正する。この解...
建石 由佳, 伊東 伸泰
全国大会講演論文集   49(3) 147-148   1994年9月
形態素解析において、一定のパターンに従った文字列集合が文中で同一の役割を持つとみなせることがある。文字列パターンは未知語テンプレートとして、未知語(OCR後処理の場合の文字選択誤りを含む)の影響が周辺に及ぶことの抑止にも利用できる。このようなパターンを辞書上にコンパクトに記述できれば、辞書サイズの縮小、管理の手間の軽減に役立つ。このために、日本語形態素解析用トライ辞書を拡張し、正規表現を辞書項目とできるようにしたのでその構成と利用について報告する。
建石 由佳, 金子 宏, 鳥原 信一
全国大会講演論文集   46(3) 277-278   1993年3月
部分的に漢字を含む文字列を入力として,漢字表記を出力する「かん字漢字変換」は,タッチタイプ入力の補助的入力手段として研究が始められた.われわれは手書きによる日本語入力システムの補助としてかん字漢字変換を利用することを考え,そのシステムを構築したが,入力に漢字を交ぜることによって文字の読みに関する情報が失われるために,かなから変換する場合には起こらなかった誤変換が新たに生ずることがわかった.本稿は,入力の表記によって変換率(入力が正しく変換される率)がどう変わるかを調べるために,入力中の漢字...
建石 由佳, 金子 宏, 鳥原 信一
全国大会講演論文集   45(3) 249-250   1992年9月
「かん字漢字変換」は、日本文の表記変換の一種で、ユーザーの書きたい文Sを構成する漢字の一部がその読みに対応するかなになっている入力文からSを生成する操作であるとする。Sを構成する漢字のすべてをかなにした文からSを生成する操作がかな漢字変換である。かん字漢字変換は、入力に漢字が交じることを許した、かな漢字変換の拡張であると見ることもできる。かん字に変かん→漢字に変換(図1)かん字漢字変換 かん字漢字変換は、直接漢字が入力できるフロントエンドの補助手段として有効である。実際、タッチタイプ入力の...
金子 宏, 鳥原 信一, 建石 由佳
全国大会講演論文集   45(3) 255-256   1992年9月
ペン・コンピュータで文字認識を利用するテキスト入力の補助手段として、「土よう日」を「土曜日」に変換するようなかな漢字変換の拡張機能を考えた。この機能は、喜多らが2ストローク入力、小野がTコード入力の補助手段として提案している。われわれは、かな漢字変換を「表記変換つきの形態素解析」ととらえ、その表記変換辞書を変更することにより実現した。また、このプログラムには、ペン・コンピュータ以外にも多くの利用分野がある。
武田 浩一, 建石 由佳, 奥村 薫
システム・制御・情報   35(11) p674-681   1991年11月

講演・口頭発表等

 
Natural Language Processor (for Literature)
建石 由佳
The Thirteenth Confrence of the International Society for Utilitarian studies   2014年8月21日   
Annotation of Predicate-argument Structure of Molecular Biology Text
JCNLP-04 workshop on Beyond Shallow Analyses   2004年   

担当経験のある科目

 
 

競争的資金等の研究課題

 
厚生労働科学研究成果データベースの検索機能強化に関する研究
厚生労働省: 厚生労働科学特別研究事業
研究期間: 2010年10月 - 2011年3月    代表者: 辻井潤一

特許

 
特許 US 5669007 A : Method and system for analyzing the logical structure of a document
建石 由佳