岡 照晃

J-GLOBALへ         更新日: 19/01/28 17:20
 
アバター
研究者氏名
岡 照晃
 
オカ テルアキ
URL
https://unidic.ninjal.ac.jp/
所属
国立国語研究所
部署
コーパス開発センター
職名
特任助教
学位
博士(工学)(奈良先端科学技術大学院大学)

プロフィール

趣味で小説を書いていたら,色々あって自然言語処理の研究者に.どちらかというとリソース系。座右の銘は小学校卒業の際,担任の先生からもらった「不断の努力」。研究のモットーは「自然言語処理は前処理が9割」。

研究分野

 
 

経歴

 
2016年9月
 - 
現在
国立国語研究所 コーパス開発センター 特任助教
 
2016年4月
 - 
2016年8月
国立国語研究所 言語変化研究領域 プロジェクト非常勤研究員
 
2015年4月
 - 
2016年3月
京都大学 大学院 情報学研究科 知能情報学専攻 知能メディア講座 特定研究員
 
2013年4月
 - 
2015年3月
日本学術振興会 特別研究員(DC2)
 

学歴

 
2012年4月
 - 
2015年3月
奈良先端科学技術大学院大学  情報科学研究科 情報科学専攻 自然言語処理学研究室 博士後期課程
 
2010年4月
 - 
2012年3月
奈良先端科学技術大学院大学  情報科学研究科 情報科学専攻 自然言語処理学研究室 博士前期課程
 
2008年4月
 - 
2010年3月
豊橋技術科学大学 工学部 情報工学課程
 
2003年4月
 - 
2008年3月
舞鶴工業高等専門学校  電子制御工学科
 

論文

 
岡 照晃, 小町 守, 小木曽 智信, 松本 裕治
情報処理学会論文誌   54(4) 1641-1654   2013年4月   [査読有り]
生の歴史的資料の中には,濁点が期待されるのに濁点の付いていない,濁点無表記の文字が多く含まれている.濁点無表記文字は可読性・検索性を下げるため,歴史コーパス整備の際には濁点付与が行われる.しかし,濁点付与は専門家にしか行えないため,作業人員の確保が大きな課題となっている.また,作業対象が膨大であるため,作業を完了するまでにも時間がかかる.そこで本論文では,濁点付与の自動化について述べる.我々は濁点付与を文字単位のクラス分類問題として定式化した.提案手法は分類を周辺文字列の情報のみで行うため...

競争的資金等の研究課題

 
統計的機械学習を用いた歴史的資料の校訂の自動化に関する研究と自動校訂ツールの開発
日本学術振興会: 特別研究員(DC2)
研究期間: 2013年4月 - 2015年3月    代表者: 岡 照晃

講演・口頭発表等

 
UniDic―短単位辞書データベースと形態素解析―
岡 照晃
NINJALシンポジウム「データに基づく日本語研究」, 2016/12/16, 東京証券会館   2018年12月16日   
実践医療用語に現れる語構成要素の辞書構築にむけて
東条佳奈, 内山清子, 岡照晃, 小野正子, 相良かおる, 山崎誠
計量国語学会 第62回大会, 2018/09/29, 京都教育大学藤森キャンパス   2018年9月29日   
中の人が国語研日本語ウェブコーパス(NWJC)”さわって”みた―【中級編】ウェブコーパスを”さわって”みる― [招待有り]
岡 照晃
コーパスとしてのウェブテキスト活用シンポジウム (SUWTC), 2018/09/06, 国立国語研究所 [主催者]   2018年9月6日   国立国語研究所コーパス開発センター・岡 照晃
『国語研日本語ウェブコーパス』からの新規語彙素獲得の試み
岡 照晃
言語資源活用ワークショップ2018 (LRW2018), 2018/09/04-05, 国立国語研究所, 言語資源活用ワークショップ2018発表論文集 (LRW2018), pp.   2018年9月5日   国立国語研究所コーパス開発センター
実践医療用語の語構成要素抽出の試み
内山清子, 岡照晃, 東条佳奈, 小野正子, 山崎誠, 相良かおる
言語資源活用ワークショップ2018 (LRW2018), 2018/09/04-05, 国立国語研究所, 言語資源活用ワークショップ2018発表論文集 (LRW2018), pp.   2018年9月5日   国立国語研究所コーパス開発センター

Misc

 
UniDic―短単位辞書データベースと形態素解析―
岡 照晃
国立国語研究所オープンハウス2018 (2018/12/22)      2018年12月
新しいUniDicについて(UniDic四方山話)
岡 照晃
第9回入力メソッドワークショップ(IM2017)(2017/12/20)      2017年12月
乱択アルゴリズムを使った『国語研日本語ウェブコーパス』からのUniDic新語彙素候補の自動抽出
岡 照晃
第168回NINJALサロン (2017/12/26)      2017年12月
万葉集の原文-訓読文の自動アライメント ―コーパスアノテーションの効率化に向けて―
岡 照晃
第151回NINJALサロン (2016/10/18)      2016年10月
統計的機械学習を用いた歴史的資料の表記整理支援
岡 照晃
「統計と機械学習による日本語史研究」 研究発表会(合同)      2013年2月

受賞

 
2011年5月
情報処理学会第201回自然言語処理研究会 学生奨励賞
 
2009年11月
豊橋技術科学大学 平成21年度後期「卓越した技術科学者養成プログラム」
 
2009年4月
豊橋技術科学大学 平成21年度前期「卓越した技術科学者養成プログラム」
 
2008年3月
舞鶴工業高等専門学校 学業成績優秀賞
 

Works

 
岡 照晃   コンピュータソフト   2018年4月 - 現在
岡 照晃   コンピュータソフト   2018年4月 - 現在
岡 照晃   コンピュータソフト   2018年3月 - 2018年4月
岡 照晃   コンピュータソフト   2018年3月 - 2018年4月
岡 照晃   コンピュータソフト   2017年9月 - 現在

社会貢献活動

 
1時間で日本語研究体験
【講師】  国立国語研究所  横浜翠嵐高校1年生研究所訪問、見学  2017年10月20日 - 2017年10月20日
講義時に使用したスライドを資料公開のページにて公開しています.

その他

 
2018年9月
コーパスとしてのウェブテキスト活用シンポジウム
Symposium for Utilization of Web Texts as Corpora (SUWTC)
主催・運営
2018年9月
言語資源活用ワークショップ2018(LRW2018)運営
クラウドソーシングによるUniDicへの構成語と関連語情報の大規模付与
平成30年度所長裁量経費に関する公募(2018/7-2019/3)
「元の語形が一般にあまり使われることがない」か否かの判断~クラウドソーシングを用いたUniDic登録略語規定の見直し
平成29年度所長裁量経費に関する公募(2017/12-2018/3)
2017年9月
言語資源活用ワークショップ2017(LRW2017)運営
2017年3月
言語資源活用ワークショップ2016(LRW2016)運営
2015年12月
食生活アドバイザー2級 (2015年12月) FLAネットワーク協会