2017年6月 - 2021年3月
RNA-クロマチン相互作用予測と応用
日本学術振興会 科学研究費助成事業 挑戦的研究(萌芽) 挑戦的研究(萌芽)
哺乳類ゲノムの大部分は,コーディングあるいはノンコーディングRNAを転写している.このうちノンコーディングRNAの一部は,クロマチンと相互作用を行い,エピジェネティックな制御を行っていることが示唆されている.RNAとクロマチン相互作用のメカニズムを解明するために,lncRNAとクロマチンの相互作用予測を行うモデルを構築し,構築したモデルからどのような特徴が相互作用い寄与しているかの検討を行った.今回考えた特徴としては下記のものである:R-loop形成,RNA:DNA triplex, RNA結合によるscafold.このうち,R-loop形成に関しては配列相補性をアラインメントにより同定することにより推定した.またこの際には,RNAアクセシビリティも考慮するようにした.RNA:DNA triplexに関しては,既存のtriplex予測ツールを利用した.機械学習モデルとしては,ランダムフォレストを主に利用した.これは,ランダムフォレストは,分類に寄与した特徴量の導出が容易に可能となるためである.実際のデータとしては,RNAクロマチン相互作用に関する大規模実験データを用いて,正例と負例を作成し,構築したモデルの学習を行った.予測精度の評価はクロスバリデーションを用いたが,現状十分な予測精度は出ていない.特徴量および学習データの両面から現在詳細に検討を行っている段階である.機械学習モデルに関しても深層学習なども含めて検討を行うことを計画している.
- ID情報
-
- 課題番号 : 17K20032
- 体系的課題番号 : JP17K20032