SlideShare a Scribd company logo
1 of 33
Download to read offline
次世代シーケンサ解析で
新たに求められる機械学習

東京工業大学 大学院情報理工学研究科
          瀬々 潤
   sesejun@cs.titech.ac.jp


   2011/11/10 @ IBIS 2011
遺伝子                   DNA(ゲノム)



                                             mRNA




                                     タンパク質




        細胞


Illustrations are © 2011 DBCLS Licensed
under a Creative Commons 表示 2.1 日本 License
                                                         2
次世代シーケンサとは?
  •   DNAを読む機械
  •   単純にはDNAを読む量が,今までより増え,安価になっただけ
      の機械.ただ,その規模が半端ない.
  •   大規模データの扱い→統計解析→学習モデルへ?

  長さ                   次世代シーケンサ
                      (第3世代,2010∼)
                   7万本 x2000bp



               96本 x500bp
          サンガー法                    次世代シーケンサ
          (ヒトゲノムが読まれた             (第2世代, 2005∼)
円の大きさは    00年代前半のスペック)
精度を表す
                                   60億本 x100bp

                                 速度 or コスト
単に読める塩基が増えただけ?
•   「シーケンスをする」という用途は多様
    •   高速かつ安価になったことで,今までコストや時間
        の面から不可能と思われていた実験が現実になる
    •   既存の方法が置き換えられる例
        •   マイクロアレイからRNA-seqへ




        Mcpherson JD. 2009. Next-generation gap.

        Nature Methods 6: S2–S5.
マイクロアレイ
                         DNA
                         mRNA
                        (遺伝子)




                   マイクロアレイ


                         発現量

•   遺伝子の量を蛍光強度に変換して観測
RNA-seq
                         DNA
                         mRNA

                次世代シーケンサ
                から得られるリード
                (100塩基程度の塩基配列)

                        リードのマッピング
                        (リードをゲノムの
                        領域に対応付ける)



                         発現量

•   遺伝子の量をリードの数を数えることで定量化
機械学習の応用範囲
  進化                 配列アセンブリ                     ゲノム科学

                        配列                  遺伝子発見
          系統樹作成      アラインメント      翻訳領域予測    RNA遺伝子予測             システム生物学
                                                       スプライス
                                              選択的       部位予測
                     オペロン予測                 スプライシング
      ゲノム                 遺伝子      転写因子
                                                                 シグナルネットワーク
                                              連鎖解析(SNPs, GWAS)
      の比較                機能比較     結合部位予測
                                               メチル化サイト予測
                                                                  代謝パスウエイ

                          遺伝子
                         機能予測                    RNA構造予測         遺伝子ネットワーク
           専門用語
  マイニング
   テキスト




          の対応付け
                        タンパク質       タンパク質      タンパク質構造予測          ネットワーク
                        機能予測        局在予測                            予測
           知識抽出        機能予測        タンパク質間       構造予測




                                                                           マイクロアレイ
                                   相互作用予測


                                                                 マイクロアレイ
                                             質量分析データ前処理          データ前処理
                                    実験データ
                                      解析      質量分析データ解析
                                                                 マイクロアレイ
                    タンパク質                                         データ解析

                                                                 マイクロアレイ
     Larranaga et al. 2006.         画像解析       医療画像解析
                                                                   画像解析
Briefings in Bioinformatics. を改変
次世代シーケンサの影響範囲
  進化                 配列アセンブリ                     ゲノム科学

                        配列                  遺伝子発見
          系統樹作成      アラインメント      翻訳領域予測    RNA遺伝子予測             システム生物学
                                                       スプライス
                                              選択的       部位予測
                     オペロン予測                 スプライシング
      ゲノム                 遺伝子      転写因子
                                                                 シグナルネットワーク
                                              連鎖解析(SNPs, GWAS)
      の比較                機能比較     結合部位予測
                                               メチル化サイト予測
                                                                  代謝パスウエイ

                          遺伝子
                         機能予測                    RNA構造予測         遺伝子ネットワーク
           専門用語
  マイニング
   テキスト




          の対応付け
                        タンパク質       タンパク質      タンパク質構造予測          ネットワーク
                        機能予測        局在予測                            予測
           知識抽出        機能予測        タンパク質間       構造予測




                                                                           マイクロアレイ
                                   相互作用予測


                                                                 マイクロアレイ
                                             質量分析データ前処理          データ前処理
                                    実験データ
                                      解析      質量分析データ解析
                                                                 マイクロアレイ
                    タンパク質                                         データ解析

                                                                 マイクロアレイ
     Larranaga et al. 2006.         画像解析       医療画像解析
                                                                   画像解析
Briefings in Bioinformatics. を改変
Re-               ChIP-seq/
                                                  Genome      Meta-      mRNA
                sequencing/ RNA-seq    MeDIP/
                methylation                       Assembly   Genomics   assembly
                                      CLIP-seq

 parameter
                   ⃝          ⃝          ◎           ⃝
   fitting

unsupervised
   learning        ⃝          ⃝          ⃝           ⃝          ◎          ⃝
 (clustering)
    semi-
 supervised        ◎          ⃝          ⃝                      ⃝          ⃝
  learning

 supervised
                   ⃝          ⃝                                 ⃝          ◎
  learning


  committee
                                         ◎                      ⃝
(モデルの結合)
Re-               ChIP-seq/
                                                  Genome      Meta-      mRNA
                sequencing/ RNA-seq    MeDIP/
                methylation                       Assembly   Genomics   assembly
                                      CLIP-seq

 parameter
                   ⃝          ⃝          ◎           ⃝
   fitting

unsupervised
   learning        ⃝          ⃝          ⃝           ⃝          ◎          ⃝
 (clustering)
    semi-
 supervised        ◎          ⃝          ⃝                      ⃝          ⃝
  learning

 supervised
                   ⃝          ⃝                                 ⃝          ◎
  learning


  committee
                                         ◎                      ⃝
(モデルの結合)
Re-sequencing
•   異なる個人の配列をシークエンスする
    •   ゲノム配列の種族間の差,個人間の差を明確にする
    •   James Watson Genotype Viewer
        •   http://jimwatsonsequence.cshl.edu/about.html
SNPs/GWAS
  •   個人間のゲノムの違いを調べる

                                          対象者のゲノム


                           次世代シーケンサで読む
                          参照ゲノムにマッピングする


                     C                     ヒトの
      T              C
      G              T
                                          参照ゲノム
                塩基置換
SNPs (single nucleotide polymorphisms),
GWAS (genome wide association study)
                         疾患との関連性を見つける
•     各readは,他のreadの情報と独立に,参照ゲノムに
               マッピングされる
         •     2個のSNPsが存在する様に見えるが,おそらく本当は
               4塩基の欠失が起きている例
         •     各置換に確率分布を設定し,Bayes Gasussian
               mixture modelでモデル化
DePristo MA, Banks E, Poplin R, Garimella KV, Maguire JR, Hartl C, Philippakis AA, del Angel G, Rivas MA, Hanna M, et al. 2011.
   A framework for variation discovery and genotyping using next-generation DNA sequencing data. Nat Genet 43: 491–498.
その他の問題
•       家系図が与えられている上で本当に疾患に関連している
        mutationを見つける

    •    ベイズ的な方法の利用

•       mutation集合が与えられた上で,細胞の分裂系譜を予測する

    •    因果関係の予測

    T    C




              T   T

                      G   C   G   T   T   T

    G    T
Re-               ChIP-seq/
                                                  Genome      Meta-      mRNA
                sequencing/ RNA-seq    MeDIP/
                methylation                       Assembly   Genomics   assembly
                                      CLIP-seq

 parameter
                   ⃝          ⃝          ◎           ⃝
   fitting

unsupervised
   learning        ⃝          ⃝          ⃝           ⃝          ◎          ⃝
 (clustering)
    semi-
 supervised        ◎          ⃝          ⃝                      ⃝          ⃝
  learning

 supervised
                   ⃝          ⃝                                 ⃝          ◎
  learning


  committee
                                         ◎                      ⃝
(モデルの結合)
RNA-seq
スプライシング(Splicing)
•   一つの遺伝子のDNA領域は,途中使われない事もある.
選択的スプライシング
    (alternative splicing)
•   一つの遺伝子から,複数の異なるスプライシングが起きる
    ことがある.特に高等生物の神経系でよく見られる.

•   観測できるのは,複数のスプライシングの値の総和.

•   元のスプライシングパターンを知りたい.




                                 ?
ISMB 2010 NGS TutorialのSlideより
RNA-seqで変わる行列
                                          サンプル数 m
•   マイクロアレイ

    •   n遺伝子 x mサンプル          遺伝子数 n
•   RNA-seq

    •   遺伝子数nが(ざっくり言って)5倍以上に増加

        •   選択的スプライシング

        •   non-codingRNA

    •   観測レンジ,定量性の向上


                            non-coding RNA. 遺伝子領域以外.
                            タンパク質にならない.
RNA-seq (定量化後)
•   定量化の後は,基本的にマイクロアレイと同様
    •   遺伝子数は増加.
    •   データの精度向上,粒度向上によるデータ量の増加
•   手法
    •   クラスタリング
        •   類似の挙動を示す遺伝子群の発見
    •   クラス分類
        •   疾患予測


•   SNPs/GWASと併せて,両親いずれの遺伝子が発現したの
    かを同定する観測も進んでいる
    •   アリル特異的な発現
Re-               ChIP-seq/
                                                  Genome      Meta-      mRNA
                sequencing/ RNA-seq    MeDIP/
                methylation                       Assembly   Genomics   assembly
                                      CLIP-seq

 parameter
                   ⃝          ⃝          ◎           ⃝
   fitting

unsupervised
   learning        ⃝          ⃝          ⃝           ⃝          ◎          ⃝
 (clustering)
    semi-
 supervised        ◎          ⃝          ⃝                      ⃝          ⃝
  learning

 supervised
                   ⃝          ⃝                                 ⃝          ◎
  learning


  committee
                                         ◎                      ⃝
(モデルの結合)
ChIP-seq
 •   転写因子(遺伝子の活動をオンにするスイッチ)が,DNAに結合
     (スイッチをオンにする)した状態を取り出して,該当部分の
     DNA配列を読む.その後,その配列をゲノムにマップ.

 •   理想的にはゲノムの一部しか観測されないはずだが,現実は全
     領域に渡る.本当の結合部位を予測する.

ChIP-seq

     転写    DNA
     因子
           理想               現実
ChIP-seq(2)
•   分布の推定問題
    •   どの山が本当の結合点で,どの山が観測ノイズか.
•   答え自身も曖昧
    •   ある種のsemi-supervised learning
    •   もし,予測があっていれば,計算量は高いけれど他の種
        のゲノム情報と比較することで,ある程度の検証が可能




Feng X, Grossman R, and Stein L. 2011. PeakRanger: A cloud-enabled peak caller for ChIP-seq data. BMC Bioinformatics 12: 139.
RNA-seqとChIP-seq
•   RNA-seqで観測している遺伝子発現とChIP-seqで発現し
    ている転写因子には深い関連

    •   遺伝子が発現するスイッチを入れるが転写因子

    •   他にもメチル化(スイッチのフタを開ける)や
        miRNA(スイッチを切る)など複数の要素が関連

•   これら複数のデータを組み合わせて解析する技術が必要




    ChIP-seq
               RNA-seq
Re-               ChIP-seq/
                                                  Genome      Meta-      mRNA
                sequencing/ RNA-seq    MeDIP/
                methylation                       Assembly   Genomics   assembly
                                      CLIP-seq

 parameter
                   ⃝          ⃝          ◎           ⃝
   fitting

unsupervised
   learning        ⃝          ⃝          ⃝           ⃝          ⃝          ⃝
 (clustering)
    semi-
 supervised        ◎          ⃝          ⃝                      ◎          ⃝
  learning

 supervised
                   ⃝          ⃝                                 ⃝          ◎
  learning


  committee
                                         ◎                      ⃝
(モデルの結合)
種の多様化が進む



モデル生物                       非モデル生物

既に全ゲノムが読まれている            ゲノム配列が無い
多くの研究室が研究対象としている   ほとんど全部の生物種はこちら

                      対象種が増えたことで
                      比較をする研究が増加


 1000人ゲノム(ヒト)       脊椎動物10,000種ゲノム
 1001個体ゲノム(ナズナ)
Re-               ChIP-seq/
                                                  Genome      Meta-      mRNA
                sequencing/ RNA-seq    MeDIP/
                methylation                       Assembly   Genomics   assembly
                                      CLIP-seq

 parameter
                   ⃝          ⃝          ◎           ⃝
   fitting

unsupervised
   learning        ⃝          ⃝          ⃝           ⃝          ◎          ⃝
 (clustering)
    semi-
 supervised        ◎          ⃝          ⃝                      ⃝          ⃝
  learning

 supervised
                   ⃝          ⃝                                 ⃝          ◎
  learning


  committee
                                         ◎                      ⃝
(モデルの結合)
Meta-Genomics
•   微生物ゲノムの解析
•   大きな動植物は「1種1個体」を得ることが可
    能だが,微生物は単離することが難しい
    •   複数種をまとめてゲノム解析する
•   問題
    •   腸内から得た,数億本x100bpの配列から,
        どのような種がいたか分かるか?
        •   そして,それぞれの種は,どのような役
            割を果たしているのか?
        •   話者判別に近い?
    •   土壌細菌でも同様の問題
        •   オープンな環境ほど,種数が増えるので
            大変
Wooley JC, Godzik A, and Friedberg I. 2010. A primer on metagenomics. PLoS Computational Biology 6: e1000667.
Re-               ChIP-seq/
                                                  Genome      Meta-      mRNA
                sequencing/ RNA-seq    MeDIP/
                methylation                       Assembly   Genomics   assembly
                                      CLIP-seq

 parameter
                   ⃝          ⃝          ◎           ⃝
   fitting

unsupervised
   learning        ⃝          ⃝          ⃝           ⃝          ◎          ⃝
 (clustering)
    semi-
 supervised        ◎          ⃝          ⃝                      ⃝          ⃝
  learning

 supervised
                   ⃝          ⃝                                 ⃝          ◎
  learning


  committee
                                         ◎                      ⃝
(モデルの結合)
遺伝子機能予測
 •   非モデル生物は,今までモデル生物では発見出来なかった

 •   遺伝子機能は大抵配列から決定されている

     •   配列が類似している遺伝子は,機能も類似している仮定

     •   非モデル生物では,配列類似性の低い遺伝子も多い

モデル生物の領域                非モデル生物の領域




                  モデル生物の知識を
                    活かして理解
遺伝子機能予測(2)
•   遺伝子の機能は分類が進んでいる
    •   遺伝子オントロジー
        •   DAG構造を持った機能クラス
        •   可能な限り下(細かい)分類を行いたい
•   クラスに階層構造を持った超多クラス分類問題
    •   遺伝子発現(数値ベクトル)と機能のDAG構造(階層化さ
        れたクラス)で予測.[Bi and Kwok, ICML 2011]
•   種毎に配列の傾向が異なるので,ある種の転移学習と考えられ
    ないか?

        ヒトの学習結果        猿データの予想

        ヒトの学習結果
                       うさぎデータの予想
        マウスの学習結果
次世代シーケンサの影響範囲
  進化                 配列アセンブリ                     ゲノム科学

                        配列                  遺伝子発見
          系統樹作成      アラインメント      翻訳領域予測    RNA遺伝子予測             システム生物学
                                                       スプライス
                                              選択的       部位予測
                     オペロン予測                 スプライシング
      ゲノム                 遺伝子      転写因子
                                                                 シグナルネットワーク
                                              連鎖解析(SNPs, GWAS)
      の比較                機能比較     結合部位予測
                                               メチル化サイト予測
                                                                  代謝パスウエイ

                          遺伝子
                         機能予測                    RNA構造予測         遺伝子ネットワーク
           専門用語
  マイニング
   テキスト




          の対応付け
                        タンパク質       タンパク質      タンパク質構造予測          ネットワーク
                        機能予測        局在予測                            予測
           知識抽出        機能予測        タンパク質間       構造予測




                                                                           マイクロアレイ
                                   相互作用予測


                                                                 マイクロアレイ
                                             質量分析データ前処理          データ前処理
                                    実験データ
                                      解析      質量分析データ解析
                                                                 マイクロアレイ
                    タンパク質                                         データ解析

                                                                 マイクロアレイ
     Larranaga et al. 2006.         画像解析       医療画像解析
                                                                   画像解析
Briefings in Bioinformatics. を改変

More Related Content

What's hot

機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明Satoshi Hara
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説Shiga University, RIKEN
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介Naoki Hayashi
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?Fumihiko Takahashi
 
合成変量とアンサンブル:回帰森と加法モデルの要点
合成変量とアンサンブル:回帰森と加法モデルの要点合成変量とアンサンブル:回帰森と加法モデルの要点
合成変量とアンサンブル:回帰森と加法モデルの要点Ichigaku Takigawa
 
機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話Ryota Kamoshida
 
実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)
実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)
実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)Ayako_Hasegawa
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性Satoshi Hara
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心takehikoihayashi
 
因果推論の奥へ: "What works" meets "why it works"
因果推論の奥へ: "What works" meets "why it works"因果推論の奥へ: "What works" meets "why it works"
因果推論の奥へ: "What works" meets "why it works"takehikoihayashi
 
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCHDeep Learning JP
 
1 4.回帰分析と分散分析
1 4.回帰分析と分散分析1 4.回帰分析と分散分析
1 4.回帰分析と分散分析logics-of-blue
 
因果探索: 観察データから 因果仮説を探索する
因果探索: 観察データから因果仮説を探索する因果探索: 観察データから因果仮説を探索する
因果探索: 観察データから 因果仮説を探索するShiga University, RIKEN
 
Normalization of microarray
Normalization of microarrayNormalization of microarray
Normalization of microarray弘毅 露崎
 
負の二項分布について
負の二項分布について負の二項分布について
負の二項分布についてHiroshi Shimizu
 
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度Seiichi Uchida
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII
 

What's hot (20)

機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明
 
正準相関分析
正準相関分析正準相関分析
正準相関分析
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
 
合成変量とアンサンブル:回帰森と加法モデルの要点
合成変量とアンサンブル:回帰森と加法モデルの要点合成変量とアンサンブル:回帰森と加法モデルの要点
合成変量とアンサンブル:回帰森と加法モデルの要点
 
機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話
 
実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)
実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)
実践 Amazon Mechanical Turk ※下記の注意点をご覧ください(回答の質の悪化・報酬額の相場の変化・仕様変更)
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
因果推論の奥へ: "What works" meets "why it works"
因果推論の奥へ: "What works" meets "why it works"因果推論の奥へ: "What works" meets "why it works"
因果推論の奥へ: "What works" meets "why it works"
 
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
 
1 2.t検定
1 2.t検定1 2.t検定
1 2.t検定
 
1 4.回帰分析と分散分析
1 4.回帰分析と分散分析1 4.回帰分析と分散分析
1 4.回帰分析と分散分析
 
因果探索: 観察データから 因果仮説を探索する
因果探索: 観察データから因果仮説を探索する因果探索: 観察データから因果仮説を探索する
因果探索: 観察データから 因果仮説を探索する
 
Normalization of microarray
Normalization of microarrayNormalization of microarray
Normalization of microarray
 
負の二項分布について
負の二項分布について負の二項分布について
負の二項分布について
 
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
 
BlackBox モデルの説明性・解釈性技術の実装
BlackBox モデルの説明性・解釈性技術の実装BlackBox モデルの説明性・解釈性技術の実装
BlackBox モデルの説明性・解釈性技術の実装
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
 

Viewers also liked

フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料Amelieff
 
ISMB/ECCB2015読み会イントロ+Misassembly detection using paired-end sequence reads an...
ISMB/ECCB2015読み会イントロ+Misassembly detection using paired-end sequence reads an...ISMB/ECCB2015読み会イントロ+Misassembly detection using paired-end sequence reads an...
ISMB/ECCB2015読み会イントロ+Misassembly detection using paired-end sequence reads an...Kengo Sato
 
ISMB2014読み会 イントロ + Deep learning of the tissue-regulated splicing code
ISMB2014読み会 イントロ + Deep learning of the tissue-regulated splicing codeISMB2014読み会 イントロ + Deep learning of the tissue-regulated splicing code
ISMB2014読み会 イントロ + Deep learning of the tissue-regulated splicing codeKengo Sato
 
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-SeqItoshi Nikaido
 
BGI Webinar June 6, 2014 "Genomic Big Data Analysis and Customised Analysis w...
BGI Webinar June 6, 2014 "Genomic Big Data Analysis and Customised Analysis w...BGI Webinar June 6, 2014 "Genomic Big Data Analysis and Customised Analysis w...
BGI Webinar June 6, 2014 "Genomic Big Data Analysis and Customised Analysis w...kazuoishii20
 
資料】<福島第一原子力発電所事故により放出されたヨウ素131の地表面沈着量を導出>
資料】<福島第一原子力発電所事故により放出されたヨウ素131の地表面沈着量を導出>資料】<福島第一原子力発電所事故により放出されたヨウ素131の地表面沈着量を導出>
資料】<福島第一原子力発電所事故により放出されたヨウ素131の地表面沈着量を導出>Kazuhide Fukada
 
中央大学学術講演会(2013年6月15日)ゲノム科学でわかること
中央大学学術講演会(2013年6月15日)ゲノム科学でわかること中央大学学術講演会(2013年6月15日)ゲノム科学でわかること
中央大学学術講演会(2013年6月15日)ゲノム科学でわかることY-h Taguchi
 
近大「基礎生物学」#8「細胞内の遺伝情報」130610
近大「基礎生物学」#8「細胞内の遺伝情報」130610近大「基礎生物学」#8「細胞内の遺伝情報」130610
近大「基礎生物学」#8「細胞内の遺伝情報」130610Nobuyuki Takahashi
 
第3回NGS現場の会モーニング教育セッション 配布用資料
第3回NGS現場の会モーニング教育セッション 配布用資料第3回NGS現場の会モーニング教育セッション 配布用資料
第3回NGS現場の会モーニング教育セッション 配布用資料Aya Takeda
 
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」Genaris Omics, Inc.
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)Haruka Ozaki
 
小町のレス数が予測できるか試してみた
小町のレス数が予測できるか試してみた小町のレス数が予測できるか試してみた
小町のレス数が予測できるか試してみたJubatusOfficial
 
新聞から今年の漢字を予測する
新聞から今年の漢字を予測する新聞から今年の漢字を予測する
新聞から今年の漢字を予測するJubatusOfficial
 
単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)JubatusOfficial
 
jubarecommenderの紹介
jubarecommenderの紹介jubarecommenderの紹介
jubarecommenderの紹介JubatusOfficial
 
Jubatus 新機能ハイライト
Jubatus 新機能ハイライトJubatus 新機能ハイライト
Jubatus 新機能ハイライトJubatusOfficial
 

Viewers also liked (20)

フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
 
ISMB/ECCB2015読み会イントロ+Misassembly detection using paired-end sequence reads an...
ISMB/ECCB2015読み会イントロ+Misassembly detection using paired-end sequence reads an...ISMB/ECCB2015読み会イントロ+Misassembly detection using paired-end sequence reads an...
ISMB/ECCB2015読み会イントロ+Misassembly detection using paired-end sequence reads an...
 
ISMB2014読み会 イントロ + Deep learning of the tissue-regulated splicing code
ISMB2014読み会 イントロ + Deep learning of the tissue-regulated splicing codeISMB2014読み会 イントロ + Deep learning of the tissue-regulated splicing code
ISMB2014読み会 イントロ + Deep learning of the tissue-regulated splicing code
 
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
 
BGI Webinar June 6, 2014 "Genomic Big Data Analysis and Customised Analysis w...
BGI Webinar June 6, 2014 "Genomic Big Data Analysis and Customised Analysis w...BGI Webinar June 6, 2014 "Genomic Big Data Analysis and Customised Analysis w...
BGI Webinar June 6, 2014 "Genomic Big Data Analysis and Customised Analysis w...
 
資料】<福島第一原子力発電所事故により放出されたヨウ素131の地表面沈着量を導出>
資料】<福島第一原子力発電所事故により放出されたヨウ素131の地表面沈着量を導出>資料】<福島第一原子力発電所事故により放出されたヨウ素131の地表面沈着量を導出>
資料】<福島第一原子力発電所事故により放出されたヨウ素131の地表面沈着量を導出>
 
中央大学学術講演会(2013年6月15日)ゲノム科学でわかること
中央大学学術講演会(2013年6月15日)ゲノム科学でわかること中央大学学術講演会(2013年6月15日)ゲノム科学でわかること
中央大学学術講演会(2013年6月15日)ゲノム科学でわかること
 
近大「基礎生物学」#8「細胞内の遺伝情報」130610
近大「基礎生物学」#8「細胞内の遺伝情報」130610近大「基礎生物学」#8「細胞内の遺伝情報」130610
近大「基礎生物学」#8「細胞内の遺伝情報」130610
 
201010ksmap
201010ksmap201010ksmap
201010ksmap
 
第3回NGS現場の会モーニング教育セッション 配布用資料
第3回NGS現場の会モーニング教育セッション 配布用資料第3回NGS現場の会モーニング教育セッション 配布用資料
第3回NGS現場の会モーニング教育セッション 配布用資料
 
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
 
線形計画法入門
線形計画法入門線形計画法入門
線形計画法入門
 
小町のレス数が予測できるか試してみた
小町のレス数が予測できるか試してみた小町のレス数が予測できるか試してみた
小町のレス数が予測できるか試してみた
 
新聞から今年の漢字を予測する
新聞から今年の漢字を予測する新聞から今年の漢字を予測する
新聞から今年の漢字を予測する
 
単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)
 
jubarecommenderの紹介
jubarecommenderの紹介jubarecommenderの紹介
jubarecommenderの紹介
 
Jubatus 新機能ハイライト
Jubatus 新機能ハイライトJubatus 新機能ハイライト
Jubatus 新機能ハイライト
 
jubabanditの紹介
jubabanditの紹介jubabanditの紹介
jubabanditの紹介
 
JubaQLご紹介
JubaQLご紹介JubaQLご紹介
JubaQLご紹介
 

Similar to 次世代シーケンサが求める機械学習

遺伝子(勉強会)
遺伝子(勉強会)遺伝子(勉強会)
遺伝子(勉強会)nozma
 
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料Genaris Omics, Inc.
 
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析Amelieff
 
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベースDNA Data Bank of Japan center
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクスMas Kot
 
Protein-Protein Interaction Prediction
Protein-Protein Interaction PredictionProtein-Protein Interaction Prediction
Protein-Protein Interaction PredictionMasahito Ohue
 
150304 science council of japan-kawaji
150304 science council of japan-kawaji150304 science council of japan-kawaji
150304 science council of japan-kawajiHideya Kawaji
 
DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正弘毅 露崎
 

Similar to 次世代シーケンサが求める機械学習 (12)

kita m
kita mkita m
kita m
 
遺伝子(勉強会)
遺伝子(勉強会)遺伝子(勉強会)
遺伝子(勉強会)
 
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
 
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
 
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
 
StatGenSummerSchool2023_GenomeDataAnalysis3.pdf
StatGenSummerSchool2023_GenomeDataAnalysis3.pdfStatGenSummerSchool2023_GenomeDataAnalysis3.pdf
StatGenSummerSchool2023_GenomeDataAnalysis3.pdf
 
Protein-Protein Interaction Prediction
Protein-Protein Interaction PredictionProtein-Protein Interaction Prediction
Protein-Protein Interaction Prediction
 
ENCODE勉強会
ENCODE勉強会ENCODE勉強会
ENCODE勉強会
 
150304 science council of japan-kawaji
150304 science council of japan-kawaji150304 science council of japan-kawaji
150304 science council of japan-kawaji
 
DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正
 
臨床検査9月号2011
臨床検査9月号2011臨床検査9月号2011
臨床検査9月号2011
 

More from sesejun

20110602labseminar pub
20110602labseminar pub20110602labseminar pub
20110602labseminar pubsesejun
 
20110524zurichngs 2nd pub
20110524zurichngs 2nd pub20110524zurichngs 2nd pub
20110524zurichngs 2nd pubsesejun
 
20110524zurichngs 1st pub
20110524zurichngs 1st pub20110524zurichngs 1st pub
20110524zurichngs 1st pubsesejun
 
20110214nips2010 read
20110214nips2010 read20110214nips2010 read
20110214nips2010 readsesejun
 
Datamining 9th association_rule.key
Datamining 9th association_rule.keyDatamining 9th association_rule.key
Datamining 9th association_rule.keysesejun
 
Datamining 8th hclustering
Datamining 8th hclusteringDatamining 8th hclustering
Datamining 8th hclusteringsesejun
 
Datamining r 4th
Datamining r 4thDatamining r 4th
Datamining r 4thsesejun
 
Datamining r 3rd
Datamining r 3rdDatamining r 3rd
Datamining r 3rdsesejun
 
Datamining r 2nd
Datamining r 2ndDatamining r 2nd
Datamining r 2ndsesejun
 
Datamining r 1st
Datamining r 1stDatamining r 1st
Datamining r 1stsesejun
 
Datamining 6th svm
Datamining 6th svmDatamining 6th svm
Datamining 6th svmsesejun
 
Datamining 5th knn
Datamining 5th knnDatamining 5th knn
Datamining 5th knnsesejun
 
Datamining 4th adaboost
Datamining 4th adaboostDatamining 4th adaboost
Datamining 4th adaboostsesejun
 
Datamining 3rd naivebayes
Datamining 3rd naivebayesDatamining 3rd naivebayes
Datamining 3rd naivebayessesejun
 
Datamining 2nd decisiontree
Datamining 2nd decisiontreeDatamining 2nd decisiontree
Datamining 2nd decisiontreesesejun
 
Datamining 7th kmeans
Datamining 7th kmeansDatamining 7th kmeans
Datamining 7th kmeanssesejun
 
100401 Bioinfoinfra
100401 Bioinfoinfra100401 Bioinfoinfra
100401 Bioinfoinfrasesejun
 
Datamining 8th Hclustering
Datamining 8th HclusteringDatamining 8th Hclustering
Datamining 8th Hclusteringsesejun
 
Datamining 9th Association Rule
Datamining 9th Association RuleDatamining 9th Association Rule
Datamining 9th Association Rulesesejun
 
Datamining 9th Association Rule
Datamining 9th Association RuleDatamining 9th Association Rule
Datamining 9th Association Rulesesejun
 

More from sesejun (20)

20110602labseminar pub
20110602labseminar pub20110602labseminar pub
20110602labseminar pub
 
20110524zurichngs 2nd pub
20110524zurichngs 2nd pub20110524zurichngs 2nd pub
20110524zurichngs 2nd pub
 
20110524zurichngs 1st pub
20110524zurichngs 1st pub20110524zurichngs 1st pub
20110524zurichngs 1st pub
 
20110214nips2010 read
20110214nips2010 read20110214nips2010 read
20110214nips2010 read
 
Datamining 9th association_rule.key
Datamining 9th association_rule.keyDatamining 9th association_rule.key
Datamining 9th association_rule.key
 
Datamining 8th hclustering
Datamining 8th hclusteringDatamining 8th hclustering
Datamining 8th hclustering
 
Datamining r 4th
Datamining r 4thDatamining r 4th
Datamining r 4th
 
Datamining r 3rd
Datamining r 3rdDatamining r 3rd
Datamining r 3rd
 
Datamining r 2nd
Datamining r 2ndDatamining r 2nd
Datamining r 2nd
 
Datamining r 1st
Datamining r 1stDatamining r 1st
Datamining r 1st
 
Datamining 6th svm
Datamining 6th svmDatamining 6th svm
Datamining 6th svm
 
Datamining 5th knn
Datamining 5th knnDatamining 5th knn
Datamining 5th knn
 
Datamining 4th adaboost
Datamining 4th adaboostDatamining 4th adaboost
Datamining 4th adaboost
 
Datamining 3rd naivebayes
Datamining 3rd naivebayesDatamining 3rd naivebayes
Datamining 3rd naivebayes
 
Datamining 2nd decisiontree
Datamining 2nd decisiontreeDatamining 2nd decisiontree
Datamining 2nd decisiontree
 
Datamining 7th kmeans
Datamining 7th kmeansDatamining 7th kmeans
Datamining 7th kmeans
 
100401 Bioinfoinfra
100401 Bioinfoinfra100401 Bioinfoinfra
100401 Bioinfoinfra
 
Datamining 8th Hclustering
Datamining 8th HclusteringDatamining 8th Hclustering
Datamining 8th Hclustering
 
Datamining 9th Association Rule
Datamining 9th Association RuleDatamining 9th Association Rule
Datamining 9th Association Rule
 
Datamining 9th Association Rule
Datamining 9th Association RuleDatamining 9th Association Rule
Datamining 9th Association Rule
 

Recently uploaded

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Hiroshi Tomioka
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 

Recently uploaded (11)

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 

次世代シーケンサが求める機械学習

  • 2. 遺伝子 DNA(ゲノム) mRNA タンパク質 細胞 Illustrations are © 2011 DBCLS Licensed under a Creative Commons 表示 2.1 日本 License 2
  • 3. 次世代シーケンサとは? • DNAを読む機械 • 単純にはDNAを読む量が,今までより増え,安価になっただけ の機械.ただ,その規模が半端ない. • 大規模データの扱い→統計解析→学習モデルへ? 長さ 次世代シーケンサ (第3世代,2010∼) 7万本 x2000bp 96本 x500bp サンガー法 次世代シーケンサ (ヒトゲノムが読まれた (第2世代, 2005∼) 円の大きさは 00年代前半のスペック) 精度を表す 60億本 x100bp 速度 or コスト
  • 4. 単に読める塩基が増えただけ? • 「シーケンスをする」という用途は多様 • 高速かつ安価になったことで,今までコストや時間 の面から不可能と思われていた実験が現実になる • 既存の方法が置き換えられる例 • マイクロアレイからRNA-seqへ Mcpherson JD. 2009. Next-generation gap. Nature Methods 6: S2–S5.
  • 5. マイクロアレイ DNA mRNA (遺伝子) マイクロアレイ 発現量 • 遺伝子の量を蛍光強度に変換して観測
  • 6. RNA-seq DNA mRNA 次世代シーケンサ から得られるリード (100塩基程度の塩基配列) リードのマッピング (リードをゲノムの 領域に対応付ける) 発現量 • 遺伝子の量をリードの数を数えることで定量化
  • 7. 機械学習の応用範囲 進化 配列アセンブリ ゲノム科学 配列 遺伝子発見 系統樹作成 アラインメント 翻訳領域予測 RNA遺伝子予測 システム生物学 スプライス 選択的 部位予測 オペロン予測 スプライシング ゲノム 遺伝子 転写因子 シグナルネットワーク 連鎖解析(SNPs, GWAS) の比較 機能比較 結合部位予測 メチル化サイト予測 代謝パスウエイ 遺伝子 機能予測 RNA構造予測 遺伝子ネットワーク 専門用語 マイニング テキスト の対応付け タンパク質 タンパク質 タンパク質構造予測 ネットワーク 機能予測 局在予測 予測 知識抽出 機能予測 タンパク質間 構造予測 マイクロアレイ 相互作用予測 マイクロアレイ 質量分析データ前処理 データ前処理 実験データ 解析 質量分析データ解析 マイクロアレイ タンパク質 データ解析 マイクロアレイ Larranaga et al. 2006. 画像解析 医療画像解析 画像解析 Briefings in Bioinformatics. を改変
  • 8. 次世代シーケンサの影響範囲 進化 配列アセンブリ ゲノム科学 配列 遺伝子発見 系統樹作成 アラインメント 翻訳領域予測 RNA遺伝子予測 システム生物学 スプライス 選択的 部位予測 オペロン予測 スプライシング ゲノム 遺伝子 転写因子 シグナルネットワーク 連鎖解析(SNPs, GWAS) の比較 機能比較 結合部位予測 メチル化サイト予測 代謝パスウエイ 遺伝子 機能予測 RNA構造予測 遺伝子ネットワーク 専門用語 マイニング テキスト の対応付け タンパク質 タンパク質 タンパク質構造予測 ネットワーク 機能予測 局在予測 予測 知識抽出 機能予測 タンパク質間 構造予測 マイクロアレイ 相互作用予測 マイクロアレイ 質量分析データ前処理 データ前処理 実験データ 解析 質量分析データ解析 マイクロアレイ タンパク質 データ解析 マイクロアレイ Larranaga et al. 2006. 画像解析 医療画像解析 画像解析 Briefings in Bioinformatics. を改変
  • 9. Re- ChIP-seq/ Genome Meta- mRNA sequencing/ RNA-seq MeDIP/ methylation Assembly Genomics assembly CLIP-seq parameter ⃝ ⃝ ◎ ⃝ fitting unsupervised learning ⃝ ⃝ ⃝ ⃝ ◎ ⃝ (clustering) semi- supervised ◎ ⃝ ⃝ ⃝ ⃝ learning supervised ⃝ ⃝ ⃝ ◎ learning committee ◎ ⃝ (モデルの結合)
  • 10. Re- ChIP-seq/ Genome Meta- mRNA sequencing/ RNA-seq MeDIP/ methylation Assembly Genomics assembly CLIP-seq parameter ⃝ ⃝ ◎ ⃝ fitting unsupervised learning ⃝ ⃝ ⃝ ⃝ ◎ ⃝ (clustering) semi- supervised ◎ ⃝ ⃝ ⃝ ⃝ learning supervised ⃝ ⃝ ⃝ ◎ learning committee ◎ ⃝ (モデルの結合)
  • 11. Re-sequencing • 異なる個人の配列をシークエンスする • ゲノム配列の種族間の差,個人間の差を明確にする • James Watson Genotype Viewer • http://jimwatsonsequence.cshl.edu/about.html
  • 12. SNPs/GWAS • 個人間のゲノムの違いを調べる 対象者のゲノム 次世代シーケンサで読む 参照ゲノムにマッピングする C ヒトの T C G T 参照ゲノム 塩基置換 SNPs (single nucleotide polymorphisms), GWAS (genome wide association study) 疾患との関連性を見つける
  • 13. 各readは,他のreadの情報と独立に,参照ゲノムに マッピングされる • 2個のSNPsが存在する様に見えるが,おそらく本当は 4塩基の欠失が起きている例 • 各置換に確率分布を設定し,Bayes Gasussian mixture modelでモデル化 DePristo MA, Banks E, Poplin R, Garimella KV, Maguire JR, Hartl C, Philippakis AA, del Angel G, Rivas MA, Hanna M, et al. 2011. A framework for variation discovery and genotyping using next-generation DNA sequencing data. Nat Genet 43: 491–498.
  • 14. その他の問題 • 家系図が与えられている上で本当に疾患に関連している mutationを見つける • ベイズ的な方法の利用 • mutation集合が与えられた上で,細胞の分裂系譜を予測する • 因果関係の予測 T C T T G C G T T T G T
  • 15. Re- ChIP-seq/ Genome Meta- mRNA sequencing/ RNA-seq MeDIP/ methylation Assembly Genomics assembly CLIP-seq parameter ⃝ ⃝ ◎ ⃝ fitting unsupervised learning ⃝ ⃝ ⃝ ⃝ ◎ ⃝ (clustering) semi- supervised ◎ ⃝ ⃝ ⃝ ⃝ learning supervised ⃝ ⃝ ⃝ ◎ learning committee ◎ ⃝ (モデルの結合)
  • 17. スプライシング(Splicing) • 一つの遺伝子のDNA領域は,途中使われない事もある.
  • 18. 選択的スプライシング (alternative splicing) • 一つの遺伝子から,複数の異なるスプライシングが起きる ことがある.特に高等生物の神経系でよく見られる. • 観測できるのは,複数のスプライシングの値の総和. • 元のスプライシングパターンを知りたい. ?
  • 19. ISMB 2010 NGS TutorialのSlideより
  • 20. RNA-seqで変わる行列 サンプル数 m • マイクロアレイ • n遺伝子 x mサンプル 遺伝子数 n • RNA-seq • 遺伝子数nが(ざっくり言って)5倍以上に増加 • 選択的スプライシング • non-codingRNA • 観測レンジ,定量性の向上 non-coding RNA. 遺伝子領域以外. タンパク質にならない.
  • 21. RNA-seq (定量化後) • 定量化の後は,基本的にマイクロアレイと同様 • 遺伝子数は増加. • データの精度向上,粒度向上によるデータ量の増加 • 手法 • クラスタリング • 類似の挙動を示す遺伝子群の発見 • クラス分類 • 疾患予測 • SNPs/GWASと併せて,両親いずれの遺伝子が発現したの かを同定する観測も進んでいる • アリル特異的な発現
  • 22. Re- ChIP-seq/ Genome Meta- mRNA sequencing/ RNA-seq MeDIP/ methylation Assembly Genomics assembly CLIP-seq parameter ⃝ ⃝ ◎ ⃝ fitting unsupervised learning ⃝ ⃝ ⃝ ⃝ ◎ ⃝ (clustering) semi- supervised ◎ ⃝ ⃝ ⃝ ⃝ learning supervised ⃝ ⃝ ⃝ ◎ learning committee ◎ ⃝ (モデルの結合)
  • 23. ChIP-seq • 転写因子(遺伝子の活動をオンにするスイッチ)が,DNAに結合 (スイッチをオンにする)した状態を取り出して,該当部分の DNA配列を読む.その後,その配列をゲノムにマップ. • 理想的にはゲノムの一部しか観測されないはずだが,現実は全 領域に渡る.本当の結合部位を予測する. ChIP-seq 転写 DNA 因子 理想 現実
  • 24. ChIP-seq(2) • 分布の推定問題 • どの山が本当の結合点で,どの山が観測ノイズか. • 答え自身も曖昧 • ある種のsemi-supervised learning • もし,予測があっていれば,計算量は高いけれど他の種 のゲノム情報と比較することで,ある程度の検証が可能 Feng X, Grossman R, and Stein L. 2011. PeakRanger: A cloud-enabled peak caller for ChIP-seq data. BMC Bioinformatics 12: 139.
  • 25. RNA-seqとChIP-seq • RNA-seqで観測している遺伝子発現とChIP-seqで発現し ている転写因子には深い関連 • 遺伝子が発現するスイッチを入れるが転写因子 • 他にもメチル化(スイッチのフタを開ける)や miRNA(スイッチを切る)など複数の要素が関連 • これら複数のデータを組み合わせて解析する技術が必要 ChIP-seq RNA-seq
  • 26. Re- ChIP-seq/ Genome Meta- mRNA sequencing/ RNA-seq MeDIP/ methylation Assembly Genomics assembly CLIP-seq parameter ⃝ ⃝ ◎ ⃝ fitting unsupervised learning ⃝ ⃝ ⃝ ⃝ ⃝ ⃝ (clustering) semi- supervised ◎ ⃝ ⃝ ◎ ⃝ learning supervised ⃝ ⃝ ⃝ ◎ learning committee ◎ ⃝ (モデルの結合)
  • 27. 種の多様化が進む モデル生物 非モデル生物 既に全ゲノムが読まれている ゲノム配列が無い 多くの研究室が研究対象としている ほとんど全部の生物種はこちら 対象種が増えたことで 比較をする研究が増加 1000人ゲノム(ヒト) 脊椎動物10,000種ゲノム 1001個体ゲノム(ナズナ)
  • 28. Re- ChIP-seq/ Genome Meta- mRNA sequencing/ RNA-seq MeDIP/ methylation Assembly Genomics assembly CLIP-seq parameter ⃝ ⃝ ◎ ⃝ fitting unsupervised learning ⃝ ⃝ ⃝ ⃝ ◎ ⃝ (clustering) semi- supervised ◎ ⃝ ⃝ ⃝ ⃝ learning supervised ⃝ ⃝ ⃝ ◎ learning committee ◎ ⃝ (モデルの結合)
  • 29. Meta-Genomics • 微生物ゲノムの解析 • 大きな動植物は「1種1個体」を得ることが可 能だが,微生物は単離することが難しい • 複数種をまとめてゲノム解析する • 問題 • 腸内から得た,数億本x100bpの配列から, どのような種がいたか分かるか? • そして,それぞれの種は,どのような役 割を果たしているのか? • 話者判別に近い? • 土壌細菌でも同様の問題 • オープンな環境ほど,種数が増えるので 大変 Wooley JC, Godzik A, and Friedberg I. 2010. A primer on metagenomics. PLoS Computational Biology 6: e1000667.
  • 30. Re- ChIP-seq/ Genome Meta- mRNA sequencing/ RNA-seq MeDIP/ methylation Assembly Genomics assembly CLIP-seq parameter ⃝ ⃝ ◎ ⃝ fitting unsupervised learning ⃝ ⃝ ⃝ ⃝ ◎ ⃝ (clustering) semi- supervised ◎ ⃝ ⃝ ⃝ ⃝ learning supervised ⃝ ⃝ ⃝ ◎ learning committee ◎ ⃝ (モデルの結合)
  • 31. 遺伝子機能予測 • 非モデル生物は,今までモデル生物では発見出来なかった • 遺伝子機能は大抵配列から決定されている • 配列が類似している遺伝子は,機能も類似している仮定 • 非モデル生物では,配列類似性の低い遺伝子も多い モデル生物の領域 非モデル生物の領域 モデル生物の知識を 活かして理解
  • 32. 遺伝子機能予測(2) • 遺伝子の機能は分類が進んでいる • 遺伝子オントロジー • DAG構造を持った機能クラス • 可能な限り下(細かい)分類を行いたい • クラスに階層構造を持った超多クラス分類問題 • 遺伝子発現(数値ベクトル)と機能のDAG構造(階層化さ れたクラス)で予測.[Bi and Kwok, ICML 2011] • 種毎に配列の傾向が異なるので,ある種の転移学習と考えられ ないか? ヒトの学習結果 猿データの予想 ヒトの学習結果 うさぎデータの予想 マウスの学習結果
  • 33. 次世代シーケンサの影響範囲 進化 配列アセンブリ ゲノム科学 配列 遺伝子発見 系統樹作成 アラインメント 翻訳領域予測 RNA遺伝子予測 システム生物学 スプライス 選択的 部位予測 オペロン予測 スプライシング ゲノム 遺伝子 転写因子 シグナルネットワーク 連鎖解析(SNPs, GWAS) の比較 機能比較 結合部位予測 メチル化サイト予測 代謝パスウエイ 遺伝子 機能予測 RNA構造予測 遺伝子ネットワーク 専門用語 マイニング テキスト の対応付け タンパク質 タンパク質 タンパク質構造予測 ネットワーク 機能予測 局在予測 予測 知識抽出 機能予測 タンパク質間 構造予測 マイクロアレイ 相互作用予測 マイクロアレイ 質量分析データ前処理 データ前処理 実験データ 解析 質量分析データ解析 マイクロアレイ タンパク質 データ解析 マイクロアレイ Larranaga et al. 2006. 画像解析 医療画像解析 画像解析 Briefings in Bioinformatics. を改変