SlideShare a Scribd company logo
1 of 28
Download to read offline
ヒト、チンパンジー、マウスに
おけるトリプレットリピートの
網羅的解析
ゲノムにおけるリピート
             散在型反復配列
                 短散在型核因子(SINE)
                 長散在型核因子(LINE)
   反復配列          LTRエレメント
   約70%          DNAトランスポゾン

             縦型反復配列
                 サテライトDNA
                 ミニサテライト
                 マイクロサテライト
                   • 反復単位1-6 bp
ゲノムにおけるリピート
                         散在型反復配列
                             短散在型核因子(SINE)
                             長散在型核因子(LINE)
             反復配列            LTRエレメント
             約70%            DNAトランスポゾン

                         縦型反復配列
                             サテライトDNA
                             ミニサテライト
                             マイクロサテライト
                               • 反復単位1-6 bp



反復単位が3つ組であるトリプレットリピートが注目される
(例) ‥ CAG CAG CAG CAG CAG CAG‥ →CAGリピート
トリプレットリピート病
    リピートの異常伸長がもたらす遺伝性疾患の総称
              CAG   ポリグルタミン病         GCN ポリアラニン病
               ハンチントン病                 眼咽頭型筋ジストロフィー
               脊椎小脳失調症 1, 2型   など      手足性器症候群    など

 5’末端                                                        3’末端
                     イントロン
     5’UTR          イントロン       翻訳領域
                                翻訳領域                     3’UTR

脊髄小脳失調症12型 CAG          フリードライヒ症候群   GAA       筋強直性ジストロフィー1型 CTG




             リピートの長さの例
                                       正常       疾患
             ハンチントン病                 11~34     36~121
             筋強直性ジストロフィー1型           5~37      50~5000
リピートのインシリコ解析の現状
   遺伝子領域と遺伝子間領域を区別しない
    網羅的な解析が主流
   オーソログ遺伝子での比較はほとんど行われていない

   リピートが機能部位であるかはまだ不明
   リピートとタンパク質の機能を研究した例は少ない




        翻訳領域のリピートを対象
本研究の流れ
   リピートの再定義

   生物種ごとにリピートの分布の違いはあるのか?
       分断配列の由来
       ヒト、チンパンジー、マウスにおけるリピートの
        網羅的解析

   リピートの進化的な形成速度は生物種によって
    差はあるのか?
       ヒトとマウスのオーソログ遺伝子におけるリピート

   リピートを持つタンパク質は機能に偏りが
    あるのか?
       ヒトでリピートを持つタンパク質の機能
本研究の流れ
   リピートの再定義

   生物種ごとにリピートの分布の違いはあるのか?
       分断配列の由来
       ヒト、チンパンジー、マウスにおけるリピートの
        網羅的解析

   リピートの進化的な形成速度は生物種によって
    差はあるのか?
       ヒトとマウスのオーソログ遺伝子におけるリピート

   リピートを持つタンパク質は機能に偏りが
    あるのか?
       ヒトでリピートを持つタンパク質の機能
リピートの数え方と問題点
   現在のリピートの数え方       例)
                       ・・・CAG CAG CAG CAG CAG CAG・・・
       連続するトリプレットを
        リピートとして数える          ①    ②   ③   ④   ⑤   ⑥
                                     ↓
                                長さ6のCAGリピート
リピートの数え方と問題点
   現在のリピートの数え方       例)
                       ・・・CAG CAG CAG CAG CAG CAG・・・
       連続するトリプレットを
        リピートとして数える          ①    ②   ③   ④   ⑤   ⑥
                                     ↓
                                長さ6のCAGリピート
   しかし、リピートには
                      例)脊髄小脳失調症1型の原因遺伝子SCA1
    分断配列を持つものが
                       ・・・ (CAG)12CATCAGCAT (CAG)14・・・
    存在する
                                      ↓
                        長さ12のリピートと14のリピート?

           例)脊髄小脳失調症1型(SCA1)の患者
           分断配列CATを持つ患者の方が
            発症年齢が遅い

            症状が和らげられる
本研究での解析手法
    従来行われていなかった分断配列を考慮して
    リピートの網羅的解析を行う


   トリプレットリピート病の原因に
    より近い部位を抽出できる
   リピートの進化的な比較が行いやすくなる
     例) Crebbp遺伝子の場合

     ヒト    QQQQQQQQQQQQQQQQQQ   (連続したQ=18)
     マウス   QHQQQQQQQQQQQQQQQ    (連続したQ=15)

     ヒスチジン(H)はCACによってコードされる
     グルタミン(Q)はCAGによってコードされる
本研究での解析手法
    従来行われていなかった分断配列を考慮して
    リピートの網羅的解析を行う


   トリプレットリピート病の原因に
    より近い部位を抽出できる
   リピートの進化的な比較が行いやすくなる
     例) Crebbp遺伝子の場合

     ヒト    QQQQQQQQQQQQQQQQQQ   (連続したQ=18)
     マウス   QHQQQQQQQQQQQQQQQ    (連続したQ=15)

     ヒスチジン(H)はCACによってコードされる       分断配列を含めて
     グルタミン(Q)はCAGによってコードされる       17と考える
分断配列を考慮したリピートの再定義

   リピート              例)脊髄小脳失調症2型(SCA2)
       5 以上のトリプレット   ・・ CCC(CAG)13CAA(CAG)9 CCG ・・
        またはアミノ酸                     ↓
       分断配列を除いて、       リピート名           :   CAGリピート
        2以上連続する部位が      分断配列            :   CAA
        1つ以上あること        リピート            :   下線部
   分断配列                リピートの長さ         :   23 (=13+1+9)
       1トリプレット
        または1アミノ酸


           ヒト、チンパンジー、マウスの翻訳領域での
           リピートを抽出を行った
本研究の流れ
   リピートの再定義

   生物種ごとにリピートの分布の違いはあるのか?
       分断配列の由来
       ヒト、チンパンジー、マウスにおけるリピートの
        網羅的解析

   リピートの進化的な形成速度は生物種によって
    差はあるのか?
       ヒトとマウスのオーソログ遺伝子におけるリピート

   リピートを持つタンパク質は機能に偏りが
    あるのか?
       ヒトでリピートを持つタンパク質の機能
分断配列の由来
    上位10位のトリプレットリピートが持つ分断配列と
     リピートのトリプレットの塩基の変異数を調べた
                 80                                             マ
例)                                                              ヒト 1点変異

CAGリピートの場合       60



CAA →   1点変異   % 40
TAA →   2点変異
                                                                ヒト2点変異
TCA →   3点変異
                 20

                                                                ヒト3点変異

                  0
                      GAG CTG CAG GGC GAA AAG AGC GCC GAT GCG
                                      リピート


     1点変異の分断配列が平均6割を占め、最も多く存在した
分断配列の由来
        上位10位のトリプレットリピートが持つ分断配列と
         リピートのトリプレットの塩基の変異数を調べた
                    80                                             マウス1点変異
例)                                                                 ヒト 1点変異

CAGリピートの場合          60                                             チンパンジー1点変異


CAA →      1点変異   % 40
TAA →      2点変異                                                    チンパンジー2点変異
                                                                   ヒト2点変異
TCA →      3点変異     20                                             マウス2点変異

                                                                   ヒト3点変異
                                                                   チンパンジー3点変異
                     0
                                                                   マウス 3点変異
                         GAG CTG CAG GGC GAA AAG AGC GCC GAT GCG
                                         リピート

        分断配列の形成は点変異による
        全体的な分布は3生物種で傾向が類似していた
ヒト、チンパンジー、マウスに
       おけるリピート
   アミノ酸単位でリピートの平均の長さを比較した


      16
                                                                               ヒト
                                                                               チンパンジー
    平                                                                          マウス
    均
      12
    の
    長
    さ
    ( 8
    残
    基
    ) 4



       0
           A   C   D   E   F   G   H   I   K   L   M   N   P   Q   R   S   T   V   W   Y
                                               リピート


               3種では大きな違いは見られなかった
本研究の流れ
   リピートの再定義

   生物種ごとにリピートの分布の違いはあるのか?
       分断配列の由来
       ヒト、チンパンジー、マウスにおけるリピートの
        網羅的解析

   リピートの進化的な形成速度は生物種によって
    差はあるのか?
       ヒトとマウスのオーソログ遺伝子におけるリピート

   リピートを持つタンパク質は機能に偏りが
    あるのか?
       ヒトでリピートを持つタンパク質の機能
ヒトとマウスのオーソログ遺伝子に
     おけるリピート
   3生物種において傾向が似ていたことの由来を検証
        ヒトでリピートを              マウスでリピートを
         持つ遺伝子                  持つ遺伝子



       ①           ②          ①
       ヒトのみ        ヒトとマウス両方   マウスのみ
       3,041遺伝子    6,058遺伝子   3,729遺伝子




    ① → 進化的には異なる
    ② → 進化的な保存度が同じ
①ヒトのみ、マウスのみでリピートを
                  持つ遺伝子で違いはあるのか?
              リピートの割合や長さの平均値を比較した

    20                                               16
                                                                                     ヒトのみ
                                     ヒトのみ
                                                                                     マウスのみ
                                     マウスのみ
    16
                                                   平 12
                                                   均
                                                   の
    12                                             長
%                                                  さ 8
                                                   (
     8                                             残
                                                   基
                                                   ) 4
     4


     0                                                0
         A S P L G E R K Q D T V F I H N C Y M W          A S P L G E R K Q D T V F I H N C Y M W
                         リピート                                             リピート

                       ヒトのみでのリピートとマウスのみでのリピートの
                       組成や長さの平均値に差は見られなかった
②ヒトとマウスの両方でリピートを
        持つ遺伝子で違いはあるのか?
     アラニンリピートとグルタミンリピートにおいて
      それぞれの相同部位のリピートの長さの差
                                     0の場合は
                                     アラニン645個、グルタミン296個
例)                160
                                                    アラニンリピート
ヒト=10、マウス=5の場合
                                                    グルタミンリピート
5 - 10 = -5       120

                              ←+ヒト                       +マウス→
                 個
                 数
                   80



アラニンリピート、
                   40
グルタミンリピートとも
ほぼ左右対称的な分布を示した
                    0
                        -30   -20      -10    0     10     20    30
                                             長さの差

 ヒトとマウスのオーソログ遺伝子でのリピートの形成速度に大きな偏りはない
本研究の流れ
   リピートの再定義

   生物種ごとにリピートの分布の違いはあるのか?
       分断配列の由来
       ヒト、チンパンジー、マウスにおけるリピートの
        網羅的解析

   リピートの進化的な形成速度は生物種によって
    差はあるのか?
       ヒトとマウスのオーソログ遺伝子におけるリピート

   リピートを持つタンパク質は機能に偏りが
    あるのか?
       ヒトでリピートを持つタンパク質の機能
リピートを持つタンパク質の機能
     ヒトの15,521のタンパク質に機能のアノテーション
      情報であるGO slim単語を付加した
     各機能ごと割合の差を検定した
例)ヒトでリピートを持つタンパク質のうちdevelopmentという機能の有意性
       すべてのタンパク質
          15,521            ヒトでリピートを
                            持つタンパク質
                               1,394
        development
                              development

                                1,078
          1,882


                           p-value = 1×10-6
ヒトでリピートを持つ
            タンパク質の機能
              GO slim 単語           タンパク質の数    p-value
development                            1078      <10-6
nucleic acid binding                   1696      <10-6
cell                                   5394      <10-6
transcription regulator activity        791      <10-6
binding                                4762      <10-6      有意に多い
cell growth and/or maintenance         1914      <10-6
enzyme regulator activity               323      <10-3
transport                              1039      <10-3
extracellular                           599      <10-3
unlocalized                              22      <10-4
metabolism                             3426      <10-4
                                                       -5
                                                            有意に少ない
physiological processes                5084      <10
catalytic activity                     2104     <10-19
ヒトで上位10位のリピートを持つ
                      タンパク質の機能
                                                                               有意に多い     有意に少ない
                                   ロイシンリピート
           GO slim 単語              ロイシン   アラニン   アスパラギン酸 グルタミン酸   グリシン   リシン   プロリン   グルタミン   アルギニン   セリン
biological process unknown
cell communication
cell cycle
cell growth and/or maintenance
cell motility
death
development
metabolism
physiological processes
response to stress
transport
cell
cellular component unknown
external encapsulating structure
extracellular
unlocalized
binding
catalytic activity
enzyme regulator activity
molecular function unknown
motor activity
nucleic acid binding
signal transducer activity
structural molecule activity
transcription regulator activity
transporter activity
機能の分布に対するクラスタリング




    ロイシンリピートは他のリピートと比べ、
    特に機能の傾向が異なっていた
本研究のまとめ
   分断配列の形成は点変異によって生じる可能性が高い

   ヒト、チンパンジー、マウスにおいてリピートの
    分布や平均的な長さに大きな差は見られなかった

   ヒトとマウスではリピートの形成速度はほぼ同じで
    あることが示唆された

   一部のリピートはタンパク質の機能に関係している
    可能性が高い

   ロイシンリピートを持つタンパク質の機能の傾向は
    他のリピートを持つタンパク質と比較して
    大きく異なっていた
仮説- 分断配列の機能
   リピートをエネルギー的に安定化させる
   リピートの異常伸長を抑える




      例)脊髄小脳失調症1型(SCA1)の患者
      分断配列CATを持つ患者の方が
       発症年齢が遅い

       症状が和らげられる
仮説-
        リピートの進化的な形成モデル
       分断配列はリピートの形成過程で出現する
                            例)グルタミンリピートの形成
   点変異によって、短い              (CAGとCAAのみがグルタミンをコード)
    純粋なリピートが生じる
    (purifying selection)   CAT CAC CAT CAG
                                           ↓ 点変異     purifying selection
   リピートの伸長が起こる             CAT CAC CAG CAG
                               ↓ 点変異
   一部で同義の分断配列が             CAG CAC CAG CAG
                                   ↓ 点変異
    点変異によって生じる              CAGNucleotide sequence
                                CAG CAG CAG          純粋なリピート


                            CAG CAG CAG CAG CAG CAG CAG CAG
                                               リピートの伸長
    リピートが安定化する                        ↓ 点変異
                            CAG CAG CAA CAG CAG CAG CAG CAG
                                               純粋でないリピート

More Related Content

More from teapipin

就職して1ヶ月が経って
就職して1ヶ月が経って就職して1ヶ月が経って
就職して1ヶ月が経ってteapipin
 
明日は入社式(就職する前日)
明日は入社式(就職する前日)明日は入社式(就職する前日)
明日は入社式(就職する前日)teapipin
 
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論teapipin
 
定番アルゴリズムを徹底理解!
定番アルゴリズムを徹底理解!定番アルゴリズムを徹底理解!
定番アルゴリズムを徹底理解!teapipin
 
「生命」と「情報」の関わりについて
「生命」と「情報」の関わりについて「生命」と「情報」の関わりについて
「生命」と「情報」の関わりについてteapipin
 
細胞間コミュニケーション(細胞の分子生物学 13章)
細胞間コミュニケーション(細胞の分子生物学 13章)細胞間コミュニケーション(細胞の分子生物学 13章)
細胞間コミュニケーション(細胞の分子生物学 13章)teapipin
 
Comprehensive Analysis of Triplet Repeats in Vertebrate Genomes
Comprehensive Analysis of Triplet Repeats in Vertebrate GenomesComprehensive Analysis of Triplet Repeats in Vertebrate Genomes
Comprehensive Analysis of Triplet Repeats in Vertebrate Genomesteapipin
 
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hackツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hackteapipin
 

More from teapipin (8)

就職して1ヶ月が経って
就職して1ヶ月が経って就職して1ヶ月が経って
就職して1ヶ月が経って
 
明日は入社式(就職する前日)
明日は入社式(就職する前日)明日は入社式(就職する前日)
明日は入社式(就職する前日)
 
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論
 
定番アルゴリズムを徹底理解!
定番アルゴリズムを徹底理解!定番アルゴリズムを徹底理解!
定番アルゴリズムを徹底理解!
 
「生命」と「情報」の関わりについて
「生命」と「情報」の関わりについて「生命」と「情報」の関わりについて
「生命」と「情報」の関わりについて
 
細胞間コミュニケーション(細胞の分子生物学 13章)
細胞間コミュニケーション(細胞の分子生物学 13章)細胞間コミュニケーション(細胞の分子生物学 13章)
細胞間コミュニケーション(細胞の分子生物学 13章)
 
Comprehensive Analysis of Triplet Repeats in Vertebrate Genomes
Comprehensive Analysis of Triplet Repeats in Vertebrate GenomesComprehensive Analysis of Triplet Repeats in Vertebrate Genomes
Comprehensive Analysis of Triplet Repeats in Vertebrate Genomes
 
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hackツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
 

修士研究:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論

  • 2. ゲノムにおけるリピート  散在型反復配列  短散在型核因子(SINE)  長散在型核因子(LINE) 反復配列  LTRエレメント 約70%  DNAトランスポゾン  縦型反復配列  サテライトDNA  ミニサテライト  マイクロサテライト • 反復単位1-6 bp
  • 3. ゲノムにおけるリピート  散在型反復配列  短散在型核因子(SINE)  長散在型核因子(LINE) 反復配列  LTRエレメント 約70%  DNAトランスポゾン  縦型反復配列  サテライトDNA  ミニサテライト  マイクロサテライト • 反復単位1-6 bp 反復単位が3つ組であるトリプレットリピートが注目される (例) ‥ CAG CAG CAG CAG CAG CAG‥ →CAGリピート
  • 4. トリプレットリピート病  リピートの異常伸長がもたらす遺伝性疾患の総称 CAG ポリグルタミン病 GCN ポリアラニン病 ハンチントン病 眼咽頭型筋ジストロフィー 脊椎小脳失調症 1, 2型 など 手足性器症候群 など 5’末端 3’末端 イントロン 5’UTR イントロン 翻訳領域 翻訳領域 3’UTR 脊髄小脳失調症12型 CAG フリードライヒ症候群 GAA 筋強直性ジストロフィー1型 CTG リピートの長さの例 正常 疾患 ハンチントン病 11~34 36~121 筋強直性ジストロフィー1型 5~37 50~5000
  • 5. リピートのインシリコ解析の現状  遺伝子領域と遺伝子間領域を区別しない 網羅的な解析が主流  オーソログ遺伝子での比較はほとんど行われていない  リピートが機能部位であるかはまだ不明  リピートとタンパク質の機能を研究した例は少ない 翻訳領域のリピートを対象
  • 6. 本研究の流れ  リピートの再定義  生物種ごとにリピートの分布の違いはあるのか?  分断配列の由来  ヒト、チンパンジー、マウスにおけるリピートの 網羅的解析  リピートの進化的な形成速度は生物種によって 差はあるのか?  ヒトとマウスのオーソログ遺伝子におけるリピート  リピートを持つタンパク質は機能に偏りが あるのか?  ヒトでリピートを持つタンパク質の機能
  • 7. 本研究の流れ  リピートの再定義  生物種ごとにリピートの分布の違いはあるのか?  分断配列の由来  ヒト、チンパンジー、マウスにおけるリピートの 網羅的解析  リピートの進化的な形成速度は生物種によって 差はあるのか?  ヒトとマウスのオーソログ遺伝子におけるリピート  リピートを持つタンパク質は機能に偏りが あるのか?  ヒトでリピートを持つタンパク質の機能
  • 8. リピートの数え方と問題点  現在のリピートの数え方 例) ・・・CAG CAG CAG CAG CAG CAG・・・  連続するトリプレットを リピートとして数える ① ② ③ ④ ⑤ ⑥ ↓ 長さ6のCAGリピート
  • 9. リピートの数え方と問題点  現在のリピートの数え方 例) ・・・CAG CAG CAG CAG CAG CAG・・・  連続するトリプレットを リピートとして数える ① ② ③ ④ ⑤ ⑥ ↓ 長さ6のCAGリピート  しかし、リピートには 例)脊髄小脳失調症1型の原因遺伝子SCA1 分断配列を持つものが ・・・ (CAG)12CATCAGCAT (CAG)14・・・ 存在する ↓ 長さ12のリピートと14のリピート? 例)脊髄小脳失調症1型(SCA1)の患者 分断配列CATを持つ患者の方が  発症年齢が遅い  症状が和らげられる
  • 10. 本研究での解析手法 従来行われていなかった分断配列を考慮して リピートの網羅的解析を行う  トリプレットリピート病の原因に より近い部位を抽出できる  リピートの進化的な比較が行いやすくなる 例) Crebbp遺伝子の場合 ヒト QQQQQQQQQQQQQQQQQQ (連続したQ=18) マウス QHQQQQQQQQQQQQQQQ (連続したQ=15) ヒスチジン(H)はCACによってコードされる グルタミン(Q)はCAGによってコードされる
  • 11. 本研究での解析手法 従来行われていなかった分断配列を考慮して リピートの網羅的解析を行う  トリプレットリピート病の原因に より近い部位を抽出できる  リピートの進化的な比較が行いやすくなる 例) Crebbp遺伝子の場合 ヒト QQQQQQQQQQQQQQQQQQ (連続したQ=18) マウス QHQQQQQQQQQQQQQQQ (連続したQ=15) ヒスチジン(H)はCACによってコードされる 分断配列を含めて グルタミン(Q)はCAGによってコードされる 17と考える
  • 12. 分断配列を考慮したリピートの再定義  リピート 例)脊髄小脳失調症2型(SCA2)  5 以上のトリプレット ・・ CCC(CAG)13CAA(CAG)9 CCG ・・ またはアミノ酸 ↓  分断配列を除いて、 リピート名 : CAGリピート 2以上連続する部位が 分断配列 : CAA 1つ以上あること リピート : 下線部  分断配列 リピートの長さ : 23 (=13+1+9)  1トリプレット または1アミノ酸 ヒト、チンパンジー、マウスの翻訳領域での リピートを抽出を行った
  • 13. 本研究の流れ  リピートの再定義  生物種ごとにリピートの分布の違いはあるのか?  分断配列の由来  ヒト、チンパンジー、マウスにおけるリピートの 網羅的解析  リピートの進化的な形成速度は生物種によって 差はあるのか?  ヒトとマウスのオーソログ遺伝子におけるリピート  リピートを持つタンパク質は機能に偏りが あるのか?  ヒトでリピートを持つタンパク質の機能
  • 14. 分断配列の由来  上位10位のトリプレットリピートが持つ分断配列と リピートのトリプレットの塩基の変異数を調べた 80 マ 例) ヒト 1点変異 CAGリピートの場合 60 CAA → 1点変異 % 40 TAA → 2点変異 ヒト2点変異 TCA → 3点変異 20 ヒト3点変異 0 GAG CTG CAG GGC GAA AAG AGC GCC GAT GCG リピート 1点変異の分断配列が平均6割を占め、最も多く存在した
  • 15. 分断配列の由来  上位10位のトリプレットリピートが持つ分断配列と リピートのトリプレットの塩基の変異数を調べた 80 マウス1点変異 例) ヒト 1点変異 CAGリピートの場合 60 チンパンジー1点変異 CAA → 1点変異 % 40 TAA → 2点変異 チンパンジー2点変異 ヒト2点変異 TCA → 3点変異 20 マウス2点変異 ヒト3点変異 チンパンジー3点変異 0 マウス 3点変異 GAG CTG CAG GGC GAA AAG AGC GCC GAT GCG リピート  分断配列の形成は点変異による  全体的な分布は3生物種で傾向が類似していた
  • 16. ヒト、チンパンジー、マウスに おけるリピート  アミノ酸単位でリピートの平均の長さを比較した 16 ヒト チンパンジー 平 マウス 均 12 の 長 さ ( 8 残 基 ) 4 0 A C D E F G H I K L M N P Q R S T V W Y リピート 3種では大きな違いは見られなかった
  • 17. 本研究の流れ  リピートの再定義  生物種ごとにリピートの分布の違いはあるのか?  分断配列の由来  ヒト、チンパンジー、マウスにおけるリピートの 網羅的解析  リピートの進化的な形成速度は生物種によって 差はあるのか?  ヒトとマウスのオーソログ遺伝子におけるリピート  リピートを持つタンパク質は機能に偏りが あるのか?  ヒトでリピートを持つタンパク質の機能
  • 18. ヒトとマウスのオーソログ遺伝子に おけるリピート  3生物種において傾向が似ていたことの由来を検証 ヒトでリピートを マウスでリピートを 持つ遺伝子 持つ遺伝子 ① ② ① ヒトのみ ヒトとマウス両方 マウスのみ 3,041遺伝子 6,058遺伝子 3,729遺伝子 ① → 進化的には異なる ② → 進化的な保存度が同じ
  • 19. ①ヒトのみ、マウスのみでリピートを 持つ遺伝子で違いはあるのか?  リピートの割合や長さの平均値を比較した 20 16 ヒトのみ ヒトのみ マウスのみ マウスのみ 16 平 12 均 の 12 長 % さ 8 ( 8 残 基 ) 4 4 0 0 A S P L G E R K Q D T V F I H N C Y M W A S P L G E R K Q D T V F I H N C Y M W リピート リピート ヒトのみでのリピートとマウスのみでのリピートの 組成や長さの平均値に差は見られなかった
  • 20. ②ヒトとマウスの両方でリピートを 持つ遺伝子で違いはあるのか?  アラニンリピートとグルタミンリピートにおいて それぞれの相同部位のリピートの長さの差 0の場合は アラニン645個、グルタミン296個 例) 160 アラニンリピート ヒト=10、マウス=5の場合 グルタミンリピート 5 - 10 = -5 120 ←+ヒト +マウス→ 個 数 80 アラニンリピート、 40 グルタミンリピートとも ほぼ左右対称的な分布を示した 0 -30 -20 -10 0 10 20 30 長さの差 ヒトとマウスのオーソログ遺伝子でのリピートの形成速度に大きな偏りはない
  • 21. 本研究の流れ  リピートの再定義  生物種ごとにリピートの分布の違いはあるのか?  分断配列の由来  ヒト、チンパンジー、マウスにおけるリピートの 網羅的解析  リピートの進化的な形成速度は生物種によって 差はあるのか?  ヒトとマウスのオーソログ遺伝子におけるリピート  リピートを持つタンパク質は機能に偏りが あるのか?  ヒトでリピートを持つタンパク質の機能
  • 22. リピートを持つタンパク質の機能  ヒトの15,521のタンパク質に機能のアノテーション 情報であるGO slim単語を付加した  各機能ごと割合の差を検定した 例)ヒトでリピートを持つタンパク質のうちdevelopmentという機能の有意性 すべてのタンパク質 15,521 ヒトでリピートを 持つタンパク質 1,394 development development 1,078 1,882 p-value = 1×10-6
  • 23. ヒトでリピートを持つ タンパク質の機能 GO slim 単語 タンパク質の数 p-value development 1078 <10-6 nucleic acid binding 1696 <10-6 cell 5394 <10-6 transcription regulator activity 791 <10-6 binding 4762 <10-6 有意に多い cell growth and/or maintenance 1914 <10-6 enzyme regulator activity 323 <10-3 transport 1039 <10-3 extracellular 599 <10-3 unlocalized 22 <10-4 metabolism 3426 <10-4 -5 有意に少ない physiological processes 5084 <10 catalytic activity 2104 <10-19
  • 24. ヒトで上位10位のリピートを持つ タンパク質の機能 有意に多い 有意に少ない ロイシンリピート GO slim 単語 ロイシン アラニン アスパラギン酸 グルタミン酸 グリシン リシン プロリン グルタミン アルギニン セリン biological process unknown cell communication cell cycle cell growth and/or maintenance cell motility death development metabolism physiological processes response to stress transport cell cellular component unknown external encapsulating structure extracellular unlocalized binding catalytic activity enzyme regulator activity molecular function unknown motor activity nucleic acid binding signal transducer activity structural molecule activity transcription regulator activity transporter activity
  • 25. 機能の分布に対するクラスタリング ロイシンリピートは他のリピートと比べ、 特に機能の傾向が異なっていた
  • 26. 本研究のまとめ  分断配列の形成は点変異によって生じる可能性が高い  ヒト、チンパンジー、マウスにおいてリピートの 分布や平均的な長さに大きな差は見られなかった  ヒトとマウスではリピートの形成速度はほぼ同じで あることが示唆された  一部のリピートはタンパク質の機能に関係している 可能性が高い  ロイシンリピートを持つタンパク質の機能の傾向は 他のリピートを持つタンパク質と比較して 大きく異なっていた
  • 27. 仮説- 分断配列の機能  リピートをエネルギー的に安定化させる  リピートの異常伸長を抑える 例)脊髄小脳失調症1型(SCA1)の患者 分断配列CATを持つ患者の方が  発症年齢が遅い  症状が和らげられる
  • 28. 仮説- リピートの進化的な形成モデル  分断配列はリピートの形成過程で出現する 例)グルタミンリピートの形成  点変異によって、短い (CAGとCAAのみがグルタミンをコード) 純粋なリピートが生じる (purifying selection) CAT CAC CAT CAG ↓ 点変異 purifying selection  リピートの伸長が起こる CAT CAC CAG CAG ↓ 点変異  一部で同義の分断配列が CAG CAC CAG CAG ↓ 点変異 点変異によって生じる CAGNucleotide sequence CAG CAG CAG 純粋なリピート CAG CAG CAG CAG CAG CAG CAG CAG リピートの伸長 リピートが安定化する ↓ 点変異 CAG CAG CAA CAG CAG CAG CAG CAG 純粋でないリピート