生物工学実習 W

実習の流れ
  1. 塩基配列の取得
    [GenBank]

  2. ORFの検索
    [ORF Finder]

  3. SD配列の検索
    [GeneMark]

  4. プロモーター領域の予測
    [Neural Network Promoter]

  5. 転写終結部位予測
    [FindTerm]

  6. 塩基配列の諸性質
    [MBCF OligoCalculator]

  7. アミノ酸配列の取得


  8. タンパク質の諸性質
    [ProtParam]

  9. 類似性検索
    [BLAST]

  10. モチーフ配列検索
    [MOTIF]

  11. 系統樹の作成
    [UniProt, ClustalW]

  12. ヒトゲノムとの相同性解析とマッピング
    [BLAST]

  13. 文献検索
    [PubMed]

  14. 膜貫通領域の予測
    [SOSUI]

  15. 二次構造予測
    [SSP]

  16. 三次構造予測
    [SWISS-MODEL]

  17. 構造を見る
    [PDB]

  18. 実習のデータ


    実習の検索結果のデータです。
    これは、はじめから使わないで、はじめは自分でデータをとるようにしましょう。
    (山登よりのお願い。インターネットの通信混雑と検索側計算機の負荷軽減にも ご配慮下さい。その意味で、田中君にお願いして、ここに検索結果のデータを載せて 頂きました。少なくともこの実習でインターネットをご利用になるときは、自分の 成長に資することを目的にしているということを、しっかり念頭に置いてご利用下さい。)

バイオインフォマティクスの基礎実習



  1. V-ATPase遺伝子群塩基配列の取得

    @ DBGET(データベース統合検索システム)にアクセスし、GenBank をクリックする。

    A GenBankの入力枠内に "Enterococcus hirae ntp operon" とキーワードを入力し、Go ボタンをクリックする。

    GenBank

    B 検索結果の gb:ENENTP をクリックし、開かれたページを "お気に入り" に登録しておく(以下、このページをGenBank resultページと呼ぶ)

    pointイオン輸送性 ATPase について




  2. ORF (Open Reading Frame) の検索

    @ GenBank resultページにある、FASTA をクリックし、FASTA形式のDNAシークエンスを表示させる。

    A ORF Finderの入力枠内に、このDNAシークエンスをコピー&ペーストし、OrfFind ボタンをクリックする。

    ORFfinder

    B GenBank resultページの CDS 行を参考に、サブユニットF・I・K・E・C・G・A・B・D・H・Jに対応する ORF をクリックし、表示された塩基配列・アミノ酸配列と比較し、良ければ Accept ボタンを押す。

    【例、E サブユニットの場合】

    GenBank_seq

          ↓

    ORF_example

    C サブユニットの中には終止コドンのみが一致するものがある。その際は、Alternative Initiation Codons をクリックし、表示された結果が正しければ、Accept ボタンを押す。

    【注】このページは後で使用するため、閉じずにそのままにしておく。


    【TOPへ戻る】



  3. SD (Shine-Dalgarno) 配列の検索

    GeneMarkの Sequence の枠内にDNAシークエンスをコピー&ペーストする。Species は Enterococcus_faecalis を選択し、Start GeneMarkボタンをクリックする。

    GeneMark


    【TOPへ戻る】



  4. プロモーター領域の予測

    Neural Network Promoterの Type of organismprokaryoteInclude reverse strand?noを、選択スコアはデフォルトのまま、Cut and paste your sequence(s) here: の枠内にFASTA形式のDNAシークエンスをコピー&ペーストし、Submit ボタンをクリックする。


    【TOPへ戻る】



  5. 転写終結部位の推定

    FindTermの Paste nucleotide sequence here: の枠内にDNAシークエンスをコピー&ペーストし、PROCESS ボタンをクリックする。

    FindTerm


    【TOPへ戻る】



  6. DNA塩基配列の諸性質

    Oligo Calculatorの入力枠内に、A, B, I の各サブユニットをコードするORFのDNAシークエンスをコピー&ペーストし、Calculate ボタンをクリックする。


    【TOPへ戻る】



  7. A サブユニットと B サブユニットのアミノ酸配列の取得

    ORF finderのページの、Viewの横の選択Boxで3 Fasta protein を選択し、FASTA形式のアミノ酸配列を表示させる。

    ORFfindAAsequence

    subunit A, subunit B についてアミノ酸配列を取得する。


    【TOPへ戻る】



  8. タンパク質の諸性質

    ProtParamの入力枠内に、A サブユニットのアミノ酸配列(FASTA形式の第1行目は入れない)をコピー&ペーストし、Compute parameters ボタンをクリックする。

    ProtParam

    同様に B サブユニットについても調べる。


    【TOPへ戻る】



  9. タンパク質のアミノ酸配列の類似性検索

    BLASTの入力枠内に、A サブユニットのアミノ酸配列をコピー&ペーストする。

    プログラムは BLASTP (prot query vs prot db) 、データベースは KEGG GENES を選択し、Compute ボタンをクリックする。

    BLAST

    同様に B サブユニットについても調べる。

    pointBLAST について


    【TOPへ戻る】



  10. モチーフ配列の検索

    MOTIFの入力枠内に、A サブユニットのアミノ酸配列をコピー&ペーストする。

    For protein をチェックし、データベースは PROSITE Pattern を選択し、Skip entries with SKIP-FLAG のチェックははずして、Search ボタンをクリックする。

    MOTIF

    同様に B サブユニットについても調べる。


    【TOPへ戻る】



  11. 系統樹の作成

    @ DBGET(データベース統合検索システム)にアクセスし、UniProt をクリックする。

    A キーワードとして、V-ATPase "subunit A" を入力し、Go ボタンをクリックする。

    UniProt_top

    B 作業Cを、[sp:VATA_HUMAN]、[sp:VATA_PIG]、[sp:VATA_BOVINE]、[sp:VATA_MOUSE]、[sp:VATA1_DROME]、[sp:VATA_SCHPO]、[sp:VATA_YEAST]、[sp:VATA1_ACEAT] の8種のタンパク質について行う。それぞれのタンパク質が何の生物種由来かは、各自調べること。

    C sp:VATA_HUMAN を例とする。
    sp:VATA_HUMAN をクリックする。

    UniProt_Asubunit

    下の方にある SQ をクリックする。

    VATA1_HUMAN

    表示されたアミノ酸配列を、メモ帳にコピー&ペーストし、先頭行を >HUMAN に書き換える。

    SequenceMemo

    D 上の図のように8種のアミノ酸配列を、1つのメモ帳にまとめて保存する。

    E 最後に、GenBank result のページから、腸内連鎖球菌V-ATPase のAサブユニットのアミノ酸配列をコピーし、メモ帳にペーストして、先頭行を >ENTERO に書き換える。

    SequenceMemo_2

    F Clustal Wの入力枠内に、作成した9種のタンパク質のアミノ酸配列情報をコピー&ペーストし、Execute Multiple Alignment のボタンをクリックする。。

    ClustalW

    G 一番下のSelect tree menu のタブから、N-J Tree を選択し、Exec ボタンをクリックすると、系統樹が表示される。


    【TOPへ戻る】



  12. ヒトゲノムとの相同性解析とマッピング

    @ NCBI Human Genome Resourceにアクセスし、BLAST the Genome クリックする。

    データベースをRefSeq protein、プログラムをBLASTP: Compare protein sequences とし、入力枠内にAサブユニットのアミノ酸配列をコピー&ペーストし、Begin Search のボタンをクリックする。

    BLASTtheGenome

    A 次のページでFormat のボタンをクリックし、少し待つと結果が表示される。

    B 検索の結果、相同性の高いタンパク質がいくつか見つかるが、その中で最も相同性の高い human の V-ATPase に注目する。

    C human の V-ATPase の右の G をクリックし、表示されたページの ATP6V1A をクリックして、このタンパク質についての情報を得る。

    特に、染色体番号、場所、機能について注目する。

    D ページ右の Map Viewer をクリックし、染色体上の位置を確認する。


    【TOPへ戻る】



  13. 文献検索

    V-ATPase に異常があるとどのような病気になるのかを論文で調べる。

    Entrez PubMedで、キーワードとして、「vacuolar ATPase human disease mutation」 を入力し Go ボタンをクリックすると、検索された論文の一覧が表示される。

    PubMed


    【TOPへ戻る】



  14. 水溶性タンパク質か膜タンパク質かの予測

    @ SOSUI1. SOSUI system の SOSUI をクリックする。入力枠内に、A サブユニットのアミノ酸配列(FASTA形式の第1行目は入れない)をコピー&ペーストし、Exec ボタンをクリックする。

    SOSUI

    A 同様に、B サブユニット、I サブニユットについても予測する。


    【TOPへ戻る】



  15. 二次構造の予測

    SSPのChou-Fasman, GOR, Neural Networkすべてを選択し、Paste the amino acid sequence in the box:枠内に、A サブユニットのアミノ酸配列(FASTA形式の第1行目は入れない)をコピー&ペーストし、start prediction ボタンをクリックする。

    同様に、B サブユニット、I サブニユットについても予測する。


    【TOPへ戻る】



  16. 三次構造の予測

    【注】三次構造の予測は計算量が多く、結果を出すまでに時間がかかるため、結果は E-mail で返信される。よって、実習では計算結果をこちらで配布する。ただし、自宅でインターネットに接続できる人は、ぜひ作業を行ってほしい。

    SWISS-MODELの First Approach mode をクリックする。Email アドレス、名前、query のタイトル(例: V-ATPase subunit A)、A サブユニットのアミノ酸配列を入力枠内にコピー&ペーストする。ページの下部にある Results options は Normal mode にし、Send Request ボタンをクリックする。

    SwissModel

    同様に、B サブユニット、K サブニユットについても予測する。


    【TOPへ戻る】



  17. ホモロジーの高い構造を見る

    @ SWISS-MODELのMENU の Interactive tools の項目にある Search をクリックする。

    A FASTA 形式の A サブユニットのアミノ酸配列を入力枠内にコピー&ペーストし、Submit Request ボタンをクリックする。

    PDB

    B 表示された結果から 1bmfF の Detail をクリックし、特徴を調べる。

    また、Parent PDB 列の 1bmf をクリックし、Protein Data Bank (PDB) にアクセスする。

      PDB

    C Download / Display File をクリックし、Download the Structure File: の ZIPped の X をクリックし、コンピュータの適当なところにファイルを保存する。

    また、View Structure をクリックし、Interactive 3D Display: の QuickPDB ボタンをクリックしたり、Still Images: のリンクをクリックして、1bmf の立体構造を見る。

    PDB

    D 同様に、B サブユニット、K サブニユットについても調べる。

    検索結果から、 B サブユニットでは、1bmfF、K サブユニットでは 2bl2 について調べる。


    【TOPへ戻る】







Tokyo University of Science
Last update: 2005/11/01