【学部生向け】タンパク質データベースPDBの使い方

この記事では、PDBを使ったことがなくて、これから使ってみたいという学部生を対象に、PDBの活用方法の基礎の基礎をご紹介いたします。

記事の筆者は化学(生物寄り)を専攻している学部生です。

普段の勉強で生物系の教科書や授業スライドで描かれているタンパク質を、自分で回しながら勉強できるといいなと思い、調べた情報を共有させていただきます。

PDBとは

PDBとはProtein Data Bankの略で、主にタンパク質の構造情報をまとめているサービスです。

構造情報はPDB形式(拡張子.pdbまたは.ent、旧形式で段階的に廃止予定)やPDBx/mmCIF形式(拡張子.cif)のファイルとしてまとめられ、誰でも無料でダウンロードできる他、加工・二次配布は商用/非商用問わず、完全に自由となっています。

wwPDB(ワールドワイドPDB)という組織がファイルを管理しており、構造情報の収集と配布、構造を見るためのビューアの開発などはRCSB PDB(米)、PDBe(欧)、PDBj(日)の3つの組織が、それぞれの地域を対象に独自のサービスを展開しています。

タンパク質の構造を明らかにした構造生物学者は、論文を雑誌に掲載する際にはPDBへの登録が事実上義務となっています。多くの雑誌がPDBへの登録を、論文の掲載の条件としているからです。

そのように収集されたデータは出典元の論文が掲載された後に、RCSB PDBPDBePDBjから同時にアクセス可能となり、世界中に公開されるしくみになっています。

入手可能なファイルは3つの支部で完全に共通となっており、公開のタイミングも厳密に揃えているみたいです。

また、日本に住んでいるからといって、PDBj以外のところからダウンロードしてはいけないことはありません。

PDBjでできること

PDBjのトップページの上部には、検索ボックスが設置されており、ここにキーワードを入力して目的のタンパク質の情報を検索します。

PDBjのトップページ(https://pdbj.org/)
©PDBj licensed under CC-BY-4.0 International
©David S. Goodsell and RCSB PDB licensed under CC-BY-4.0 International

調べたいタンパク質のPDBコード(PDBIDとも。例:1SPR, 5Y2Yなど)をご存じの方は、PDBjトップページの検索窓に入れると目的のタンパク質の情報がすぐに手に入ります。

タンパク質の名前(例えばHuman Hemoglobin)や、“肝臓”や“魚”など一般名詞のキーワードからも検索が可能です。

タンパク質の個別ページにたどり着くと、ダウンロードというタブがありますからここからファイルをダウンロードしてください。ファイルは圧縮されていますので、7zipなどの解凍ソフトを準備しておきましょう。

PDBファイルやPDBx/mmCIFファイルをダウンロードできるだけではなく、ブラウザ上で構造やアミノ酸配列を見たり、似た構造を持つタンパク質を検索したりすることができます。タンパク質の個別ページに様々なタブがあり、ここから情報を探すことができます。

他にもNMRデータ検索、複合体のデータ検索、コラムページ「今月の分子」なども展開しています。これらのサービスは、ほとんどがPDBjのトップページから検索・アクセス可能となっていますので、色々と探索してみると面白いですよ。

ビューア:UCSF Chimera

UCSF(カリフォルニア大学サンフランシスコ校)のチームが管理するChimera(キメラ)というソフトは、PDBファイルなどの分子構造データを可視化するソフトで、無料で使用できます。

UCSF Chimeraはこちらのサイトからダウンロードすることができます。

構造を見るだけでなく、アミノ酸配列を見たり、選択した領域がアミノ酸配列のどこに対応しているか、逆にアミノ酸配列中の一部を選択するとそれに対応する領域を表示したりできます。

実はChimera内からPDBデータのダウンロードもできますし、PDB以外の多くのフォーマットやデータベースに対応しています。

UCSF Chimeraで作成した画像をインターネットで公開する場合には、コンテンツ内に謝辞を表記し、UCSF Chimeraのwebサイトへのリンクを貼らなくてはなりません。

書籍や論文に掲載する際には、画像がUCSF Chimeraで作成されたことを明記し、UCSF Chimeraのリファレンスを最低1つ引用しなければなりません。

権利関係について、詳しくはCiting UCSF Chimeraをご覧ください。UCSF Chimeraを使用するときに守るべき規約が書いてあります。

QuteMolで分子をきれいに表示する

ヒトのDNAポリメラーゼ(PDB ID:1zqa)です。黄色の原子がDNA中のリン原子でD螺旋構造が見えます。
この画像はQuteMol(http://qutemol.sourceforge.net/)で作成されました。

QuteMolというソフトを使えば上の画像のように、分子をきれいに描画することができます。

雑誌や書籍の表紙で、QuteMolで作成されたものをみたことがある方も多いのではないでしょうか。

QuteMolはおしゃれな絵を書くためのソフトで、その他の機能は一切ありません。

QuteMolで作成された画像をWebで公開する場合、QuteMolのトップページへのリンクを貼らなければいけません。

How to siteには、論文等で使用する際に引用すべき文書が記載されていますので、必要な方はご参照ください。