分子生物学まとめてみた「転写」

転写

RNAと転写

DNAからRNAを合成することを転写、RNAからタンパク質を合成することを翻訳という。細胞は、転写と翻訳の両方を調節することで、その遺伝子が指令しているタンパク質の濃度を適正に保っている。DNAは相補的な鎖とともに二重螺旋構造を取るが、RNAは基本的には一本鎖で存在する。A, G, C, Uのリボヌクレオチドが重合した分子で、タンパク質と同様特定の三次元構造を取る場合もある。RNA分子がタンパク質と非共有結合して、複合体の足場の役割を果たすことが多い。RNAの三次元構造の安定化には、自己相補的な領域同士の塩基対形成が重要な役割を果たす。

RNAポリメラーゼがDNAの一方の鎖を鋳型として、相補的は塩基配列を持ったRNAを合成する。RNAポリメラーゼはDNAポリメラーゼと違って、1つ前の正しい3’末端を必要としない。プライマーがいらない代わりに、ミスはDNAポリメラーゼより多い。RNAポリメラーゼはDNAの二重螺旋を切り分けながら進んでいく。RNAポリメラーゼが通過した後は、DNAは勝手に閉じる。前のポリメラーゼが転写を完了していなくても次のポリメラーゼが転写を始めることができる。

RNAポリメラーゼとDNAポリメラーゼの構造は全く似ていない。共通点は触媒部位にMg2+を持っていることくらいである。進化の初期に、鋳型依存ヌクレオチド合成酵素が少なくとも2種類生じたと考えられており、一方はその後のDNAポリメラーゼ、逆転写酵素、ウイルスのRNAポリメラーゼとなり、もう一方がその他のRNAポリメラーゼへとつながる。

細胞内で合成されるほとんどのRNAは後にタンパク質へと翻訳されるmRNAである。RNAそのものが最終産物であることもあり、非翻訳RNAと呼ばれる。rRNA(リボソームRNA)、tRNAなどが代表で、他にもRNAスプライシングや遺伝子発現調節で働くものがある。出芽酵母の全遺伝子の内、約15%(1200個)が非翻訳RNAを指令していた。ヒトの非翻訳RNAの数はもう一桁程度多いだろうと見積もられている。RNAが細胞の乾燥重量に占める割合は数%で、mRNAはそのうち3-5%程である。単純計算すると、一種類のmRNAが平均10-15分子存在していることになる。

細菌の転写開始と終了

細菌の転写は、まずRNAポリメラーゼとσ因子が結合するところから始まる。この複合体のσ因子部分はDNAと衝突すると、DNA上をしばらく滑ってから外れるという動きをする。滑っている途中にDNAの特別な配列(プロモーター)に出会うと、σ因子はこの配列と強く結合し、同時に2重螺旋が開き始める。σ因子と一方の鎖が強く結合することで構造は安定化され、RNAポリメラーゼはもう一方の鎖を鋳型としてRNAを合成し始める。ポリメラーゼはσ因子と結合したままRNAを合成できるが、そのうち外れ、σ因子もいずれプロモーターから乖離する。

転写が進んでいき、ターミネーター配列まで転写されると転写が終了する。ターミネーター配列は長い自己相補的な配列を含んでおり、転写されたRNAは強固なヘアピン構造を取る。この構造変化により、mRNA-RNAポリメラーゼ-DNA複合体(転写バブルと呼ぶ)の構造が不安定化され、転写バブルが解散して転写が終了する。

プロモーターとターミネーターの塩基配列は異なる遺伝子でもある程度共通しているようだが、塩基配列のみからプロモーターとターミネーターを断定することは難しい。プロモーターとして一番いい配列からいくつか塩基が変わった配列は、元の配列と強度が異なる。プロモーターの強度=σ因子との結合の強さがその遺伝子の転写頻度に影響する。一方、ターミネーター配列は転写されたRNAがヘアピンを作るような回文配列なら何でもよく、許容される配列は無数に存在する。

真核生物の転写

真核生物にはRNAポリメラーゼが三種類あり、ローマ数字でI、II、IIIと番号が付けられている。これらは転写する遺伝子が異なる。IIはタンパク質指令遺伝子全てといくつかの非翻訳RNA、IはrRNAの一部、IIIはtRNAとrRNAの残りとその他の非翻訳RNAを担当している。

真核生物の転写機構は細菌のものに比べて遥かに複雑である。ポリメラーゼ自体も細菌のものより大きく、必要な転写開始因子は転写基本因子転写活性化因子介在因子クロマチン修飾タンパクなど、サブユニットにして100個以上となる。

話をRNAポリメラーゼII(mRNAの担当)に限定する。このポリメラーゼの転写基本因子はTFII(transcription factor)と呼ばれ、さらにABCの番号が割り振られている。細菌でσ因子が結合しやすい配列があったように、真核生物では4つのコンセンサス配列(BRE、TATA、INR、DPE)が知られている。RNA合成酵素の会合はTFIIDがTATAに結合することから始まる。ここに、RNAポリメラーゼIIと他の因子が集合して転写開始複合体が完成すると、TFIIHが二重螺旋をほどいて鋳型DNAに一本鎖を露出させる。TFIIHはサブユニットにDNAヘリカーゼを持っている。ポリメラーゼがプロモーターを離れてRNA合成を続けるためにはポリメラーゼの尾部のセリンへのリン酸化が必要である。ポリメラーゼはC末端に反復配列を持ち、ここにある複数のセリンがリン酸化されると、ポリメラーゼの構造が変化する。また、ポリメラーゼの尾部にはRNA加工に関わるタンパクが結合しており、ポリメラーゼによって合成されて出てきたRNAをすぐに加工できるようになっている。

in vivo(生体内)ではエンハンサー領域と呼ばれる配列に結合した転写活性化タンパクが、介在因子と結合してこれを適切な位置に配置する。介在因子は巨大な足場タンパクで、転写基本因子、ポリメラーゼ、ヒストン修飾酵素、クロマチン再構成複合体を集合させて、転写開始を助ける。転写活性化タンパクは通常複数同時に働き、それらの作用の合成として転写速度が決定する。

ATP依存クロマチン再構成複合体がヒストンの位置をずらしたり、ヒストンシャペロンが前方でヒストンを外して後方で付け直したりして、RNAポリメラーゼの仕事を助ける。ポリメラーゼが通過すると、結合して一緒に移動しているヒストン修飾酵素がヒストンに目印をつけるが、この目印の機能は良くわかっていない。

RNAポリメラーゼがDNAを引き裂きながら通過することで、DNAに超螺旋を生成するねじれ力が働く。この力により、ポリメラーゼの前方では正の超螺旋ができてヒストンが外れやすくなり、後方では負の超螺旋ができる。トポイソメラーゼがDNAに切り込みを入れたり、一時的に切断したりして、ねじれを解消する。細菌ではDNAジャイレースがわざわざATPを消費して負の超螺旋を生み、ポリメラーゼが二重螺旋を解きやすくしている。

原核細胞ではポリメラーゼによって合成されたRNAはそのままmRNAとして転写が終わらないうちに翻訳されるが、真核細胞では生成したRNAは加工を経て、これが核外へ輸送されてから翻訳が始まる。加工(プロセシング)では、RNAの5’末端にメチル化グアノシンが反対向きに結合したキャップ(7-メチルグアノシン-5′,5′-三リン酸結合)がつけられ、スプライシング及び3’末端にはおよそ200個のAが伸長される。

RNAポリメラーゼIIのリン酸化された尾部に待機していた3つのタンパク質が、生成されて間もないRNAの5’末端を7-メチルグアノシン-5′,5′-三リン酸結合に加工する。まず、ホスファターゼが新生RNAの5’の三リン酸の内1つだけ除去して、グアニル酸転移酵素が5’-5’の向きにGMPを結合させる。最後にメチル基転移酵素がグアノシル基の7位のNにメチル基をくっつけて、5’キャップが完成する。これがmRNAであることのサインである。RNAポリメラーゼIとIIIはIIのような尾部を持たず、これらが合成したRNAにはキャップはつかない。

スプライシング

スプライシングの起こる場所、つまりイントロンの両端は塩基配列が主に決めている。このコンセンサス配列は短く多様なので、塩基配列だけでなくその他の情報も加味して最終的なスプライシングの場所が決まる。スプライソソームにはsnRNA(核内小分子RNA、small nuclear)が含まれており、コンセンサス配列との塩基対形成の役割を果たしている。

スプライシングの過程で、イントロンの5’末端がイントロン中のAの2’とリン酸結合して、イントロンが分岐のある環状になる。次に、イントロンが外れたことでむき出しになったエキソンの3’末端は隣のエキソンの5’末端とリン酸結合を結ぶ。このときにイントロンは完全に遊離する。エキソンとエキソンの接合部にはエキソン接合部複合体が結合する。エキソン接合部複合体の機能は翻訳の節で解説する。

スプライソソームには同じコンセンサス配列に結合する複合体が複数存在する。各複合体はRNA-RNA再編成複合体の手助けのもと、順番にコンセンサス配列に結合して離れることを繰り返す。全ての複合体がコンセンサス配列を認識し終えた後にエステル転移を触媒できる構造となるので、スプライシングの間違いは滅多に起こらない。

コンセンサス配列に似た配列がエキソンにあると、スプライソソームがこれをコンセンサス配列と間違える恐れがある。そこで、SRタンパク(セリンとアルギニンが多い)がエキソンに結合して、スプライソソームの構成体がエキソンとは結合しないようにしている。SRタンパクがどうやってイントロンとエキソンを見分けているかはまだわかっていないが、どうやらエキソンの長さが比較的均一なのを利用しているらしい。

スプライシングはRNA合成と同時並行するので、エキソンの読み飛ばしは抑制される。

真核生物の話のときには、DNAがヒストンに巻き付いていることを忘れてはならない。クロマチンの凝縮度が変わればポリメラーゼの通過速度が速くなったり、停止したりすることもある。すると、スプライソソームが出会うRNAの長さが変わり、エキソンの読み飛ばしを誘発・抑制することがある。ヒストンへの修飾がスプライソソームと結合して、より直接的に活性を調節することもある。

RNAの3’末端を決める配列があるが、これはポリメラーゼの停止を指令しているのではない。転写後のRNAのこの配列に、ポリメラーゼ尾部に待機していた切断促進因子が結合するためのものである。切断後にアデニル化特異因子が鋳型無しでAを付加し始める。生成するポリAにはポリA結合タンパクがくっついていき、仕組みはわからないが、ポリAの長さを調節している。一方、RNAポリメラーゼはまだ転写を続けている。しかし、ポリメラーゼから出てくるRNAには5’キャップが付いていないので、5’→3’エキソヌクレアーゼが分解して、最終的にポリメラーゼを鋳型から離して転写を終わらせる。

正しく完成したmRANには核外輸送複合体が結合し、核膜孔複合体を通過して細胞質に移動する。核膜孔複合体が形成する孔は、分子量6万未満程度なら自由に行き来できるが、それ以上の分子に関しては自由エネルギーを消費して能動輸送している。不完全なmRNAやイントロン、その他の切れ端RNAは核内でエキソソームによって分解される。エキソソームは3’→5’エキソヌクレアーゼなどを含む巨大な複合体である。

非翻訳RNAは核内で合成・加工される。特にrRNAは大量に必要であるため、ヒトの場合200個程度の遺伝子から常に転写され続けている。大腸菌でさえ7個の遺伝子を稼働させている。rRNAは二種類あり、それぞれRNAポリメラーゼIとIIIによって合成される。Iによって合成される方は、修飾を受けた後3つに切断され、最終的には計4種類のrRNAがリボソームに1つずつ含まれる。DNAのrRNA遺伝子部分、合成中のrRNA、成熟rRNA、rRNA加工酵素、snoRNP(核小体低分子リボ核タンパク)、その他多数のリボソームの部品は、凝集して核小体を形成する。核小体は光学顕微鏡でも観察できる。必要な因子が集合した環境で効率よくリボソームが組み立てられている。核小体の他にも、必要に応じて凝集して機能を果たす構造体が存在する。

<前の記事   目次   次の記事>