生物の設計図とも呼ばれる遺伝子ですが、似たような言葉にDNA、ゲノムなどがあります。
この3つの用語、厳密には異なる意味ですが、混同している方や間違った使い方をしている方を時折見かけます。
私は高校の頃、ずっとモヤモヤしながらもこの3つの違いを見て見ぬ振りをしてきましたが、大学に入ってからようやく区別がつくようになりました。
以前の私と同じモヤモヤを抱えている方へ向けて、DNAと遺伝子そしてゲノムの定義とこれら違いをわかりやすく解説していきます。
DNA
DNAは化学物質の名前
DNA(デオキシリボ核酸)は遺伝情報を保管する分子の名前です。
ヌクレオチドと呼ばれる分子が脱水縮合して連なった長大な分子で、2本の独立した鎖が螺旋を組んだ構造をとっています。
それぞれの鎖の中の原子たちは共有結合でつながっていますが、2本の鎖は水素結合で結ばれており、温度を上げていくと螺旋がほどけて1本鎖に分離します。
DNAといえばたいてい2本まとめて指しており、1本だけ指したいときには一本鎖DNAと呼びます。
塩基
DNAに使われるヌクレオチドはリン酸、糖(デオキシリボース)、塩基の3つの部品から構成されています。
塩基にはアデニン、グアニン、シトシン、チミンの四種類があり、頭文字を取ってAGCTと表記します。
また、ヌクレオチドのことも塩基の名前で呼び、より簡潔に表したいときには頭文字一文字で表します。
DNAは4種類のヌクレオチドが特定の配列で連なった分子で、この配列のことを塩基配列と呼びます。
遺伝情報とはこの塩基配列のことであって、言い換えると塩基配列を指定している分子をDNAと呼ぶということになります。
DNAの長さは片方の鎖を構成するヌクレオチドの数で表現され、単位は塩基対(bp)です。
例えば、「大腸菌K-12株のDNAの長さは約460万塩基対である」というふうに表現します。
一本鎖DNAやRNAなどの長さはmerで表します。したがって、長さ350bpのDNAの片方の鎖の長さは350merとなります。
遺伝子
遺伝子は機能の単位
DNAは遺伝情報を塩基の並びによって記録していますが、細胞はそのすべてを利用しているわけではありません。
DNAの塩基配列のうち、あるまとまった領域ごとに転写と翻訳を行ってタンパク質を生成し、このタンパク質が実際に細胞内で機能を果たしています。
このときの「まとまった領域」のことを指して遺伝子と呼びます。
ときには、DNAの塩基配列は転写だけされてRNAとして細胞内で働くことがあります。この場合でも、そのRNAをコードしているDNAの領域は1つの遺伝子であると考えます。
また、転写後にスプライシングと呼ばれるmRNAの加工を経て、複数の異なるタンパク質に翻訳されることがあります。
このとき、その塩基配列は2種類以上の機能をコードしていることになりますが、遺伝子としては1つとカウントされます。
DNAの長さは塩基対で表しましたが、遺伝子は個数で数えます。
遺伝子ではない領域
塩基配列の中には、タンパク質やRNAに転写されることはないけれど、別のタンパク質の結合部位となって近隣の遺伝子の転写を促進したり逆に妨害したりする領域があります。
このような場所は調節領域と呼ばれ、細胞内の遺伝子発現について重要な機能を果たしていますが、遺伝子の数にはカウントされません。
また、多くの生物種のDANには、転写もされず調節領域でもない場所がかなり沢山あります。
実際には機能はあるけれどまだ判明していないという領域もあるかもしれませんが、大部分はDNAから取り除いても生体に何ら影響を及ぼさないようです。
こういった場所は当然遺伝子ではありません。
ゲノム
遺伝子を全部まとめてゲノムという
DNAにコードされている遺伝子をすべて指してゲノムといいます。
正確にはその細胞がもっている1セットの遺伝子たちをゲノムと呼びます。
ヒトを始めとする有性生殖を行う生物のほとんどは、両親からそれぞれ染色体を継承するため、同じ遺伝子を2個ずつ重複して持っていることになります。
この場合、ゲノムには1個だけカウントするため、我々ヒトはゲノムを2セットもっていることになります。
注)遺伝子数の計数は1倍体として行います。したがって、多倍体として同一の遺伝子を複数もっているときには、重複している遺伝子はゲノムにカウントしませんが、遺伝子重複などによって生じた同一遺伝子は別々にカウントします。
DNAとほぼ同じ意味でゲノムという言葉を用いることがあります。
例えば、「ゲノム上の〇〇な領域」という表現は「DNA上の〇〇な領域」に置き換えても、たいていは全く同じ意味になります。
ゲノムサイズ
ゲノムサイズは1組のDNAの長さをすべて足し合わせたものです。単位はDNAの長さと同じ塩基対(bp)です。
ゲノムは遺伝子だけの集合ですが、ゲノムサイズには遺伝子、調節領域、その他の機能を持たない領域もすべて含まれています。
ゲノムサイズという用語は言葉の成り立ちを考えると、総遺伝子数を表しそうな語感がして紛らわしいので、総塩基対数という言葉を好んで使う方もいます。
まとめ
- DNAは遺伝情報を担う分子そのものの名前
- 遺伝子は長い塩基配列を機能ごとに分けて1個とカウントしたもの
- 調節領域は遺伝子にはカウントされない
- DNAには遺伝子でも調節領域でもない箇所が存在する
- ゲノムは遺伝子をまとめて指す言葉
- ゲノムサイズはDNAの長さの合計(遺伝子数ではない)