ゲノムの数字

Genomicsの分野でよく言われる数字をまとめる

ヒトゲノムの話

ここでは主にHuman Genomeの話を記載する。

知識として知っていることなどを書くだけなので、出典などもあとから追記をする予定

ヒトゲノムサイズ

およそ30億塩基対と言われてる。

もう少し細かくいうと31億塩基対(3.1Gb)。

ただし、unlocalized sequence などは考慮に入ってないので、実際にはもう少し大きくなるはず。

ATGCの4パターンなので2bit。これが30億塩基対だから、750MBの情報量。

ヒトゲノムの長さ

ワトソンクリックの二重らせんモデルでは10.5塩基対でらせんが一周する。

その長さは3.6nm。

ということは、30億塩基対でおよそ1.03mつまり1mぐらいになる。

ヒトゲノムは二倍体なので実際には2m。

ちなみに細胞核のサイズは数µmで、細胞自体は数十µm。

ヒトゲノムの中にある遺伝子の数

およそ2万前後。Ensemblをみると20300超えるぐらいか。

もともとは三万ぐらいかと思われてた。

ヒトゲノム中の遺伝子領域

およそ3分の1程度。

タンパク質になるエキソンはおよそ1%程度。イントロン(非翻訳領域)をいれても1.5%。

ヒトゲノムの中で遺伝子領域以外の部分は?

トランスポゾン的な散財反復配列のLINEやSINEが存在している。

ヒトゲノムにおける分節重複

segmental duplicationのことを指す。ヒトゲノムのうち5%程度。

 

コメント