Genomicsの分野でよく言われる数字をまとめる
ヒトゲノムの話
ここでは主にHuman Genomeの話を記載する。
知識として知っていることなどを書くだけなので、出典などもあとから追記をする予定
ヒトゲノムサイズ
およそ30億塩基対と言われてる。
もう少し細かくいうと31億塩基対(3.1Gb)。
ただし、unlocalized sequence などは考慮に入ってないので、実際にはもう少し大きくなるはず。
ATGCの4パターンなので2bit。これが30億塩基対だから、750MBの情報量。
ヒトゲノムの長さ
ワトソンクリックの二重らせんモデルでは10.5塩基対でらせんが一周する。
その長さは3.6nm。
ということは、30億塩基対でおよそ1.03mつまり1mぐらいになる。
ヒトゲノムは二倍体なので実際には2m。
ちなみに細胞核のサイズは数µmで、細胞自体は数十µm。
ヒトゲノムの中にある遺伝子の数
およそ2万前後。Ensemblをみると20300超えるぐらいか。
もともとは三万ぐらいかと思われてた。
ヒトゲノム中の遺伝子領域
およそ3分の1程度。
タンパク質になるエキソンはおよそ1%程度。イントロン(非翻訳領域)をいれても1.5%。
ヒトゲノムの中で遺伝子領域以外の部分は?
トランスポゾン的な散財反復配列のLINEやSINEが存在している。
ヒトゲノムにおける分節重複
segmental duplicationのことを指す。ヒトゲノムのうち5%程度。
コメント