ゲノムプロジェクトとは、DNAシークエンシングによって生物のゲノムの全塩基配列を解読し、タンパク質コード領域やその他のゲノム領域のアノテーションをつけることを目的としたプロジェクトである。当初はヒトをはじめ、マウスや線虫などのモデル生物が主な対象であったが、多くの生物種に対象は拡大している。各国の公的研究機関がチームを組んでプロジェクトを進行させるケースが多いが、イネや小麦などの主要農産物については企業による解読もなされた。
塩基配列情報は重要なものではあるが、それだけでは生物の理解には不十分であり、遺伝子領域や制御領域の認識、それらの役割の解明などを進めていくことが望まれる。これらの研究をポストゲノムと総称する。
ゲノムアッセンブリング
ゲノムアッセンブリングとは、大量の短いDNA断片の配列を決定し、元となった染色体のDNA配列を構築しようとする過程であり、配列アセンブリングなどとも呼ばれる。ショットガン・シークエンシング法によるプロジェクトでは、サンプルから得られたDNAは断片化されている。これら一つ一つの断片はリードと呼ばれ、シーケンサーにより配列決定される。得られたリードは、バイオインフォマティクス的なアルゴリズムによりオーバーラップする部分を探索しつなぎ合わせていく。
ゲノムアッセンブリングは非常に困難な技術的問題を抱えている。それはマイクロサテライトや、SINEs、LINEsといった繰り返し配列がゲノムには大量に含まれるためである。とりわけ、ゲノムサイズの大きい動植物ではこれらのリピートは数千塩基におよんだり、大量に散在している。
結果として得られるドラフト配列は、コンティグごとにまとめられ、領域ごとの情報とリンクさせるための足場となる。
ゲノムアノテーション
ゲノムアノテーションとは、配列に生物的な情報を注釈する過程である。
ゲノムプロジェクトとモデル生物の一覧
- 節足動物 Arthropoda:
- 脊索動物 Chordata:
- ウシ Bos taurus: 進行中
- イヌ Canis familiaris
- ウマ Equus caballus: 進行中
- ネコ Felis catus: 進行中
- ヒト Homo sapiens
- マウス Mus musculus:
- チンパンジー Pan troglodytes
- ラット Rattus norvegicus:2004年4月1日
- イノシシ、ブタ Sus scrofa
- ニワトリ Gallus gallus
- アフリカツメガエル Xenopus laevis
- ネッタイツメガエル Xenopus tropicalis
- メダカ Oryzias latipes: 700 Mbp, NIG、東京大学, 2007年
- ゼブラフィッシュ Danio rerio: 進行中
- トラフグ Fugu rubripes: 365 Mbp
- ミドリフグ Tetraodon nigroviridis
- カタユウレイボヤ Ciona intestinalis
- 線形動物 Nematoda:
- 吸虫 Trematoda:
植物 Plantae
- シロイヌナズナ Arabidopsis thaliana
- トマト Lycopersicon esculentum
- タルウマゴヤシ Medicago truncatula
- イネ Oryza sativa
- ミヤコグサ Lotus japonicus
- ポプラ Populus trichocarpa
- ブドウ Vitis vinifera: 467.5 Mbp, フランス&イタリア, 2007年
菌類 Fungi
- 子嚢菌 Ascomycota:
- アスペルギルス(コウジカビ類)Aspergillus fumigatus
- アスペルギルス・ニデュランス Aspergillus nidulans
- アスペルギルス Aspergillus parasiticus
- アスペルギルス Aspergillus terreus
- カンジダ Candida albicans
- カンジダ Candida glabrata CBS138
- Debaryomyces hansenii
- Fusarium sporotrichioides
- イネバカナエ菌病菌 Gibberella zeae PH-1
- Kluyveromyces lactis
- アカパンカビ Neurospora crassa
- ニューモシスチス・カリニ(カリニ肺炎) Pneumocystis carinii
- 出芽酵母 Saccharomyces cerevisiae
- 分裂酵母 Schizosaccharomyces pombe
- Yarrowia lipolytica
- 担子菌 Basidiomycota:
- 微胞子虫 Microsporidia:
原生生物
- アピコンプレックス門 Apicomplexa[1]:
- Bacillariophyta(珪藻):
- Cryptophyta(クリプト藻):
- Dictyosteliida:
- Diplomonadida:
- Entamoebidae:
- Heterokontophyta(不等毛藻)
- シオミドロ Ectocarpus siliculosus 2010年6月
- Rhodophyta(紅藻):
- Kinetoplastida:
細菌
2008年10月現在、細菌では780の菌株のゲノム解読が終了している。
古細菌
2008年10月現在、古細菌では53の菌株のゲノム解読が終了している。3ドメインの中では最も解読数が少ないが、発見種も少ないため解読された割合自体は最も高い。ほぼ全ての目に渡って解読種が存在する。
細胞内小器官
葉緑体やミトコンドリアもそれぞれ独自にゲノムを持っており、これらについてのゲノムプロジェクトも進行している。
ウイルス
ウイルスは宿主の遺伝子に依存しているためゲノムサイズが小さい。2008年10月現在、ウイルスでは2700種のゲノム解読が終了している。
メタゲノム
メタゲノム解析は単一菌種の分離・培養過程を経ずに、微生物の集団から直接そのゲノムDNAを調製し、そのヘテロなゲノムDNAをそのままシークエンシングする。そのため、メタゲノム解析により従来の方法では困難であった難培養菌のゲノム情報が入手可能となった。
脚注
関連項目
外部リンク