タテよこ斜め縦横無尽

田舎の年金暮らしのたわごと

遺伝子解析とDNA解析とゲノム解析

 新型コロナウイルスの変異株による感染が拡大する中、一部の検体は国立感染症研究所に送られ検査されているという。変異株か否かはPCR検査では分からないので、ウイルスの持つ遺伝情報の更なる解析が必要となる。最近のニュースで、国立感染症研究所が行っているこの解析を「ゲノム解析」と言っていた。今まで「遺伝子解析」や「DNA解析」という言葉があり、人が持つ遺伝情報の解析が親子鑑定や犯人特定に役立っていることは知っていたが、ウイルスに対しては「ゲノム解析」という言葉を使うようなので、どこが違うのか調べてみた。
 まず、生物が持つ遺伝情報の一揃いをゲノムと言う。一般に生物は、このゲノムがDNAの中に格納されている。一方でコロナウイルスのゲノムはRNAの中に格納されている。DNAは長いはしごの形をしていて、RNAはそのはしごを縦に真っ二つに切り分けた時の片方だと思えば良い。すなわち、人の遺伝情報を解析する場合は「DNA解析」と言う言葉は適当だが、コロナウイルスに対して「DNA解析」という言葉を使うと間違いになる。よって、より一般的な言葉である「ゲノム解析」という言葉を使うわけである。
 次に、「遺伝子解析」と「DNA解析」や「ゲノム解析」の違いを説明する。ゲノムには、長い長い塩基文字列が書いてある。塩基文字は4種類あり、A(アミン)、T(チミン)、G(グアニン)、C(シトシン)である。これらの連続する3文字(コドン)がある特定のアミノ酸を意味する。そして、ゲノム上のこのコドン配列でアミノ酸配列が決まり、そのアミノ酸配列で蛋白質が決まるという風に遺伝情報が蛋白質へと翻訳される。ある特定の蛋白質を遺伝子と呼び、それが書いてある領域を「コーディング領域」と呼ぶ。人の場合、コーディング領域はゲノムの中のほんの一部になる。
 すなわち、「遺伝子解析」では、ゲノムの中のほんの一部となる「コーディング領域」のみを解析する。しかも一般的には、全ての遺伝子ではなく、ある特定の対立遺伝子(例えば、血液型でA型、B型、O型があるような複数タイプ存在する遺伝子)のみ解析することが多い。一方で「DNA解析」や「ゲノム解析」においては、遺伝子(蛋白質)に拘らず、アミノ酸配列、あるいは塩基文字列(A,T,G,C)を解析する。

f:id:TatsuyaYokohori:20201210205205p:plain
 上図は新型コロナウイルスのゲノムを示す。このゲノムには全体で3万文字程度の情報が書いてある。Sと書いてある領域がスパイク蛋白質がコーディングされている領域であり、この領域のアミノ酸配列に変異が起こったものを変異株と呼んでいる。例えば、英国株はN501Yと呼ばれており、この領域のアミノ酸配列の501番目が、アスパラギン(N)からチロシン(Y)へ置換している。
 ウイルスをゲノム解析すると、個々のウイルスをより細かく系統分類できる。すなわち、同じ英国株の中でも、501番目以外の変異個所を比較することで、英国株-1系統、英国株-2系統という風に分類することができる。そしてこれは、感染経路がより細かく精緻に解析できることを意味する。