|
〜知的生命体による遺伝子操作の痕跡〜 |
初めまして、私はエドワード・ウィルソン、J・ホプキンス大学の分子生物学教授 です。私の集中講座に、これだけ多くの学生諸君が来てくれて、ありがとう。大学 当局も、少しは私を見直して年俸をアップしてくれるかもしれない。はははは。 (注:エドワード・ウィルソン博士は34歳で独身。真面目そうな風貌をしている が、天才にありがちな偏執狂的な面もみられるらしい。) さて、今日の受講者は一般教養ということで、分子生物学の学生は一人もいな いで、いろいろな分野の研究者の寄せ集めであるから、誰にも分かり易く、かみ 砕いて講義を進めていきたい。退屈だったら、いつでも退席してよろしい。その変 わり単位はやらないからそのつもりで・・・ えー、それではさっそく講義に入ります。 ヒトゲノム。と一言でいっても、君たちには何のことやら分からないだろう。 うん、ヒトゲノム、ヒトゲノム、ヒトゲノム。人間が持つ遺伝情報の全体をヒトゲノ ムという。ヒトには23対の染色体があり、その中身はDNAである。DNAはA(アデ ニン)、T(チミン)、G(グアニン)、C(シトシン)という4種類の塩基で構成されてお り、その数はJUNK-DNAも含めて30億もある(注:JUNK-DNA;ヒトの遺伝に直 接役立たない無意味な情報が入ったDNA部分で、全体の95〜97%を占めてい る。これをJUNK-DNAと呼んでいるらしい)。 人間100兆個の細胞1つ1つに30億の塩基対が入っているのですぞ。そし て、30億塩基の全てを読みとってしまおうというのが、ヒトゲノム解析計画です。 アメリカ国立衛生研究所(NIH)やフランスのヒト多型研究センター(CEPH)などが 中心になって、がんがん進めている。まあ、シークエンサーとコンピュータを使っ ているとはいえ、大変な作業です。金もかかるし・・・ なお、読みとったヒトゲノムのデータベースは、当ジョンズ・ホプキンス大学の GDB(Genome Data Base)にアクセスすれば見ることができる。まあ君たちが 見ても、塩基の配列が何を意味しているか、わけが分からないだけかもね。見る だけムダムダ、ははははは。 そうだね、とりあえず、4種類の塩基「ATGC」がどのようにして遺伝情報として 働くのか、まあ簡単に説明しておこうか。 この表を見て欲しい。 |
|
1 番目 |
2番目 |
3 番目 |
|||
|
T |
C |
A |
G |
||
|
T
|
フェニルアラニン フェニルアラニン ロイシン ロイシン |
セリン セリン セリン セリン |
チロシン チロシン 停止 停止 |
システイン システイン 停止 トリプトファン |
T C A G |
|
C |
ロイシン ロイシン ロイシン ロイシン |
プロリン プロリン プロリン プロリン |
ヒスチジン ヒスチジン グルタミン グルタミン |
アルギニン アルギニン アルギニン アルギニン |
T C A G |
|
A |
イソロイシン イソロイシン イソロイシン メチオニン(開始) |
スレオニン スレオニン スレオニン スレオニン |
アスパラギン アスパラギン リジン リジン |
セリン セリン アルギニン アルギニン |
T C A G |
|
G |
バリン バリン バリン バリン(開始) |
アラニン アラニン アラニン アラニン |
アスパラギン酸 アスパラギン酸 グルタミン酸 グルタミン酸 |
グリシン グリシン グリシン グリシン |
T C A G |
|
これで分かる通り、4種類の塩基から3つを選んで一つのアミノ酸の暗号として使っている。この3文字の組み合わせを「コドン」と呼ぶ。 ところで、4種類から3つを選ぶという塩基の順列組み合わせは、全部で4×4 ×4の64通りある。これは分かるだろう。簡単な算数だな。 しかし、地球上の生物(ペンペン草でもウニでもゴキブリでも人間でも同じ生物) に必要なアミノ酸は全部で20種類。ということは一つのアミノ酸を作るのに、いく つかの暗号が存在するのではないかということが考えられる。 実際その通りで、TTTというコドンはアミノ酸の一つである「フェルニアラニン」を 表すのであるが、TTCも「フェルニアラニン」を指定している。「セリン」は、TCT、 TCC、TCA、TCGで指定される。でも、トリプトファンやメチオニンは1つのコドンし か持っていないけどね。それぞれTGG、ATGだ。 ただし、ATGやGTGは「読み始め」を表し、TAA、TAG、TGAは「読み終わり」を 表している。アミノ酸は一部を除いて指定していない。 実際にはこのDNAから、Messenger-RNAに転写されて、アミノ酸に翻訳される のだけれどね。DNAのA(アデニン)、T(チミン)、G(グアニン)、C(シトシン)が転 写されると、U(ウラシル)、A(アデニン)、C(シトシン)、G(グアニン)となる。こん なことは今覚える必要はない。まあ、君たちならハンバーガーを食べたり、ガー ルフレンドといちゃいちゃしているうちに全部忘れてしまうんだろうけど。はははは ははは。(教室中は水を打ったように静か)。 あー、えーと、遺伝子暗号はその辺にして、DNAの中がどうなっているのか、も う少し詳しく見てみよう。 DNAはS(糖)とP(燐酸)とが交互に二重螺旋で伸びている。その間にA(アデニ ン)・T(チミン)・G(グアニン)・C(シトシン)の四種類の塩基のうちの二組で繋がって いて、AはTと、GはCとそれぞれ対を作っている。この姿は君たちもどこかで見た ことがあるだろう。本当に美しい姿をしているね。(注;DNAの2重螺旋図は省 略)。 それでは、誰のでもいいからDNAを1本引っぱってきて、顕微鏡で見たとしよ う。これを図式的に示してみる。 DNA −−■−−−−■−−−−−−−■−−−−−−−■−−−−− − ■が遺伝子で、その間の−−−はスペーサーと呼ばれている何万文字もの意 味のない領域が続く部分だ。ヒトゲノム全体では30億塩基もあるのに、有意義 な遺伝子はその3〜5%程度だ。遺伝子の数はだいたい10万程度と予測され ている。この鎖が延々と続いているわけだが、95〜97%部分の今は使われて いないゲノムの部分。 昔は使われていたが進化の過程で使われなくなったという説や、今でも一部分 は何らかの働きをしているとの説もあるのだが、よく分かっていない。はっきり 言って、ほとんどが役に立たないDNAだといわれている。Triplet-Repeatや2塩 基の繰りしがやたらと多いしね。(注;Triplet-Repeat:CAGCAGCAGなど3塩基 の繰り返しが意味もなく続いていること)。 次に■の部分の遺伝子を拡大して図式的に示してみよう。 遺伝子 ====□===□=□==== □がエクソンといって、意味のある情報がある場所だ。=がイントロンといって 意味のない情報。時には1万文字も続くんだからやんなっちゃう。DNAは本当に 無駄な部分が多い。この部分が、意外に重要な役割をするという学者もいるけど ね。 ところで、さっき説明したTriplet-Repeat(3塩基の繰り返し)がこの遺伝子部分 に強く現れると、ハンチントン舞踏病、延髄小脳萎縮症、ジョセフ病などの遺伝子 病になってしまう。これは人の血液からDNAを取り出して調べてみれば直ぐ分か る。 ということで、まあ、以上がDNAの基本的な、ほんとに基本的な説明だ。よく分 からない所もあったと思うが、ここまでで何か質問があれば受け付けよう。 はい。そう君、君だよ。よれよれのヨットパーカーを着ている青年。 <学生の質問> ちょっと1点だけ質問します。現在ヒトゲノム解析計画が進め られてるといいますが、実際に読みとられているヒトゲノムは一体誰のものなん ですか。私は見ての通り黒人だが、読み取っているヒトゲノムは先生と同じ白人 のものなんじゃないですか。 はい答えます。君は人種間によってDNAの中身が大きく違っていると思ってい るようだが、実はほとんど差はない。それよりも個人差の方が大きい。つまり、白 人と黒人の差よりも、同じ白人同士の個人差の方が大きい。まあ大きいといって も、全体から見ると無視できるくらいの差異しかないんだけどね。 従って、ヒトゲノム解析の対象となるDNAは世界中の誰のものでもいいんだ。 今日もこの講座にはいろいろな人種の人達が集まって来ているけど、あっ、そこ の君は中国人かな。えっ、日本人?それにしては眼鏡をかけていないねえ。う ん、日本はいいよ。なんてったって女性がきれいでやさしい。君も幸せ者だなあ。 まあ、そのまま幸せでいて二度と真珠湾には攻めてこないでね。頼むよ。 えーそういうわけで、研究者は自分の妻や恋人や愛人や同性愛の相手などの ゲノムを解析機にかけているとの噂が、まことしやかに広がっている。まあ、私は 自分の生殖細胞から取ったゲノムを使っているけどね。昨日もペントハウスを読 みながらたくさんサンプルを採取したよ、なんてね、はははは。 (注:受講している女性数名が、怒った顔で途中退席する。あきれた顔もある。 教室は例によって引き潮のように静か。) ぐふ。さて、講義を続けよう。 先ほどいったように、ヒトゲノムは、NIH(アメリカ国立衛生研究所)やCEPH(フラ ンス ヒト多型研究センター)などが競争で解読している。日本もこのごろがんばっ ているね。特に、Messenger-RNAが運んでくる有意義な部分、先程の図でいえ ば、□で現した遺伝子部分にいては、その遺伝子がどういう働きをするのかとい うことを含めてかなり解読が進んでいる。どうやらアメリカと張り合って特許申請 するらしいが。どうも日本はあとから遅れてやって来て、おいしいところだけを 持っていくということが得意だね。 まあ、このように解析は加速度的に進んでいる。あと2、3年で全て解析が終わ るだろう。次のワールドカップの2002年ごろには終わっている。 さて、ここからが、いよいよ私の講座の本題に入るわけだが、ヒトゲノムの9割 以上を占めるスペーサーやイントロンの部分。進化の過程で使われなくなったと か、今でも一部分は何らかの働きをしているとかいわれている部分。ここに私は 目を付けたのである。この役立たずのJUNK-DNA。ここにこそ、非常に大切な情 報が隠されているのではないか。そう考えたのである。 どうしてそう思ったのかと尋ねられても、直感的にとしか答えられない。天才的なインスピレーションだね。 ただ、30億もの塩基の羅列の一体どこにそれが隠されているのかは分からな い。藁の山の中から1本の針を探すようだ。ニューヨーク市の若い女性の中から やさしくて美しい人を探すようだ。ホプキンス大学の中から真面目で勉強熱心で 将来有望な学生を探すようだ。 うん、ここで質問。ヒトとチンパンジーのDNAはどれくらい同じか。半分くらいは 共通している?いやいや、全体の92%が同じものとされているのだよ。よく調べ れば、もっと%が上がるかもしれない。つまり、人間とチンパンジーの設計図は9 割以上が同じものが使われている。 これは逆にいえば、もし人間だけに隠された情報が含まれているとするなら、こ の両者のDNAの異なっている部分を調べればよいということだ。それも現在有意 義な情報がないとされているスペーサー、図でいえば「−−−」で現した部分。 よろしいかな。これでかなり調べるところが絞られたわけだ。 こうなってくると話は早い。ヒトは性染色体を含めて23対の染色体を持ってい て、大きい順に1番から番号がついている。実は、そのうちの2番染色体は、チン パンジーの12番と13番が融合した構造を持つ染色体なのである。染色体構造 からいって、ヒトとチンパンジーが最も異なる場所なのだ。2番染色体、これが怪 しい。 もっとも、2番染色体1本とってみても、これに含まれる情報量は莫大なもので あるから、まだまだ絞り込んだとはいえないのだがね。2番染色体のどの部分を 読んだかは、ちょっとここではいえないな。企業秘密ということで。まあ、ある遺伝 子病が症例として分かっている多型マーカーにほど近い、かなり長めのスペー サー部分といっておこう。はは、これでは分かるまい。 さて、このようにして私が読みとった「ATGC」の羅列はこのままでは何の役にも 立たない。4種類の塩基「ATGC」の並びから20種類の必須アミノ酸を翻訳し、そ れからタンパク質を組み立てていくという規定のやり方ではだめだ。人間の体の 設計図を解読するのではなく、私はあくまでも何か隠された情報を解読しようとし ているのだから。 いってみれば、シャンポリオンがロゼッタストーンなしでエジプトの象形文字を解 読しようとするに等しい。諸君、聞いているかな?シャンポリオンがロゼッタストー ンなしで、エジプト象形文字を解読するに等しいのだ。・・・しかし、現代ではロゼッ タストーンの代わりにコンピュータという大きな武器があるけれど。 ところで、先程説明したように、「ATGC」から3種類を選んで作られるコドンは6 0種類の意味を表現できる。つまり、アルファベットは26文字しかないが、コドン は60文字ある。それで何かを表現できるというわけだ。つまり、何十万、何百 万、何千万と並んでいる「コドン」の文字を一つの暗号と見たてて、コンピュータ で解読していく。逆から読んでしまっただけでも大変だ。解読プログラムには、非 対称暗号系のEuclid(ユークリッド)互除法の拡張定理を基本に「くりこみ2重排 除法」を組み合わせたものを使った。 あっ、この辺のプログラムの中身は、難解な暗号解読の専門的世界だから、質 問のある人は後で個人的に聞いて欲しい。時間がかかってしょうがない。まあ、 質問してくるような熱心な学生はいないだろうけどね。 えー、このようにして、コンピュータに解読させること約3ヶ月。昼食後のコー ヒーを飲みながら、ディズニーの新作アニメをビデオで見ている時だったな。急に コンピュータがピーピー鳴り出したのだ。別にエラーメッセージではない。有意な 情報が見つかったという知らせ。のろまで亀のようなコンピュータだったが、よく ぞ結果を出したものだ。モニターを見ると、ある数字の羅列が表示されていて、そ の下のメッセージボックスには、円周率が256桁まで合致したとある。 とうとう、ヒットした。私の直感は間違っていなかったのである。 有意な情報は、円周率ばかりではなかった。実は、それは始まりの合図にしか すぎなかった。円周率が256桁で終わると、簡明な数学が解読されてきた。例え ば、素数、ピタゴラスの定理、円の公式などである。続いて、3次元の座標らしき ものが表示されてくる。解読に時間はかかるが、コンピュータは確実に有意な情 報をモニターに表示し続けてるのだ。続けてるのだ。まだ続けてるのだ。コーヒー が冷めてしまった。 諸君、私は大変ついていたと思う。このつきがあれば、ラスベガスで億万長者 にだってなれる。しかし、つきだけではだめだな。やはり、インスピレーションと信 念。3ヶ月の間、私は自分の考えがが正しいという固い信念を持ち続けていた。 覚えておいたほうがいいと思うよ。インスピレーションと固い信念。それにつきだ。 ところで、このようにして解読できた内容についてであるが、それは次回以降の 講座で明らかにしよう。ヒトのDNAに有意な情報を書き込んだのは、いったい誰 なのか。また、それはいつ頃なのか。人類が未到達の科学の概要もある。恋人 とのデートをすっぽかしても、次回の私の講座を欠席することはないと、確信して いる。 では、これで第1回目の講座を終了する。 <第2回講座に続く> |