小林裕和
(株)グリーン・インサイト・代表取締役/静岡県立大学・名誉教授・客員教授
夏季オリンピックが7月26日からパリで開催される。夏季に開催される近代オリンピックは、1896年にアテネで第1回、今回は第33回となる。毎回多くの競技において世界記録が更新され、今回もアスリートの活躍に世界の視線が集まる。私の研究者人生は50年目に差し掛かる。ここ50年間の各種スピード上昇率を比較してみよう。今から50年前の1974年、日本では 「第一次オイルショック」 が1973年10月に始まり、消費者によるトイレットペーパーの買い占め騒動が起きた。当時大学生だった私にとっては、大学の建物に2機設置されていたエレベーターの片方が止められ、また、廊下の明かりも節電されて暗くなった。その結果、気持ちまで暗くなった。その頃、未だ生まれていない人も多いはずだが、当時を思い出せない人には、以下の歌が流行っていた時代と言えば思い出せるはず。発表順に、神田川:かぐや姫、あなた:小坂明子、襟裳岬:森 進一、積木の部屋:布施 明、なごり雪:イルカ、精霊流し:グレープなど。当時の若者には、ラジオ深夜放送が人気だった。私のお気に入りは、文化放送 「セイ! ヤング」 の谷村新司さん (チンペイ:1948年〜2023年)。また、ニッポン放送 「オールナイトニッポン」 では笑福亭鶴光さん (1948年〜) など。そのまま聞いていると午前3時からの「歌うヘッドライト」 になり、翌日の授業に影響した。
1974年と現在 (2024年6月) を比較すると、
100メートル走:9秒95 → 9秒58(速度として1.04倍)
200メートル走:19秒72 → 19秒19(速度として1.03倍)
400メートル走:43秒86 → 43秒03(速度として1.02倍)
100メートル自由形:49秒44 → 46秒91(速度として1.05倍)
200メートル自由形:1分45秒85 → 1分42秒00(速度として1.04倍)
100メートル背泳ぎ:55秒49 → 51秒85(速度として1.07倍)
新幹線運行最高速度:210 km/h → 320 km/h (1.52倍)
市販自動車最高速度記録:302 km/h → 490 km/h (1.62倍)
コンピュータ・プロセッサ速度:1〜5 MHz → 2〜5 GHz (約1,000倍)
遺伝情報解読:0.08塩基/日* → 900億塩基/日 (約約1兆倍)
*ロバート・ウィリアム・ホリー (1922年〜1993年) のノーベル生理学・医学賞受賞講演の原稿の値から計算
結果は、遺伝情報解読が圧勝。スポーツは、フォームやウェアーが改善されてきたが、人体能力の限界に達している。移動手段においては、車輪やタイヤという駆動力伝達方法に限界があり、これがリニアモーターカーになると、「603 km/h」 まで上がる。空の交通では、2003年に引退した超音速旅客機 「コンコルド」 があった。私はこの機体をロンドン・ヒースロー空港で見かけたことがある。引退の原因は、2000年の墜落事故による113名全員の死亡、経済性、衝撃波音などの問題が挙げられる。コンピュータは、記憶媒体としては、パソコンのレベルで数百万倍に増大したが、計算速度は千倍程度に留まる。かたや、遺伝情報解読速度は約1兆倍となり、断然のトップとなった。
私の研究人生は、遺伝情報の解読の歴史と併走した。遺伝情報の本体であるDNAは長い紐といえるが、当初の技術では混合物のままであり、解析できなかった。そこで、RNAの遺伝情報 (塩基配列) の解析から始まった。最初の偉業は、ホリーによる77塩基からなるアラニンtRNAの塩基配列決定である (1965年)。当時、断片化RNAに対し、ろ紙電気泳動とペーパークロマトグラフィーによる二次元展開法が開発され、この方法の発端は1960年まで遡ることができる。1970年代に入り、静岡県立大学において親しくさせて頂いた竹石桂一教授 (1940年〜) の大腸菌リポタンパク質mRNAの塩基配列決定が挙げられる。DNAについて、この頃その断片化と大腸菌を用いてそれらを増やすこと (クローニング) が可能になった。すなわち、均一なDNA断片を用い遺伝情報の解読技術 (シーケンシング) が開発された。DNAはA、C、G、Tという4文字から構成されるが、それらの文字特異的にその左側 (5’側) を切断する化学的方法が開発された (マキサム−ギルバート法)。これは1977年に発表され、世界中の研究者に普及した。私は、1983年より博士研究員として、ハーバード大学生物学研究棟に籍を置いたが、この図書室でアラン・マキサム (1942年〜) の博士論文を見つけ、この方法が博士課程学生に由来することに驚いた。1977年には、フレデリック・サンガー (1918年〜2013年) により、酵素反応を用い4文字特異的に遺伝情報の右側 (3’側) まで延ばす方法が開発された (サンガー法)。当時、これらの技法はすべて手作業であった。ウォルター・ギルバート (1932年〜) とサンガーは、DNA塩基配列の決定方法を開発した功績により、クローニング技術を開発したポール・バーグ (1926年〜2023年) と共に、1980年にノーベル化学賞を受賞した。サンガーにとっては二度目のノーベル化学賞受賞となった。
1つの遺伝子は100〜5,000文字ぐらいの塩基配列からなる。そこで、1980年代には、動植物や微生物からの多くの遺伝子の情報解読が進んだ。最初は、リボソームRNAや転移RNAの遺伝子から解析が進み、つぎにタンパク質の遺伝情報が解明されていった。植物では、植物特有の機能である 「光合成」 において、炭酸ガスを最初に固定する酵素RubiscoのLサブユニット遺伝子の解析から始まった。ハーバード大学のローレンス・ボゴラード (1921年〜2003年) らは、これを1980年にNatureに発表した。当時私は名古屋大学の博士課程学生であり、この研究を羨望の眼差しで眺めた。そして、私は1983年からボゴラード研究室に所属する機会に恵まれた。その後、Rubiscoの起原に関し、原始的な光合成細菌においてこの遺伝子はSサブユニット遺伝子と合わせて先ず1セットが出現し、さらに2セットに複製されていることを世界で最初に見いだした (1989年)。私は、これら以外、遺伝情報解読には余り傾倒せず、遺伝子の発現制御機構を研究テーマとした。
生物が生きていく上で必要な遺伝情報の集合をゲノムと呼ぶ。したがって、ゲノムが小さいウイルスから、ゲノム解析が進んだ。動物においては、核以外にミトコンドリアにゲノムが存在し、先ずはこれから始まった。16,569塩基からなるヒト・ミトコンドリア・ゲノムが、サンガーらによって1981年にNatureに発表された。植物においては、ミトコンドリアに加えて葉緑体にもゲノムが存在する。葉緑体ゲノムの大きさは12〜16万塩基ぐらいであり、この解析においては、日本が世界をリードした。共に親しくさせて頂いた杉浦昌弘 (1936年〜) 研究グループがタバコ葉緑体、後発だった小関治男 (1925年〜2009年) ・大山莞爾 (1939年〜) 研究グループがゼニゴケ葉緑体のそれぞれの全ゲノム解析を終了し、1986年にそれぞれEMBOジャーナルとNatureに発表した。1990年頃からサンガー法の検出部分が機械化され、その後反応処理も機械化された。日本におけるゲノム解析はさらに世界を牽引し、私と面識がある方々が活躍された。植物型光合成のモデルとなるラン藻 (シアノバクテリア) の357万塩基が、「かずさDNA研究所」 の田畑哲之 (1954年〜) 研究グループから1996年に、分子生物学のモデルとなった大腸菌の464万塩基が米国を中心とした混成研究チームにより1997年に発表された。動植物の核ゲノムはこれらの300倍以上であり、解読にはさらに時間を要した。植物のモデルとされるシロイヌナズナについては、田畑研究グループが3番 (2300万塩基) および5番染色体 (2600万塩基) を解読し、2000年にNatureに発表した。ヒトゲノム計画では榊 佳之教授 (1942年〜:東京大学・医科学研究所・ヒトゲノム解析センター/理化学研究所・ゲノム科学総合研究センター、現:静岡県立大学・経営審議会委員) を中心にして、11番 (1億3400万塩基)、18番 (7600万塩基)、21番染色体 (4700万塩基) を担当し、ドラフト配列は2001年にNatureにて報告された。主要穀物であり、単子葉植物のモデルとなるイネでは、佐々木卓治教授 (1947年〜:農業生物資源研究所/筑波大学) および五條堀 孝教授 (1951年〜:遺伝学研究所) らが、1番染色体 (4600万塩基) を解析し、2002年にNatureに掲載された。
1990年代後半に入って 「次世代シーケンシング」 の方法が開発されてきた。従来法では同一DNA断片の集合を用いたが、「次世代シーケンシング」 では、異なるDNA断片の混合状態から処理を始める。DNA断片の両端にアダプターを結合後、PCRを行い、蛍光標識基質の利用、あるいは放出されるピロリン酸かプロトンの検出により、シーケンシングされる。さらに、2014年より、「第3世代シーケンシング」 が発表された。その1つは、塩基の同定にナノポアを使う。もう一方は、DNA断片の両端にヘアピンアダプターを結合、変性後は環状一本鎖DNAとなり、これを鋳型として蛍光標識基質の取り込みを繰り返し行う。これはPacBio社のRevioというシーケンサーである。これにより、カタログ性能としては、900億塩基/日の決定が可能となる。私は、チャのゲノム (40億塩基) にこの方法を適用し、710億塩基を読むことができ、読み誤りは約1/400であった。すなわち、ゲノムサイズの約18倍をカバーする満足できる結果であり、このデータをチャのゲノム編集に活用している。
Komentarze