医学の分野では長い間、体が作り出すすべてのタンパク質の会話を聞くというのは、夢物語だと考えられてきた。だが、それは、ただうまくいかなかっただけのことなのだ。タンパク質の会話を聞くことは、ゲノミクスよりはるかに難しい。理由の一つは、血液中のタンパク質のダイナミックレンジ(最大量と最小量の差)が大きいことで、その差は10倍から12倍にも及ぶ。

 また、タンパク質を研究するには、ニューロンを解析できるほどの高機能の技術が必要とされ、しかも、誤差を出さずにその微小な断片を調べるのは極めて難しい。また、DNAの解読と違ってタンパク質は、わずかなサンプルからすべての情報がデジタル的に読み取れるわけではない。それどころか、膨大な数に及ぶタンパク質分子を集めて組織化するのは、極めてアナログ的な作業なのだ。

 科学者たちは何年もかけて、すべてのタンパク質の量を測定しようとしてきた。しかし、測定値には誤差が多く、また、測るたびに数値が異なり、信頼できる結果は出せなかった。したがって、プロテオミクスの評判は悪く、大半の人は、一度に数個以上のタンパク質を研究するのはしょせん無理なことだ、とあきらめていた。しかし、長く医学界では(特に、私が専門とするがん研究の分野では)革新が待たれており、私は、最終的には技術が追いついて、プロテオミクスが革新をもたらすに違いないと信じていた。

 タンパク質を調べようとする研究者が直面するハードルの一つは、そのプロセスの繊細さである。午前9時に実験室に入室し、小学生でもできる単純な作業をすれば、2時間後には機械が分析結果を吐き出す、といった具合にはいかないのだ。DNAのシーケンシングは、そのくらい簡単にできるようになったが、残念ながら、血液中のタンパク質の分析には数百もの段階があり、そのうちの一つでも間違えると結果が歪む。たとえば、その分析を生物学の実験室で大学院生と行ったとしよう。そのうちの1人がラジオの選局を変えるため持ち場を離れ、サンプルを15秒間ほど長く薬品に曝露させたら、まったく違う結果が出てしまう。これは、科学では許されないことである。結果を再現できない実験は、意味がない。再現可能な結果が得られて初めて、結論は信用できるのだ。そういうわけで、アル・ゴアは私に、デジタル技術の専門家であるダニー・ヒリスの力を借りるべきだと言ったのだった。

 問題は「技術の遅れ」にあり、そうなると、私のような生物学者には解決のしようがない。私の研究は、最先端の物理学を求めていた。つまり、ラボの作業台ではなく、厳しく管理された半導体のラインのようなものを必要としていたのだ。さらに、たとえタンパク質の量を計測できたとしても、そこから意味を引き出すには、膨大な計算、つまり、コンピューター処理をしなければならない。1人の人間のタンパク質を図式化するだけで、約40ギガバイトという大容量が求められる。

 最初の作業だけでなくすべての段階で、私はヒリスの技術力を必要としていた。そして、彼はさまざまな解決策をもたらしてくれた。その一つ、パラレル・コンピューティング(多くの計算を複数のプロセッサーで同時並行に処理する方法)は、タンパク質濃度を測る質量分析法を変化させた。

たった1滴の血液から、10万を超す特徴を把握

 質量分析法の原理は単純だ。まず分子を、電荷を帯びたイオンの状態に変化させる。そうしておけば、電気や磁気によって操作できるからだ。次にそのイオン化した分子の質量と電荷を計測し、グループ分けしてグラフに示す。もっとも、タンパク質は巨大分子(非常に多数の分子が結合してできている)なので、まずアミノ酸の鎖を切断して、断片にしてからこの作業に入る。そしてその結果を既知の、あるいは予測されるタンパク質のデータベースと比較して、オリジナルのタンパク質を同定するのである。こう説明すると簡単そうだが、実際の作業には、非常に多くの先端技術が絡んでいる。原理は単純だが、人間の手で変化しやすいサンプルを処理する作業は、単純という言葉からは程遠いのだ。

 私たちは6年にわたって困難な作業を続け、2009年になってようやく、「組み立てライン」を作ることができた。そのラインは、何百段階にも及ぶ作業を自動的にこなし、おかげで私たちはようやく、正確で再現可能な結果を得られるようになった。たった1滴の血液から、10万を超す特徴を把握できるようになったのだ。