ウェット実験×機械学習の分子進化工学でタンパク質開発を加速
取材/文・坂本希美 | 最終更新日:2024年10月
機能タンパク質は私たちの社会で広く使われており、より役立つものが求められ、各分野でブレイクスルーをもたらすと期待されている。しかし、その作製は容易ではなく、多くのコストがかかる。 “分子進化工学とドメイン組み換え設計技術を用いて、目的の構造と機能を持つタンパク質をボトムアップにスマート設計し、「医学」「環境」「MEMS」「ナノ材料」の各分野において活躍できる分子を提案していく”ことを目的としている東北大学大学院工学研究科梅津研究室の伊藤智之助教は、機械学習やAI技術を用いて、効率よく高機能の機能タンパク質を得られる進化工学プロセスの開発を研究している。機械学習には教師データが膨大に必要となるが、そもそも課題となっている作製の手間や難しさが伊藤助教の前に立ちはだかった。そんな時、研究室に導入されたのがザルトリウス・ジャパン株式会社のOctet® 生体分子間相互作用解析システムだ。ハイスループットに多検体をリアルタイム解析できるこの装置の使いこなしを伊藤先生に伺った。
サハラ砂漠から一粒の砂金を見付けられる可能性
── 現在取り組んでおられるご研究について教えて下さい。
私はタンパク質の機能を進化させる進化分子工学を研究しています。この高分子化合物は、20種類のアミノ酸配列で機能が決まります。そこに改変を加えたり変異を入れたりすることで、天然にはない機能タンパク質が作り出され、多様な分野で人間社会の役に立っています。しかし、タンパク質を構成する20種類のアミノ酸が取り得る配列種(配列空間)はとても膨大で、アミノ酸を100個並べたときの配列空間は20の100乗にもなります。一方実験的に機能を評価できる配列数は配列空間の規模よりも格段に小さいため、目的の機能を持つタンパク質を見つけられる可能性は場合によって「サハラ砂漠から一粒の砂金を見つける程度」にもなります。現状では実験で変異や改変をかけて選ぶことを繰り返して機能変異体を取得しますが、手間や時間などコストの割に目的の機能タンパク質が得られる確率は低いのです。そこで、機械学習やAI技術を使って、より確実に、より効率よく、より機能の高い目的機能変異体を含む配列空間を当てるという、ウェット実験と機械学習を融合した進化工学プロセスの開発を目指しています。このプロセスを使えば、「サハラ砂漠のこのあたりに砂金がある」という地図を持って一粒の砂金を探しに行けるというようなイメージです。目的の砂金がありそうなエリアを機械学習に提案させて、あとは実験で作っていく。機械学習は候補の順位も出してくれますから順番に実験し、外れていたら新たな候補を絞り直していくことができます。
── 機械学習によって実験に費やす時間も手間も効率化できるわけですね。他にはどのようなメリットがあるでしょうか。
例えば、医薬品に使うタンパク質を作る際に抗体の機能を結合性と安定性の両方を同時に上げたいことがあります。実験で作ると、異なる2つの働きはトレードオフになることが多いのですが、機械学習を使うとどちらも上げる方法を提案できるケースがありましたし、逆にできない可能性を事前に知ることもできます。ウェットの実験では不可能な複数の機能を同時に見ていくことも可能になると考えられ、タンパク質設計のクオリティが上がっていくでしょう。
── 機械学習のプロセスづくりは、どのように進めておられるのでしょうか。
機械学習に組み込むデータを作っているところです。実験で作ったデータと、それを使って機械学習が提案した結果を評価しているところで、非常に多くの実験をこなさなくてはなりません。研究室としても打開策はないかと検討して、ザルトリウスさんのOctet®を導入することになったのです。
メンテナンスフリーで各コストを縮小し、研究に注力
── Octet®のどのようなところが導入のきっかけになったのでしょうか。
多検体サンプルも測定することができる点とハイスループット性が大きな魅力で、私たちのやりたいことと相性ぴったりでした。機械学習にはとにかく大量のデータが必要なので、同時並行で多検体のデータが取れるのは本当にありがたいですね。取り扱いに関して、これまで使ってきたSPRの機器はサンプルをマイクロ流路に流すので繊細なために壊れやすく、メンテナンスがかなり必要なものですが、Octet®はほぼメンテンアンスフリーなので、時間的にも経済的にもコストを抑えることができています。失敗しても、その後のメンテナンスを心配しなくていいので、色々なトライができますし、とにかく手間が少ないです。
相互作用解析も濃度アッセイもオフレートスクリーニングも一台でこなす
── 導入されてから3年近くになるとのことですが、伊藤先生の「Octet®おすすめポイント」は?
相互作用解析だけでなく、濃度を測ることもできるのはおすすめポイントですね。結合の強さを見る際に、ELISAでは濃度が高くて光っているのか、濃度は薄いが結合が強くて光っているのかを評価しづらいものです。Octet®は夾雑が多いタンパク質溶液でも、抗Hisタグセンサーチップを使えば精製・希釈等なし、ものの数分で濃度が測定できます。従来のやり方ではハードルになっていた手間、コスト、時間を突破できるようになりました。また、チップごとに固定化するものを変えられるのも、おすすめポイントです。SPRではたいてい機械に付属している基盤の上に抗原を固定し、そこに抗体を流して相互作用を見るのが基本的な使い方ですが、Octet®はセンサーチップをサンプルにチャポンと浸すだけですから、チップに抗体を固定化して抗原に浸す、そのまた逆など、工夫次第で多様なアプリケーションが可能になります。他には、多検体のオフレートスクリーニングにも使っています。これらは、既存の実験系では実現できないものでした。
「中くらい」という解析を教師データに組み込む
── Octet®を使うことで、どういった課題解決ができたでしょうか。
タンパク質によって性質が違いますから、どういう実験系を組むのが一番いいのかはやってみないとわからないところです。実験の選択肢が増えるということは、それだけできることが増えるということなので、ELISAでできないからと教師データ取得自体を諦めていたものが可能になったケースもありました。また、先ほどデータの質と量はトレードオフになりがちと申し上げましたが、Octet®を使うことで程よく両立していると感じています。これまでは量が増えると、結合するか否かだけで中間がよくわからないケースもあったのですが、Octet®だと明らかな数値が出てきます。機械学習的にはその中間部分も判別できるようになるので、OKかNGだけでなく、「中ぐらい」という解析もできるようになりますね。細かいところですが、1 mLの培養をすることが多いのですが、Octet®では40 μLからの測定が可能なので、Octet®でなければ1タンパク質あたりに発現させる培養量は4 mLや10 mLに増やさなければならないケースもあり、コスト的にも大変だったので、これもひとつの課題解決だと思います。
── 使い心地はいかがですか。
とても使いやすいです。壊れにくく、メンテナンスフリーという点はもちろんのこと、ソフトウエアもわかりやすい。自分で設定していく時にどのウェルには何を入れるのかなどをはっきり表示してくれるので、あとは決められた溶液を入れてセットして終わり。煩雑なことを考えなくて済むので助かります。もちろん、実験結果が出たら溶液調整や条件の変更などを考えますけれど、操作はウェルに入れてセットして走らせるだけですから、安心な上にすごく楽です。
Octet® 生体分子間相互作用解析システム
── 新しい装置を使うということで、わかりにくさなどはございましたか。
導入してすぐにザルトリウスさんに使い方をご説明していただきましたが、そう言われてみれば戸惑ったりすることもなく、最初からある程度のデータを得られていました。その後、データに関してわからないことや結果の解釈について質問し、ご対応いただいていますが、装置のトラブルや使い方で困ったことはほとんどなかったと記憶しています。
── サポートの部分で印象的なご経験等はありますか。
従来、SPRで得ていたデータの波形と、Octet®で得られたものが合わなくて何故なのかわからない時や、センサーチップに抗原を固定化しているものとしていないものと両方用意してモニタリングする実験で、固定化していない方に結合するのはどの程度か判断しかねて、生データをザルトリウスさんに送って助言をいただきました。チップの置き方や設置の部分でコツを教えていただいたり、「こんな条件でやってみたのですが、どうでしょうか」「こんなふうに解析したらできますよ」というようにアドバイスをいただきました。
「これは駄目なデータです」とはっきり言ってくださることもあって、私たちとしては解決につながることはもちろん、不安も解消されるので本当に助けていただいています。特に使い始めの時期はラボの誰にも聞けない状態でしたから、測定が間違っているのかもしれないけれど、それっぽいデータは出てきても不安でしかたありませんでした。そんなSOSにも親身にサポートしていただけて、精神的にもありがたかったです。
── 満足されてご使用になられているとのことですが、他にリクエスト等はございますか。
Octet®の問題ではないのですけれど、実験と向き合っていて々思うのは、384ウェルプレートが見えやすくならないかなと。ウェルが小さいので、溶液を注入してもちゃんと入っているかどうかがよく見えなくて、慢性的に肩こりと眼精疲労を抱えています。おそらく、実験に携わる方は皆さんそうではないかと思うのですけれど、これが解決されたら多くの方に喜ばれるのではないでしょうか。
(ザルトリウス社アプリケーション担当)製薬企業様でも同じようなお悩みをよく聞きます。解決方法としては、現在のところは自動化というのがお答えになります。プログラム通りに384ウェルに間違いなく入れてくれる自動分注装置があります。そうした装置を組み合わせて使っていただき、測定まで持っていく連結もOctet®ではできるようになっております。やはり機械の方が正確ですし、再現性を取るという意味でもより良い実験になるだろうと思います。ただアカデミアでは「ちょっとやってみようか」というお試し的なシーンがかなり多いため、流動性や柔軟性を考えると人の手で行う方が早い、ということになるのだと思います。実験で手を割く部分が変わっていけばいいなと思っております。
情報技術の目覚ましい進歩に踊らされない、着実な開発を目指す
── 伊藤先生はなぜ研究者になろうと思われたのですか?
高校の生物の授業がとてもおもしろかったのがきっかけだと思います。特に興味を持ったのが遺伝子についてでした。遺伝子があって、タンパク質になって……というところを勉強していた時に、どんな生物も遺伝子は一緒なのに、それがタンパク質になってそれぞれ別の形になる。生物は不思議だなあというふうに思ったのですね。それで、大学受験の時に化学・バイオ系という言葉に惹かれて学部にバイオという言葉があるのに惹かれて東北大学工学部化学・バイオ工学科を受験して、今に至っています。
修士課程あたりまでは実験が楽しくてしかたがなかったのですが、研究室での先生方や先輩たちと過ごすうちに、研究者というのは実験をするだけではなくて、非常に多岐にわたる知識や技術を持ち、洞察力や発想の豊かさ等によって研究をするのだと知りました。実験結果について考察したり議論したりするにも、深い知識と広い視野が必要だと痛感した時に、本当にかっこいいなという憧れをもって、研究者になろうと思いました。
── 先生のご研究では、Octet®によってどのような成果がありましたか。
抗体の発現量、安定性、抗体の親和性の3つを同時に向上させる研究において、機械学習データ取りにOctet®を使いました。発現量評価にもOctet®を使い、その機械学習によって提案されてきたものの最終評価もOctet®の相互作用解析プログラムで行いました。その結果、発現量は4倍以上、安定性は約10度、結合力は40倍以上に向上させられたという成果を得られました。「Machine-learning-guided simultaneous molecular evolution for affinity, expression, and stability of antibody fragment」として2024年度の日本蛋白質科学会で若手奨励賞をいただきました。
── 今後の抱負をお聞かせ下さい。
タンパク質は生物の体内で重要な役割を果たすのみならず、薬や触媒など人間社会に役立っていますが、もっと色々な役立て方があるだろうと思います。材料分野に使おうという動きもありますし、タンパク質が活躍する場はどんどん広がるでしょう。タンパク質に求められる機能等が増える一方で、作製の難しさが課題となっています。機械学習やデータの取得方法をさらに洗練させていくことで、タンパク質の研究をしている方々の助けとなり、タンパク質開発の加速に貢献できる研究ができたらと思っています。
最近ではGoogle DeepMindの「AlphaFold3」の登場など情報科学が目覚ましく発展しており、多様な分野でのブレイクスルーが期待されていますが、私たちとしては、実験と新しい情報技術を両輪として冷静に取り組まなければと考えています。着実なタンパク質開発のプロセス化を実現し、開発者にとって使いやすいものになるよう目指していきます。
── 機械学習を用いたタンパク質開発が加速することで、どのような未来を思い描いておられますか。
これまで特定の標的に結合する抗体をゼロから取得するには、動物の免疫機能を利用する実験をすることが主流でした。でも結合の強い抗体をゼロから得るプロセスをもっとスムーズ化できれば、こうした動物実験を減らすことができるかもしれません。もちろん、動物実験という段階は非常に重要ですが、やはりさまざまなコストがかかるものなので、手が届かない研究者も少なくないはずです。もし、不要とすることができれば、研究にコミットする人が増えるでしょうから、ライフサイエンス研究全般にとっても、人類にとっても良い未来になるのではと思います。