※本ブログは、BIOVIA Blog (英語版)で先に公開されたブログの日本語参考訳です。
生物学者のためのAI活用
ここ数年で、人工知能(AI)が生物学研究の進め方そのものを大きく変えつつあることを私たちは目の当たりにしてきました。実験による検証が依然として不可欠である一方、AI はアミノ酸配列から直接タンパク質構造を予測できるようになりました。これは、Protein Data Bank(PDB)に蓄積された高品質なデータがもたらした大きなブレークスルーです。構造予測にとどまらず、Baker Labをはじめとする研究により、AI がゼロからまったく新しいタンパク質を生成できることも示されています。さらに最近では、AlphaFold3やOpenFold3に代表される co-folding モデルの登場により、タンパク質だけでなく核酸や低分子を含む多分子複合体の構造を、配列情報から直接予測できるようになるという大きな進歩が生まれました。これらすべての進展により、合理的設計(rational design)の可能性は飛躍的に広がり、分子設計や創薬における新たな道が切り開かれています。
これらのAI駆動ツールがもたらす可能性は非常に魅力的である一方で、計算生物学者は、これらを自分たちのタンパク質工学ワークフローにどのように統合するのが最適か、最も効率的かを常に模索しています。RFdiffusion、ProteinMPNN、AlphaFold2はde novoタンパク質設計において非常に有用ですが、これらのツールを用いてどのように設計キャンペーンを進めるべきかどうかは簡単ではありません。たとえば、特定のタンパク質ターゲットに対するProtein Binderを設計する場合、一般的に複数のステージを経る必要があります。(1)バインダーの候補となるスキャフォールドの生成、(2)それらのスキャフォールドへの配列割り当て、(3)配列に基づく構造モデルの構築、という流れです。設計プロセス全体を通じて、各ステージには多くのパラメータが関与します。さらに、一つの設計キャンペーンで最適だったパラメータ設定が、次のキャンペーンでも有効とは限りません。そのため、広いパラメータ空間を探索できる統合的な設計プロセスへのニーズが高まっています。
この課題をどう解決するか:統合型プロトコルの登場
3DEXPERIENCE® プラットフォーム上の最新バージョンのDiscovery Studio Simulationでは、de novoバインダー設計に必要とされる要件に応える新プロトコル「Design Protein Binders」を提供します。Design Protein Bindersは、RFdiffusion を用いてターゲットタンパク質に結合するバインダーのスキャフォールドを生成し、ProteinMPNNによってそれらのスキャフォールドに最適化されたアミノ酸配列を割り当て、さらにAlphaFold2によって各配列の構造を予測し、RFdiffusionが生成したスキャフォールドとの構造類似性を評価します。de novoバインダー設計パイプラインの第1段階では、Design Protein Bindersはユーザーが定義したパラメータ空間を探索する逐次的な設計プロセスを用いて、既知のターゲットタンパク質構造に結合すると予測される新規タンパク質を設計します。第2段階では、同じ逐次設計プロセスを用いて、第1段階で得られた上位デザインに類似したインターフェースをサンプリングします。具体的には、結合インターフェースから離れた残基を部分的に拡散させることで、結合インターフェースを保持しつつ追加のスキャフォールドを生成します。
第1段階・第2段階のいずれにおいても、ユーザーは設計スコアに基づくフィルター条件を設定できます。たとえば、predicted local distance difference test、predicted aligned error、interface predicted aligned error、AlphaFold2が予測した複合体構造とRFdiffusionが設計したスキャフォールドとの RMSD などです。フィルター条件を満たさないデザインは自動的に除外されます。その結果、ユーザーが設計の網羅性を調整しながら利用できる、自動化されたde novo 設計プロセスが実現します(下図参照)。

Design Protein Bindersプロトコルは、構造予測におけるmultiple sequence alignment(MSA)生成ステップを省略することで、ユーザーが定義したパラメータ空間にわたり、数千件規模のバインダー設計を効率的にサンプリングできます。さらに、BIOVIA Discovery Studio Simulationの追加ステップを用いて、スコア項目を自動的に計算することも可能です。また、ユーザーは既存の「Generate Protein Scaffolds」「Generate Protein Sequences」「Predict Protein Structures」プロトコルを利用して、上位候補のバインダーを手動でさらに精密化したり、multiple sequence alignmentを用いて予測構造を確認したりすることもできます。
Design Protein Bindersプロトコルは、Discovery Studio Simulationにおけるde novoタンパク質設計を大きく前進させるものであり、研究者に革新的な新規Protein Binderの発見を加速する、効率的・知的・柔軟なプラットフォームを提供します。このプロトコルは、RFdiffusionによるタンパク質スキャフォールド生成、Protein Scaffoldsに対する配列生成、そしてタンパク質配列の構造予測といった、BIOVIA Discovery Studio Simulationにすでに存在する個別パイプラインを補完するものであり、これらすべてのツールを統合するプロトコルとしての役割を果たす可能性を秘めています。
-ティエン・ルー博士(ダッソー・システムズ BIOVIAバイオサイエンス部門 ポートフォリオ・シニアマネージャー)
科学分野におけるAIがタンパク質の合理的設計を変革し続ける中、統合されたワークフローは、こうした高度な手法を生物学者へと広く開放し、発見のスピードを加速させています。BIOVIAはこの領域をリードし、AI駆動のタンパク質設計を、より身近で、効率的で、実践的なものへと進化させています。
新しいDesign Protein Bindersプロトコルについて詳しく知りたい方は、ぜひこちらの動画をご覧ください。
📩BIOVIAの最新イベントやお客様事例、ブログ更新などの情報をいち早く受け取りたい方は、BIOVIAニュースレター にご登録ください!



