※本ブログは、BIOVIA Blog （英語版）で先に公開されたブログの日本語参考訳です。

サイエンティフィックR&DにおいてAIを信頼することが難しい理由（そしてその解決策）

サイエンティフィックR&DにおけるAIの可能性は計り知れない一方で、リスクもまた大きいのが実情です。サイエンティフィック技術革新において、AIの誤りは臨床試験の失敗、有害な電池の開発、あるいは保存性の低い飲料の誤飲など、数百万ドルの損失と何年もの進歩の遅れにつながる可能性があります。そのため、AIへの信頼を確立することは、単なる好みの問題ではなく、導入の前提条件になります。

しかしながら、AIと従来のサイエンティフィックの中核となる手法は、しばしば相反します。本稿では、サイエンティフィックR&Dにおける信頼のギャップを生み出す根本的な課題を探り、そのギャップを埋めるための枠組みを提示します。これらの障壁を理解することが、AIを活用してイノベーションを加速させ、競争優位性を確保するための第一歩となるからです。

サイエンティフィックな文脈におけるAIの中核的な対立

AIへの信頼を築くには、まずAIモデルの動作原理とサイエンティフィックの発見の厳密さとの間に内在する矛盾を認識する必要があります。これらの課題は、データの完全性、モデルの透明性、規制遵守など多岐にわたります。

「ブラックボックス」対サイエンティフィック的方法

根本的な対立点は、説明可能性という概念にあります。科学者は、AとBの因果関係、つまり作用機序を理解するよう訓練されています。しかし、多くの高度なAIモデル、特にディープラーニングシステムは「ブラックボックス」として機能し、明確で導き出せる根拠を示さずに予測を行います。

ライフサイエンス分野： AIが特定の生物学的ターゲットに対してある分子が有効であると予測することがあります。しかし、その理由――例えば、特定のタンパク質ポケットにどのように結合するのか――を説明できなければ、創薬化学者は高額で時間のかかるウェットラボでの検証に自信を持って進むことができません。
電池・材料研究開発：新しい正極材料を探索する際に、AIが高いエネルギー密度を実現する新規組成を予測することがあります。しかし、その安定性を支える電気化学的原理を説明できなければ、研究者は化学的に不安定であったり、危険な熱暴走を引き起こしたりしやすいバッテリーを開発してしまうリスクがあります。

データ整合性と「サイロ」問題

AIシステムの信頼性は、学習に使用されるデータの質に左右されます。サイエンティフィックデータは、断片化されていたり、文脈が不十分であったり、既存システムに分散していたりすることが多いため、特有の課題を抱えています。

コンテキストのギャップ：科学データの多くは、メタデータがなければ意味を成しません。例えば、pH7.0という値は、温度、使用した緩衝液、測定機器といった情報がなければ役に立ちません。このように文脈のないデータで学習したAIモデルは、信頼性の低い予測を行い、異なる実験条件に対して汎用性を持たない結果を生み出してしまいます。
サイロ化されたレガシーデータ：製剤開発では、数十年分のデータが異なる電子実験ノート（ELN）、ローカルのスプレッドシート、さらには紙の記録に分散して閉じ込められていることがよくあります。この断片化により、企業全体で包括的なAIモデルを学習させるための統合データ基盤を構築することが不可能になっています。
ネガティブデータバイアス：研究室では、成功した実験だけがデジタル化されることが多く、失敗例は同じレベルの詳細さで記録されないことが一般的です。こうした「成功例中心」のデータで学習したAIは、生存者バイアスを抱え、何が「うまくいかないか」を正確に予測できなくなります。これは時間とリソースを節約するうえで極めて重要な機能です。

物理的現実の「幻覚」

生成AIモデルは確率的に動作しており、物理的または化学的に正しい結果ではなく、「統計的にもっともらしい」出力を予測するよう設計されています。そのため、科学的に不可能な結果を「幻覚」として生成してしまうことがあります。

化学・製薬分野：AIモデルが、化学の基本法則に反する分子構造を「幻覚」として生成した事例が報告されています。例えば、炭素原子に5本の結合を持たせたり、合成不可能な分子を提案したりするケースです。
消費財処方：食品科学では、AIが栄養要件を満たすレシピを紙の上では生成できても、物理的に不安定な場合があります。たとえば、すぐに分離してしまう乳化液や、相性の悪いタンパク質の混合物などが挙げられます。

規制およびコンプライアンス（GxP）の壁

製薬のような規制産業において、「信頼」とは法的かつ運用上の概念であり、バリデーションによって定義されます。

決定論的モデル vs 確率論的モデル： GxPガイドラインや21 CFR Part 11などの規制は、システムが決定論的である（入力Aは常に出力Bを生成する）という前提に基づいて構築されています。しかし、生成型AIは多くの場合、非決定論的です。同じプロンプトから異なる出力を生成できる動的システムを検証することは、規制当局への申請において、非常に大きな、そしてほとんど解決されていない課題となっています。
モデルのドリフト：品質管理（QC）に使用されるAIモデルは、時間の経過とともに新しいデータから学習するにつれて「ドリフト」する可能性があります。GxP環境では、モデル挙動に何らかの変化が生じた場合に、完全な再検証が必要になる可能性があり、これは運用上実現不可能な要件であり、継続的な改善を阻む要因となります。

信頼できるサイエンティフィックAIを構築するためのフレームワーク

これらの課題を克服するには、汎用的なAIの利用から脱却し、科学のために特別に設計されたシステムを採用する方向へと転換する必要があります。確率的なAIを決定論的な科学原理で制約することで「信頼」を構築することができます。このアプローチは、物理学に基づくバリデーション、独自データの統合、そして継続的な学習サイクルという３つの柱の上に成り立っています。

1. 物理ベースモデル：科学的安全策

標準的な生成AIは「推測」しますが、科学的知識を備えたAIは「検証」しなければなりません。信頼の第一の柱は、生成AIを物理ベースのモデリングと組み合わせることにあります。この直交的なアプローチは、自動化された「現実チェック」として機能します。

生成モデルが新しい分子や材料を提案した際には、創薬化学者がバリデーション工程を担い、その結果を物理ベースのモデリングツールに移して検証します。AIが生成した構造を精緻化したり、AIが提案した分子がターゲットにどのように結合するかをドッキングで評価したりして、その構造の実現可能性を確認することができます。

2. 独自データ：コンテキストエンジン

一般的な公開AIモデルは、幅広いものの浅く、しばしば古い公開データで学習されています。信頼できる科学AIには、狭く深く、かつ独自性のある情報で学習させる必要があります。

BIOVIAのPipeline PilotやGenerative Therapeutics Designのようなソリューションを活用すれば、失敗した実験、独自のアッセイ、特定の化学ライブラリなど、企業独自のデータを外部に公開することなくAIモデルをファインチューニングできます。これにより、AIは汎用的な提案エンジンから、その組織に特化したエキスパートシステムへと変貌します。組織固有の「言語」や「歴史」を学習し、そのラボの能力や戦略目標に直接結びつく推奨を提供できるようになります。

3. アクティブラーニングサイクル：信頼のループ

静的なAIモデルは時間とともに劣化します。信頼できるAIは、新しいデータが追加されるたびに透明性をもって改善される動的システムでなければなりません。これは、バーチャル＋リアル（V+R）サイクルと呼ばれるアクティブラーニングサイクルによって実現されます。

このプロセスは閉じたループで構成されます：

バーチャル：AIが新しい候補分子、材料、または製剤を設計する。
リアル：ラボがその候補を合成・評価し、結果を取得する。
フィードバック：得られた実世界データを即座にAIモデルに戻し、モデルを改善する。

AIが成功を予測したにもかかわらずラボで失敗した場合、モデルはペナルティを受け、即座に学習します。この透明で閉じたループにより、AIは時間とともに確実に賢く、正確になり、科学者は実績に基づいて信頼を寄せられるようになります。このループを確実に維持する最良の方法は、インシリコデータと実験データの間で共通のデータモデルを使用することです。これにより、両者を同等に信頼できるようになります。

未来への道筋を描く

サイエンティフィックR&DにAIを統合する道のりは、まさに真の意味での事業であり、変革の可能性を秘めた大胆かつ複雑な取り組みです。リーダーにとって、進むべき道はAIを全面的に導入することではなく、科学的方法を尊重し、強化するように設計されたシステムを選択することではないでしょうか。

標準的な生成型AIは、才能豊かで想像力に溢れた芸術家のようなものです。何でも創造できますが、その創造物が実際に機能するかどうかは分かりません。一方、サイエンティフィックAIは、アーティストに構造技師（物理ベースモデル）と建物の全履歴を知るアーキビスト（独自データ）を組み合わせた存在であるべきです。そうして初めて、創造物が革新的であるだけでなく、実現可能であると信頼できるようになります。

この体系的アプローチを採用することで、組織は AI の潜在能力を最大限に引き出し、次世代の科学的ブレークスルーを推進するために必要な“信頼”を構築できます。

BIOVIA Scientific AI で未来を切り拓く

BIOVIA Scientific AIは、革新的なAI技術と堅牢な物理ベースモデル、そして独自のデータを組み合わせることで、研究開発プロセスを変革します。イノベーションの加速、規制遵守の確保、業務効率の最適化など、お客様の目標が何であれ、当社のソリューションは科学的ブレークスルーを促進し、信頼と信用を築くように設計されています。BIOVIAを活用することで、すべての科学者に生成型AIを提供することができます。

BIOVIA Scientific AI がお客様固有の課題をどのように解決し、研究開発のスピードをどのように変革できるかについて、詳しくはこちらをご覧ください。

Stephen Hayward
Stephen Hayward is a PhD in Chemical Engineering, with a background in laboratory informatics, chemical modeling, and environmental analysis. Originally from Toronto, Canada, he currently leads product marketing efforts for informatics solutions at Dassault Systèmes BIOVIA in San Diego.

この記事におけるトピック

サイエンティフィック R&Dにおいて、AIは信頼できるのか？