Wed. Jul 30th, 2025

ダラス – 2025年7月28日 – UTサウスウエスタン医学センターの学際的チームは、複雑な自由記述の医療記録から関連情報を迅速かつ正確に抽出するAI対応のパイプラインを開発しました。

この革新的なアプローチは、npj Digital Medicineに掲載され、研究データの分析準備に必要な時間を大幅に短縮する可能性があります。

同センターのデータサイエンティストであるデイビッド・ハイン氏(M.S.)は、「自由記述の医療記録から詳細かつ正確なデータセットを構築することは非常に時間がかかり、しばしば手動のチャートレビューが必要です。」と述べています。

「本研究は、医療データを収集・整理するプロセスを簡素化するAI駆動の大規模言語モデル(LLM)を構築するアプローチの1つを示しています。AIを通じてデータ抽出と標準化を自動化することで、大規模な臨床研究をより効率的に行えるようにします。」

研究者たちは、AI駆動のLLMを使用して、2200以上の腎がん病理報告書を分析し、モデルが異なる種類の腫瘍を認識し分類する能力を評価しました。

AI科学者、病理医、臨床医、統計学者との緊密な協力を通じて、複数回のテストを重ねてワークフローを洗練させ、複雑で微妙な情報を扱う能力を向上させました。

その結果、腫瘍の種類を特定する精度が99%、癌が転移しているかどうかを検出する精度が97%に達しました。

「AIにナラティブ報告からデータを抽出させる最大の課題は、臨床医が同じ所見を説明するために多様な自由記述の用語を使用することです。」と、病理および泌尿器科の教授であるペイアル・カプール博士は述べています。

「単なる‘はい・いいえ’の結果をカウントするだけでは済みません。各報告書には、ナラティブ形式で数百の詳細が含まれています。しかし、適切な入力と監視があれば、AIモデルは迅速かつ正確に膨大な記録をレビューし分類できます。」

最終的なステップでは、3500以上の内部腎がん病理報告書の広範なデータセットでのテストが行われ、同様の結果が得られました。

これは、UTサウスウエスタン医学センターの腎がんプログラムを通じて利用可能な高品質なキュレーションデータとパイプラインによって促進されました。

「正確性を確保するためには、専門分野横断の協力的なチームワークが重要です。」と腎がんプログラムのディレクターであり、内科学の教授であるジェームズ・ブルガローラス博士は語っています。

この研究は腎がんに焦点を当てていますが、著者たちはこの方法が他の腫瘍タイプにも広範な応用が可能であると述べています。

「医療データ抽出のための‘一律のモデル’は存在しません。」と、リダ・ヒルバイオインフォマティクス学部の助教授であり、主な研究者であるアンドリュー・ジャメソン博士は述べました。

「しかし、本研究は他の研究者が自己の専門分野でAI駆動のLLMをより効果的に使用するための重要な戦略を示しています。私たちはこのプロセスのさらなる洗練と、医療研究におけるAIの役割の拡大を引き続き楽しみにしています。」

本研究に貢献した他のUTSWの研究者には、腎がんプログラムの内科学の助手教授であるビンチン・シェ氏(Ph.D.)、内科学の助手教授であるジョセフ・ヴェント氏(M.D.)、公共衛生および免疫学部門の教授であるリンジー・カウエル氏(Ph.D.)、オドネル公共衛生学校の計算生物学者であるスコット・クリスリー氏(Ph.D.)、リダ・ヒルバイオインフォマティクス学部のデータサイエンティストであるアミール・ハムザ・シャクール氏(Ph.D.)、リダ・ヒルバイオインフォマティクス学部のリードデータサイエンティストであるマイケル・ホルコム氏(M.S.)、シモンズ癌センターおよび腎がんプログラムの生物統計コンサルタントであるアラナ・クリスティ氏(M.S.)、シモンズ癌センターの学生インターンであるニール・ラクヘジャ氏、バイオメディカル工学の博士課程学生であるAJ・ジャイン氏が含まれます。

カプール博士は、ジェリー・ナイト・ライマーとアネット・ブラナン・ライマーの記憶の中で、ジャネットとボブ・ピッケンズ医療科学名誉教授職に就いています。

ブルガローラス博士は、ロバート・ルイス・カービー医学博士の名誉に授与されるシェリー・ウィグリー・クラウ癌研究の特別基金に所属しています。

カプール博士、ブルガローラス博士、カウエル博士はシモンズ癌センターのメンバーです。

本研究は、国立癌研究所の腎癌専門研究プログラム(P50 CA196516)からの助成金およびブロック・ファンドからの寄付金により資金提供されました。

画像の出所:utsouthwestern