インテルとペンシルベニア大、合同学習で患者のセキュリティを維持し脳腫瘍を識別するAIを開発

インテルとペンシルベニア大、合同学習で患者のセキュリティを維持し脳腫瘍を識別するAIを開発

まず、連合学習(federated learning)は、開発者や組織が複数の位置に分散したトレーニングデータを使用して深層ニューラルネットワーク(DNN Deep Neural Networks)を訓練できる新しい学習パラダイムである。 これを通じ、医療専門家らは臨床データを直接共有する必要なく、共有モデルについて協業することができる。

グローバルIT企業各社も、研究や開発に余念がない。 まず、グーグルが昨年8月に発表した連合学習は、一般的にすべてのデータをサーバーで集め、AIを学習する方式とは異なり、ユーザーが直接使用するスマートフォンでデータを処理し、モデルを強化し、このモデルを1ヵ所に集めてさらに精巧なモデルを作って配布する方式だ。

これは相対的に少ないデータで最適化したAIモデルを開発することができる。 膨大なデータを格納するストレージやこうしたデータを処理するための高性能プロセッサをユーザ個人デバイスに分散し、必要事項のみを共有して最適化したモデルを配布し直すだけにトラフィックへの負担も少ない。 また、個人情報侵害の可能性も相対的に少なく、制度的障壁も簡単に越えられる。


소스 TTS

복사하기

필기인식기

写真はグーグルの連合学習概要で、スマートフォンは使用量に応じてモデルをローカルに個人化し(A)、多くのユーザーのアップデートが集計され、(B)共有モデルに対する合意変更(C)が行われた後、手続きが繰り返される(写真:本紙DB)

また、フェイスブックがアンドロイドとiOS環境で円滑にマシンラーニングを実行·配布できるようにする新しいフレームワーク「PyTorchMobile」を11日(現地時間)に公開した。 この新たに公開されたフレームワークは、「連合学習(Federated Learning)」を支援し、個人情報流出の憂慮を減らし、より個人に合わせてAIを学習させることができるのが特徴だ。

すなわち、連合学習はAI アルゴリズムが異なるサイトに位置する膨大な範囲のデータから経験を得ることができるものであり、このアプローチにより複数の組織でモデル開発について共同作業ができるものである。

特に、この連合学習がより注目を集めるのは医療機関だ。

一般的に健康管理AIアルゴリズムの場合、経験は大きく多様な高品質なデータセットの形で提供される。 しかしこれらのデータセットは収集に非常に難しいという。 例えば、医療機関は患者人口の統計、使用されたツールまたは臨床の専門化によって偏向する独自のデータソースに依存しなければならず、他の機関のデータを集めて必要なすべての情報を収集しなければならない。

インテルラボ(IntelLabs)が米ペンシルベニア大学フェラルマン医科大学(PerelmanSchoolofMedicineattheUniversityofPennsylvania,PennMedicine)と協力し、フェンメディソンが率いる29の国際保健医療·研究機関連合がAIモデルを訓練できるよう共同開発中だと11日(現地時間)明らかにした。

このAIモデルはプライバシーを守る技術である連合学習を活用して脳腫瘍を識別する。

今回の研究における連合学習の概要(写真:インテル)

ペンメディスンの研究は3年間でペンシルベニア大学の「バイオイメージコンピューティング及び分析センター」のスピリドン·バカス博士(Dr. Spyridon Bakas)に120万ドルの研究補助金が授与される。 この助成金は国立保健院(National Institutes of Health (NIH))傘下の国立がん研究所(National Cancer Institute (NCI))の「がん研究のための情報技術学(Informatics Technology for Cancer Research, ITCR)」プログラムの一部である。

インテルラボのジェイソン·マーティン首席エンジニアは「AIは脳腫瘍の早期発見に大きな可能性を見せているが、潜在力を最大限に発揮するためにはどの単一医療機関よりも多くのデータが必要」とし、「インテルのソフトウェアとハードウェアを活用してインテルラボの支援を受け、インテルはペンシルベニア大学や29の共同医療センターと協力し、敏感な患者データを保護しながら脳腫瘍の識別を早めている」と明らかにした。

ペンメディスンや米国、カナダ、英国、ドイツ、オランダ、スイス、インドなど29の医療および研究機関は、患者データを共有しなくてもディープラーニングプロジェクトに協力できる分散型マシンラーニングアプローチの「連合学習」を使用する予定だ。

ペンメディスンとインテルラボは、医学映像領域で連合学習に関する論文を初めて発表し、特に連合学習法が既存のプライバシーを守らない方式で訓練されたモデル正確度の99%以上でモデルを訓練させることができるということを立証した。 研究論文はスペインのグラナダで開催された2018年医療映像技術学会(Medical Image Computing and Computer Assisted Intervention, MICCAI)において発表された。

新しい研究は、モデルとデータの両方に追加的なプライバシー保護を提供する方式で、連合学習を実現するためにインテル ソフトウェアとハードウェアを活用する予定だ

ペンシルベニア大学生物学的イメージコンピューティングおよび分析センターのスピリドン·バカス博士は、「マシンラーニング訓練に必要な豊富なデータは一つの機関が処理するには困難がある。 我々は29の世界的な医療や研究機関の連合体を組織化しており、それにより連合学習を含むプライバシーを保存するマシンラーニング技術を使用し、医療用の最先端AIモデルを訓練している」と述べた。

同氏は「今年、連合体は大きく拡張された脳腫瘍分割試験(International Brain Tumor Segmentation (BraTS) challenge)データセットで拡張されたバージョン上で脳腫瘍を識別するアルゴリズムを開発する予定だ。 同連合体は「医療研究員たちが膨大な量の医療データにアクセスすると同時に、該当データのセキュリティを維持できるようにする」と付け加えた。

一方、米国脳腫瘍協会(American Brain Tumor Association (ABTA))によると、今年脳腫瘍と診断される人は8万人近く、このうち4,600人以上が子供であると予想している。 脳腫瘍の早期発見とより良い予後に役立つように脳腫瘍を感知するモデルを訓練し、構築するために研究者は大量の関連医療データを活用する必要がある。

しかし、データは非公開であり、保護されなければならないため、インテル技術基盤の連合学習が必要である。 このアプローチを活用することで、すべての協力機関の研究者は敏感な医療データを保護しながら脳腫瘍を感知するアルゴリズムを構築し、訓練することに協力することができるようになる。

2020年にペンメディスンと29の国際医療研究機関は、インテルの連合学習ハードウェアとソフトウェアを使って、現在まで最も大量の脳腫瘍データセットで訓練された新しい最先端AIモデルを作るだろう。

これらすべては、個別の協力者を必要とするものではなく、敏感な患者データも使用しない。

この連合体の第1段階をスタートさせるのに参加が予定されている協力機関はペンシルベニア大学病院(Hospital of the University of Pennsylvania)、セントルイスに位置するワシントン大学(Washington University)、ピッツバーグ大学メディカルセンター(University of Pittsburgh Medical Center)、ヴァンダーバルト大学(Vanderbilt University)、クイーンズ大学(Queen’ Unicity)、Unnnnn)、タタメモリアル病院(Tata Memorial Hospital)などだ。

結論的に、連合学習を現在のデータ中心システムと比較すると、提案されたアプローチ方式は、機関データを共有しなくても似たようなセグメンテーション性能を達成でき、希少ベクトル技術(the sparsevector technique)を使用する連合学習システムは、かなり少ないコストで厳格な個人情報を保護することができる。

また、個人データによりローカルに学習された医療機関間で効果的にデータを集計することができ、深層モデルの正確性、堅牢性及び一般化能力をさらに向上させることができる。 今回の研究は安全な連合学習を構築するための重要な段階とみられ、これは広大なデータ中心の精密医学を大規模に可能にするものと予想される。

関連記事一覧