Un nouveau programme informatique d’intelligence artificielle créé par des chercheurs de l’Université de Floride et NVIDIA peut si bien générer des notes de médecins que deux médecins ne pourraient pas faire la différence, selon une première étude menée par les deux groupes.
Dans cette étude de validation de principe, les médecins ont examiné les notes des patients – certaines rédigées par de vrais médecins tandis que d’autres ont été créées par le nouveau programme d’IA – et les médecins ont identifié le bon auteur seulement 49 % du temps.
Une équipe de 19 chercheurs de NVIDIA et de l’Université de Floride a publié ses résultats, publiés le 16 novembre dans la revue Nature. npj Médecine Numériqueouvrez la porte à l’IA pour soutenir les travailleurs de la santé avec une efficacité révolutionnaire.
Les chercheurs ont formé des superordinateurs pour générer des dossiers médicaux basés sur un nouveau modèle, GatorTronGPT, qui fonctionne de manière similaire à ChatGPT. Les versions gratuites des modèles GatorTron™ comptent plus de 430 000 téléchargements depuis Hugging Face, un site Web d’IA open source. Les modèles GatorTron™ sont les seuls modèles du site disponibles pour la recherche clinique, selon l’auteur principal de l’article, Yonghui Wu, Ph.D., du département des résultats de santé et de l’informatique biomédicale de l’UF College of Medicine.
« Dans le domaine des soins de santé, tout le monde parle de ces modèles. GatorTron™ et GatorTronGPT sont des modèles d’IA uniques qui peuvent alimenter de nombreux aspects de la recherche médicale et des soins de santé. Pourtant, leur construction nécessite des données massives et une puissance de calcul étendue. Nous sommes reconnaissants d’avoir ce supercalculateur, HiPerGator, de NVIDIA pour explorer le potentiel de l’IA dans les soins de santé », a déclaré Wu.
Chris Malachowsky, ancien élève de l’UF et co-fondateur de NVIDIA, est l’homonyme du nouveau Malachowsky Hall de l’UF pour la science des données et les technologies de l’information. Un partenariat public-privé entre UF et NVIDIA a contribué à financer cette structure de 150 millions de dollars. En 2021, UF a fait passer son supercalculateur HiPerGator au statut d’élite grâce à un package d’infrastructure de plusieurs millions de dollars de NVIDIA, le premier dans une université.
Pour cette recherche, Wu et ses collègues ont développé un grand modèle de langage qui permet aux ordinateurs d’imiter le langage humain naturel. Ces modèles fonctionnent bien avec des écrits ou des conversations standard, mais les dossiers médicaux présentent des obstacles supplémentaires, tels que la nécessité de protéger la vie privée des patients et leur caractère hautement technique. Les dossiers médicaux numériques ne peuvent pas être recherchés sur Google ni partagés sur Wikipédia.
Pour surmonter ces obstacles, les chercheurs ont supprimé les dossiers médicaux d’UF Health des informations d’identification de 2 millions de patients tout en conservant 82 milliards de mots médicaux utiles. En combinant cet ensemble avec un autre ensemble de données de 195 milliards de mots, ils ont formé le modèle GatorTronGPT pour analyser les données médicales avec l’architecture GPT-3, ou Generative Pre-trained Transformer, une forme d’architecture de réseau neuronal. Cela a permis à GatorTronGPT d’écrire un texte clinique similaire aux notes des médecins.
« Ce modèle GatorTronGPT est l’un des premiers produits majeurs issus de l’initiative de l’UF visant à intégrer l’IA dans l’ensemble de l’université. Nous sommes très satisfaits de la manière dont le partenariat avec NVIDIA porte déjà ses fruits et ouvre la voie à l’avenir de la médecine », a déclaré Elizabeth Shenkman, Ph.D., co-auteur et président du département des résultats en matière de santé et d’informatique biomédicale de l’UF.
Parmi les nombreuses utilisations possibles d’un GPT médical, une idée consiste à remplacer l’ennui de la documentation par des notes enregistrées et transcrites par l’IA. Wu dit que l’UF dispose d’un centre d’innovation qui travaille sur une version commerciale du logiciel.
Pour qu’un outil d’IA atteigne une telle parité avec l’écriture humaine, les programmeurs passent des semaines à programmer des superordinateurs avec un vocabulaire clinique et une utilisation du langage basés sur des milliards et des milliards de mots. Une ressource fournissant les données cliniques nécessaires est le réseau de recherche clinique OneFlorida+, coordonné à l’UF et représentant de nombreux systèmes de santé.
« Il est essentiel de disposer de quantités aussi massives de données cliniques d’UF Health, non seulement disponibles, mais prêtes pour l’IA. Seul un superordinateur pourrait gérer un ensemble de données aussi volumineux de 277 milliards de mots. Nous sommes ravis de mettre en œuvre les modèles GatorTron™ et GatorTronGPT dans le monde réel de la santé. soins à UF Health », a déclaré Jiang Bian, Ph.D., co-auteur et scientifique en chef des données et responsable de l’information de recherche d’UF Health.
Un échantillon représentatif de 14 professeurs de l’UF et de l’UF Health ont contribué à cette étude, y compris des chercheurs du Research Computing, des Services de recherche intégrés du référentiel de données au sein de l’Institut des sciences cliniques et translationnelles, ainsi que des départements et divisions du Collège de médecine, y compris la neurochirurgie et l’endocrinologie. , diabète et métabolisme, médecine cardiovasculaire, résultats pour la santé et informatique biomédicale.
L’étude a été partiellement financée par des subventions du Patient-Centered Outcomes Research Institute, du National Cancer Institute et du National Institute on Aging.
Voici deux paragraphes faisant référence à deux cas de patients, l’un écrit par un humain et l’autre créé par GatorTronGPT : pouvez-vous dire si l’auteur était une machine ou un humain ?