Intelligenza artificiale e score del rischio per i pazienti con Sindrome Coronarica Acuta.

Keyword: , , , , , ,

Indice

Inquadramento

Il machine learning è un’articolazione dell’intelligenza artificiale che viene impiegato per la programmazione di algoritmi espliciti quando questa è difficilmente praticabile. In medicina il machine learning è utilizzato per ambiti clinici che comprendono la diagnostica, il trattamento e la prognosi. In particolare, la creazione di score prognostici è intuitivamente uno dei campi che meglio possono sfruttare la capacità del machine learning di analizzare una considerevole mole di dati in moltissimi pazienti. Per i pazienti con sindrome coronarica acuta (ACS) si dispone di alcuni score prognostici in svariati ambiti clinici, quali il GRACE score e il TIMI risk score o il DAPT e il PRECISE DAPT score che hanno mostrato di performare in maniera che può essere definita – sulla base del loro c-index – da media a buona. I limiti degli score prognostici appena citati, che non si sono avvalsi del learning machine per la loro programmazione, sono noti e da ricondurre all’epoca della loro produzione (non recente per GRACE e TIMI score) o all’inclusione di coorti che comprendevano anche pazienti con CAD stabile e trattati prevalentemente con clopidogrel (per DAPT e PRECISE DAPT).

Lo studio in esame

Si tratta di una ricerca nella quale sono stati valutati diversi modelli generati mediante machine learning in grado di prevedere la mortalità per tutte le cause, la recidiva di infarto miocardico acuto e i sanguinamenti maggiori a 1 anno in pazienti con ACS. I modelli sono stati sviluppati impiegando una coorte di derivazione di 19.826 pazienti adulti con ACS (età media 64 anni), costituita dai pazienti degli studi BleeMACS e RENAMI. Le “performance” dei modelli prodotti con il supporto del machine learning sono state validate su una coorte di 3.444 pazienti facenti parte di uno studio – controllato e randomizzato – e di tre registri prospettici italiani. La previsione del rischio era basata su 25 variabili rilevate alla dimissione del paziente. Per ciascuno dei tre principali outcome, è stato scelto il modello che offriva le migliori prestazioni predittive e così è stato ottenuto il PRAISE score, che ha mostrato un potere predittivo secondo la curva ROC (area sotto la curva, AUC 0,82 -95% CI 0,88-0,85-) nella coorte di validazione interna e 0,92 (0,90-0,93) nella coorte di validazione esterna per la mortalità totale a 1 anno e con valori minori di AUC per la recidiva a 1 anno di infarto miocardico e per i sanguinamenti maggiori a 1 anno. Per ciascun outcome si calcolava il PRAISE score di ogni paziente, costituendo gruppi a rischio basso, intermedio e alto. La distribuzione delle percentuali di pazienti per le varie classi di rischio è mostrata nella Tabella.

Take home message

Il PRAISE score, ottenuto mediante l’impiego del machine learning, è uno strumento semplice, intuitivo e di facile implementazione nella pratica clinica. Offre una performance da ritenere buona o molto buona (a seconda degli outcome). La suddivisione in tre classi di rischio permette di individuare i pazienti a più elevato rischio per ogni outcome e potrebbe consentire la loro gestione più accurata ed efficace.

Interpretazione dei dati

Gli Autori focalizzano l’attenzione sui limiti degli score di cui disponevamo per i pazienti ACS. Si tratta di score validati e dalle performance soddisfacenti che, tuttavia, derivano da casistiche datate che quindi non hanno previsto l’impiego delle attuali procedure e dei materiali e trattamenti farmacologici oggi in uso. Guardando ai c-index dei diversi modelli di machine learning per i tre outcome scelti si potrebbe ipotizzare una migliore performance del PRAISE rispetto agli score oggi in uso. Mancano, tuttavia, confronti diretti testa-a-testa e questa rimane un’ipotesi da verificare. Lo studio non è privo di limiti, quali l’impiego di studi osservazionali (con tutti i loro difetti) per la coorte di derivazione. Qualcuno ha sottolineato anche la circostanza che la validazione esterna (in cui il PRAISE score ha offerto una performance davvero buona) è stata condotta solo su pazienti italiani. Ma al di là di queste osservazioni, forse troppo tecniche, quello che lascia ancora “in sospeso” tutto l’argomento è la mancanza di studi di management che valutino l’impatto dell’impiego sistematico degli score rispetto alla comune pratica nell’ottimizzare l’approccio clinico. Nonostante le Linee Guida raccomandino, con gradi più o meno forti, l’impiego degli score per i pazienti ACS, i pochi dati esistenti evidenziano il cosiddetto “risk-treatment paradox” in cui i pazienti del mondo reale a più elevato rischio non sono quelli meglio trattati secondo le Linee Guida. Lo studio AGRIS non ha dimostrato che l’implementazione del GRACE score nella pratica clinica porti a un miglior risultato in termini di outcome. In sostanza, quello che serve è uno studio prospettico e randomizzato in cui sia testata l’efficacia e la sicurezza del PRAISE score nella gestione clinica dei pazienti ACS.

L’opinione di Rossella Marcucci

Università degli Studi di Firenze

Gli Autori di questo lavoro hanno utilizzato l’approccio del ‘machine learning’ per elaborare uno score capace di distinguere i pazienti a maggior rischio di mortalità totale, reinfarto e sanguinamento dopo ACS. Il primo punto, per il quale lodare gli Autori, è l’approccio innovativo che ha consentito di estrapolare gli items clinici associati a morte, infarto e sanguinamento da un numero elevatissimo di pazienti e, in aggiunta, di confermarne la validità su una ulteriore casistica. Sempre di più dovremo abituarci a ragionare in questi termini per analizzare la complessità dei dati che siamo in grado di raccogliere con gli studi multicentrici. Analogamente a quanto avviene in altri campi della medicina, come nella genetica, i modelli di intelligenza artificiale e di machine learning sono, e saranno sempre di più, in grado di aiutarci ad analizzare la “complessità”. In questo caso il setting è quello delle ACS e la domanda clinica riguarda la possibilità di riconoscere, alla dimissione, i pazienti a maggior rischio a cui dedicare un trattamento più aggressivo e/o una sorveglianza clinica maggiore. Le variabili estrapolate e associate a rischio maggiore sono quelle che clinicamente conosciamo già molto bene: età, livello di emoglobina (Hb), funzione renale, frazione di eiezione del ventricolo sinistro. Queste variabili si sono confermate capaci di riconoscere i pazienti a rischio di morte, infarto e sanguinamento anche, e anzi di più, nella coorte di validazione. Gli Autori suggeriscono che questo score potrebbe essere utilizzato per la decisione sulla durata della doppia antiaggregazione, pur con i limiti dettati dal fatto che lo studio non aveva questo endpoint. L’analisi del tipo di antiaggregazione mostra, tuttavia, notevoli differenze negli studi presi in esame con una percentuale nettamente superiore di utilizzo di ticagrelor, anzichè clopidogrel, nella coorte di validazione [ticagrelor: 47.2% coorte di validazione vs 17,2% coorte di derivazione; clopidogrel: 12.6% vs 68.4%, rispettivamente]. L’utilizzo di una doppia antiaggregazione più potente nella coorte di validazione, quindi, non ha sostanzialmente modificato il rischio di morte, infarto e sanguinamento del paziente con ACS, legato alle stesse variabili identificate dalle coorti di derivazione. Questo suggerisce come sia il profilo di rischio del paziente, ‘per sè’, a determinare l’outcome, potenzialmente poco modificabile dalla doppia antiaggregazione, poichè sia nella coorte di derivazione che di validazione, questo profilo condiziona gli stessi outcome clinici. Pertanto, questi risultati sembrerebbero suggerire come sia più necessario concentrare gli sforzi, del clinico e della ricerca futura, in approcci terapeutici capaci di modificare quel profilo di rischio, ovvero la malattia aterosclerotica, piuttosto che la terapia antitrombotica che agisce maggiormente sulle complicanze, causa dell’evento finale. A questo riguardo, il dato sulla terapia con statina, associato di per sè al rischio degli endpoint clinici, sembra suggerire una possibilità di intervento più efficace o comunque una strada da percorrere nel senso di una riduzione aggressiva dei livelli di colesterolo o di una terapia antiinfiammatoria. Un’ultima considerazione finale, che nulla vuole togliere alla validità di questo bellissimo studio clinico che, giustamente, ha trovato spazio di pubblicazione in una prestigiosa rivista: davvero abbiamo bisogno di un ulteriore score nella nostra pratica clinica?

Lascia un commento