Syntetisk data inom intensivvård

PoC/Research owned by Region Västerbotten Swedish
2y ago update

Två av de största utmaningarna när man utvecklar AI-modeller inom vården är; brist på tillräckligt mängd av data och restriktioner för att dela data mellan sjukvårdsorganisationer. AI Sweden har tillsammans med projektpartners Region Västerbotten, Örebro universitet och Syndata AB undersökt möjligheterna att använda syntetisk data som en potentiell väg framåt.

En vanlig utmaning när man arbetar med AI-modeller inom vården är behovet av stora mängder data för att träna upp sådana modeller. Om sjukvårdsregionerna kunde dela sin data med andra regioner skulle det vara mycket fördelaktigt utveckling. En potentiell lösning skulle kunna vara att arbeta med syntetisk data som inte innehåller några identifierbara patientdata och därigenom kan delas mellan vårdorganisationer.

Vi har undersökt olika generativa metoder för att skapa syntetisk data och validerat syntetiserad data med avseende på både kvalitet och användbarhet för att träna AI-modeller.

AI Sweden bidrar till att accelerera användningen av AI i Sverige och vill stötta en nationell användning av syntetiska data för utveckling och träning av verksamhetsnyttiga AI-modeller inom sjukvården.

Projektets Fas 1 har fokus på praktiskt användning av syntetisk data i AI-modeller för att närmare utforska hur användbar syntetisk data är när man tar fram AI-modeller inom sjukvård. Baseret på den vårddata som Region Västerbotten har samlat in genom arbetet med att ta fram prediktionsmodeller för prediktion av vårdtid på intensivvården, så utreder vi hur väl syntetisk data - som skapas med olika metoder - förhåller sig till originaldata och hur träffsäkerheten för prediktionsmodeller tränade på syntetisk data skiljer sig åt jämfört med modeller tränade på originaldata.   

Projektets Fas 1 är avgränsat till att utreda förutsättningar och möjligheter kring användning av syntetisk data inom sjukvården. Utvärderingen av skapad syntetisk data är avgränsad till kvantitativ jämförelse mellan genererad syntetisk data och originaldata, samt en utvärdering av hur syntetisk data förhåller sig till originaldata vid träning och validering av befintliga prediktionsmodeller hos Region Västerbotten. Inom ramarna för projektets Fas 1 så kommer dock inte alternativa modeller för prediktion av vårdtid att utvärderas.

Projektets Fas 2 kortsiktiga mål är för att finjustera parametrarna för de utvärderade generativa modeller och på så vis även förbättra den syntetiska datan.  Med Fas 2 fortsättningsprojektet så finns det även möjlighet att besvara flertal primära frågor.

Region Västerbotten arbetar med ca 2000 patienter i de AI-modeller som nu tas fram, men för att få ännu bättre modeller skulle den mängden behöva vara betydligt större. Källsystemet från vilket data hämtas heter MetaVision, vilket är ett kliniskt informationssystem som används för elektronisk journalföring och som beslutsstöd inom perioperativ, neonatal- och intensivvård inom Region Västerbotten. 

Systemet samlar in relevant data från medicinteknisk utrustning och ger tillsammans med sjukvårdspersonalens utlåtande och integrationer till andra system en samlad bild av patientens anestesi och intensivvårdsförlopp. Detaljrikedomen per patient gör att det finns väldigt många parametrar kopplat till varje patient.

Region Västerbotten har ett pågående AI-projekt: AMHOS – AI/ML i Hälso- och sjukvård som är delvis finansierat av EU-medel genom Tillväxtverket. I projektet har det tagits fram två AI-baserade modeller för prediktion av vårdtid på intensivvården: 

● Prediktion av tid till utskrivning pga tillfrisknande 

● Prediktion av tid till utskrivning (alla orsaker) 

Det är även påbörjat ett arbete med prediktioner inom ett nytt område: prediktion av vårdtid på post-op. Därefter planeras prediktion av hypotension vid operation och prediktion av smärta på post-op.

Region Västerbotten samarbetade med Syndata för att skapa syntetisering av 2 patientuppsättningar för att användas för:

● Förutsägelse av vårdbördan inom intensivvården 

● Förutsägelse av tid för utskrivning på intensivvård

Syndata slutförde fas 1 framgångsrikt genom att leverera 4 modeller till Region Västerbotten tillsammans med medel för att syntetisera olika datauppsättningsstorlekar. Syndatas beslut att dela 4 modeller (2 olika modeller för varje originaldatauppsättning) stöds av experiment som bedömde de två bästa presterande modellerna för varje datauppsättning. Baserat på Syndatas kvalitetsbedömning utvärderas båda modellerna som liknande kandidater för RVB-mål.

Träning och validering av befintliga prediktionsmodeller
Att skapa prediktionsmodeller baserat på medicinsk syntetisk data ser överlag lovande ut. Modellerna är bara några få procent sämre i träffsäkerhet än originalmodellerna. Detta skapar goda förutsättningar för att generera än bättre prediktionsmodeller baserade på en större sammanslagen datamängd syntetiska data från flera regioner.  

För mer information, vänligen se länk till rapporterna eller kontakta Henrik Ahlén, AI Sweden.

Involverade i projektet:

Region Västerbotten (RVB)
Per Ericson, Specialist Digitalisering. 
  Projektledning, infrastruktur, utvärdering och resultatspridning. 
Robert Wiksten, Förvaltningsledare teknik Vårdstöd Special. 
  Infrastruktur och utvärdering. 
Sara Lundsten, Förvaltningsledare verksamhet, anestesi-SSK.
  Återkoppling på utfall från kliniskt perspektiv. 
Frans Vincent, klinisk ledare VSS, narkosläkare. 
  Återkoppling på utfall från kliniskt perspektiv. 
Petter Lindgren, Senior Data Scientist (konsult, Sogeti). 
  Testa AI-modeller med olika former av syntetisk data. 
Mattias Andersson, Data Engineer (konsult, Sogeti). 
  Datauttag och tester av modellerna.

Syndata AB
Mattias Ripoll, CEO, Project Manager 
Roxana Buzatoiu, Data Scientist 
Keshav Padiyar, Data Scientist
Douglas Garcia, Data Scientist 
Guillermo Padres, Tech Lead

AI Sweden / Örebro Universitet (ÖU)
Andreas Persson, Data Scientist / Forskare 

AI Sweden
Henrik Ahlén, AI Change Agent Healthcare 
  Övergripande projektledning

pages

Resources

Syntetisk data inom IVA rapport (på svenska) 
Här beskrivs förutsättningarna och insikterna från projektet.

Se länk för alla bilagor.

Attributes

Health, Region
Operations
Better Quality, More Efficient, Saving Cost, Smarter Product or Service
Experimenter
Prediction
GAN, NLP, DNN, Recurrent Neural Networks
Synthetic, Structured Data