Syntetisering av data för snabbare digitalisering

PoC/Research owned by Helsingborg Stad Swedish
1y ago update
För att kunna effektivisera offentliga sektorn, erbjuda våra invånare individanpassade tjänster och skapa möjlighet för nya företag och förmågor att blomstra så behöver vi som offentlig aktör tillgängliggöra vår data.

I många fall kräver inte en idé eller tillämpning att man behöver veta exakt vem personen är för att realisera den. Det finns olika sätt att ”avpersonifiera” data men en av de bättre metoderna för vidare bearbetning & delning av informationen är syntetisering.

Många idéer till förbättringar inom välfärden kräver tillgång till sekretessbelagd individ-data, men möjligheterna till att dela eller jobba med denna typ av data är begränsad pga Svenska lagstiftning.

Effektmål

  • Höja den interna kunskapsnivån kring syntetisering av data
  • Bygga ny infrastruktur för syntetisering av data som passar in i nuvarande arkitektur,
  • Ta fram juridisk arbetsprocess för syntetisering av sekretessbelagd data & syntetisera
  • Pilota utvald sekretessbelagd data och tillgängliggöra denna som öppna data
Syntetiserad data är en blandning av data från olika personer. Man kan alltså skapa en syntetisk individ med slumpade egenskaper i en kombination som gör att det ser ut som en riktig person utan att vara det. Data bibehåller sitt statistiska värde men det är längre inte möjligt att urskilja personerna som den data kom från.

Drivs av
Arbetsmarknadsförvaltningen, Stadsledningsförvaltningen, Vård- och omsorgsförvaltningen

Utmaning
Hur kan vi nyttja data för bättre tjänster och högre livskvalitet?

Kategori
Digitalisering & Teknik

Teknologier
AI

Estimerad budget
468000 kr

Kontakt
Magnus Lindhe
magnus.lindhe@helsingborg.se

En utforskande fas håller på att slutföras (januari 2023), och sammanfattningsvis är slutsatsen att syntetisering är bra på flera sätt men det är inte den silverkula som vi hade hoppats på då det inte går att garantera att en AI-modell tränad på verklig data inte producerar ny data med artefakt av originaldata och på så sätt innehåller någon personuppgift. 

Däremot är syntetisering, om utfört korrekt, en av de bästa anonymiseringsmetoder som finns och syntetisering kan även användas till andra fördelar.

Genom de möten och utbildningar vi har haft tillsammans med vård och omsorgsförvaltningen och arbetsmarknadsförvaltningen så vill båda förvaltningarna gå vidare och testa syntetisering. Under våren 2023 kommer detta test konkretiseras och genomföras.

Attributes

Municipality
IT & Software, Operations
Better Quality
Creation
Machine Learning
Synthetic