Wie man an die Krankendaten eines US-Gouverneurs kommt
Experimente mit den Daten der US Volkszählung von 1990 zeigen, dass 87% der Einwohner der USA alleine durch Postleitzahl, Geschlecht und Geburtstag eindeutig identifizierbar sind. Im Rahmen eines Papers von 2002 machte sich Latanya Sweeney dies zunutze, um eindrucksvoll zu zeigen, dass Daten anonymisieren mehr als nur Namen entfernen ist.
Die Group Insurance Commision (GIC) ist dafür verantwortlich Krankenversicherungen für Staatsbeamte in Massachusetts abzuschließen. Dabei sammelt die GIC patienten-spezifische Krankendaten mit fast einhundert Attributen. Unter diesen Attributen findet sich auch Geburtsdatum, Postleitzahl und Geschlecht. Für 20 Dollar konnte man damals eine Liste mit expliziten Informationen über die registrierten Wähler in Cambridge Massachusetts kaufen. Sweeney tat genau das und war so in der Lage die Informationen aus der Wählerkartei mit den Patientendaten zu verbinden. Ein explizites Beispiel dafür ist der ehemalige Gouverneur von Massachusetts William Weld. Seine Patienteninformationen waren in den Daten der GIC zu finden. Er lebte in Cambridge Massachusetts. In der Wählerliste waren nur 6 Leute mit seinem Geburtsdatum, nur drei davon waren Männer und er war der einzige mit seiner Postleitzahl. Jetzt musste nur noch der passende Datensatz in den GIC-Daten gefunden werden und man hatte seine Patientendaten.