Differential Privacy
Definition
Mathematischer Datenschutz-Standard, der garantiert, dass die Hinzunahme oder Entfernung eines einzelnen Datensatzes das Ergebnis einer Berechnung nur in einem klar quantifizierten Maß (Epsilon, ε) beeinflusst. Realisiert durch kontrolliertes Hinzufügen von Rauschen zu Daten, Zwischenergebnissen oder Modell-Updates.
Noise — Signal
Differential Privacy wird als "der Goldstandard für Datenschutz" zitiert — was korrekt ist, aber selten so verstanden, wie es gemeint ist. Der Schutz ist parametrisiert: ein hohes Epsilon bietet wenig Schutz und hohe Datennützlichkeit, ein niedriges Epsilon viel Schutz, aber stark verrauschte Ergebnisse. In der Praxis sind die in Vendor-Produkten verwendeten Epsilon-Werte oft so groß, dass der Schutz gegen reale Angreifer marginal ist. Außerdem schützt DP nicht gegen alle Bedrohungen — gegen einen Angreifer mit Hintergrundwissen über die Datenstruktur sind die Garantien schwächer als kommuniziert.
Die richtige Frage
Nicht: "Setzen wir Differential Privacy ein?" Sondern: "Mit welchem Epsilon-Wert, gegen welches Bedrohungsmodell, mit welcher gemessenen Auswirkung auf die Datennützlichkeit — und welche zusätzlichen Maßnahmen ergänzen DP, weil es allein nicht ausreicht?"