|
Sensible Daten zu analysieren birgt viele Risiken. Das Prinzip
Differential Privacy soll dabei helfen, Daten statistisch auswerten
zu lassen, ohne Rückschlüsse auf die ursprünglichen
Daten zu ermöglichen. Google
hat eine C++-Bibliothek veröffentlicht, mit der sich Daten
nach diesem Prinzip analysiert werden können.
Ziel ist es, damit die Privatsphäre und den Datenschutz zu
wahren. Es soll nicht möglich sein, zum Beispiel auf Patientendaten
in Krankenhäusern oder auf einzelne Datensätze mit spezifischen
Eigenschaften von Einzelpersonen Rückschlüsse ziehen zu
können.
Die Open Source Bibliothek ermöglicht typische statistische
Methoden wie etwa das Ermitteln von Durchschnitt, Median oder auch
Perzentilen. Sie beinhaltet auch eine ausgiebige Test-Suite, die
helfen soll, Fehler bei der Verwendung der Bibliothek zu vermeiden.
Google nutzt eine Version der bereitgestellten Bibliothek intern
selbst. Für die nun erfolgte Offenlegung habe Google sich zunächst
auf einige wichtige Funktionen fokussiert, die besonders schwer
selbst auszuführen seien. Der Code
steht auf Github unter der Apache-Lizenz bereit und Google hat
auch ein Beispiel
zur Verwendung der Bibliothek sowie eine PostgreSQL-Erweiterung
bereitgestellt.
(tl, hannover)
(siehe auch golem.de:)
Hannover · EDV-Beratung ·
Linux · Novell · Microsoft · Seminar ·
IT-Consult · Netzwerk · LPIC · CLE
|