Aktuelle Machine Learning Verfahren erfordern, dass alle Trainingsdaten an zentraler Stelle verfügbar sind. Diese Voraussetzung verhindert Training auf sensiblen privaten Daten, die aus Datenschutzgründen nicht zentralisiert gesammelt werden dürfen. Federated learning verschiebt Teile des Trainings zu den Daten und ermöglicht so, dass die Eigentümer ihre Daten nicht herausgeben müssen. Googles Smartphone-Tastatur GBoard setzt diese Technik bereits ein, um das Modell zur Text-Autovervollständigung auf den Smartphones der Benutzer zu verbessern. Die Texteingaben der Benutzer wird dabei zum Training verwendet, bleiben Google und anderen Benutzern aber unbekannt.
In diesem Vortrag werde ich von den Erfahrungen aus meiner Bachelorarbeit „Evaluation of Federated Learning in Deep Learning“ berichten. Die Arbeit beschäftigt sich mit der Frage, wie sich Federated Learning auf die Modellqualität auswirkt, wie gut Federated Learning durch bestehende Frameworks unterstützt wird und welche zusätzlichen Vorkehrungen getroffen werden müssen, um die Privatsphäre der Teilnehmer zu bewahren.
Christian Becker – Hochschule Karlsruhe / inovex GmbH