Deutsch English
  • Deutsch English
  • Tech of Tomorrow
  • Morals & Machines
  • Burn to Learn
  • Think Tanks
  • Über uns
  • 17.06.2021
  • Miriam Meckel

Realität auf Abruf

Unternehmen können mit synthetischen Daten bei KI-Modellen Zeit und Geld sparen. Warum sollte man sich noch die Mühe machen, realen Daten nachzujagen?

„Wie wirklich ist die Wirklichkeit?“, hat der österreichisch-amerikanische Psychologe Paul Watzlawick in seinem gleichnamigen Buch 1976 gefragt. Seine Antwort damals: So wirklich, wie wir sie durch unsere Kommunikation gestalten. Weil Menschen auf der Grundlage subjektiver Wahrnehmung miteinander Wirklichkeiten schaffen, gibt es davon viele, die sich durchaus widersprechen können.

Das stimmt auch heute noch, und doch müsste Watzlawick sein Buch wohl streckenweise ergänzen und umschreiben. Ein wichtiger Teil unserer Wirklichkeit beruht heute auf Daten. Und die entstehen zum Teil nicht mehr aus dem, was tatsächlich passiert und existiert, sondern aus Algorithmen. Es sind zunehmend synthetische Daten, die Unternehmen helfen, maschinelles Lernen konsequent anzuwenden.

So wie ein Double für den Schauspieler bei einem gefährlichen Stunt im Hollywood-Film einspringt, ersetzen synthetische Daten die echten Daten für Berechnungen und Simulationen beim maschinellen Lernen.

Amazon Web Services trainiert damit den Sprachassistenten Alexa. Facebook nutzt synthetische Daten, um die KI-Anwendungen zu testen, die sogenannte Fake News, Hasskommentare oder Belästigungen im sozialen Netzwerk entdecken sollen.

Sie werden auch beim Softwaretesting eingesetzt, um Bilderkennungsalgorithmen für selbstfahrende Autos zu trainieren, über Profile künstlicher Menschen deren Bewegungsverläufe und Einkaufsverhalten in Warenhäusern zu analysieren. Synthetische Daten sollen auch Anwendungsmuster bei der Geldwäsche entdecken oder als Zwillingsdatensätze Studien im Gesundheitswesen ermöglichen, bei denen die besonders hohen Datenschutzanforderungen die Arbeit mit realen Daten schwierig machen.

KI-Modelle mit synthetischen Daten erzielen vergleichbare Ergebnisse


Synthetische Daten erlauben es, Informationen auch in Anwendungsfeldern zu berechnen, in denen Gefahr für die individuelle Privatsphäre der Individuen droht. Klar, man kann auch reale Daten anonymisieren, aber das hat seinen Preis. Zum einen ist die in den Daten enthaltene Information dann weniger reichhaltig.

Zum anderen zeigen viele Beispiele, dass die Privatsphäre der Datenspender auch nach der Anonymisierung nicht immer hinreichend geschützt ist. Synthetische Daten kosten die Unternehmen weniger Zeit und Geld, um ihre KI-Systeme zu trainieren. Vor allem aber sind sie nahezu unbegrenzt herstellbar.

Mithilfe synthetischer Daten lassen sich Verzerrungen in Datensätzen ausgleichen. Auch das funktioniert nicht als digitale Wunderwaffe: Fehlerhafte Parameter, Über- oder Unteranpassung der Datensatzmuster können Verzerrungen reduzieren oder eben auch verstärken. Dennoch: Eine Studie am MIT hat schon 2017 gezeigt, dass KI-Modelle, die mit synthetischen Daten trainiert wurden, vergleichbare Ergebnisse erzielen wie solche, die mit realen Daten arbeiten. In 70 Prozent der Anwendungen waren die Ergebnisse gleichwertig. Andere Studien zeigen, dass die Datenqualität höher ist, wenn man große synthetische Datensätze durch kleinere reale Datensätze anreichert.

Der Mensch ist kreatives Element und Störfaktor zugleich


Die Zukunft der KI steht damit für eine Realität auf Abruf – gleich im doppelten Sinne. Maschinelles Lernen wird sich zunehmend mithilfe von Daten verbessern, die vergleichbare Eigenschaften haben wie reale Daten, aber eben doch künstlich sind. Unternehmen werden sie nach Bedarf abrufen können, wann immer sie solche Daten benötigen.

Das wird allerdings auch unser Verhältnis zur Realität weiter verändern. Wenn synthetische Daten immer besser eingesetzt werden können, warum soll man sich dann noch die Mühe machen, realen Daten nachzujagen? Maschinelles Lernen wird eingesetzt, um maschinelles Lernen mit Daten möglich zu machen. So entsteht ein Kreislauf der computerisierten Fiktion, der uns helfen soll, die faktische Welt zu verstehen und zu verbessern.

Wie wirklich ist die Wirklichkeit? So wirklich, wie es dem maschinellen Lernen gelingen kann, die verwendeten künstlichen Daten an das anzupassen, was wir Menschen unter Wirklichkeit verstehen. Das war immer volatil. Und so wird es auch in Zeiten synthetischer Daten sein. Der Mensch bleibt das schwierigste Datum einer jeden Realität: Er ist zugleich kreatives Element und Störfaktor in allem, was wir als wirklich betrachten.

Miriam Meckel

Miriam Meckel ist Mitgründerin und Geschäftsführerin von ada und Professorin für Kommunikationsmanagement an der Universität St. Gallen, Schweiz. In dieser Kolumne schreibt sie alle zwei Wochen über Ideen, Innovationen und Interpretationen, die Fortschritt bringen und unser Leben verbessern. Denn was die Raupe das Ende der Welt nennt, nennt der Rest der Welt einen Schmetterling.

Das könnte dir auch gefallen

  • Kreative Zerstörung
  • 05.08.2022

Mitarbeitende tauschen Geld gegen Wertschätzung

Gute Führung, Respekt und Heimarbeit sind entscheidend für die Zufriedenheit im Job. Wer das nicht versteht, verliert die Belegschaft, warnen Miriam Meckel und Marcus Heidbrink.

  • Metaverse
  • 19.10.2021

Warum uns muskulöse Avatare stärker machen

Im Interview erklärt der Medieninformatiker Martin Kocur, wie Avatare aussehen müssen, damit Menschen in der virtuellen Realität bessere Leistung erbringen.

  • Innovation
  • 13.05.2021

Bei Erfolg überflüssig

Innovation Labs sollen neue Ideen finden und den Kulturwandel beschleunigen. Wann das klappt – und woran es scheitert.

© 2022 ada
Impressum
Datenschutz