Datenqualität in Gefahr: Die Herausforderungen von generativer KI bei Online-Befragungen

Generative KI

Der Hype um generative KI-Modelle wie ChatGPT hat auch die Marktforschung erfasst und bietet unserer Branche viele neue positive Veränderungen. Allerdings hat jede neue Technologie ihre Vor- und Nachteile. In diesem Beitrag beleuchten wir die Herausforderungen, die mit dem Aufkommen generativer KI-Technologie verbunden sind, insbesondere in Bezug auf die Qualität von Online-Umfragen.

Was ist gererative KI?

Generative KI ist ein aufstrebender Bereich der künstlichen Intelligenz, der darauf abzielt, neue Daten auf der Grundlage vorhandener Daten zu erstellen. Im Wesentlichen werden bestehende Daten als Trainingsdaten verwendet, um neue Inhalte wie Texte, Bilder und Audiodateien zu generieren. Die Modelle lernen dabei die Muster der Ausgangsdaten und können auf dieser Basis neue Inhalte erstellen.

Dabei bietet generative KI enorme Potenziale für eine Vielzahl von Branchen und Anwendungen. Durch die Erstellung neuer Inhalte auf der Grundlage vorhandener Daten kann diese Technologie viele Bereiche revolutionieren. Auch die Marktforschungs- und Insights Branche kann von generativer KI profitieren. So setzen wir bei ReDem® beispielsweise diese Technologie erfolgreich zur Qualitätskontrolle von Befragungsdaten ein.

Welche Gefahren birgt generative KI für die Qualität von Online-Befragungen?

Befragungsdaten sind für Unternehmen, Regierungen und Forscher eine wichtige Informationsquelle, um Einblicke in die Meinungen und Verhaltensweisen von Menschen zu gewinnen. Um sicherzustellen, dass die Befragungen auch die Realität widerspiegeln, ist es von höchster Bedeutung, die Datenqualität zu gewährleisten.

Allerdings sind Befragungsdaten, insbesondere aus Online Access Panels, anfällig für betrügerische Teilnehmer wie „Umfrage-Bots“ und „Click-Farms“, die versuchen, das System auszunutzen, um Belohnungen zu erhalten, ohne ehrlich und aufmerksam an Umfragen teilzunehmen. Mit der zunehmenden Verbreitung von generativer KI ergeben sich wesentlich größere Herausforderungen als in der Vergangenheit.

Generative KI-Modelle können genutzt werden, um intelligente Bots zu entwickeln, die schwer erkennbar sind und eine große Gefahr für die Qualität von Befragungsdaten darstellen. In der Vergangenheit war das Problem von betrügerischen Befragungsteilnehmern und Bots bereits allgegenwärtig, aber durch den Einsatz von KI-Modellen erreicht es ein völlig neues Niveau.

Manuelle Kontrollen zur Sicherstellung der Datenqualität werden in Zukunft immer schwieriger, wenn nicht gar unmöglich. Der Kampf gegen betrügerisches Antwortverhalten wird sich ausschließlich auf technologischer Ebene abspielen müssen.

Das Worst-Case-Szenario wäre ein großangelegter Bot-Angriff, der unerkannt bleibt und dramatische Auswirkungen auf die Befragungsergebnisse hat.

Wie die Qualität dennoch sichergestellt werden kann

Generative KI-Modelle können nicht nur betrügerisches Antwortverhalten erzeugen, sondern auch dabei helfen, dieses zu erkennen. Durch KI-basierte Mustererkennung können KI-generierte Inhalte von Bots aufgedeckt werden. Da sich die Bots jedoch kontinuierlich weiterentwickeln, ist es ein ständiges technologisches Tauziehen, die Tools auf dem neuesten Stand zu halten.

Ein weiteres Mittel zur Qualitätssicherung ist das sogenannte „Digital-Fingerprinting“. Dabei werden mehrere Merkmale des digitalen Geräts eines Umfrageteilnehmers erfasst, um einen eindeutigen „Fingerabdruck“ zu erstellen. Allerdings können moderne Bots auch diese Methode teilweise überwinden. Hinzu kommt, dass Digital-Fingerprinting hinsichtlich DSGVO eine Herausforderung darstellt.

Zusammenfassend gibt es keine einzelne Maßnahme, um die Datenqualität bei Online-Umfragen zu gewährleisten. Es bedarf einer Kombination von Maßnahmen, die ständig weiterentwickelt werden müssen, um eine exzellente Datenqualität zu erreichen.

Wie sich die Branche bestmöglich auf eine Zukunft mit generativer KI vorbereiten kann

Im Hinblick auf die Zukunft wird die Sicherung der Datenqualität zu einer sich ständig wandelnden Herausforderung, die vor allem auf technologischer Ebene stattfindet. Um langfristig eine herausragende Datenqualität zu gewährleisten, sollten wir als Branche unsere Ressourcen bündeln, um die fortschrittlichsten technologischen Ansätze nutzen zu können. Nur so können wir die hohen Qualitätsansprüche aller Stakeholder erfüllen und die Glaubwürdigkeit der Marktforschungs- und Insights-Branche sicherstellen.

 

Image by starline on Freepik

Florian Kögl
Florian ist Gründer und CEO von ReDem®. Darüber hinaus ist er Vorstandsmitglied im Verband der Marktforschung Österreichs und verfügt über umfangreiche Erfahrung in der Entwicklung innovativer Softwarelösungen.