Daten haben ihren Preis

Daten haben ihren Preis

Heute stehen Daten in großer Menge zur Verfügung. Wer sie auszuwerten versteht, kann viel Geld verdienen − und andere manipulieren. Ist das aber so einfach? Der Q-Club des Vereins Qualität im Journalismus ging dieser Frage nach.


Kaum scheint eine Woche zu vergehen, in der nicht ein neuer Datenmissbrauch gemeldet wird. Eines der prominentesten Beispiele ist Cambridge Analytica. Das Unternehmen nahm für sich in Anspruch, Persönlichkeitsprofile zu erstellen, beispielsweise um Wählerverhalten im Voraus einzuschätzen. 2018 wurde durch Christopher Wylie bekannt, dass dazu auch Daten von Facebook genutzt wurden, die dort für einen freiwilligen Persönlichkeitstest – also in anderem Kontext – erhoben wurden.

Dieser Fall macht deutlich, worum es beim Umgang mit Daten geht. Menschen hinterlassen durch ihr Tun Spuren. Das können biologische Partikel sein, deren DNA in Kriminalfällen ausgewertet wird, aber auch digitale Daten. Wem ist schon bewusst, dass daran gearbeitet wird, dass Autos Daten an den Hersteller senden, beispielsweise zur Wetter- oder Verkehrssituation? Auch beim digitalen Bezahlen hinterlassen wir Spuren, ebenso beim Einsatz von Kundenkarten. Und in sozialen Netzwerken sowieso.

Da, wo Daten eine unstrukturierte ‹Masse› darstellen, sind sie nicht problematisch. Erst wenn sie aus verschiedenen Zusammenhängen miteinander in Beziehung gesetzt werden, können möglicherweise bestimmte Personen identifiziert werden. Ein fiktives Beispiel: Spricht man von einer «jüngeren Mitarbeiterin», hat man zwar noch keinen Namen genannt. Der Personalverantwortliche des Unternehmens kann aber den Personenkreis leicht eingrenzen: Sind in seinem Unternehmen 40 Prozent der Mitarbeitenden Frauen und insgesamt 15 Prozent jung, schränkt das bei einer Unternehmensgröße von 100 die Anzahl möglicher Personen auf sechs ein.

Nicht ganz so einfach

Auch für Journalisten ist der Zugang zu Daten relevant, um im ‹öffentlichen Interesse› Zusammenhänge zu ermitteln und Strukturen offenzulegen. Daher wählte der Schweizer Verein ‹Qualität im Journalismus› in seiner Veranstaltungsreihe Q-Club am 30. Mai in Zürich das Thema ‹Big data›. Angelo Zehr, Daten-Journalist bei SRF, war in Bezug auf den Effekt von Cambridge Analytica skeptischer: «Ich sehe keinen Beweis, dass eine Wirkung erzielt worden ist.» Und: «Es ist ein sehr einfaches Narrativ, zu sagen: Deshalb ist Trump gewählt worden.» Auch für Sylke Gruhnwald vom Online-Magazin ‹Republik› fehlen viele Puzzlesteine in der Argumentationskette. Sie betonte jedoch mehrmals, dass sich die Journalistinnen und Journalisten ein eingehendes technisches Verständnis erarbeiten sollten.

Nicht erst, aber auch mit der Datenschutzgrundverordnung der EU (EU-DSGVO) wird die Eigenverantwortung im Umgang mit den eigenen Daten deutlich. Die EU-DSGVO stärkt seit 25. Mai den Persönlichkeitsschutz, schreibt Transparenz der Datenverarbeitung vor, enthält das Recht auf Löschung persönlicher Daten und schafft (behördliche) Sanktionsmöglichkeiten.

Dort, wo Daten nur eine unstrukturierte ‹Masse› darstellen, sind sie nicht weiter problematisch. Werden aber zunächst voneinander unabhängige Daten aus verschiedenen Zusammenhängen miteinander in Beziehung gesetzt, können aus anonymen Daten identifizierbare Personen abgeleitet werden.

Journalisten kritisierten, dass die Informationsfreiheit beschränkt werde, denn schon jetzt seien offene Quellen geschlossen worden. Silke Gruhnwald nannte als Beispiel das ‹Internet-Telefon› mit Angaben zu Besitzern von Webseiten und ihren Kontaktdaten. Angelo Zehr nahm das gelassener: «Wir haben nun neue Möglichkeiten: das Angebot unserer Daten bei Unternehmen. Daraus entstehen neue Geschichten.» Der Datenschutzbeauftragte des Kantons Zürich, Bruno Baeriswyl, stellte klar, dass Journalisten weiterhin Privilegien besitzen, beispielsweise Daten sammeln dürfen.

Auch wies er darauf hin, dass Unternehmen wie Facebook die Datennutzung auch vorher schon transparent gemacht haben – dafür muss man allerdings die AGBS lesen und ernst nehmen: «Mit meiner Einwilligung kann ich den Datenschutz aufheben.» Allerdings gebe es auch Grenzen. Die bei Twitter veröffentlichten Meldungen sind öffentlich verfügbar und damit auswertbar. Werden aus ihnen Schlüsse gezogen, kann es problematisch werden. Dies verdeutlichte Bruno Baeriswyl, indem er fragte: «Hat der andere meine Einwilligung, aufgrund meiner Tweets meine Stimmungslage abzuleiten und mir dann ein Produkt anzubieten?»

Die Grenzen liegen dabei nicht nur in der Privatwirtschaft, sondern auch beim Staat: «Mit Algorithmen kann man berechnen, wer ein Risiko für die Gesellschaft ist. Wie geht der Staat mit Algorithmen um? Das müsste dem Öffentlichkeitsgesetz unterstellt werden», forderte jemand aus dem Kreis der Anwesenden.

Ökonomisierung der Daten

Am Beispiel der von Autos an den Hersteller gesendeten Daten wird die Frage virulent, wem die Daten eigentlich gehören. Solange es um Verkehrssicherheit geht, hat sicherlich niemand etwas gegen ihre Auswertung. Werden Daten ökonomisiert, entstehen jedoch Fragen nach dem Beitrag der Verarbeiter für die Allgemeinheit. Es geht dabei um den Wert von Rohstoffen.

Peter Brabeck-Letmathe, damals Präsident des Verwaltungsrats von Nestlé, führte im Dokumentarfilm ‹We feed the world› (2005) aus: «Wasser ist ein Lebensmittel und sollte – wie jedes Lebensmittel – einen Marktwert haben.» Bundeskanzlerin Angela Merkel kehrte auf dem Global Solutions Summit am 28./29. Mai 2018 diesen Gedanken um, indem sie als Konsequenz der Tatsache, dass andere an unseren Daten ‹verdienen›, eine «Bepreisung von Daten (insbesondere von den Konsumenten)» forderte. Sie meinte damit, dass Unternehmen, die Daten anderer vermarkten, darauf eine Steuer zahlen müssten. Josefa Haas zitierte den Gedanken, Daten als Gemeingut von Genossenschaften zu betrachten.

Die Soziologin und Psychologin setzte sich für einen wissenschaftlichen und ethischen Umgang mit Daten ein. Sie müssen valid sein, ihre Verarbeitung muss nachvollziehbar sein. Angelo Zehr sah die Notwendigkeit statistischer Grundkenntnisse, um beurteilen zu können, was sich aus einer Statistik überhaupt seriös ableiten lässt. Es geht zudem um die Quelle der Daten, ihre Einordnung und die Absicht ihrer Erhebung. Auf den Punkt brachte dies schließlich Angelo Zehr. Mit Hinweis auf die Ethikrichtlinie für Ärzte sagte er: «Das müsste es auch für Programmierer geben.»


Foto: Markus Spiske