Wahnsinn mit Methode

Was das BILDblog da heute berichtet, gehört zum ungeheuerlichsten, was ich an forschungsmethodischem Unsinn je gesehen habe. In einer Auseinandersetzung zwischen den Nachrichtenagenturen dpa und dapd hat letztere versucht, die Qualität der eigenen Arbeit mit Hilfe einer quantitativen Untersuchung zu untermauern. Methodisch befindet sich diese „Untersuchung“ etwa auf dem Niveau eines Nachmittagsprojekts achtjähriger Grundschüler (die man natürlich für eine solche Leistung loben würde, ohne es ernsthaft als wissenschaftliche Untersuchung zu verkaufen); Lukas Heinser hat auf BILDblog den gesamten Irrsinn so gut beschrieben, dass ich das hier nicht nochmal wiederholen muss. Allen Interessierten, vor allem Studierenden sozialwissenschaftlicher Fächer, sei aber der atemberaubende Originalbericht, der bis jetzt (18.04. 21:20 Uhr) allen Ernstes immer noch auf der dapd-Website online steht, sehr ans Herz gelegt; sowas sieht man nicht oft. Wie die auftraggebenden Herrschaften der dapd Medien Holding so etwas zulassen können, ist mir rätselhaft, auch vor dem durchführenden Unternehmen muss man aus fachlicher Perspektive wohl dringend warnen.

Advertisements

Titel zu „Bürger online“ ist fertig

Gestern haben wir vom UVK-Verlag die endgültige Titelseite unseres in den nächsten Wochen erscheinenden Buchs bekommen. Wir Titel "Bürger online"haben unter Mithilfe zahlreicher Kolleginnen und Kollegen sowie des Verlags versucht, eine brauchbare Visualisierung für den Gegenstand zu finden, ohne auf die übliche, etwas abgegriffene Internet-Symbolik wie Tastatur und Bildschirm zurückgreifen zu müssen. Über Kommentare und Hinweise, ob uns das gelungen ist bzw. Vorschläge zur Verbesserung oder alternative Ideen (allerdings erst für die 2. Auflage …) würden wir uns freuen, entweder hier oder auch auf der neuen Website zum Buch: http://www.buerger-online.net

Countdown für „Bürger online“ läuft

Nach noch einmal einigen Wochen intensiver Durchsicht, Lektorat und Korrektur ist es bald so weit: Das Manuskript für unser Buch mit den Ergebnissen unseres zehnjährigen Forschungprojekts zur Entwicklung der politischen Online-Kommunikation der Deutschen (http://www.politische-online-kommunikation.de) ist heute an den UVK-Verlag gegangen. In schätzungsweise drei bis vier Wochen ist das bereits länger angekündigte 350-Seiten-Werk dann erhältlich. Weitere Infos gibt es demnächst auch auf einer Website zum Buch.

Prekäre Beziehung: Statistik und Journalisten

Als Sozialwissenschaftler freut man sich ja, wenn im Feuilleton nicht nur theoretisch analysiert (und gelegentlich nur subjektiv schwadroniert), sondern auch einmal ein empirischer Forschungsstand diskutiert wird. Insofern ist der Beitrag von Tobias Kniebe im Feuilleton der SZ vom 8./9.01.2011 (in der Print-Version mit zahlreichen Grafiken und unter dem Titel „Der Männerbund des Thilo Sarrazin“, zur Darstellungsform siehe AusschnittsfotoAusschnitt aus Print-Version mit Grafiken) eine schöne Sache: Die Sarrazin-Debatte wird innovativ aus einem ganz anderen Blickwinkel betrachtet, nämlich über das soziale Profil der Leserinnen und Leser seines Buches „Deutschland schafft sich ab“. Bei genauerem Hinsehen zeigen sich aber einmal mehr ganz erhebliche Fehlinterpretationen der Daten, die ich an einem Ausschnitt mal kurz illustrieren möchte:

Basis der Auswertung ist die vierteljährliche Auswertung eines GfK-Panels zum Bücher-Kaufverhalten der Deutschen. Da die Primärdaten nicht veröffentlicht sind, sondern nur die Auswertung durch die SZ (deren Dokumentation nicht wissenschaftlichen Ansprüchen genügt), kann man die Qualität der Auswertung nur grob abschätzen. Geht man davon aus, dass sich die Grundgesamtheit auf ca. 60 Mio. (erwachsene) Deutsche bezieht, daraus eine zufällige Auswahl an 10.000 Personen befragt wurde und dass vom Sarrazin-Buch zum Analysezeitpunkt 1,2 Mio. Exemplare verkauft wurden (falls jeder Käufer nur 1 Exemplar erworben hat, maximal 2,2 % der Bevölkerung), ist zu erwarten, dass sich im Datensatz gut 200 Sarrazin-Käufer befinden, die analysiert werden können.

Damit kommt man zu Problem 1: Diese Fallzahl reicht zwar durchaus, um sich einen groben Überblick zu verschaffen, aber sie ist zu klein, um minimale Abweichungen vom Bevölkerungsdurchschnitt sinnvoll interpretieren zu können. Zwei befragte Personen machen ja gleich 1 % aller Sarrazin-Leser aus; Wenn die Daten nun sagen, dass 4 % weniger der Sarrazin-Leser hedonistisch veranlagt sind, als der Bevölkerungsdurchschnitt, kann das (wir wissen leider nicht genau, bei welcher absoluten Prozentzahl dieser Durschnitt liegt) durch nur zwei oder drei Personen mehr zustande kommen, die ein solches Hedonismus-Item abgelehnt haben. Die Wahrscheinlichkeit, dass das eine zufällige Abweichung ist, die bei einer anderen Zufallstichprobe ganz anders aussehen kann, ist hoch. Diese Wahrscheinlichkeit wäre anhand der Primärdaten auch sehr einfach zu berechnen und sollte eigentlich bei einer solchen Analyse auch dokumentiert werden.

Dies leitet zugleich zu Problem 2 über: es werden nämlich nur relative Verteilungen dokumentiert (prozentuale Abweichung vom – unbekannten – Bevölkerungsdurchschnitt). Diese Verhältnisse sind aber stark davon abhängig, wie groß die absolute Basis ist (die nicht dokumentiert ist). Die Aussage, unter den Sarrazin-Käufern seien 40 % mehr SZ-Leser als in der Gessamtgesellschaft, klingt erstmal deutlich. Allerdings lesen in Deutschland nur etwa 1,2 Mio. Menschen die SZ (ca. 0,84 % der über 14-jährigen Bevölkerung); hochgerechnet (Pi mal Daumen) heißt das, dass von den Sarrazin-Käufern etwa 1,17 % SZ lesen, im Vergleich zu 0,84 % in der Gesamtbevölkerung. Daraus den Schluss zu ziehen, die Sarrazin-Leser seien SZ-affin, geht doch etwas zu weit, den auch in dieser Gruppe lesen eben fast 99 % keine SZ. Ob dieser Unterschied aufgrund der o.g. kleinen Stichprobe (bezogen auf die höchstens 220 untersuchten Sarrazin-Käufer kann der Unterschied sich in kaum mehr als einem zusätzlichen SZ-Leser maniferstieren …) signifikant und damit tatsächlich auf alle Deutschen hochrechnen lässt, muss man darüber hinaus stark bezweifeln.
Das Grundproblem dieser Analyse relativer Verteilungen ist, dass diese umso größer ausfallen können, je kleiner die absoluten Ausgangswerte sind: Da die Zahl der Leser der „Frankfurter Allgemeinen Sonntagszeitung“ noch kleiner als die der SZ ist (< 1 %), gehört nicht viel dazu, in einer ohnehin kleinen Teilgruppe der Sarrazin-Leser einen fast fünffach größeren (+ 474 %) Leseranteil zu identifizieren: statt 0,9 % in der Gesamtbevölkerung sind es 4,6 % – aufgrund der kleinen Fallzahl in der Datenerhebung ein Unterschied von schätzungsweise 2 zu 10 Befragten.

Macht man sich diese Probleme klar, kann man manche Interprationen des Autors im Text nur naiv nennen, denn die Unterschiede zwischen den Sarrazin-Käufern und der Gesamtbevölkerung werden von ihm eben gerade anhand der besonders starken – aber wie oben gezeigt eben auch weitgehend irrelevanten – Unterschieden festgemacht. Dadurch entsteht ein zumindest in Teilen völlig realitätsfernes Bild des am Frühstückstisch FAS lesenden, im Fernsehen Bauerntheater sehenden älteren Mannes, der zwar karrieregeil aber risikoscheu ist.

Bedroht das Kostenlos-Internet die Tageszeitung?

Der Verband der deutschen Zeitungsverleger hat auf seiner gestrigen Jahrespressekonferenz, bei der das Geschäftsjahr 2009 bilanziert wurde, erneut kostenlose Online-Inhalte als Bedrohung für das eigene Geschäftsmodell identifiziert, wobei insbesondere die Online-Angebote der öffentlich-rechtlichen Rundfunkanstalten kritisiert wurden. Hier ein Zitat von Heise online:

BDZV-Hauptgeschäftsführer Dietmar Wolff kritisierte scharf die gebührenfinanzierten Online-Auftritte der öffentlich-rechtlichen Rundfunkanstalten. Angebote wie „tagesschau.de“ und „heute.de“ seien quasi „Zeitungen im Internet“. „Verlage können Bezahlmodelle nicht entwickeln, wenn öffentlich-rechtliche Sender kostenlose Angebote mit gleichen Inhalten machen“, sagte Wolff. Es sei ein Skandal, dass die Rundfunkräte solchen Angeboten grünes Licht geben.

Tatsächlich geht die Tageszeitungsnutzung seit mehr als zehn Jahren kontinuierlich zurück, während parallel die Internetnutzung, inklusive der darüber zugänglichen kostenlosen Inhalte, ebenso kontinuierlich zunimmt. Diese umgekehrt proportionale Entwicklung legt den Schluss nahe, dass die beiden Entwicklungen nicht zufällig das jeweilige Gegenmuster darstellen, sondern dass es einen Zusammenhang, ja sogar einen Kausalzusammenhang gibt.

Solche Verknüpfungen von aggregierten Variablen bergen allerdings das Risiko, einem sog. „ökologischen Fehlschluss“ aufzusitzen. Nur weil zwei Indikatoren auf Gesellschaftsebene (Marktanteil Zeitung, Marktanteil Internet) ein komplementäres Entwicklungsmuster aufweisen, muss auf der Mikroebene (beim einzelnen Informationsnutzer) nicht automatisch ein direkter, evtl. sogar kausaler Zusammenhang vorliegen.

Der Grund, warum solche Fehlschlüsse nahe liegen und oft nicht als solche erkannt werden, hängt mit Forschungsökonomie zusammen. Es gibt zwar viele quantitative empirische Untersuchungen, die zu allen möglichen Indikatoren Aggregatdaten liefern. Es gibt allerdings nur sehr wenige Datenquellen, die tatsächlich auf der Mikro-Ebene die jeweils interessierenden Variablen verknüpfen – und zwar deshalb, weil solche Datenerhebungen zeit- und kostenintensiv sind. Dass allerdings die Zeitungsverleger, obwohl sie seit Jahren um ihr wirtschaftliches Überleben kämpfen und eine tragfähige Aufklärung dieser Frage von existenzieller Bedeutung wäre, solche Investitionen bisher gescheut haben, ist mir völlig schleierhaft. Tatsächlich gibt es zwar viele Untersuchungen, die u.a. auch von Verlegerverbänden in Auftrag gegeben wurden, meines Wissens hat aber keine davon ein Studiendesign, das geeignet wäre, die zentrale Frage aufzuklären:

Führt das Internet dazu, dass die Menschen sich von (kostenpflichtigen) Informationen aus der Zeitung abwenden und statt dessen (kostenlose) Informationen aus dem Internet nutzen?

Meines Wissens gibt es weltweit überhaupt nur einen Datensatz, der diese Frage wenigstens ansatzweise beantworten könnte: Den Datensatz aus dem DFG-Projekt „Politische Online-Kommunikation“ von TU Ilmenau und Uni Düsseldorf. Nur dieser Datensatz hat während der zentralen Diffusionsphase des Internets das Kommunikationsverhalten eines repräsentativ ausgewählten Panels von Deutschen ab 16 Jahren (pro Jahr ca. 1500 Personen; weitere methodische Details auf der Projekthomepage) beobachtet und kann individuelle Verhaltensänderungen beschreiben. Vergleicht man mit diesen Daten diejenigen Personen, die zu einem bestimmten Zeitpunkt ins Internet eingestiegen sind, mit denjenigen, die weiterhin „draußen“ geblieben sind, müsste sich bei diesen „Einsteigern“ eigentlich ein Rückgang der Tageszeitungsnutzung zeigen – wenn denn die unendliche Fülle der kostenlosen (z.T. durch Rundfunkgebühren finanzierten) Inhalte eine unschlagbare Konkurrenz wäre. Die folgende Grafik zeigt an einem Beispiel, dass nichts dergleichen zu beobachten ist:Säulengrafik TZ-Nutzung von Internet-Einsteigern und Nichtnutzern

Egal ob die Befragten ins Internet eingestiegen sind oder Nicht-Nutzer blieben, die Veränderungen im Laufe eines Jahres sind die gleichen: ca. 10 % der Personen hören auf, eine Zeitung zu lesen, ca. 10 % fangen damit an, knapp 80 % ändern ihr Verhalten nicht. Egal, welchen Zeitraum man betrachtet – einen frühen Zeitabschnitt wie der zwischen Anfang 2002 und Anfang 2003 oder einen späten wie Mitte 2008 und Mitte 2009 – dieses Muster ändert sich nicht: Es gibt keinen signifikanten Unterschied zwischen dem Zeitungsleseverhalten der Internet-Einsteiger und der „Draussenbleiber“.

Man kann dem natürlich entgegenhalten, dass es sich vielleicht um längerfristige Effekte handelt, die nicht innerhalb eines Zeitraums von wenigen Monaten zu Tage treten. Aus diesem Grund ist es sinnvoll, solche Veränderungen über mehrere Jahre hinweg zu beobachten. In der folgenden Abbildung ist die „Netto“-Veränderung, also der Saldo zwischen -1 (für Aufgabe des Zeitunglesens) und +1 (für Aufnahme des Zeitungslesens) dargestellt, und zwar nur für die in der obigen Abbildung bereits beschriebenen Personen, die zwischen 2002 und 2003 ins Internet eingestiegen sind bzw. weiterhin Nicht-Nutzer blieben. Ausgangspunkt ist der gemeinsame Mittelwert des Jahres 2002, der hier auf Darstellungsgründen auf den Wert 0 gesetzt wurde.

Auch hier zeigt sich, dass die Linie der Internet-Einsteiger, von denen man eigentlich im Vergleich zu den dauerhaften Nicht-Nutzern erwarten würde, dass ihre Tageszeitungsnutzung zurückgeht, praktisch immer parallel zur Linie der „Draußenbleiber“ verläuft. Kein Unterschied – egal welchen Jahresabstand man wählt – ist signifikant, auch nicht der in der Grafik etwas größere im letzten untersuchten Jahr (hier sind die Fallzahlen wegen des gewählten Paneldesigns bereits sehr gering). Die gemeinsame Schwankung der beiden Linien geht auf externe Einflüsse zurück, denen beide Gruppen gleichermaßen ausgesetzt sind (z.B. höherer Informationsbedarf während Wahljahren). Es erübrigt sich fast zu erwähnen, dass die (dann jeweils kürzeren) Linien für diejenigen Personen, die erst ein, zwei oder drei Jahre später ins Internet gegangen sind, genau so aussehen und keinen Hinweis auf mögliche Substitutionseffekte geben.

Die Schlussfolgerung aus dieser knappen Darstellung (Details reiche ich nach, wenn die entsprechende Publikation fertig ist): Der verbissene Abwehrkampf gegen das Kostenlos-Internet ist die falsche Strategie, weil dort nicht das eigentliche Problem liegt. Das Problem liegt – unsere Daten belegen das – nicht darin, dass kostenlose Online-Angebote Nutzer von der Zeitung abziehen, sondern darin, dass die etwa unter 40jährigen von vorneherein gar keinen Kontakt mehr mit den Angeboten der Tageszeitung bekommen. Es wird gar nichts mehr ersetzt, sondern die Zeitung wird nicht mehr wahrgenommen, was zum Teil auch eine Folge der extrem defensiven Strategie vieler Verlagshäuser sein dürfte: Da man – aus Angst, die Zeitungsleser würden ihre Abos kündigen, wenn alles kostenlos im Netz steht – kaum relevante, aktuelle, hochwertige Informationen im Netz angeboten hat, haben sich die Informations- und Kommunikationsströme ihre Canyons an deren Webseiten vorbei in die Strukturen des weltweiten Netzes gegraben – und aus diesen Canyons sind sie nicht mehr so leicht umzuleiten. Dass diese Ströme im deutschsprachigen Netz fast alle irgendwie bei SPIEGEL ONLINE enden, ist eine bittere Pointe für die Tageszeitungen: Dieses eigentlich gar nicht tagesaktuelle Wochenmedium hat durch eine frühzeitige offensive Online-Strategie den Platz im Netz besetzt, den die Tageszeitungen hätten haben können.

Da die größte Problemgruppe der Tageszeitungen also nicht die über 40jährigen Menschen sind, die ihre Tageszeitung abbestellt haben, weil sie die Informationen im Internet umsonst bekommen (diese Gruppe gibt es nämlich praktisch nicht, s.o.), sondern die jungen Menschen unter 40, die noch nie Erfahrungen mit der Zeitung gemacht haben, weil sie in einer Online-Welt ohne Zeitungen ganz anders sozialisiert wurden, sind die meisten, rückwärtsgewandten Strategien der Verlage zum Scheitern verurteilt. Die einzige sinnvolle Online-Strategie wäre es, sich zu überlegen, wie man im Netz die Rolle des Informationsbrokers und Teilöffentlichkeiten-miteinander-Verknüpfers zeitgemäß umsetzen kann – und nicht, wie man das alte Verkaufserlösmodell ins Internet kopieren kann. Eine solche Strategie muss sich weitgehend über andere Quellen finanzieren als den direkten Verkaufserlös der Produkte – wenn es Unternehmen gibt, die damit Erfahrung haben sollten, dann sind es ja wohl die Zeitungsverlage, die sich bereits seit Jahrhunderten zum größeren Teil über andere Einnahmen als die Verkaufserlöse ihrer Blätter an die Leser finanziert haben.  Tatsächlich gibt es ja auch durchaus kommerzielle Online-Informationsanbieter, die sich über das Netz gut finanzieren können. Als Alternative bliebe wohl nur noch, den Konkurrenzkampf um die Restplätze der in Zukunft mutmaßlich noch verbleibenden Offline-Tageszeitungen aufzunehmen und zu versuchen, vom langsam kleiner werdenden Kuchen auf Kosten der Konkurrenz mehr abzubekommen.

Datenanalyse-Projekte zu politischer Online-Kommunikation

Dieses Semester stehen in meinen beiden Master-Kursen an der FU Berlin Sekundäranalysen der umfangreichen Befragungs-Datensätze aus dem langjährigen DFG-Projekt „Politische Online-Kommunikation“ auf dem Programm. Ziel ist, unsere Datenanalyse-Kompetenzen zu erproben und zu erweitern und dabei vielleicht auch den Daten – immerhin eine siebenwellige Panel-Befragung über sieben Jahre von etwa 1500 Personen – ein paar neue Erkenntnisse zu entlocken. Ich bin gespannt!