„Die Kunst Der Statistik. So Finden Sie Antworten In Daten "

Inhaltsverzeichnis:

Video: „Die Kunst Der Statistik. So Finden Sie Antworten In Daten "

Video: „Die Kunst Der Statistik. So Finden Sie Antworten In Daten "
Video: Vortrag von Prof. Walter Krämer: So lügt man mit Statistik 1/5 2023, März
„Die Kunst Der Statistik. So Finden Sie Antworten In Daten "
„Die Kunst Der Statistik. So Finden Sie Antworten In Daten "
Anonim

Der Mensch ist von Natur aus schlecht im Umgang mit Wahrscheinlichkeiten und großen Zahlen. Wir achten lieber auf die Informationen, die uns am interessantesten erscheinen und ignorieren alles andere. Und obwohl die Menschen seit jeher Daten gesammelt und systematisiert haben, konnte man erst dank der Mitte des 17. Seit Beginn der Neuzeit ist die Statistik ein wichtiges Werkzeug für wissenschaftliche Erkenntnisse über die Welt, die bedeutende Entdeckungen in Astronomie, Biologie und Medizin gemacht hat. In der Welt der Big Data scheint ein grundlegendes Verständnis von Statistik unerlässlich. Im Buch „Die Kunst der Statistik. Wie man Antworten in Daten findet “(Mann, Ivanov und Ferber), übersetzt ins Russische von Evgeny Ponikarov, spricht der britische Statistiker David Spiegelhalter über die wichtigsten Prinzipien und Indikatoren, die helfen, Wissen über die Welt aus Daten zu extrahieren und Fragen dazu zu beantworten. N+1 lädt seine Leser ein, eine Passage darüber zu lesen, wie man aus vielen Daten die richtigen Schlüsse zieht.

Image
Image

Inferenz aus Daten - der Prozess der "induktiven Inferenz"

In den vorherigen Kapiteln wurde davon ausgegangen, dass Sie ein Problem haben, Sie erhalten einige Daten, sehen sie sich an und finden ihre zusammenfassenden Merkmale. Manchmal liegt die Antwort bereits im Zählen, Messen oder Beschreiben. Wenn wir zum Beispiel wissen wollen, wie viele Menschen im vergangenen Jahr zum Rettungsdienst gegangen sind, dann liefern uns die Daten die Antwort.

Oft geht die Frage jedoch über die übliche Beschreibung von Daten hinaus: Wir wollen mehr wissen als nur eine Reihe von Beobachtungen, die wir haben, wir möchten beispielsweise Vorhersagen treffen (was wird mit den Indikatoren im nächsten Jahr passieren?) oder berichten Gründe (warum steigen die Zahlen?)

Bevor Sie beginnen, aus den Daten zu verallgemeinern, um etwas über die Welt zu erfahren, das über die direkte Beobachtung hinausgeht, müssen Sie sich die Frage stellen: "Worüber lernen?" Dies erfordert die Auseinandersetzung mit einer komplexen Idee. induktive Inferenz.

Viele Leute haben ein vages Verständnis von Deduktion, da Sherlock Holmes es verwendet, um Kriminelle zu finden.* Im wirklichen Leben ist Deduktion der Prozess der Anwendung der Regeln der Logik, um vom Allgemeinen zum Besonderen zu gelangen. Wenn nach der Gesetzgebung des Landes Rechtsverkehr herrscht, können wir den Schluss ziehen, dass es in jeder Situation besser ist, auf der rechten Seite zu fahren. Die Induktion funktioniert umgekehrt: Aus Einzelfällen wird versucht, allgemeine Schlussfolgerungen zu ziehen. Wir wissen zum Beispiel nicht, ob es in manchen Gemeinden üblich ist, Freunde auf die Wange zu küssen, und wir versuchen herauszufinden, ob Frauen sich einmal, zweimal, dreimal küssen oder gar nicht küssen. Der grundlegende Unterschied zwischen Induktion und Deduktion besteht darin, dass die Deduktion wahre Schlussfolgerungen liefert, während die Induktion im allgemeinen Fall keine **.

* Arthur Conan Doyle lag falsch: Holmes' Methoden hatten nichts mit Deduktion zu tun. Seine Begründung ist Entführung. Deduktion ist ein Übergang von allgemeinen Prämissen zu bestimmten Konsequenzen. Ein klassisches Beispiel: 1) alle Menschen sind sterblich; 2) Sokrates ist ein Mann; 3) Daher ist Sokrates sterblich. Deduktion garantiert die Wahrheit der Konklusion, wenn die Prämissen wahr wären. Bei der Entführung haben wir eine Schlussfolgerung und stellen eine Prämisse wieder her. Fliegt zum Beispiel ein Fußball auf uns zu, ziehen wir den verführerischen Schluss, dass jemand den Ball getroffen hat. Oder nehmen wir die erste Prämisse „Alle Menschen sind sterblich“und die Schlussfolgerung „Sokrates ist sterblich“. Dann nehmen wir an, dass die zweite Prämisse lautet: „Sokrates ist ein Mensch“. Die Entführung garantiert keineswegs die Wahrheit unserer Schlussfolgerung (z sich herausstellen, dass er kein Mörder war). Abduktives Denken bietet jedoch eine eindeutige Richtlinie, die es Ihnen ermöglicht, vernünftige Hypothesen aufzustellen. Der bedeutende Logiker Charles Peirce glaubte, dass Deduktion, Induktion und Entführung die drei Haupttypen des elementaren Denkens sind. Ca. pro.

** Die Einführung kann vollständig oder unvollständig sein. Volle Induktion garantiert die Wahrheit der Konklusion, unvollständige Induktion nicht. Hier ist ein Beispiel für die vollständige Induktion. Angenommen, es gibt 30 Personen in einer Klasse und alle haben die Prüfung bestanden. Wenn Sie 30 Pakete wie „Alexander hat die Prüfung bestanden“, „Maria hat die Prüfung bestanden“und ähnliche Aussagen für alle anderen Schüler haben, dann können Sie schlussfolgern: „Die ganze Klasse hat die Prüfung bestanden“, und dies ist eine wahre Schlussfolgerung. In den meisten Fällen ist die Induktion jedoch unvollständig - Sie wissen, dass nur ein Teil der Elemente einer Menge ein Merkmal hat, und Sie schließen daraus, dass alle seine Elemente diese haben. In diesem Fall ist die Wahrheit der Schlussfolgerung nicht garantiert. Wenn Sie beispielsweise Informationen zu nur 25 bestandenen Studenten haben, können Sie davon ausgehen, dass alle 30 Studenten die Prüfung bestanden haben, aber diese Schlussfolgerung ist bereits wahrscheinlich. Ca. pro.

In Abb. 3.1 Induktive Inferenz wird als Diagramm dargestellt, das die Schritte zeigt, die erforderlich sind, um von den Daten zum endgültigen Ziel unserer Studie zu gelangen. Wie wir gesehen haben, geben uns die bei der Umfrage erhobenen Daten Aufschluss über das Verhalten der Personen in der Stichprobe; Wir verwenden diese Informationen, um das Verhalten von Personen zu untersuchen, die Umfrageteilnehmer werden könnten, und ziehen daraus einige vorläufige Schlussfolgerungen über das Sexualverhalten auf nationaler Ebene.

Natürlich wäre es ideal, wenn wir direkt von der Betrachtung der Rohdaten zu allgemeinen Aussagen über die Zielgruppe übergehen könnten. Standardkurse in Statistik gehen davon aus, dass Beobachtungen rein zufällig und direkt von der interessierenden Bevölkerung stammen.

Image
Image

Reis. 3.1 Der Prozess der induktiven Inferenz: Jeder Pfeil kann als "erzählt uns etwas über …" interpretiert werden.

Im wirklichen Leben passiert dies jedoch selten, daher müssen wir das gesamte Verfahren für den Übergang von den Primärdaten zum endgültigen Ziel berücksichtigen. Wie wir in der Natsal-Studie gesehen haben, können jedoch in jeder Phase Probleme auftreten.

sind Messprobleme. Spiegelt das, was wir in unseren Daten erfassen, genau wider, was uns interessiert? Wir möchten, dass unsere Daten:

- zuverlässig - in dem Sinne, dass sie von Fall zu Fall eine geringe Variabilität aufweisen und als reproduzierbar und genau angesehen werden können;

- zuverlässig - in dem Sinne, dass Sie ohne Voreingenommenheit genau das messen, was Sie wollen.

Die Angemessenheit einer Umfrage zum Thema Sex beruht beispielsweise darauf, dass Menschen bei jeder Befragung dieselbe Frage beantworten, fast gleich und unabhängig von Interviewer, Stimmung oder Gedächtnis des Befragten. Dies kann teilweise durch spezielle Fragen zu Beginn und am Ende überprüft werden. Die Forschungsqualität erfordert auch, dass die Teilnehmer ihre sexuelle Aktivität ehrlich beschreiben, anstatt ihre Erfahrungen systematisch zu übertreiben oder herabzusetzen. Das sind ziemlich strenge Anforderungen.

Die Forschung wird unzuverlässig, wenn die Fragen selbst eine Voreingenommenheit zugunsten einer bestimmten Antwort aufweisen. Im Jahr 2017 gab Ryanair beispielsweise bekannt, dass 92 Prozent seiner Passagiere mit dem Service, den sie auf ihren Flügen boten, zufrieden waren. Doch wie sich herausstellte, lieferte die Zufriedenheitsumfrage nur Antworten für ausgezeichnet, sehr gut, gut, befriedigend und ok***.

*** Nachdem jemand von der Royal Statistical Society solche Umfragemethoden kritisiert hatte, sagte Ryanair-Manager Michael O'Leary: „95 Prozent der Ryanair-Kunden haben noch nie von der Royal Statistical Society gehört, 97 Prozent ist es egal, was sie sagen, und 100 Prozent sagte, es klang so, als müssten seine Mitglieder einen günstigen Ryanair-Urlaub buchen. In einer anderen kürzlich durchgeführten Studie wurde Ryanair als die schlechteste von zwanzig europäischen Fluggesellschaften eingestuft (diese Umfrage hat jedoch ihre eigenen Zuverlässigkeitsprobleme, da sie gerade zu der Zeit durchgeführt wurde, als Ryanair eine große Anzahl von Flügen stornierte).

Wir haben bereits gesehen, wie sich die Form der Zahlendarstellung (positiv oder negativ) auf die Wahrnehmung auswirkt; Ebenso kann die Formulierung der Frage die Antwort beeinflussen. In einer britischen Umfrage im Jahr 2015 wurden die Menschen beispielsweise gefragt, ob sie sich dafür aussprechen, 16- und 17-Jährigen das Wahlrecht bei einem Referendum zum Austritt aus der Europäischen Union zu geben. Es stellte sich heraus, dass 52 Prozent dafür sind und 41 Prozent dagegen sind. Daher unterstützten die meisten Menschen diesen Vorschlag, weil er aus der Perspektive der Anerkennung und Stärkung der Jugend formuliert wurde.

Aber wenn dieselben Befragten (logischerweise identisch mit der vorherigen) gefragt wurden, ob sie sich für eine Senkung des Wahlalters in einem Referendum von 18 auf 16 Jahre aussprechen, sank der Anteil der Befürworter dieser Idee auf 37 Prozent, während es 56 Prozent waren gegen. Als also derselbe Vorschlag im Sinne einer riskanteren Liberalisierung formuliert wurde, war die Mehrheit dagegen. Meinung änderte sich aufgrund einer einfachen Neuformulierung der Frage.

Die Antworten können auch durch das, was zuvor gefragt wurde, beeinflusst werden - ein Mechanismus, der in der Psychologie als Priming (oder Fixierung einer Menge oder der Effekt von Vorrang) bekannt ist. Laut offiziellen Wohlfahrtsumfragen fühlen sich 10 Prozent der jungen Briten einsam, während in einer Online-Umfrage der BBC diese Antwort von viel mehr Teilnehmern gewählt wurde - 42 Prozent. Möglicherweise ist dieser Anstieg des Indikators auf zwei Faktoren zurückzuführen: 1) das Selbstwertgefühl in der freiwilligen "Forschung" und 2) die Tatsache, dass der Frage nach Einsamkeit eine lange Reihe von Fragen vorausging, ob der Befragte generell einen Mangel an Kameradschaft erlebte, ein Gefühl von Verlassenheit, Losgelöstheit und so weiter. Vielleicht haben ihn all diese Fragen dazu veranlasst, die zentrale Frage nach der Einsamkeit positiv zu beantworten.

hängt von einer grundlegenden Qualität der Forschung ab, genannt interne Validität: Spiegelt die beobachtete Stichprobe die Eigenschaft der untersuchten Gruppe wider? Hier kommen wir zu einem wichtigen Weg, um Verzerrungen zu vermeiden – Zufallsstichproben. Sogar Kinder verstehen, was es heißt, etwas zufällig auszuwählen - mit geschlossenen Augen die Hand in eine Tüte mit Süßigkeiten stecken und sehen, welche Farbe die Bonbonverpackung für diejenige haben wird, die Sie herausgezogen haben, oder eine Nummer von einem Hut nach dem Zufallsprinzip ziehen bestimmen, wer einen Preis oder eine Belohnung bekommt (oder nicht bekommt). Diese Methode wird seit Jahrtausenden verwendet, um Fairness zu gewährleisten - Vergütungsbestimmung, Lotterien, Ernennung von Geschworenen usw. - und wurde als Losziehung bezeichnet. Es wurde auch in schwerwiegenderen Fällen verwendet - bei der Wahl, wer in den Krieg ziehen oder in einem auf See verlorenen Rettungsboot essen sollte.

**** Nicht zu verwechseln mit Wahrsagerei [ähnliche englische Wörter sortition und sortilege werden im Original verwendet. Ca. pro.], eine Form der Wahrsagerei, bei der scheinbar zufällige Phänomene verwendet werden, um den göttlichen Willen oder die Zukunft zu bestimmen, auch bekannt als Kleromantie. Beispiele gibt es in vielen Kulturen, darunter Wahrsagerei mit Teeblättern, Hühnereingeweiden, biblisches Loswerfen, um Gottes Willen zu bestimmen, oder Wahrsagerei aus dem Buch der Wandlungen (I Ging).

George Gallup, der in den 1930er Jahren tatsächlich wissenschaftliche Methoden der öffentlichen Meinungsforschung entwickelte, bot eine elegante Analogie zum Verständnis des Werts von Stichproben: Wenn man einen großen Topf Suppe gekocht hat, muss man nicht alles essen, um sehen, ob es genug Gewürze enthält. Ein Löffel ist genug, aber unter der Bedingung, dass Sie alles gut mischen. Der wörtliche Beweis für diese Aussage wurde 1969 während der Lotterie erhalten, die das Verfahren für die Einberufung zum Krieg in Vietnam festlegte. Zuerst erstellte die Lotterie eine geordnete Liste von Geburtstagen, und dann wurden diejenigen, deren Geburtsdatum ganz oben auf der Liste stand, nach Vietnam geschickt und so weiter. Um diesem Verfahren gerecht zu werden, wurden 366 Kapseln hergestellt, jede mit einem einzigartigen Geburtsdatum. Es wurde davon ausgegangen, dass die Kapseln willkürlich aus der Schachtel genommen werden. Sie steckten sie jedoch nach Geburtsmonat in eine Schachtel und machten sich nicht die Mühe, sie richtig zu mischen. Dies würde nicht zu Problemen führen, wenn die Leute beim Herausnehmen der Kapseln ihre Hand tiefer in die Schachtel stecken würden, aber, wie das Video zeigt, die Kapseln in der Regel von oben genommen werden. Infolgedessen hatten diejenigen, die am Ende des Jahres geboren wurden, am wenigsten Glück: Vom 31. Dezember wurden 26 ausgewählt, ab Januar nur noch 14 Tage.

Der Gedanke der richtigen Durchmischung ist entscheidend: Wenn Sie von einer Stichprobe auf die gesamte Grundgesamtheit übergehen möchten, müssen Sie sicherstellen, dass die Stichprobe repräsentativ ist. Das Vorhandensein einer großen Datenmenge garantiert keine gute Stichprobe und kann sogar falsches Vertrauen vermitteln. Bei den britischen Parlamentswahlen 2015 beispielsweise scheiterten Umfrageunternehmen kläglich, obwohl ihre Stichproben Tausende potenzieller Wähler umfassten. Spätere Untersuchungen machten vor allem für Telefoninterviews eine nicht repräsentative Stichprobe verantwortlich, da in den meisten Fällen nur Festnetznummern angerufen wurden und diese Anrufe tatsächlich von weniger als 10 % der Teilnehmer beantwortet wurden. Es ist unwahrscheinlich, dass eine solche Stichprobe als repräsentativ angesehen werden kann.

… Schließlich spiegeln die Ergebnisse auch mit hervorragenden Messungen und guten Stichproben möglicherweise nicht das wider, was wir erforschen möchten, wenn wir nicht in der Lage waren, die Personen zu befragen, die uns besonders interessieren. Wir wollen, dass unsere Forschung externe Validität*****.

***** Dies bedeutet lediglich die Möglichkeit, die Ergebnisse einer bestimmten Studie auf eine größere Klasse von Objekten oder Situationen auszudehnen. In Wirklichkeit ist es kaum realistisch, das erhaltene Ergebnis auf beliebige Populationen, beliebige Bedingungen und zu jeder Zeit zu verallgemeinern, daher sprechen sie nur von einem gewissen Grad an Beachtung der externen Validität. Ca. pro.

Eine extreme Manifestation ist eine Situation, in der die Zielpopulation aus Menschen besteht, während wir beispielsweise nur Tiere untersuchen können, wenn wir die Wirkung einer Chemikalie auf Mäuse analysieren. Der Unterschied wäre nicht so dramatisch, wenn klinische Studien eines neuen Medikaments ausschließlich an erwachsenen Männern durchgeführt würden und es dann bei Frauen und Kindern angewendet würde. Wir möchten die Auswirkungen auf alle Menschen kennen, aber statistische Analysen allein reichen nicht aus – wir müssen zwangsläufig Annahmen treffen und vorsichtig sein.

Beliebt nach Thema