Hinweis auf die DSGVO: Auf unserer Seite werden keine Dritt-Anbieter-Cookies verwendet und nur Daten erfasst, welche für das Minimum an Board-Funktionalität notwendig sind.
Bevor Sie sich registrieren oder das Board verwenden, lesen Sie bitte zusätzlich die DSGVO-Erklärung, welche in der Navigationsleiste verlinkt ist.

Kurzfassung der unserer Meinung nach wichtigsten DSGVO-Punkte:
Es kann vorkommen, dass Benutzer eigenverantwortlich Videos oder sonstige Medien in ihren Beiträgen verlinken, welche beim Aufruf der Forenseite als Teil der Seite samt zugehörigem Material mitgeladen werden. Sollten Sie dies nicht wünschen, verwenden Sie beim Benutzen des Forums einen Blocker wie z.B. uMatrix, welcher das Laden von Inhaltsblöcken von Fremd-URLs effektiv unterbinden kann.
Wir blenden keine Werbung ein und schränken die Inhalte in keinster Weise bei Benutzung von Addblockern ein. Dadurch ist die Grundfunktionalität des Forums auch bei vollständigem Blockieren von Drittanbieter-Inhalten stets gegeben.

Cookies werden unsererseits nur verwendet um das Einloggen des Benutzers für die Dauer der Forenbenutzung zu speichern. Es steht dem Benutzer frei die Option 'Angemeldet bleiben' zu verwenden, damit der Cookie dauerhaft gespeichert bleibt und beim nächsten Besuch kein erneutes Einloggen mehr notwendig ist.
EMail-Adressen werden für Kontakt bei wichtigen Mitteilungen und zur Widerherstellung des Passwortes verwendet. Die verwendeten IPs können von uns ohne externe Hilfsmittel mit keiner realen Person in Verbindung gebracht werden und werden nach spätestens 7 Tagen gelöscht. Diese IPs werden höchstens verwendet um Neuanmeldungen unerwünschter oder gesperrter Nutzer zu identfizieren und zu unterbinden. Wir behalten uns daher vor bei Verdacht, die Frist für die IP-Löschung auf maximal 14 Tage zu verlängern.
Unsere Webseite läuft auf einem virtuellen Linux-Server, welcher von einem externen Anbieter gehostet wird. Etwaige Verstöße der DSGVO-Auflagen seitens dieses deutschen Hosters können wir nicht feststellen und somit auch nicht verfolgen.
Wir halten Backups unserer Datenbanken, welche in regelmäßigen Abständen als Schutz vor Katastrophen, Hackerangriffen und sonstigen Ausfällen erstellt werden. Sollte ein Nutzer die Löschung seiner Daten wünschen, betrachten wir es als Unzumutbar die Backups auch von den Daten zu befreien, da es sich hierbei um eine mehrtägiges Unterfangen handelt - dies ist für eine Einzelperson beim Betrieb eines privaten Forums nicht zumutbar möglich ohne das Backup komplett zu löschen.
Sollten Sie etwas gegen die dauerhafte anonyme Speicherung ihrer EMail-Adresse, ihres Pseudonyms und ihrer Beiträge in einem Backup haben, sehen Sie von der Registrierung in diesem Forum ab. Für Mitglieder, welche vor dem 25.05.2018 registriert waren steht jedoch das Recht im Raum, eine Löschung der Datenbank-Backups zu beantragen.



Wenn dies Ihr erster Besuch hier ist, lesen Sie bitte zunächst die FAQs sowie die wesentlichen Regeln zur Benutzung des Forums.
Um an den Diskussionen teilnehmen zu können, müssen Sie sich zunächst registrieren.

Verständnisfrage zur Wahrscheinlichkeit/Statistik

Mathematische Fragestellungen
Pippen
Ehrenmitglied
Ehrenmitglied
Beiträge: 2073
Registriert: 9. Jul 2010, 04:02

Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von Pippen » 24. Jun 2016, 23:15

Ok, ich habe eine Münze und will wissen, ob sie fair ist. Ich weiß: Bei 1000 Würfen einer fairen Münze wäre der Erwartungswert für Kopf bzw. Zahl je 1.000 x 0,5 = 500, d.h. die Wahrscheinlichkeit für 500mal Kopf aus 1000 Würfen wäre 50%. Richtig?

Um meine Frage zu beantworten will ich nun schauen, welche Ergebnisse mit weniger als 5% Wahrscheinlichkeit auftreten und wenn dann so eine Sequenz vorkommt, dann kann ich meinen Spieler des Falschspielens bezichtigen. MaW: Wieviel mal Kopf/Zahl muss kommen/nicht-kommen, damit die Wahrscheinlichkeit dafür bei unter 5% liegt? Wie geht man da vor (bitte schön langsam und nicht zuviel überspringen)?

Benutzeravatar
Stephen
Ehrenmitglied
Ehrenmitglied
Beiträge: 3012
Registriert: 14. Dez 2005, 17:09
Wohnort: Halle (Saale)

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von Stephen » 25. Jun 2016, 05:36

Ich kann dazu nur etwas aus dem purem Leben beitragen:
Mit meinen Verwandten und Bekannten spiele ich gerne das Würfelspiel Macke. Etwa seit 8 Jahren. Während ich in dieser Zeit noch nie einen Sechser (alle 6 Würfel tragen die gleiche Zahl beim Aufdecken) erleben durfte, hatte meine Tochter dieses Glück schon fast 10 Mal.

Die Wahrscheinlichkeit, mit 6 Würfeln sechs gleiche Zahlen zu würfeln liegt bei etwa 0,002% wegen (1/6)6 und somit wären 50.000 Runden fällig, um (statistisch gesehen) dieses Ergebnis zu erreichen.
Grob überschlagen haben wir in den acht Jahren aber jeder nur 20.000 Mal gewürfelt. So gesehen liege ich im Trend, mein Kind aber weit über den von dir veranschlagten 5% Abweichung, ohne gemogelt zu haben :wink:
Heißt im Umkehrschluss: ich brauche noch 30.000 Würfe, um auf 100% Wahrscheinlichkeit zu kommen, Töchterlein hat nur ein Bruchteil von etwa 10% davon genügt.

Aber hier könntest du fündig werden.

PS: meine Rechnung von oben ist nicht ganz korrekt, weil man die Anzahl der Spieler berücksichtigen müsste, die aber zwischen 2 bis 8 schwankte...

Jetzt stellt sich mir aber noch eine ganz blöde Frage: Ist so ein Ergebnis abhängig von einer einzelnen Person oder von allen Leuten, die im Universum würfeln? :mrgreen:
Die Demokratie beruht auf drei Grundpfeilern: Der Freiheit der Gedanken, der Freiheit der Rede und der Klugheit, beides nicht zu gebrauchen.
Mark Twain

Benutzeravatar
tomS
Ehrenmitglied
Ehrenmitglied
Beiträge: 10670
Registriert: 19. Nov 2007, 20:29

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von tomS » 25. Jun 2016, 09:48

Man kann diese Frage nicht absolut sondern wieder nur mit einer Wahrscheinlichkeit beantworten.

Nehmen wir eine endliche Menge von N Objekten und ziehen daraus eine kleine Stichprobe vom Umfang Z. Die Objekte haben gewisse Eigenschaften A, B, C, ... die mit einer gewissen Wahrscheinlichkeit p(A), p(B), p(C) vorkommen; wir kennen diese Wahrscheinlichkeiten nicht. Nun betrachten wir unsere Stichprobe vom Umfang Z mit den absoluten Häufigkeiten H(A), H(B), H(C). Daraus berechnen sich die relativen Häufigkeiten h = H/Z.

Nun kann man Hypothesen aufstellen und testen. Bsp.: wenn h(A) = 1/2, dann 0.45 < p(A) < 0.55 (also ein Intervall). Mittels der Stochastik erhält man dann eine Wahrscheinlichkeit, dass diese Hypothese richtig ist.

Außerdem unterscheidet man noch Fehler beim Test der Hypothesen.
Bsp. 1: wie groß ist die Wahrscheinlichkeit, dass ich im obigen Beispiel aufgrund meiner Stichprobe fälschlicherweise die Hypothese als wahr ansehe; also es stimmt nicht, dass 0.45 < p(A) < 0.55, aber aufgrund von h(A) nehme ich das an.
Bsp. 2: wie groß ist die Wahrscheinlichkeit, dass ich im obigen Beispiel aufgrund meiner Stichprobe fälschlicherweise die Hypothese als falsch ansehe; also es stimmt, dass 0.45 < p(A) < 0.55, aber aufgrund von h(A) lehne ich das ab

Ich habe da keine wirkliche praktische Erfahrung; liegt lange zurück (Abitur 1987). Ein guter Startpunkt ist https://de.wikipedia.org/wiki/Statistischer_Test
Gruß
Tom

Der Wert eines Dialogs hängt vor allem von der Vielfalt der konkurrierenden Meinungen ab.
Sir Karl R. Popper

deltaxp
Ehrenmitglied
Ehrenmitglied
Beiträge: 1129
Registriert: 23. Sep 2010, 17:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von deltaxp » 27. Jun 2016, 15:28

ich würd es so machen. Dein Nullhypothese lautet: Die Würfel sind fair. Nun hast du es mit Stichproben zu tun, da gibt es statische Schwankungen.

Sei N die Gesamtanzahl deiner unabhängigen Versuche, N1 die Anzahl Kopf, N0 die Anzahl Zahl, mit N1+N2=N, also N=1000 bei dir
Dann ist dein Erwartungswert pro Versuchsreihe E=N1/(N1+N0). Dieser erwartungswert ist aber statistischen Schwankungen unterworfen.
Den statistische Fehler kannst du dem mit Fehlerfortpflanzungsgesetzt bestimmen. ich nehm es mal ab, unter der Annahme des fairen Würfels kannst du N1~N0~N/2 nähern. dann kommt raus Sigma(0.5)=0.5/sqrt(N)~0.016; (i.a. Sigma(p)=sqrt(N1*N0/(N1+N0)^3) falls ich mich nicht verrechnet habe.
Das kannst du nehmen um im Nachschlagewert bei einer Gaußverteilung anzugucken, was man so erwartet.
+-1 std-abweichung sind 68% der Versuchsreihen im Bereich E=0.500+-0.016.
Typischerweise gibt man Vertrauensbereiche an, 95%, 99%

95% entspricht 2 Sigma, 99% etwa 2.6 Sigma. nehmen wir mal letzeres,
2.6*0.5/sqrt(1000)~0.04.

Die Nullhypothese (also fairer Würfel) verwerfen tust du also dann, wenn den Testreihen Ergebnsis mehr als 0.04 von 0.5 abweicht, also ausserhalb des interwalls [0.46,0.54] liegt. Denn Wahrscheinlichkeit, dass eine 1000-Wurf-versuchsreihe durch Zufall einen Wert ausserhalb des Intervalls liefert ist kleiner 1%.

bei 95% ist das Intervall dann etwa [0.47,53], eine Abweichung von mehr als 0.03 duch Zufall kann mit 5% tiger Wahrscheinlichkeit vorkommen.

Man kann eine Nullhypothese nie beweisen (nur das -statistsche- Vertrauen in sie steigern). selbst wenn du sie verwirfst, tust du das nur aufgrund einer Wahrscheinlichkeit, Aber man darf nie vergessen, unwahrscheinlich heisst nicht unmöglich.

Für den Nachweis eines Teilchens in der Hochenergie-Physik liegt man härtere Bandagen an, 5 Sigma abstand zum Untergrund ist hier die Forderung.
Es kann immer noch fake sein, aber die Wahrscheinlichkeit einer statistischen Fluktuation, die zu solchen Abstand führt ist kleiner als 0.000057%

wenn dein Problem bezogen, wäre es ein wert ausserhalb des Interwalls [0.42,0.58]. das käme bei bei rund 2 Millionen Versuchsreihen a 1000 Wurf vielleicht einmal vor. Du kannst mit deiner einen versuchreihe zufällig den einen erwischt haben, aber viel plausibler ist, dass da wer schummelt :P und die münze getürkt (oh. ist das politisch korrekt) ist.

Benutzeravatar
seeker
Ehrenadmin
Ehrenadmin
Beiträge: 8109
Registriert: 26. Dez 2009, 10:29

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von seeker » 27. Jun 2016, 18:09

Pippen hat geschrieben:Ok, ich habe eine Münze und will wissen, ob sie fair ist. Ich weiß: Bei 1000 Würfen einer fairen Münze wäre der Erwartungswert für Kopf bzw. Zahl je 1.000 x 0,5 = 500, d.h. die Wahrscheinlichkeit für 500mal Kopf aus 1000 Würfen wäre 50%. Richtig?
Kann man so nicht sagen.
Unter der Voraussetzung, dass die Münze fair ist, ist es äußerst unwahrscheinlich, dass nach genau 1000 Würfen exakt 500x Kopf gekommen ist.
Trotzdem ist der Erwartungswert für Kopf 50%, d.h., dass nach 1000 Würfen 500x Kopf und 500x Zahl zu erwarten ist.
Einigermaßen paradox - nicht wahr? :)

Grüße
seeker
Grüße
seeker


Wissenschaft ... ist die Methode, kühne Hypothesen aufstellen und sie der schärfsten Kritik auszusetzen, um herauszufinden, wo wir uns geirrt haben.
Karl Popper

Pippen
Ehrenmitglied
Ehrenmitglied
Beiträge: 2073
Registriert: 9. Jul 2010, 04:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von Pippen » 28. Jun 2016, 21:57

Ich muss es wieder vereinfachen, sonst stehe ich auf dem Schlauch:

Gegeben sei die Münzwurfsequenz: K K K K K K K K K K (10mal Kopf). Die Wahrscheinlichkeit dafür liegt bei einer fairen Münze bei 0,510.
Gegeben sei die Münzwurfsequenz: K Z Z K K Z K Z K Z. Diese Wahrscheinlichkeit ist gleich der obgigen.
Aus der genauen Wurfseuqenz kann man daher keine Schlüsse ableiten, weil alle Wahrscheinlichkeiten gleich hoch sind.
Wenn ich aber nun nicht die Wurfsequenz, sondern nur das Auftreten von K und Z beachte, dann ergibt sich P(alles Kopf) = 0,510 und P(nicht alles Kopf) = 1 - 0,510 = 0,999, also 99,9%.

Kann ich nun allein daraus schließen, dass der Würfel unfair ist - unter der Annahme, dass unfair alles sei bzw. Indiz dafür, was eine Wahrscheinlichkeit von unter 5% habe - oder muss ich diese komischen Hypothesentests machen?

So und dann können wir ein Bsp. besprechen, wo man empirisch eine Häufigkeit von 58% für X und 42% ~X bekommt. Wenn ich die Grundidee richtig verstehe - und nur darum geht's mir erstmal - dann setzt man das als sog. Nullhypothese nach dem Motto: reiner Zufall. Dann wiederholt man die Häufigkeiten nach Zufallsmuster und schaut sich an, wo sich der Erwartungswert einpendelt und ob die 58% und 42% davon "zu weit wegliegen". Wenn nein, dann bleibt's bei der Nullhypothese, wenn ja, dann ist's doch kein Zufall.

deltaxp
Ehrenmitglied
Ehrenmitglied
Beiträge: 1129
Registriert: 23. Sep 2010, 17:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von deltaxp » 29. Jun 2016, 10:19

Ja so ungefähr. ich hab dir ja ausgerechnet mit was für einer "normalen" (normal im Sinne der Gausschen Normal-Verteilung :) schwankungsbreite bei einer Versuchsreihe mit 1000 Wurf zu rechnen hast. Wenn man da deutlich von weg ist, wird die Wahrscheinlichkeit, dass das durch zu statistischen Zufall passiert so verschwindend gering, (das ist der sogenannte p-Wert, 1-p ist der Vertrauensbereich) dass die Annahme, es handelt sich um einen fairen Würfel - die nullhypothese - verworfen werden kann und es sich eher um eine unfaire münze handelt. Welchen Wert für p du als schwelle nimmst ist deine Entscheidung. typischerweise nimmt man p=5% (aka 95% vertrauens-Bereich, aka 2 Sigma) oder p=1% (aka 99% vertrauensbereich aka 2.6 Sigma). aber das ist keine regel, hängt ja auch von Wichtigkeit ab. wenn man in einem industriellen Prozess mit 1% ausschuss zb leben kann, nimmt man p=1%, wenn man aber nur 0.0001% ausschuss haben darf nimmt man eben p=0.0001 % also eher in Richtung 5 Sigma., wenn dir 5% reichen sollte bei 1000 Wurf Testreihe das Ergebnis im Interall [0.47..0.53] liegen. denn wenn der Würfel fair ist passiert das in 95% der Versuchsreihen. wenn deien Versuchsreihe ein wert ausserhalb des Intervalls betrifft, kann das eben nur mit p<5% durch Zufall eines fairen Würfels entstanden sein, also verwirfst du die annahme, dass er fair ist.

ich weiss nicht was ich sonst noch dazu sagen soll.
statistische tests laufen immer nach diesem muster ab.
Man stellt eine nullhypothese für seine zielgröße auf (fairer würfel), bestimmt die wahrscheinlichkeitsverteilung (meist gaus, aber nicht immer) der grundgesamtheit, und guckt nach mit ihrer hilfe nach welcher Wahrscheinlichkeit sein versuchsergebnis den gefunden wert durch zufall haben kann. liegt er ausserhalb des vertrauensbereiches (bei dir 95%), den man selbst festlegen muss, verwirft man die null-Hypothese.

Angemerkt sei noch dass die nullhypothese nicht immer einer gausschen grundgesamtheit folgen muss. auch in diesem fall gilt das nicht, denn die geht ja zwischen +- unendlich, dein werte Bereich ist ja nur zwischen [0 und 1], aber sie ist ne gute Näherung in dem interessierenden Bereich um 0.5.

was auch machen kann. man simuliert Versuchsreihen mit einem Computer, zb 100000 mal eine versuchreihe mit 1000 wurf. kriegst du da kriegst du dann halt ein Verteilung von erwartungswerten und die nimmst du dann zum p-wert ablesen. in diesem fall wäre es aber Verschwendung, da die gausverteilung das mit ausreichender Genauigkeit im relevanten vertrauensbereich gut abbildet.

Pippen
Ehrenmitglied
Ehrenmitglied
Beiträge: 2073
Registriert: 9. Jul 2010, 04:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von Pippen » 3. Sep 2016, 03:49

Wir werfen eine Münze 5mal. Jedes Mal zeigt sie Kopf. Wir müssen uns entscheiden, was wir mit welcher Wahrscheinlichkeit im 6. Wurf erwarten. Mehr Infos gibt es nicht. Was würdet ihr tun?

Ich würde so rangehen: Wäre die Münze fair, dann müssten bei 5 Würfen 5/2mal Kopf (Erwartungswert) kommen, mit eine Standardabweichung von 1,12, d.h. mit 76,2% müssten bei 5 Würfen zwischen ca. 1,4mal und 3,6mal Kopf kommen. Dem widerspricht unser bisheriges Ergebnis von 5mal Kopf, es liegt außerhalb der Standardabweichung. Wir schließen daraus korrekt, dass die Münze mit einer Wahrscheinlichkeit von größer als 50% unfair zugunsten Kopf ist (kann man das so einfach machen?). Da nun die Münze unfair mit Kopftendenz ist, ist es sinnvoll anzunehmen, dass im 6. Wurf Kopf mit einer Wahrscheinlichkeit von größer als 50% kommt.

Zusatzfrage: Ist es eigentlich immer so, dass die Standardabweichung 76,2% aller Werte beinhaltet?

deltaxp
Ehrenmitglied
Ehrenmitglied
Beiträge: 1129
Registriert: 23. Sep 2010, 17:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von deltaxp » 5. Sep 2016, 12:48

nein, das hängt von der Verteilung der grundgesamtheit ab. bei einer gausverteilung sind es 68% bei ner gleichverteilung 56%
und man darf icht vergesen, dass die empirisch aus einer Stichprobe bestimmte Standardabweichung selbst nur ein Schätzwert ist, der einen statischen fehler hat, sozusagen seien eigene Standardabweichung. die std(Sigma)=Sigma/(sqrt(N-2)).

Pippen
Ehrenmitglied
Ehrenmitglied
Beiträge: 2073
Registriert: 9. Jul 2010, 04:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von Pippen » 5. Sep 2016, 19:38

@delta: Wie würdest du also rangehen und mit welchem Argument was für eine Schätzung für den 6. Wurf angeben?

deltaxp
Ehrenmitglied
Ehrenmitglied
Beiträge: 1129
Registriert: 23. Sep 2010, 17:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von deltaxp » 6. Sep 2016, 09:49

hab ich doch oben beschrieben (27. Juni 2014post)

in diesem fall ist es aber auch noch relativ einfach. beim fairer ist die Wahrscheinlichkeit auf kopf ;

das bei N-Würfen N-mal Kopf bei fairer Münze (angenommen alle Würfe sind unabhängig von einander. dann ist das das gleiche woe wenn du N münzen gleichtzeitig wirfst)



5 mal nacheinander also , 6 mal nacheinander usw usf.

wenn du also eine Versuchsreihe machst von sagen wir 10000 mal 5 würfe und du kriegst dabei etwa 3% 5 sequenzen, dann ist alles okay. wenn das deutlich (dazu verweise ich wieder nach oben, denn die Stichproben sind natürlich statistischen Schwankungen unterworfen, und man berücksichtigt das. ode raber du sagst dir gleich: die Wahrscheinlichkeit, dass ich bei zufällig 5 mal kopf würfle ist nur 3%, da ist viel wahrscheinlicher eine unfaire
münze anzunehmen.

wenn aber die frage lautet: unter der annahme, dass ich schon 5 mal kopf geworfen habe, wie hoch ist dann die Wahrscheinlichkeit das 6te mal kopf zu werfen, das ist die bedingte Wahrscheinlichkeit, die ist 0.5, da die würfe unabhängig sind.

Pippen
Ehrenmitglied
Ehrenmitglied
Beiträge: 2073
Registriert: 9. Jul 2010, 04:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von Pippen » 6. Sep 2016, 23:12

Du willst sagen, dass wenn du 5mal hintereinander Kopf wirfst- und mehr Informationen gäbe es nicht, also keine weiteren Statistiken mit dieser Münze - würdest du immer noch von einer fairen Münze ausgehen und beim 6. Wurf für Kopf P = 0.5 angeben?

ME kann man eben, wenn man die 5 Würfe bereits statistisch auswertet, sehen, dass dieses Ergeignis deutlich außerhalb der Standardabweichung für eine gleichverteilte Wahrscheinlichkeit läge, so dass einiges dafür spräche, dass die Wahrscheinlichkeitsverteilung der Münze nicht gleichverteilt ist. Das ist doch u.a. der Zweck einer Standardabweichung, oder?

Benutzeravatar
tomS
Ehrenmitglied
Ehrenmitglied
Beiträge: 10670
Registriert: 19. Nov 2007, 20:29

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von tomS » 7. Sep 2016, 00:37

Du Hypothesen aufstellen und dafür die Irrtumswahrscheinlichkeiten berechnen. Die Hypothese könnte lauten: wenn ich bei N Sequenzen der Länge 5 x-mal oder öfter immer die selbe Zahl (also "11111", "22222", ...) erhalte, dann behaupte ich, dass die Münze nicht fair ist. Zu berechnen ist die Wahrscheinlichkeit, dass diese Hypothese wahr ist.

Essentiell ist der Umfang der Stichprobe. Bei exakt 5 Würfen liegt demnach genau eine Sequenz der Länge 5 vor, der Stichprobenumfang ist dang N = 1 - und damit ziemlich bescheiden :-)
Gruß
Tom

Der Wert eines Dialogs hängt vor allem von der Vielfalt der konkurrierenden Meinungen ab.
Sir Karl R. Popper

deltaxp
Ehrenmitglied
Ehrenmitglied
Beiträge: 1129
Registriert: 23. Sep 2010, 17:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von deltaxp » 7. Sep 2016, 11:23

Pippen hat geschrieben:Du willst sagen, dass wenn du 5mal hintereinander Kopf wirfst- und mehr Informationen gäbe es nicht, also keine weiteren Statistiken mit dieser Münze - würdest du immer noch von einer fairen Münze ausgehen und beim 6. Wurf für Kopf P = 0.5 angeben?

ME kann man eben, wenn man die 5 Würfe bereits statistisch auswertet, sehen, dass dieses Ergeignis deutlich außerhalb der Standardabweichung für eine gleichverteilte Wahrscheinlichkeit läge, so dass einiges dafür spräche, dass die Wahrscheinlichkeitsverteilung der Münze nicht gleichverteilt ist. Das ist doch u.a. der Zweck einer Standardabweichung, oder?
nein, du hörst mir nicht zu. bei einer fairen münze (als p=0.5), die du nur 5 mal würfelst besteht eine Wahrscheinlichkeit von 3% das 5 mal hintereinander kopf fällt und 1.5% (eben *0.5) das 6 mal hintereinander kopf fällt. das kann also, wenn auch recht unwahrscheinlich, passieren. das ist eben das gesetz der Wahrscheinlichkeiten, deswegen ist eine Stichprobe von 5 würf (oder 6) zur Verifizierung auch knapp.

der fall, wie ist die Wahrscheinlichkeit, dass der 6 wurf kopf zeigt unter der annahme, dass die ersten 5 schon kopf sind ist immer noch 0.5 bei einer fairen münze, weil sie eben unabhängig sind. das kannst du mittels bayes Theorem bzw mit der wahrscheinlichkeits kettenregel sehr schnell selbst rauskriegen

p(K1,K2,K2,K4,K5,K6)=p(K1,K2,K3,K3,K4,K5)* p(K6 | K2,K3,K3,K4,K5)

der senkrecht strich heisst : Unter der bedingung, dass
als p(k6 | K1-K5) ist die Wahrscheinlichkeit dass der 6te Wurf Kopf fällt, unter der Bedingung dass die ersten 5 würfe schon Kopf sind !

während p(K1-K6) die Wahrscheinlichkeit, dass alle würfe 6 Kopf sind

das die würfe unabhängig sind ist

=> p(K6 | K2,K3,K3,K4,K5)=p(K1,K2,K2,K4,K5,K6)=/p(K1,K2,K2,K4,K5)=0.5^6/0.5^5=0.5. = p(K6)

das heisst nichts anders, als dass es dem aktuellen wurf egal ist was vorher gefallen ist.

man vergleicht sein messergebnis von statischen Versuchsreihen immer gegen eine nullhypothese. die lautet hier: die münze ist fair. und du musst eine grenze angeben, ab wann dir die 0 Hypothese zu unwahrscheinlich ist. ind diesem fall ist sie p(K)=3% Kopf bei 5 wurf, bzw p(K)=1.5 % bei 6 wurf
bzw p(K)=0.5^N bei Nwurf.

wenn dir 3% zu unwahrscheinlich sind wirst du die 0 Hypothese verwerfen und du eher von einer unfairen münze ausgehen. wenn du der Ansicht bist, oh 3% durch zufall kann schon mal vorkommen, macht du mehr würfe, wenn 20 mal hintereinander kopf fällt, wäre die zufallswahrscheinlichkeit nur noch 0.5^20~1E-6 also 0.0001 % aber sie wird nieeee 0.

du kannst auch gerne mal ne Simulation , um zu verifizieren dass die die zahlen stimmen. in matlab ist der kern nen 3-zeiler
function coin_check(N,Nseq)
if nargin==0;
N=100000;
Nseq=5;
elseif nargin==1
Nseq=5;
end
l=rand(N,Nseq)>0.5;
NumSeq=sum(sum(l,2)==Nseq);
pSeq=NumSeq/N
return

wie du unschwer siehst, fair münze. 100000 Versuchsreihen a 5 wurf und du wirst sehen pSeq~0.03 als 3% ist (natürlich leicht schwankend)

Pippen
Ehrenmitglied
Ehrenmitglied
Beiträge: 2073
Registriert: 9. Jul 2010, 04:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von Pippen » 7. Sep 2016, 15:19

deltaxp hat geschrieben:man vergleicht sein messergebnis von statischen Versuchsreihen immer gegen eine nullhypothese. die lautet hier: die münze ist fair. und du musst eine grenze angeben, ab wann dir die 0 Hypothese zu unwahrscheinlich ist. ind diesem fall ist sie p(K)=3% Kopf bei 5 wurf, bzw p(K)=1.5 % bei 6 wurf
bzw p(K)=0.5^N bei Nwurf.

wenn dir 3% zu unwahrscheinlich sind wirst du die 0 Hypothese verwerfen und du eher von einer unfairen münze ausgehen. wenn du der Ansicht bist, oh 3% durch zufall kann schon mal vorkommen,
Ist diese Grenzbestimmung willkürlich oder was nimmt man dafür? Ich würde schon sagen, dass ein Fünfkopfwurf mit 3% so unwahrscheinlich ist, dass man die Hypothese der fairen Münze fallen lassen muss. Immerhin heißt das ja, dass zu 97% eigentlich mind. einmal Zahl hätte kommen müssen. Oder nimmt man in den Wissenschaften den Grenzwert erst ab unter 1% Wahrscheinlichkeit an?

positronium
Ehrenmitglied
Ehrenmitglied
Beiträge: 2832
Registriert: 2. Feb 2011, 20:13

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von positronium » 7. Sep 2016, 15:29

Du bist nicht der Durchschnitt, sondern ein völlig beliebiger Münzwerfer. Es gibt 2^5 Möglichkeiten bei 5 Würfen - jede Reihe ist gleich wahrscheinlich, und irgend eine davon ist die Deine. Warum solltest Du sagen können kkkkk ist unwahrscheinlicher als kzzkz?

deltaxp
Ehrenmitglied
Ehrenmitglied
Beiträge: 1129
Registriert: 23. Sep 2010, 17:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von deltaxp » 7. Sep 2016, 16:00

ist er nicht, jeder ist gleich wahrscheinlich. hast du ja selber oben angegegben. denn die Wahrscheinlichkeit eines speziellen zustandes bei fünf würfen einer fairen münze ist 1/Anzahl der moglich, als 1/2^5 bzw 0.5^5 ~ 3%

kkkkk und kzzkz und zkkkz usw habe alle die gleiche wahrscheinlchkeit

deltaxp
Ehrenmitglied
Ehrenmitglied
Beiträge: 1129
Registriert: 23. Sep 2010, 17:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von deltaxp » 7. Sep 2016, 16:03

doppelpost
Zuletzt geändert von deltaxp am 7. Sep 2016, 16:37, insgesamt 1-mal geändert.

deltaxp
Ehrenmitglied
Ehrenmitglied
Beiträge: 1129
Registriert: 23. Sep 2010, 17:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von deltaxp » 7. Sep 2016, 16:09

Pippen hat geschrieben: Ist diese Grenzbestimmung willkürlich oder was nimmt man dafür? Ich würde schon sagen, dass ein Fünfkopfwurf mit 3% so unwahrscheinlich ist, dass man die Hypothese der fairen Münze fallen lassen muss. Immerhin heißt das ja, dass zu 97% eigentlich mind. einmal Zahl hätte kommen müssen. Oder nimmt man in den Wissenschaften den Grenzwert erst ab unter 1% Wahrscheinlichkeit an?
ist sie ja, das gibt sonen paar gentlement agreements, ha ich oben geschrieben, 95,99, 99,9999

positronium
Ehrenmitglied
Ehrenmitglied
Beiträge: 2832
Registriert: 2. Feb 2011, 20:13

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von positronium » 7. Sep 2016, 16:18

deltaxp hat geschrieben:ist er nicht, jeder ist gleich wahrscheinlich. hast du ja selber oben angegegben. denn die Wahrscheinlichkeit eines speziellen zustandes bei fünf würfen einer fairen münze ist 1/Anzahl der moglich, als 1/2^5 bzw 0.5^5 ~ 3%

kkkkk und kzzkz und zkkkz usw habe alle die gleiche wahrscheinlchkeit
Ja. Meine Frage war rhetorischer Natur. :)

Pippen
Ehrenmitglied
Ehrenmitglied
Beiträge: 2073
Registriert: 9. Jul 2010, 04:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von Pippen » 7. Sep 2016, 16:42

kkkkk ist zu 3% wahrscheinlich, ~kkkkk zu 97%. Klar, auch kzzkk ist nur 3% wahrscheinlich und ~kzzkk zu 97%, aber wenn wir sagen: 5 Würfe und darin 2mal Zahl und 3mal Kopf (Reihenfolge egal), dann ändert sich das und die Wahrscheinlichkeit ist viel höher, die Wahrscheinlichkeit bei 5 Würfen 5 Kopf zu werfen bleibt bei mickrigen 3% - und das erscheint eben sehr unwahrscheinlich. Wenn ich es richtig verstehe, dann kann man daraus zwei alternative Schlußfolgerungen ziehen:

1. So ist eben Zufall, auch das Unwahrscheinliche kann eintreten.
2. Das ist kein Zufall, denn das Unwahrscheinliche tritt sehr selten auf und wenn es gerade hier auftritt, dann könnte das ein Hinweis sein, dass hier kein oder ein tendenziellerer Zufall vorliegt.

Mein Problem: Wo würdet ihr die Grenze zwischen 1. und 2. ziehen?

positronium
Ehrenmitglied
Ehrenmitglied
Beiträge: 2832
Registriert: 2. Feb 2011, 20:13

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von positronium » 7. Sep 2016, 17:03

Die Wahrscheinlichkeit ist für jede Kombination immer gleich - sagst Du doch auch.
Wenn Du jetzt sagst: "Wenn aber die ersten 4 Kopf waren..." bleibt die Wahrscheinlichkeit des nächsten Wurfs ebenso 1/2 für Kopf. Du hast nämlich zuerst eine Bedingung eingeführt, mit der Du diesen unwahrscheinlichen Fall "4 mal Kopf" festgelegt, und alle anderen ausgeschlossen hast.
Pippen hat geschrieben:1. So ist eben Zufall, auch das Unwahrscheinliche kann eintreten.
2. Das ist kein Zufall, denn das Unwahrscheinliche tritt sehr selten auf und wenn es gerade hier auftritt, dann könnte das ein Hinweis sein, dass hier kein oder ein tendenziellerer Zufall vorliegt.

Mein Problem: Wo würdet ihr die Grenze zwischen 1. und 2. ziehen?
Das hat Tom oben schon beantwortet.
Wenn Du nur statistische Methoden zur Verfügung hast, also nichts näheres über das System erfahren kannst, bleibt Dir nur, eine Stichprobe zu wählen, dafür eine Abweichung zu ermitteln, und diese als Eigenschaft des Systems zu betrachten.
Dann wird eben z.B. eine Normalverteilung transformiert (verschoben, skaliert, gescheert). Oder vielleicht hat die Münze zwei Seiten mit Kopf - dann steht eine Dirac-Delta-Funktion bei x=Kopf.

Benutzeravatar
seeker
Ehrenadmin
Ehrenadmin
Beiträge: 8109
Registriert: 26. Dez 2009, 10:29

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von seeker » 8. Sep 2016, 00:29

Um mal noch einen Punkt einzubringen:

Bei realen Münzwürfen (und auch ganz allgemein bei realen Systemen) hast du es nie ganz exakt mit fairen Würfen zu tun.
Bei Messungen hast du stets einen gewissen systematischen Fehler drin und bei Münzwürfen stets irgendwelche kleinen Asymmetrien, die eine exakte 50/50-Chance verhindern.
Die spannende Frage ist nur immer: Wie groß ist diese Abweichung? Ist sie relevant? Ist sie erfassbar? Ist sie sinnvoll quantifizierbar? Und ist sie überhaupt zeitlich völlig konstant?

Wenn du deine Frage aber nun so aufbaust wie du es tust, nämlich zu sagen "ich sehe 5x Kopf und habe keine weiteren Informationen", dann idealisiert du also, d.h. du hast kein reales System mehr und kannst rein mathematisch per Wahrscheinlichkeitsbetrachtung vorgehen.
Deine Frage jedoch "ist es hier sinnvoll anzunehmen, dass die Würfe nicht fair sind, also Kopf aus systematischen Gründen wahrscheinlicher erscheint"? bezieht sich aber gerade wieder auf eine reale Situation.

Du musst dich nun entscheiden:

1. Wenn das System idealisiert sein soll, dann lautet die Antwort: Es ist auch jetzt noch völlig egal, ob du beim nächsten Wurf auf Kopf oder Zahl wettest. Und wenn zuvor nicht 5x sondern 1 Million mal Kopf gekommen wäre, so wäre die Antwort dieselbe.

2. Wenn das System real betrachtet werden soll, dann lautet die Antwort: Es ist praktisch unmöglich, dass keine weiteren Informationen vorliegen!
D.h. die Prämisse "keine weiteren Informationen" in deiner Frage ist dann unrealistisch.

5x Kopf in Folge legt dabei nahe beim 6. Wurf auf Kopf zu wetten, denn beim fairen Wurf wärst du mit einer Wette auf Zahl ja auch nicht besser dran. Jedoch sind die anderen Informationen, die dir mit Sicherheit beim realen System auch noch in irgendeiner Weise vorliegen (Kontext, wer, wo, was, wann, wie, warum, was war vorher, wie kamst du in die Wettsituation, wie sieht die Münze aus, wie wird geworfen, usw., usw.) zwingend auch zu berücksichtigen (man darf hier nicht einfach so ohne Weiteres "halb-idealisieren", entweder-oder!).
Diesen ganzen Informationssack musst du dann hier zusammenfassend berücksichtigen/erfassen und dann abschätzend oder berechnend entscheiden. Dabei kann dann wiederum herauskommen, dass es doch sinnvoller ist auf Zahl zu setzen oder gar nicht zu wetten. Der Münzwerfer könnte ja z.B. auch eine Art Hütchenspieler sein, der dich übers Ohr hauen will und daher extra 5x Kopf geworfen hat, etc.

D.h.: Wenn man in realen Systemen eine Datenreihe hat (wie lang die nun konkret zu sein hat, wie viel Sigma man exakt immer braucht, kann man m. E. nicht pauschal sagen), die auf systematische Fehler hindeutet und man diese loswerden will, dann wird man natürlich die Daten durchforsten und analysieren, aber man wird zusätzlich natürlich auch das System bzw. den Versuchsaufbau selbst nochmals von allen Seiten detailliert betrachten, untersuchen, durchdenken, zerlegen, neu aufbauen, usw., um an der Stelle auch nach Fehlern zu suchen. Es wäre verrückt sich hier ausschließlich nur auf die Statistik zu verlassen. Zu berücksichtigen ist ja auch, dass mehrere systematische Fehler vorliegen können, die in verschiedene Richtungen wirken, sich manchmal aufheben, etc. Wer misst, misst Mist, ich kann auch Sigma 5 haben und trotzdem Mist messen.

Gruß
seeker
Grüße
seeker


Wissenschaft ... ist die Methode, kühne Hypothesen aufstellen und sie der schärfsten Kritik auszusetzen, um herauszufinden, wo wir uns geirrt haben.
Karl Popper

deltaxp
Ehrenmitglied
Ehrenmitglied
Beiträge: 1129
Registriert: 23. Sep 2010, 17:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von deltaxp » 8. Sep 2016, 11:50

Pippen hat geschrieben:kkkkk ist zu 3% wahrscheinlich, ~kkkkk zu 97%. Klar, auch kzzkk ist nur 3% wahrscheinlich und ~kzzkk zu 97%, aber wenn wir sagen: 5 Würfe und darin 2mal Zahl und 3mal Kopf (Reihenfolge egal), dann ändert sich das und die Wahrscheinlichkeit ist viel höher
oh ja, das ist absolut richtig und essentiell, man würde dann halt Klassen zusammenfassen. das ist dann sozusagen grobkörnung und spiegelt sich in der Entropie wieder, denn die mist ja die anzahl der Möglichkeiten, die zum selben makroskopischen zustand führen. was dabei als makroskopisch gemeint ist hängt dann von deiner grobkörnung ab.
Pippen hat geschrieben: ,die Wahrscheinlichkeit bei 5 Würfen 5 Kopf zu werfen bleibt bei mickrigen 3% - und das erscheint eben sehr unwahrscheinlich. Wenn ich es richtig verstehe, dann kann man daraus zwei alternative Schlußfolgerungen ziehen:

1. So ist eben Zufall, auch das Unwahrscheinliche kann eintreten.
2. Das ist kein Zufall, denn das Unwahrscheinliche tritt sehr selten auf und wenn es gerade hier auftritt, dann könnte das ein Hinweis sein, dass hier kein oder ein tendenziellerer Zufall vorliegt.
genau so
Pippen hat geschrieben: Mein Problem: Wo würdet ihr die Grenze zwischen 1. und 2. ziehen?
das ist nicht nur dein Problem: das hängt davon ab, wie sicher du sein willst. wenn du deine Sicherheit erhöhen willst, weil du dich damit unwohl fühlst (oder weil andere Bedingungen höhere genauigkeit vorschreiben, z.b, ausschusswahrscheinlichkeit bei der Produktion. da gibt dir dann der Boss die grenzen vor, zuviel ausschuss reduziert den Profit, nicht mehr als so oder. dann musst du Versuchsreihen aufnehmen und wenn du (statistisch signifikant!) drüber liegst, dann muss man den Produktionsprozess verbessern.

in der teilchenühysik fordert man wie gesagt 5sigma abstand zum Untergrund bis ein Teilchen als entdeckt gilt. weil da hängt schon viel dran. das letzte 750 GeV Signal am cern voriges jahr hatte 3.5 bzw 3.8 Sigma. man hat sich schon gefreut. 500 Theorie paper haben die Theoretiker dazu veröffentlicht, aber cern hatte nie eine Bestätigung gegben. und siehe da es war tatsächlich nur eine statistische Fluktuation, die dies jahr wieder verschwand (sehr zum Leidwesen aller Physiker...). auch bei 5 Sigma könnte es noch eine sein, aber das ist soooooooo unwahrscheinlich, dass man das es viel wahrscheinlicher ist zu sagen, das Signal ist echt, es ist ein Teilchen.

aber die grenze ist in der tat letztlich willkürlich. ich glaube ein Buchhalter wäre da überfordert, weil auch die klitze kleinste Möglichkeit, dass es sich um ein puren zufall handelt an ihm nagen und nagen würde :P für einen richtigen Buchhalter ist eben 1 Cent genauso bedeutend wie 1 Milliarde (sonst wäre er kein richtiger Buchhalter)

deltaxp
Ehrenmitglied
Ehrenmitglied
Beiträge: 1129
Registriert: 23. Sep 2010, 17:02

Re: Verständnisfrage zur Wahrscheinlichkeit/Statistik

Beitrag von deltaxp » 8. Sep 2016, 11:54

deltaxp hat geschrieben:
Pippen hat geschrieben:kkkkk ist zu 3% wahrscheinlich, ~kkkkk zu 97%. Klar, auch kzzkk ist nur 3% wahrscheinlich und ~kzzkk zu 97%, aber wenn wir sagen: 5 Würfe und darin 2mal Zahl und 3mal Kopf (Reihenfolge egal), dann ändert sich das und die Wahrscheinlichkeit ist viel höher
oh ja, das ist absolut richtig und essentiell, man würde dann halt Klassen zusammenfassen. das ist dann sozusagen grobkörnung und spiegelt sich in der Entropie wieder, denn die mist ja die anzahl der Möglichkeiten, die zum selben makroskopischen zustand führen. was dabei als makroskopisch gemeint ist hängt dann von deiner grobkörnung ab.
Pippen hat geschrieben: ,die Wahrscheinlichkeit bei 5 Würfen 5 Kopf zu werfen bleibt bei mickrigen 3% - und das erscheint eben sehr unwahrscheinlich. Wenn ich es richtig verstehe, dann kann man daraus zwei alternative Schlußfolgerungen ziehen:

1. So ist eben Zufall, auch das Unwahrscheinliche kann eintreten.
2. Das ist kein Zufall, denn das Unwahrscheinliche tritt sehr selten auf und wenn es gerade hier auftritt, dann könnte das ein Hinweis sein, dass hier kein oder ein tendenziellerer Zufall vorliegt.
genau so
Pippen hat geschrieben: Mein Problem: Wo würdet ihr die Grenze zwischen 1. und 2. ziehen?
das ist nicht nur dein Problem: das hängt davon ab, wie sicher du sein willst. wenn du deine Sicherheit erhöhen willst, weil du dich damit unwohl fühlst (oder weil andere Bedingungen höhere genauigkeit vorschreiben, z.b, ausschusswahrscheinlichkeit bei der Produktion. da gibt dir dann der Boss die grenzen vor, zuviel ausschuss reduziert den Profit, nicht mehr als so oder. dann musst du Versuchsreihen aufnehmen und wenn du (statistisch signifikant!) drüber liegst, dann muss man den Produktionsprozess verbessern.

in der teilchenühysik fordert man wie gesagt 5sigma abstand zum Untergrund bis ein Teilchen als entdeckt gilt. weil da hängt schon viel dran. das letzte 750 GeV Signal am cern voriges jahr hatte 3.5 bzw 3.8 Sigma. man hat sich schon gefreut. 500 Theorie paper haben die Theoretiker dazu veröffentlicht, aber cern hatte nie eine Bestätigung gegben. und siehe da es war tatsächlich nur eine statistische Fluktuation, die dies jahr wieder verschwand (sehr zum Leidwesen aller Physiker...). auch bei 5 Sigma könnte es noch eine sein, aber das ist soooooooo unwahrscheinlich, dass man das es viel wahrscheinlicher ist zu sagen, das Signal ist echt, es ist ein Teilchen.

aber die grenze ist in der tat letztlich willkürlich. ich glaube ein Buchhalter wäre da überfordert, weil auch die klitze kleinste Möglichkeit, dass es sich um ein puren zufall handelt an ihm nagen und nagen würde :P für einen richtigen Buchhalter ist eben 1 Cent genauso bedeutend wie 1 Milliarde (sonst wäre er kein richtiger Buchhalter)
aber genau deine fragen, und Feststellungen, wie aber was ist wenn Reihenfolge und so keine rolle spielt oder andere randbedingungen, die inhärenten Unsicherheiten usw., schwierigkeiten mit vorstellungen bei wahrscheinlichkeiten, die nicht im 10% rahmen sind (das koennen wir ganz gut, aber die anzahl der lotto-spieler zeigt, dass man mit ganz kleinen wahrscheinlichkeiten so seine schwirigkeiten hat,) sind gründe, warum keiner wirklich Statistik mag.

Antworten