How To Avoid The Seven Deadly Sins Of Statistical Misinterpretation

Statystyka jest przydatnym narzędziem do zrozumienia prawidłowości w otaczającym nas świecie. Ale nasza intuicja często nas zawodzi, jeśli chodzi o interpretację tych wzorców. W tej serii przyjrzymy się niektórym typowym błędom, które popełniamy i jak ich uniknąć, myśląc o statystykach, prawdopodobieństwie i ryzyku.The Conversation

1. Zakładając, że małe różnice są znaczące

Wiele codziennych wahań na giełdzie reprezentuje raczej przypadek niż cokolwiek znaczącego. Różnice w sondażach, gdy jedna ze stron wyprzedza o punkt lub dwa, są często tylko szumem statystycznym.

Możesz uniknąć wyciągania błędnych wniosków na temat przyczyn takich wahań, żądając zobaczenia „marginesu błędu” związanego z liczbami.

Jeśli różnica jest mniejsza niż margines błędu, prawdopodobnie nie ma znaczącej różnicy, a zmienność jest prawdopodobnie spowodowana przypadkowymi fluktuacjami.

How To Avoid The Seven Deadly Sins Of Statistical MisinterpretationSłupki błędów ilustrują stopień niepewności wyniku. Gdy takie marginesy błędu nakładają się na siebie, różnica jest prawdopodobnie spowodowana szumem statystycznym.


innerself subscribe graphic



2. Zrównanie istotności statystycznej z istotnością w świecie rzeczywistym

Często słyszymy uogólnienia o tym, jak dwie grupy różnią się w jakiś sposób, na przykład, że kobiety są bardziej opiekuńcze, podczas gdy mężczyźni są silniejsi fizycznie.

Różnice te często opierają się na stereotypach i mądrości ludowej, ale często ignorują podobieństwa między ludźmi między tymi dwiema grupami oraz różnice między ludźmi w obrębie grup.

Jeśli wybierzesz losowo dwóch mężczyzn, prawdopodobnie będzie duża różnica w ich sile fizycznej. A jeśli wybierzesz jednego mężczyznę i jedną kobietę, mogą być bardzo podobni pod względem wychowania lub mężczyzna może być bardziej opiekuńczy niż kobieta.

Możesz uniknąć tego błędu, pytając o „wielkość efektu” różnic między grupami. Jest to miara tego, jak bardzo średnia jednej grupy różni się od średniej innej.

Jeśli wielkość efektu jest niewielka, obie grupy są bardzo podobne. Nawet jeśli wielkość efektu jest duża, obie grupy nadal będą prawdopodobnie charakteryzować się dużą zmiennością, więc nie wszyscy członkowie jednej grupy będą się różnić od wszystkich członków innej grupy.


3. Zaniedbanie patrzenia na skrajności

Odwrotna strona rozmiaru efektu jest istotna, gdy przedmiot, na którym się koncentrujesz, podąża za „normalna dystrybucja” (czasami nazywany „krzywą dzwonową”). Jest to sytuacja, w której większość ludzi zbliża się do średniego wyniku, a tylko niewielka grupa jest znacznie powyżej lub znacznie poniżej średniej.

Kiedy tak się dzieje, niewielka zmiana w wynikach grupy powoduje różnicę, która nic nie znaczy dla przeciętnej osoby (patrz punkt 2), ale radykalnie zmienia charakter skrajności.

Unikaj tego błędu, zastanawiając się, czy masz do czynienia z skrajnościami, czy nie. Kiedy masz do czynienia z przeciętnymi ludźmi, różnice w małych grupach często nie mają znaczenia. Kiedy bardzo zależy Ci na skrajnościach, różnice w małych grupach mogą mieć znaczenie.

How To Avoid The Seven Deadly Sins Of Statistical MisinterpretationGdy dwie populacje mają rozkład normalny, różnice między nimi będą bardziej widoczne na ekstremach niż w średnich.


4. Ufny zbieg okoliczności

Czy wiesz, że istnieje korelacja między liczbą osób, które co roku utonęły w Stanach Zjednoczonych przez wpadnięcie do basenu, a liczbą filmów, w których pojawił się Nicholas Cage?

How To Avoid The Seven Deadly Sins Of Statistical MisinterpretationAle czy istnieje związek przyczynowy? Tylervigen.com

Jeśli dobrze się przyjrzysz, możesz znaleźć interesujące wzorce i korelacje, które wynikają jedynie z przypadku.

To, że dwie rzeczy zmieniają się w tym samym czasie lub w podobny sposób, nie oznacza, że ​​są ze sobą powiązane.

Unikaj tego błędu, pytając, jak wiarygodne jest obserwowane powiązanie. Czy to jednorazowe, czy zdarzyło się to wielokrotnie? Czy można przewidzieć przyszłe skojarzenia? Jeśli widziałeś to tylko raz, prawdopodobnie jest to spowodowane przypadkowym przypadkiem.


5. Cofanie przyczynowości

Kiedy dwie rzeczy są ze sobą skorelowane – powiedzmy, bezrobocie i problemy ze zdrowiem psychicznym – może być kuszące, aby zobaczyć „oczywistą” ścieżkę przyczynową – powiedzmy, że problemy ze zdrowiem psychicznym prowadzą do bezrobocia.

Ale czasami ścieżka przyczynowa idzie w innym kierunku, na przykład bezrobocie powodujące problemy ze zdrowiem psychicznym.

Możesz uniknąć tego błędu, pamiętając o myśleniu o odwrotnej przyczynowości, gdy widzisz skojarzenie. Czy wpływ może pójść w innym kierunku? A może może działać w obie strony, tworząc pętlę sprzężenia zwrotnego?


6. Zapominanie o rozważeniu przyczyn zewnętrznych

Ludzie często nie oceniają możliwych „czynników trzecich” lub przyczyn zewnętrznych, które mogą tworzyć związek między dwiema rzeczami, ponieważ obie są w rzeczywistości wynikiem trzeciego czynnika.

Na przykład może istnieć związek między jedzeniem w restauracjach a lepszym zdrowiem układu krążenia. To może prowadzić do przekonania, że ​​istnieje między nimi związek przyczynowy.

Może się jednak okazać, że ci, których stać na regularne jedzenie w restauracjach, znajdują się w wysokim przedziale społeczno-ekonomicznym, a także mogą sobie pozwolić na lepszą opiekę zdrowotną, a to właśnie opieka zdrowotna zapewnia lepsze zdrowie układu krążenia.

Możesz uniknąć tego błędu, pamiętając, aby pomyśleć o czynnikach trzecich, gdy zobaczysz korelację. Jeśli śledzisz jedną rzecz jako możliwą przyczynę, zadaj sobie pytanie, co z kolei powoduje tę rzecz? Czy ten trzeci czynnik może spowodować oba obserwowane wyniki?


7. Zwodnicze wykresy

Przy skalowaniu i etykietowaniu osi pionowej na wykresach pojawia się wiele psot. Etykiety powinny pokazywać pełny zakres treści, na które patrzysz.

Ale czasami twórca wykresu wybiera węższy zakres, aby mała różnica lub skojarzenie wyglądały bardziej imponująco. W skali od 0 do 100 dwie kolumny mogą wyglądać na tę samą wysokość. Ale jeśli wykreślisz te same dane pokazujące tylko od 52.5 do 56.5, mogą wyglądać drastycznie inaczej.

Możesz uniknąć tego błędu, zwracając uwagę na etykiety wykresów wzdłuż osi. Bądź szczególnie sceptyczny wobec nieoznakowanych wykresów.

How To Avoid The Seven Deadly Sins Of Statistical MisinterpretationWykresy mogą opowiadać historię – sprawiając, że różnice wydają się większe lub mniejsze w zależności od skali.

O autorze

Winnifred Louis, profesor nadzwyczajny psychologii społecznej, Uniwersytet w Queensland oraz Cassandra Chapman, doktorantka psychologii społecznej, Uniwersytet w Queensland

Ten artykuł został pierwotnie opublikowany w Konwersacje. Przeczytać oryginalny artykuł.

Powiązane książki:

at Rynek wewnętrzny i Amazon