Statystyk Damian umiłowany w modżajto i wizualizacja danych

Najgorzej to jest wtedy, kiedy statystyk Damian przychodzi do roboty i wciąż ma zdecydowanie zbyt niski poziom krwi w alkoholu po tym, jak poniosła go alkoholowa chłosta z okazji Barbórki, co by nawet nie było takie dziwne, gdyby nie to, że ta Barbórka to była trzy miesiące wcześniej. No i on przychodzi, a tam go kolega spotyka i mówi mu, że na takiej bani to na bank mu się nie uda narysować żadnego wykresu, a on mówi, że jemu się nie uda??!? On nie da rady?!!?!?!? POTRZYMAJ MI EXCELA!!!!

I właśnie w ten sposób, moje drogie dzieci, powstało to małe statystyczne dzieło sztuki, które kosztowało mnie trzy zawały serca i trzydzieści telefonów na policję, choć oni wciąż twierdzą, że nie, pani Janino, nie możemy zamknąć kogoś w więzieniu za to, że za pomocą wykresu dokonał aktu wandalizmu na zdrowym rozsądku. Popatrzcie na grafikę poniżej – to są te same dane, ale dwa różne wykresy – u góry widzimy ten autorstwa TVP, a na dole ten, który narysowałam ja z drobną pomocą PRZYZWOITOŚCI.

Bo pamiętajcie, że wykresy słupkowe są naszymi najlepszymi przyjaciółmi, ale gdy ich skala nie zaczyna się od 0, to bardzo pięknie zakłamują rzeczywistość i to często w brutalny sposób. Jak w przykładzie poniżej:

O osi X naszego rodzimego wykresu z TVP to już nawet nie wspominam, bo tam co prawda coś poszło nie tak z datami, rok 2014, 2015, 2016, JEB! 2020, ale dobra tam, kogo nigdy nie poniosło sylwestrowe elo melo w taki sposób, że obudził się dopiero trzy lata później, niech pierwszy rzuci „wściekłym psem”.

Edward Tufte, wspaniały ekspert wizualizacji danych do opisu takich sytuacji stworzył pojęcie współczynnika kłamstwa (ang. Lie Factor). Jest to stosunek efektu widocznego na wykresie do efektu wykazywanego przez dane, na podstawie których ten graf narysowaliśmy. Po ludzku: jak widzicie na wykresie u góry (to ten narysowany przez statystyka Damiana) różnice pomiędzy poszczególnymi latami są jakieś oszałamiające. Na dolnym wykresie (to mój!) wyglądają trochę mniej spektakularnie. Cudna manipulacja. W programie „Jak oni rysują (wykresy)” nawet Beata Tyszkiewicz przyznałaby autorom jeden punkt.

Uważajcie więc na zdradliwe osie i znikające słupki, bo niestety w świecie statystyk manipulacje notorycznie czają się na nas niczym wąż w pomidorach. A to człowiek nie ma czasu ciągle składać wyjaśnień na policji jako świadek morderstwa na zdrowym rozsądku.  Wszak koty leżące na szklanych stolikach same się nie obejrzą.

Źródło: boredpanda.com

A jeśli chcecie poczytać więcej o wizualizacji danych i dowiedzieć się dlaczego wykres kołowy to fiat multipla statystyki i w jaki sposób nie trafić do statystycznego piekła, to mam dla Was gratkę, zniżkę na moją książkę o statystyce, co ja ją napisałam, a ty KUP JĄ!!!

Książkę „Statystycznie rzecz biorąc. Czyli ile trzeba zjeść czekolady, żeby dostać Nobla” kupicie taniej o 43% (a więc za trochę ponad dwie dyszki) o tu: https://cutt.ly/wnYlBH5

Artykuł Statystyk Damian umiłowany w modżajto i wizualizacja danych pochodzi z serwisu Janina Daily.

 •  0 comments  •  flag
Share on Twitter
Published on June 13, 2021 05:53
No comments have been added yet.


Janina Bąk's Blog

Janina Bąk
Janina Bąk isn't a Goodreads Author (yet), but they do have a blog, so here are some recent posts imported from their feed.
Follow Janina Bąk's blog with rss.