Говорят, существуют три вида лжи: ложь, наглая ложь и статистика. Это великое высказывание про статистику слету говорит о главной проблеме всех чисел — они редко бывают объективными и тоже не против ввести нас в заблуждение. И, несмотря на путаницу с тем, кому именно принадлежат эти слова, фраза более чем точна. Статистика действительно нас обманывает, только совсем не так, как вы могли бы думать. Проблема в том, как мы ее трактуем, а не в равнодушных цифрах.
Ложные корреляции
Преимущество графиков, которые нам показывают по телевизору, на презентации какого-либо предмета заключается в их наглядности. Смотришь на график продаж твоих автомобилей и понимаешь, насколько они интересны потребителю, стал ли товар популярен или нет. График съеденного пирога помогает нам понять, сколько в итоге осталось кусков и кто не взял свои, если речь идет о большой компании или застолье. И проблема в том, что числа редко выдают какие-то уникальные значения, непохожие на другие. А в результате этого уже графики часто выглядят одинаково.

Далеко не всегда есть корреляция между событиями, имеющими похожий график. Например, если число убийств людей за год и объемы потребления молока будут выдаваться как процессы с одинаковой динамикой, это не означает, что они непременно связаны. Скорее всего, данные просто похожи, но делать на их основе выводы совершенно нет смысла, так как числовых показателей в мире очень много, а значит, они так или иначе будут порождать забавные «связи» между собой.

Теория черного лебедя
Очень часто люди строят свои выводы на том, с чем имеют дело. Исходя из собственного опыта, они создают нерушимые теории, а потом с удивлением обнаруживают, что были неправы. Например, долгое время европейцы были уверены в том, что лебеди бывают только белого цвета. Это даже стало нарицательным выражением в их лексиконе. Однако позднее они столкнулись с реальным черным лебедем, опровергающим целый пласт знаний об этом виде. И фактически это тоже проблема статистики. Дело в том, что люди не имели веских оснований считать, что черных птиц не бывает, они просто их не встречали, так как в их регионе проживали преимущественно белые особи.

Сегодня о «черных лебедях» говорят как о событии, которое в ретроспективе выглядит предсказуемо, но в тот момент никто не сумел это сделать. И после того, как оно произошло, вдруг стало понятно, что все к нему и вело. То есть существование черного лебедя было чем-то вполне себе вероятным, но предугадать его на тот момент так и не смогли, хотя предпосылки были.
Статистика и ошибки
Из-за того, что статистика касается самых разных явлений, она редко бывает безупречна и графически показательна. В ней также важна трактовка. Из-за нее и возникают проблемы с ложными корреляциями, теорией черного лебедя или статистической ошибкой выжившего. Связь между разными, на первый взгляд не имеющими друг к другу отношения графиками может быть, но ее также нужно подтверждать и обосновывать.
Если вас заинтересовала затронутая тема, вам будет интересно почитать о том, что не так со статистикой по коронавирусу.
Присоединяйся к нашему сообществу в телеграмме, нас уже более 1 млн человек 😍
Ссылка на тематические чаты тут https://t.me/+69dR1AvDfdM0MTYy