Для чого потрібна статистика

У мене часто запитують, для чого потрібна статистика. Іноді з щирим нерозумінням, іноді з іронічними коментарями на кшталт “є три стадії брехні: просто брехня, нахабна брехня і статистика”. Часто згадують у цьому контексті випадки маніпулювання статистичними даними і спотворення даних, наприклад горезвісний “гребінець Чурова” (попри те, що цей “гребінець” було сфабриковано не статистиками, навпаки, саме праця статистиків-професіоналів уможливила виявлення та доведення фальсифікації). Навіть у науковців часто трапляється ставлення до статистичних методів як до чогось необов’язкового, такого, що нібито покликано підтвердити висновки, які і без цього є очевидними.

Частково це пов’язане з контрінтуїтивністю багатьох статистичних методів для тих, хто не вивчав спеціально статистику, або вивчав у надто обмеженому обсязі. Якщо, наприклад, мета і спосіб визначення середнього значення зазвичай проблем не викликає, то вже фізичний сенс і методику обчислення стандартного відхилення та стандартної похибки пояснити набагато складніше. Чому при обчисленні дисперсії треба ділити суму квадратів відхилень не на N, а на (N – 1)? Чому в дослідженні, наприклад, прибутків населення (або, хоча б даних по зарплатні у власній установі) краще застосовувати медіану, ніж середнє? Чому наявність кореляції у загальному випадку не свідчить про причинно-наслідковий зв’язок, і, якщо це справді так, то навіщо ця кореляція взагалі потрібна? Чому некоректно застосовувати критерій Стьюдента до випадкових величин із дискретним варіюванням? І так далі. Нерозуміння теорії, що лежить в основі методів, викликає сумніви у самих методах.

Ігор Ігорович Дзеверін,
доктор біологічних наук,
завідувач відділу еволюційної морфології Інституту зоології імені І. І.
Шмальгаузена НАН України,
професор кафедри теорії ймовірностей, статистики та актуарної математики
Київського національного університету імені Тараса Шевченка