Поправка Бонферрони и ложные сенсации, якобы подтверждающие прогностичность астрологии

Здравствуйте, коллеги. В ходе моей работы по подготовке научной статьи насчет низкой (ничтожной) прогностичности «зодиакальных психотипов» я столкнулся с рядом курьезных фактов, о которых захотелось Вам рассказать отдельно. Начну с цитирования моего диалога с нейронкой Perplexity. Я и с китайскими DeepSeek, и QWEN тоже продолжаю консультироваться, но именно Perplexity по поводу этого курьезного случая дает наиболее острое опровержение.

Запрос от АГШ:

В одном из процитированных Вами источников я нашел следующую информацию:

Illinois-based Allstate Insurance said its analysis of car accidents related to astrology found Virgos were the most likely to crash vehicles. The company said its comparison of 2010 claims data against the revised astrological calendar found Virgos were involved in 211,650 collisions last year, 700 percent more than the 26,833 crashes involving Scorpios, the safest drivers on the zodiac calendar.

Прошу найти какой-либо комментарий по поводу этих данных со стороны грамотных исследователей (социологов или психологов) в области статистики.

Ответ от Perplexity:

На аналогичный мой запрос DeepSeek использовал забавный термин «инфотейнмент» (аналог термина «энтертейнмент», обозначающий, как известно, сферу развлечений). Цитирую ответ от DeepSeek с сокращениями:

====================

Информация, которую вы нашли, действительно циркулировала в СМИ примерно в 2011-2012 годах и принадлежала страховой компании Allstate (точнее, ее канадскому филиалу). Это был типичный пример «инфотейнмента» — развлекательного контента, призванного привлечь внимание к бренду.

С точки зрения серьезных исследователей, социологов и статистиков, эта «статистика» вызывает абсолютно предсказуемую и уничтожающую критику. Вот основные аргументы, которые они приводят:

Самая главная ошибка. Для сравнения рисков по знакам зодиака необходимо учитывать общее количество водителей каждого знака на дорогах. Если, например, в популяции (или среди клиентов Allstate) Девы (Virgos) составляют непропорционально большую долю, то и абсолютное число аварий с их участием будет выше, даже если их индивидуальный риск такой же, как у других. Представленные цифры (211,650 vs 26,833) — это сырые абсолютные числа, а не стандартизированные по размеру группы коэффициенты (например, аварийность на 1000 водителей). Это делает сравнение бессмысленным.

======================

Ну понятно, думаю, многим. Тут получился явный казус, во многом схожий с «феноменом бермудского треугольника», о котором я уже писал. В этом треугольнике аварий происходит примерно в 10 раз больше, чем на произвольном участке мирового океана аналогичной площади. Но не потому, что тут особые условия (и тем более магические, непостижимые современной наукой), а потому, что больше судов проплывает в этом районе и больше самолетов пролетает (!). Надо сравнивать не только числители в формуле КД, но и учитывать сами знаменатели, то есть, наконец, вспомнить, что такое ПРОПОРЦИИ — вспомнить даже не из курса статистики, а из курса элементарной математики, физики и химии в средней школе. Мало того, что в клетке А стоит значение, которое в 10 раз больше, чем B, но надо проверить, насколько доля cобытий А во множестве А+С больше доли событий B во множестве B+D. Напомним, что такое события C и D в случае с «бермудским треугольником». Это благополучное проследование судна через данный участок мирового океана (!).

Если в Бермудском треугольнике проплывает в 10 раз больше кораблей, то КД=А/(A+C)-B/(B+D) = 0 даже в том случае, если А/B равняется 10.

Таблица 1. Гипотетические данные ЧТС, разоблачающие «феномен Бермудского треугольника».

Точно также получается, когда «Дев» у нас оказывается в наблюдаемой выборке в 7 раз больше, чем «Скорпионов». Хотя никакой связи на самом деле нет, но ведь «Девы» попадают в аварию в 7 раз чаще (A/B = 7), поэтому, игнорируя нижнюю строчку ЧТС, авторы сенсаций публикуют только данные, которые содержатся в верхней строчке, и …добиваются своего: люди начинают кликать на их сообщения.

Один из источников для опровержения таких сенсаций, какая была объявлена компанией Allstate, являются данные, полученные в аналогичных исследованиях другими компаниями. Например, на обложке этой статьи вы видите диаграмму, полученную австралийской страховой компанией Suncorp Metway. Здесь знаки Зодиака упорядочены по убыванию аварийности, но самыми аварийными, как мы видим, оказываются вовсе не Девы. Их превосходят в этом рейтинге и Рыбы, и Тельцы, и особенно Близнецы 🙂

Уже в 20 веке было выполнено такое множество экспериментов, опровергающих астрологию, что казалось бы проблема исчерпана вовсе — ну хотя бы исчерпана для тех людей, у которых сложилась научная картина мира в головах. Но в 21 веке началась новая технологическая эпоха. Появился интернет, и появилась возможность собирать быстро огромные массивы данных, привлекая информацию уже не о десятках и сотнях людей (их судьбоносных событиях, их психологических профилях), но уже о десятках и сотнях ТЫСЯЧ людей (!). И тут в эту область с новым энтузиазмом опять ворвались «шутники», а также искренние поклонники астрологии из числа «невежественных журналистов» (таких, которые никогда не учили никакой математической статистики и не умеют правильно группировать и анализировать собранные данные).

Чаще всего сенсации пробиваются в «желтую прессу» (а на самом деле теперь это социальные сети, чаты и форумы) именно в таком виде, в каком мы видели псевдосенсацию об особой аварийности у людей, родившихся под знаком «Девы» (Virgos).

Но иногда все-таки рядом с сенсацией можно добраться до необходимой полной таблицы с первичными числовыми значениями, которые позволяют нам произвести более квалифицированные расчеты, чем это делают «журналисты-дилетанты». Вот, например, они сообщают, что летние зодиакальные типы «Раки» и «Львы» чаще становятся медиа-знаменитостями, а зимние знаки «Водолей» и «Рыбы» — гораздо реже. Взята выборка из 570 знаменитостей и начали смотреть, сколько среди них людей, родившихся в разные «зодиакальные периоды» (периоды солнечного цикла). Обнаружено, что среди них доля «Раков» и «Львов» на 50% больше, чем доля «Водолеев» и «Рыб» (!!). Казалось бы, сенсация, да!! Ведь 50% — это очень много. Для людей, которые не подозревают, что проценты — это очень неоднозначная мера и часто обманчивая мера для регистрации различий, это выглядит в самом деле как сенсация. Но для тех, кто грамотный в статистике, понятно, что проценты можно посчитать совершенно по-разному, если подставить в знаменатель совершенно разные числа (!).

СОВЕТ ЧИТАТЕЛЮ: когда Вы слышите информацию о процентах, то сразу же задавайте вопрос, а что было в знаменателе-то (?!). К своему удивлению Вы обнаружите, что примерно половина авторов сенсаций не могут дать точного ответа на этот вопрос, так как не считают, что это … важный вопрос, на который им самим надо было обращать особое внимание (!).

Давайте приведем полную табличку данных (спасибо, что она оказалась доступной) и разоблачим еще одну псевдосенсацию.

Таблица 2. Полная таблица частот попадания знаменитостей в определенный «зодиакальный период» плюс анализ частот с помощью статистического критерия Хи-квадрат.

Вот известная формула, которую я применил для вычисления значения Хи-квадрат по таблице 2:

Как видим в таблице 1, для непредвзятого анализа требуется вычислить ожидаемое значение для каждой строчки — ожидаемую частоту Fтеор, то есть частоту попадания в «зодиакальный период» на фоне нулевой гипотезы об отсутствии связей (о наличии равномерного распределения — одинаковой частоты в каждой из 12 клеточек таблицы). Это число равно 570/12 = 47,5. Ну и… мы сразу же на глазок видим, что только очень многие знаки не дают никаких существенных отклонений от теоретического ожидаемого значения (!). То есть, если суммировать нормированные квадраты отклонений по всем 12 строчкам (как это сделано в последнем столбце), то получится сумма, равная 11, 26, что ниже критических значений Хи-квадрат для 11 степеней свободы (меньше 19,7 и тем более меньше 24,7).

Почему же все-таки в головах у некоторых горе-аналитиков сенсация возникает? — А потому, что они выхватывают из общего эксперимента неправомерно только «интересующих их выборку наблюдений» — только 4 случая вместо всех 12 (!), только частоты для «раков», «львов», «водолеев» и «рыб» (!). И в этом случае получается такая таблица 3:

Таблица 3. Неправомерно выхваченная из общего контекста исследования сокращенная таблица частот только для 4х знаков.

Как видим, частота 121 в самом деле почти в 1.5 раза больше, чем 82, так что для данного случае якобы получается, что вычисленная сумма нормированных квадратов отклонений равна 7,49 и оказывается выше граничного значения 6,63, то есть выявляется якобы значимое статистическое различие в пользу «летних месяцев».

Но … таким авторам как бы невдомек, что они применяют в таком случае известную порочную стратегию «фишинга» (то есть стратегию «рыбной ловли» случайных связей — выхватывают значимые связи из большого количества проанализированных случаев) и… объявляют эти случайные связи «научным фактом» (!). При этом статистический «навык» (беру в кавычках,так как это псевдонавык) работает как бы вслепую — без применения логики вероятностного мышления.

В самом деле ответьте сами себе на такую несложную вероятностную задачку. Если Вы регистрируете корреляции между знаками Зодиака (их 12) и, например, списком из 10 профессий (выбранных людьми, рожденными в определенный «зодиакальный период»), то с какой вероятностью Вы обнаружите хотя бы одну корреляцию, значимую на уровне вероятности ошибки p<0,05 ? Давайте выполним несложные подсчеты. Сколько всего парных корреляций подсчитает в этом случае компьютерная статистическая программа (вроде SPSS)? — Умножим 12 на 10 и получаем 120, так ведь? Ну и сколько будет среди них таких коэффициентов, которые достигнут уровня значимости p<0,05? Для этого умножаем 120 на 0,05 и получаем, разумеется, 6 совершенно случайных коэффициентов, которые ТОЛЬКО КАЖУТСЯ значимыми (!). Ну а если мы анализируем не 10 профессий, а 100 профессий? — Ну,конечно, тогда мы получим в 10 раз больше якобы «значимых связей», то есть уже не 6, а 60. Вот и покажется нам, что астрология предсказывает выбор профессии! А значит вместо выполнения трудоемких тестов на профориентацию (и последующих бесед с опытным консультантом) надо только посмотреть на дату рождения и… все тут!

Но коллеги, уже давно, еще в 20 веке настоящие специалисты по статистике вскрыли и описали буквально все подобные статистические артефакты. Разработана целая «кухня», целая система методов борьбы с получением таких артефактов. Одни из этих методов являются более сложными и трудоемкими (как, например, метод расщепления выборки пополам — split half, бутстрап-анализ — генерация случайных выборок методом Монте-Карло), другие — более простыми и легкими поправками. Одна из легких поправок — это так называемая «поправка Бонферрони». Она интересна даже не сама по себе, а прежде всего потому, что Бонферрони показал всем, какая именно логика вероятностного мышления должна работать, чтобы не обманывать самих себя с помощью «фишинговых», то есть ложных корреляций (spurious correlations).

Бонферрони предложил такую логику рассуждения. Если объектов наблюдения у нас ровно один(или ровно одна регистрируемая переменная) и мы считаем что граница значимой корреляции для него равна p=0,05, то в случае K объектов наблюдения мы должны просто-напросто поделим p на k, то есть снизить вероятность допустимой ошибки (или, что тоже самое, повысить требование к надежности вывода). Если у нас 12 зодиакальных периодов, то k=12 и мы должны взять p=0,05/12, то есть должно быть p<0,004. Ну что же применим этот простой прием. Смотрим в таблицу значимости критерия Хи-квадрат для p<0,004 и видим, что это значение равно 8,21 и вычисленное эмпирическое значение Хи-квадрат даже в некорректной таблице 3 не достигает этого уровня значимости (!), то есть даже полуторное превышение частот все-таки оказывается незначимым.

Очень ясный пример для объяснения логики Бонферрони предложила в диалоге со мной нейросеть Дипсик. Предположим у вас есть один лотерейный билет, про который Вы знаете, что вероятность выигрыша составляет p=0,05. Сколько нужно купить таких билетов, чтобы хотя бы один выиграл с высокой вероятностью, то есть пренебрежимой вероятностью ошибки? Давайте нащупаем расчетную формулу, рассуждая постепенно. Очевидно, что 2 билета дадут нам вероятность такого выигрыша по формуле 1 — 0,95*0,95, ибо из единицы мы вычитаем вероятность такого исхода, когда не выигрывают оба билета. В случае пяти билетов это уже будет такая формула 1-0,95^5, то есть надо возвести в степень 5 число 0,95 и вычесть результат из 1. Таким образом, уравнение сводится к поиску такого значения показателя степени X, которое даст нам значение функции Y, равное 0,95, в такой формуле 1-0,95^X. Признаюсь, что не я сам, но Дипсик помог мне преобразовать данное неравенство так, чтобы оно позволяло находить минимально необходимое значение X:

X ≥ log(1 — P) / log(1 — α),

Где p = 0,95; α = 0,05.

Вы сами можете написать эту формулу в Эксель и получите следующее минимальное значение X>= 58,4. Но так как X у нас должно быть целым числом (допустим это количество профессий), то делаем вывод, что покупка 59 лотерейных билетов с высокой долей вероятности (с пренебрежимой долей ошибки) гарантируют нам получение хотя бы одного выигрыша. К счастью, связь любого знака зодиака с произвольным набором профессий гораздо ниже, чем а=0,05, а иначе было бы достаточно взять всего лишь только 5 случайных профессий, чтобы на 60 парах наблюдений (12 знаков * 5 профессий = 60 пар) получить одну связь, которая достигнет уровня надежности p>0.95 (!).

Надо сказать, что появление доступных статпакетов снимает в настоящее время с повестки дня «поправку Бонферрони», так как совсем нетрудно разбить выборку наблюдений на 2 случайные подвыборки и посмотреть, какие корреляции выявляются как значимые в каждой половине. Я неоднократно лично выполнял такой простой прием и… в результате буквально «испарялись» почти все корреляции, которые казались вовсе неслучайными – не были они устойчивыми к такому приему, который чаще всего называется в психометрической тестологии «внутренней кросс-валидизацией».

ВМЕСТО ВЫВОДОВ

В 21 веке из-за доступности данных на огромных выборках резко возрос риск получения «ложных корреляций», поэтому волей-неволей растет число сенсаций, который устраивают некомпетентные пользователи статпакетов. Как правило, такие пользователи не проводит никакого психологического тестирования и напрямую устанавливают связи между принадлежностью к определенному «зодиакальному типу» и эмпирической вероятностью появления таких судьбоносных событий как «автомобильная авария», «успех в медиа-бизнесе» (с кинозвездами теперь по индексу известности начали успешно конкурировать популярные блогеры), «выдающиеся достижения в науке» (какое-то время возникла иллюзия, что значимо чаще других Нобелевскую премию получают «близнецы», но в последнее время и эта мнимая связь потеряла устойчивость), «разводы», «психические заболевания», «самоубийства» и другие события, по которым определенные ведомства просто автоматически теперь накапливают огромную социальную статистику на сотнях тысячах и миллионах граждан, которую совсем нетрудно теперь связать с датой рождения человека.

Казалось бы, новыми красками заиграл известный еще с конце 19 века мрачный афоризм Марка Твена: «Есть ложь, есть наглая ложь и есть статистика». Но… данная статья написана мной для того, чтобы уточнить этот афоризм следующим образом:

«Есть ложь, есть наглая ложь и есть неквалифицированная статистика».

P.S.

При чтении у неопытных читателей может сложиться такое неправильное впечатление, будто такая статистическая работа, которую я называю квалифицированной уничтожает буквально все значимые корреляции (?!). Нет, дело обстоит вовсе не так. Уничтожаются зыбкие и неустойчивые связи именно с показателями «астрологического статуса». Тогда как множество казалось бы банальных связей остаются очень и очень сильным и устойчивыми. Например, пол и возраст являются традиционно более сильными предикторами аварийного стиля езды, чем самый замысловатый астрологический портрет (так называемая «натальная карта»). Например, корреляция с возрастом имеет U-образную (нелинейную) форму, но на отдельных участках достигает очень высокого значения 0,3 (если сопоставлять менее аварийный средний возраст в одном случае с молодым в диапазоне 16-25 лет, а в другом случае с пожилым 75+). А корреляция с полом может достигать значений 0,35 (для тяжелых аварий). Ну разумеется в пользу более осторожных женщин. Так что для предсказания очень многих судьбоносных событий лучше работают такие банальные факторы как пол, возраст, социоэкономический статус, характер занятости (надомная или офисная работа) и так далее. Именно о них полезней знать психологу-консультанту, чтобы учитывать в ходе консультирования ожидаемые особенности типичного образа жизни. – Гораздо полезней, чем добывать бесполезные данные о зодиакальном психотипе и строить сложные «натальные карты».

Хотя… бесспорным оказывается такой психологический факт, что многим людям просто необходимо верить в то, что ими интересуются «звезды» и некие сверхъестественные «космические боги» руководят их судьбой. Это снижает у них до терпимого уровня страх перед будущим, освобождает от тревожного переживания неопределенности и от тягостного напряжения, связанного с необходимостью свободного и ответственного собственного выбора.

Впрочем, о том, как психоастрологи могут опозориться, имея на руках очень подробные «натальные карты», пойдет разговор в нашей следующей публикации. Обещаю также не обойти вниманием самый сложный для научного объяснения «эффект Гоклена», который, в частности, как бы подтвержден на статистически значимом уровне в крупнейшем результативном многолетнем проекте Лоис Роден (это женщина) под название Astrodatabank. В качестве предварительной подготовки к этому обсуждению рекомендую Вам следующую ссылку на статью про «астросоциотипологию» в Циклопедии:

https://cyclowiki.org/wiki/Астросоциотипология

Добавить комментарий Отменить ответ

Баллы могут переводиться в оценки только по статистике правильных ответов. И никак иначе.

Да, Алексей, меня тоже это утверждение удивило.

Интересно, полезно, спасибо.

Утверждение DeepSeek, что в Великобритании «пороги для высоких оценок (А), как правило, строже», весьма спорно. Скорее мягче по сравнению с…

Наташа, спасибо за Ваше активное участие в обсуждении актуальных проблем на этом блоге Шмелева 🙂

Брюс Уилис

Поправка Бонферрони и ложные сенсации, якобы подтверждающие прогностичность астрологии

Добавить комментарий Отменить ответ

Актуальный опрос

Ваши вопросы

Рубрики

Последние комментарии:

Облако меток