Всеволод Баширов (sevabashirov) wrote,
Всеволод Баширов
sevabashirov

Проверка на вшивость по Байесу

Нам дали урну, полную шаров, клятвенно заверив, что каждый из них черный либо белый. Наугад мы вытягиваем один шар - он оказывается черным.

Какова вероятность того, что следующий вытянутый шар окажется черным?

Комментарии не скрываю, вернусь к вечеру.
___

Ответ - 2/3. Решение чуть позже.
___

Для начала оговорки: пусть выборка производится с возвращением, а количество шаров в урне близко к бесконечности. В целом условия таковы, что вероятность вынуть черный шар не меняется в зависимости от результатов проведенных опытов. Аналогия: вместо урны - стрелок, вместо вынутого черного шара - попадание в цель. Мастерство стрелка не меняется в процессе тренировки, он всегда стреляет так, что попадает с одинаковой вероятностью (он вообще робот со вшитым ГСЧ, например). Да, не слишком четко сформулировал, и в итоге комментаторы ушли в другие дебри.

Кто знает про теорему Байеса - молодцы, быстро поймут, куда клоню. Остальным надо объяснить. В простых задачах на нахождение вероятности определены все начальные условия, и там все четко. Но даже если начальные условия могут быть разными, можно рассчитать итоговую вероятность события, но для этого нужно определить вероятности 2-го порядка: установить набор гипотез, для каждой из них отобрать случаи, удовлетворяющие условиям задачи, и уже на основе этого делать заключения.

Пример: есть три стрелка. Один попадает в цель с вероятностью 30%, другой - с 40%, третий - с 80%. Мы видим стрелу, попавшую в цель. Какова вероятность того, что ее выпустил первый стрелок?

Пусть стрелки выпустят по n стрел каждый. В цель из них попадут 0,3n+0,4n+0,8n=1,5n (половина от выпущенных, кстати). Среди всех торчащих в мишени стрел первому стрелку принадлежит 0,3n/1,5n=20% - это и есть та самая вероятность.
___

Теперь к нашей задаче. Фишка в том, что у нас нет информации о доле черных шаров в урне (= вероятности вынуть черный шар). Мы можем дать бесконечный набор гипотез - непрерывный ряд от 0 до 100%. Представим себе единичный квадрат на координатной плоскости и отложим эти гипотезы по Ох. Каждой из них соответствует столбик нулевой ширины (интегрирование проходили? Ну вот).

Мы увидели вынутый черный шар. Это дает нам некоторую информацию. Если верна гипотеза "доля черных шаров = 43%", то 43% исходов будут заканчиваться тем, что мы увидели. Вообще, закрасим на нашем квадрате ту долю каждого столбика, которая соответствует благоприятному исходу. Сообразили, что получится? Нижняя правая половина единичного квадрата, отрезанная по диагонали. Вся эта половина - это "торчащие в мишени стрелы", множество благоприятных исходов. Центр тяжести треугольника легко находится геометрически как точка пересечения медиан, его абсцисса равна 2/3. Это и есть ответ - вероятность, полученная суперпозицией всех гипотез (столбцов) с весами (их высотами), соответствующими доле нужных нам исходов при каждой из них.

Если бы мы не наблюдали вынутый черный шар, то для каждой из гипотез нашим условиям удовлетворял бы весь столбик, и мы бы искали центр масс единичного квадрата - ясно дело, это 1/2. Если бы мы наблюдали два черных шара и построили график вероятности такого исхода, получилась бы парабола, и надо было бы искать центр масс того вогнутого уголка, который она отсекает (3/4 там получается, если проинтегрировать).

В общем, чем больше мы вынимаем черных шаров подряд, тем перекошеннее в бОльшую сторону становится множество наших гипотез о том, какова их доля (а начиналось все с симметричного случая - равномерного распределения гипотез от 0 до 1): гипотезы о малых долях становятся менее вероятными, о высоких долях - более вероятными. Соответственно, тем больше среднеожидаемая гипотеза и собственно искомая вероятность, то есть ожидаемая доля черных шаров.
___

Надо полагать, многие из вас так ни черта и не поняли, если изначально с Байесом были нелады. Мда, зря я все это затеял.
Tags: задача, наука, пробабли
Subscribe

Posts from This Journal “наука” Tag

  • НТР и все-все-все

    Книга "1000 условий наступления всеобщего благоденствия". Выдержка: ... 473. Лекции по стереометрии в вузах начнут преподавать в формате…

  • ЗАТО и наукограды России

    Собрал воедино данные о населении ЗАТО и наукоградов России - странно, но до сих пор никто этого не делал. В целом население ЗАТО сокращается,…

  • А действительно

    Эрудитом можно считать того, кто без подсказки вспомнит хотя бы трех женщин-ученых (не моя фраза, но поддерживаю). Можете? Сам припомнил следующих:…

promo sevabashirov march 5, 2014 19:02 13
Buy for 10 tokens
Таки да. Промо-блок работает, стартовая сумма за размещение - 10 жжж, ниже некуда. Размещать можно любые посты. То есть абсолютно.
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 44 comments