ПРОБЛЕМА РЕФЕРЕНТНОГО КЛАССА И УСЛОВНЫЕ
ВЕРОЯТНОСТИ
В.М. Резников
Впервые на проблему референтного
класса обратил внимание Дж.Венн. «Каждая
индивидуальная вещь или событие, – писал он, – имеет бесконечное
множество свойств или атрибутов, и поэтому они могут рассматриваться как
принадлежащие к бесконечному множеству различных классов» [1] Эта ситуация порождает
проблему назначения вероятностей индивидуальным событиям, например назначения
вероятности того, что Джон Смит, 50-летний англичанин, болеющий воспалением
легких, доживет до 61 года. Она сводится к тому, заключается в том, что
надежные статистические данные одновременно по всем показателям, в данном
случае – по трем показателям: быть англичанином, быть 50-летним человеком
и болеть воспалением легким, – не являются доступными. Доступны данные,
относящиеся к части показателей, например к любым двум показателям: быть 50-летним
англичанином; болеть воспалением легких в возрасте 50 лет; быть англичанином,
болеющим воспалением легких.
Возникает вопрос, какой из этих трех классов является
наиболее адекватным. Прежде чем исследовать решение этой задачи, рассмотрим
проблему референтного класса в общем случае. Эта
проблема возникает при определении вероятности сингулярного события E.
Событие E принадлежит к разным классам событий, которые мы обозначим
символами A, B, C. Исходя из этого
вероятности возникновения события E будут различными в
зависимости от рассматриваемого класса.
Вероятность возникновения события E при
условии, что оно принадлежит к классу A, равняется P(E/A);
вероятность этого же события при условии, что оно принадлежит к классу B,
равняется P(E/B); наконец, вероятность события E,
если оно принадлежит к событию C, равняется P(E/C). В зависимости от
того, как мы классифицировали событие E, оно имеет различную
вероятность. Но вероятность события E не должна зависеть от того, как мы
его описали. В связи с этим возникает эпистемологический вопрос: какова
истинная вероятность события E?
Принято считать, что проблема референтного
класса представляет собой специфическую проблему частотной концепции. Автором
первой частотной концепции является Дж.Венн, авторами
наиболее известных вариантов частотных концепций – Р. фон Мизес [2] и Г.Рейхенбах [3] В
частотной концепции Мизеса вероятность задается на
бесконечных коллективах. Она является предельной частотой. Вероятности в этой
концепции удовлетворяют двум условиям. Во-первых, существует единственная
вероятность, к которой сходятся последовательности частот, полученные для
членов коллектива. Во-вторых, предельная вероятность, к которой сходится
последовательность частот, вычисленная на произвольной подпоследовательности,
равняется предельной вероятности, к которой сходится последовательность частот,
определенная на всем коллективе. Строго правила выбора подпоследовательностей
впервые сформулировал А.Черч [4].
Для Мизеса проблема референтного класса не существует. Вероятности определяются
только для коллективов. Вероятность для сингулярного события, по Мизесу, не может быть определена.
Рейхенбах предложил прагматичный вариант теории вероятностей.
Во-первых, он рассматривает коллективы специального вида, а именно,
упорядоченные по времени последовательности. Во-вторых, он рассматривает в
качестве коллективов не только бесконечные последовательности, как Мизес, но и актуальные конечные последовательности.
В-третьих, он отказался от требования к коллективам, выдвинутого Мизесом, которое заключается в том, что все подпоследовательности являются независимыми относительно
друг друга.
По мнению Рейхенбаха,
единственной обоснованной концепцией является частотная.
Согласно этой концепции вероятности определяются на коллективах. Тем не менее допускается применение частотной концепции для анализа
сингулярных событий. Для анализа сингулярных вероятностей используется
концепция минимального референтного
класса. Минимальный референтный
класс – это минимальный класс, на основе которого осуществляются надежные
статистические оценки. В работах Рейхенбаха не
содержится методологии определения минимального референтного класса.
Требование определения вероятностей для сингулярных
событий при использовании частотной концепции на основе наименьшего
референтного класса включено в систему
прагматических правил, регулирующих применение этой концепции.
Г.Кайберг [5] приводит пример, иллюстрирующий использование
понятия наименьшего референтного
класса. Пусть имеются основания для уверенности в том, что относительная
частота наступления смерти на 39‑м году жизни среди американских мужчин
равна 0,012, а среди белых американских рабочих – 0,009. В то же время
отсутствует убедительная статистика относительно учителей американских школ. В
рассматриваемом примере для определения вероятности смерти 39‑летнего
учителя предлагается использовать частоту 0,009. Принятие этого решения
основано на субъективных и прагматических соображениях.
Таким образом, в рамках частотной концепции представлено
три подхода к описанию вероятности сингулярного события. Для Венна существует
бесконечное множество одинаково обоснованных назначений вероятности
сингулярному событию, так как имеется бесконечное множество референтных
классов. По Мизесу, частотная концепция неприменима
для определения вероятности сингулярного события. Для Рейхенбаха
легитимным является применение частотной концепции для множеств. Из
прагматических соображений возможно применение этой концепции для сингулярных
событий на основе понятия наименьшего референтного
класса. Понятие референтного класса Рейхенбах не операционализировал.
В связи с описанным положением дел считается, что
корректное применение частотной концепции невозможно из-за существования
проблемы референтного класса. А.Хайек
в своих недавно опубликованных работах [6] показывает, что проблема референтного класса возникает при описании вероятностей
сингулярных событий в рамках известных вероятностных интерпретаций:
классической, субъективистской и логической. В настоящей
статье исследуется обоснованность аргументации Хайека
для классической, субъективистской и логической концепций.
Классическая вероятность. Классическая концепция исходит из того, что заданы
равновозможные события. Равновозможные события являются равновероятными.
Определение вероятности события для равновероятных событий не приводит к
логическому кругу, потому что понятие равновероятности
определяется через равновозможность. Определение равновозможности основано на принципе индифферентности,
предложенном П.Лапласом. Этот принцип «гласит: две возможности тогда, и только
тогда равновероятны, когда нет основания для предпочтения одной из них” [7]. Принцип
индифферентности критиковали по самым разным причинам. Наиболее сильная критика
связана с парадоксами, которые обнаружил французский математик Ж.Бертран. Он
рассматривал решение следующей задачи. В круге единичного радиуса наугад
проведена хорда. Ставится вопрос: какова вероятность того, что длина хорды
превышает единицу?
В первом варианте решения задачи используется величина
угла, образованного радиусами, исходящими из центра окружности к концам хорды.
Этот угол изменяется в пределах от 0 до 180°. Хорды, имеющие длину больше единицы, опираются на
углы, изменяющиеся от 60 до 180°. Тогда вероятность того, что длина хорды больше единицы,
равна 120/180=2/3.
Во втором варианте решения используется длина
перпендикуляра, проведенного из центра окружности до искомой хорды.
Максимальное допустимое значение этой величины равно единице. Легко подсчитать,
что расстояние от центра окружности до хорды единичной длины равно Ö3/2. Отсюда следует, что вероятность того, что
проведенная наугад хорда, будет иметь длину больше единицы, равна (Ö3/2)/1 = Ö3/2.
Парадокс Бертрана заключается в том, что разные
способы решения этой задачи приводят к разным ответам.
Современный вариант парадокса Бертрана был предложен Б.
ван Фраассеном [8]. На
фабрике производят кубики, длина ребра которых меняется случайным образом от 0
до 1 фута. Возникает вопрос: какова вероятность того, что длина ребра равняется
половине фута в выбранном случайно кубике? На основе принципа индифферентности
получаем очевидный ответ: 0.5 . В рамках данной задачи рассмотрим еще два
вопроса.
1. Какова вероятность того, что площадь выбранного кубика
равняется 0,25? Соответственно принципу индифферентности все площади поверхности
одинаково вероятны и варьируют от 0 до 1. Поэтому вероятность того, площадь
поверхности составляет 0,25 будет численно равна 0,25.
Как мы ранее отмечали, вероятность случайного выбора
кубика с длиной ребра 0,5 равна 0,5. В этом случае кубик будет иметь площадь поверхности,
равную 0,25, с той же самой вероятностью 0,5, а не 0,25.
2. Какова вероятность того, что объем выбранного
кубика равняется 0,125? В соответствии с принципом индифферентности все объемы
кубиков одинаково вероятны и варьируют от 0 до 1. Поэтому вероятность того, что
объем кубика составляет 0,125, будет численно равна 0,125.
Применение принципа индифферентности для длины кубика
дает вероятность получения кубика с объемом 0,125, равную 0,5. Применение
принципа индифферентности для площадей при решении данной задачи дает ответ 0,25.
И наконец, применение принципа индифферентности для объемов при решении данной
задачи дает ответ 0,125.
Таким образом, проблема референтного
класса имеет место в классической концепции теории вероятностей. В зависимости
от выбора референтного класса получаются разные
ответы при решении одной и той же задачи.
Логическая вероятность. Точной экспликацией понятия «логическая вероятность»
считается понятие степени подтверждения гипотезы. Степень подтверждения
гипотезы H с помощью утверждения E (обозначается C(H,E))
определяется как условная вероятность гипотезы H при условии E.
Первая экспликация логической вероятности как степени подтверждения была
предложена Р.Карнапом [9]. Она сводилась к тому, что задавая определенным
образом вероятности посылок, получаем вероятности следствий. Так как
вероятность следствия получается не непосредственно, а относительно посылок, возникает
проблема референтного класса при определении
логических вероятностей.
Карнап считал возможным создание логического языка, в
котором выразимы как дедуктивные, так и индуктивные закономерности. В
дедуктивной логике если утверждение e влечет h и e
истинно, то h тоже будет истинным. Для индуктивных закономерностей
вводится понятие частичной выводимости. Если e – основание для h,
то связь между e и h будет отношением частичной выводимости.
Начиная с простейших языков первого порядка с конечным
числом одноместных предикатов, с конечным числом индивидных констант, Карнап
постепенно развивал концепцию логической вероятности. При этом он использовал
обычные логические связки: конъюнкцию, дизъюнкцию и отрицание. Им исследовались
дескриптивно полные языки; в этих языках для каждого утверждения можно
построить цепочку предпосылок, из которых оно выводимо.
Рассмотрим в качестве примера язык с двумя
дескриптивными предикатами F и G и тремя индивидными константами a,
b, c. Из двух примитивных предикатов можно получить четыре
составных – так называемые Q-предикаты:
Q1(x)= FxÙGx,
Q2(x)= ØFxÙGx,
Q3(x)= FxÙØGx,
Q4(x)= ØFxÙØGx.
Общее число возможных состояний: 4**3. Первые восемь
из них таковы:
Q1(a) Ù Q1(b) Ù Q1(c); Q1(a)
Ù Q2(b) Ù Q1(c);
Q1(a) Ù Q1(b) Ù Q2(c); Q1(a)
Ù Q2(b) Ù Q2(c);
Q1(a) Ù Q1(b) Ù Q3(c); Q1(a)
Ù Q2(b) Ù Q3(c);
Q1(a) Ù Q1(b) Ù Q4(c); Q1(a)
Ù Q2(b) Ù Q4(c).
Для того чтобы получить вероятность любого
предложения, необходимо задать вероятности возможных состояний. Естественным
представляется задание на основе принципа индифферентности одинаковых
вероятностей всем описаниям состояний. Оказалось, что этот способ приводит к
получению утверждений, независимых друг от друга. Описание зависимых
утверждений для данного способа задания вероятностей предпосылок не является
возможным.
Другой способ задания исходных вероятностей основан на
использовании описаний структур. Описание структуры – это дизъюнкция
описаний состояний, отличающихся друг от друга перестановками индивидных констант.
Например, описания состояний Q1(a) Ù Q1(b) Ù Q2(c) и Q1(a) Ù Q2(b) Ù Q1(c) могут быть получены один из
другого перестановками констант b и с. Применение принципа
индифферентности для описаний структур позволяет описывать как вероятностно
независимые, так и зависимые предложения.
Проблема референтного класса
возникает в связи с выбором языка. Фиксируем язык, получаем описание одних суждений
с одними вероятностями. Изменяя язык, мы изменяем возможные описания и их
вероятности. Возникает вопрос, почему мы выбираем один язык, а не другой?
Известна попытка Карнапа построить канонический язык,
в котором допустимы исключительно естественные предикаты. Естественным,
например, является предикат “зеленый”, неестественным – предикат “зелоголубой”. Строгое отделение
естественных предикатов от неестественных оказалось трудноразрешимой задачей,
так как, во-первых, вероятность предложения оказывается не безусловной, а
условной. Она определяется как условная вероятность посылок. Во-вторых,
возможные суждения и их вероятности связаны с используемым языком.
Субъективистская вероятность. Этот вид вероятности означает степень веры субъекта в
некоторое утверждение. При радикальном субъективизме степени веры должны
соответствовать аксиоматике теории вероятностей, других ограничений на значения
вероятности нет. В этом случае возникает банальный вариант проблемы референтного класса. Пусть E – событие,
вероятность которого оценивается экспертами A, B, С и D. Тогда эксперты назначают вероятности P(E/A),
P(E/B), P(E/C), P(E/D).
Возникает типичная постановка проблемы референтного
класса: чему равна вероятность события E?
Интересные постановки проблемы референтного
класса возникают для умеренных субъективистских вариантов теории вероятностей.
Часто вероятностные оценки утверждений делаются на основе известных экспертных
оценок. Пусть X – оцениваемое утверждение, P – искомая
вероятностная оценка утверждения X, Q(X) – экспертная
оценка утверждения X. Тогда вероятностная оценка P на основе
экспертной функции Q определяется следующим образом:
P(X/Q(X)
= x) = x для всех X таких, что P(Q(X)
= x) > 0. (1)
Различные методологические принципы принятия решений
вписываются в предложенную схему (1). Так, принцип прямого вывода трактует
известную частоту как экспертную информацию для оценивания сингулярной
вероятности. Этот принцип может быть рассмотрен на следующем примере:
P (выпадения
герба при следующем бросании монеты при условии, что бросаемая монета 95 раз из
100 падает гербом вверх) = 0,95. (2)
Подобный принцип был предложен Льюисом для связи
шансов некоторого события и субъективных вероятностей для этого же события.
Льюис назвал предложенный им принцип главным принципом. Он имеет следующий вид:
P (E
при условии ch(E) = p Ù A) = p.
(3)
Здесь
E оцениваемое событие; ch – функция
шанса для единичного события; A – утверждение, не содержащее
информации о том, произойдет ли событие E или нет.
Еще один подобный принцип, связывающий вероятности
будущих и текущих событий, был предложен Б. ван Фраассеном [10]. Этот принцип получил название рефлексивного
принципа. Формальная схема рефлексивного принципа имеет следующий вид:
Pt0 (E при условии, что Pt1 (E)
= p) = p. (4)
Здесь
Pt0 – вероятностная функция в некоторый момент времени t0,
Pt1 – вероятностная оценка в более поздний момент
времени. Например, если известно, что завтра событию E, которое
заключается в том, что будет дождь, будет назначена вероятность 1/3, то сегодня
этому событию назначается та же вероятность.
Все рассмотренные формализации не приводят к проблеме референтного класса, если экспертная функция Q
является единственной при том функции P и Q – согласованные.
Проблемы возникают, если имеется несколько экспертных функций.
Пусть имеется несколько экспертных функций
и они не являются согласованными. Мы не всегда знаем, какая экспертная функция
самая надежная. Естественным представляется использование всей информации с
назначением экспертным оценкам весов. Экспертные оценки являются условными
вероятностями. На их основании строится безусловная вероятность. Проблема референтного класса возникает по двум причинам. Во-первых,
в силу парадокса Симпсона [11] итоговая оценка может оказаться несогласованной
с частными экспертными оценками. Во-вторых, многие важные практические задачи
не могут быть точно формализованы и поэтому приводят к проблеме референтного класса. Например, решение задачи определения
дней, похожих на дождливый завтрашний день, связано с выбором референтного класса. При одном референтном
классе будет одна выборка дней, при другом – другая.
Проведенный анализ показывает, что
при оценивании вероятностей сингулярных событий не удается избежать проблемы референтного класса не только в частотной концепции, но
также в субъективистской и логической концепциях. В техническом плане проблема связана с переходом от
условных вероятностей к безусловным. Предположим, что
обнаружены устойчивые оценки условных вероятностей и нет особого смысла в поиске
безусловных вероятностей. Тогда первостепенное значение приобретает анализ
условных вероятностей.
В наиболее влиятельной теории вероятностей
А.Н.Колмогорова понятие условной вероятности не имеет самостоятельного
значения. Условная вероятность события A при условии события B
определяется с помощью безусловных вероятностей событий A Ù B и B. Формально условная вероятность
определяется следующим образом:
P(A/B)
= P(A Ù B)/P(B), предполагается, что P(B)
> 0. (5)
Данное определение имеет некоторые недостатки. Во-первых,
условная вероятность события корректно определена в ряде случаев, даже если
знаменатель в формуле (5) равен нулю. Пусть P(B) = 0. Тогда
следующие формулы являются корректно определенными:
P(B/B)
= 1;
P(ØB/B) =
0; (6)
P(T/B)
= 1;
P(F/B)
= 0.
Здесь
T – абсолютно истинная формула, F – абсолютно ложная
формула. Данные формулы не могут быть определены с помощью формулы условной
вероятности (5).
Во-вторых,
условная вероятность события корректно определена в ряде случаев, хотя
безусловные вероятности, отношение которых равно условной вероятности,
неизвестны. Пусть событие A заключается в том, что при следующем броске
монеты выпадет герб. Событие B заключается в том, что монета является
правильной. Состояние наших знаний о событиях A и B может быть
таково, что вероятности событий A и B не могут быть заданы. Тем
не менее условная вероятность события A при
условии события B определяется точно:
P(A/B)
= 0,5
Аналогично
P(A/A) = 1, даже если вероятность события A
неизвестна.
В-третьих,
условная вероятность определена для формул структуры (6), даже если множество B
является неизмеримым множеством. Так, например,
P(ØB/B) =
0; P(B/B) = 1.
Формула условной вероятности Колмогорова не является
адекватной для рассмотренных выше примеров, потому что эта формула представляет
собой редукцию двухместной формулы к отношению одноместных формул.
Кроме рассмотренных формальных примеров, для которых
стандартная формула условной вероятности неадекватна, известны содержательные
примеры из различных областей науки, для которых существенным является анализ
условных вероятностей, в то время как безусловные вероятности оказываются
неопределимыми. Важными примерами такого рода представляются
– правило Борна в квантовой механике для вычисления
вероятности измерения результата при условии осуществления соответствующего
измерения;
– различные базовые понятия статистической проверки
гипотез, такие как мощность критерия, размер критерия;
– примеры из области вероятностной теории причинности.
Другие содержательные примеры, для которых безусловные
вероятности не могут быть описаны, и поэтому в них используются условные
вероятности, приведены в работах А.Хайека [12].
Условные вероятности действительно представляются
базовыми понятиями, несводимыми к безусловным вероятностям.
Во-первых, безусловная вероятность события A
чисто формально может быть получена как условная вероятность этого события при
условии тождественно истинного события.
Во-вторых, наше знание по существу всегда является
условным. Любой прогноз, любая статистическая оценка являются условными и
определяются состоянием знания эксперта, его ментальностью и психологией.
В-третьих, многие известные парадоксы, в частности
парадокс Симпсона, возникают как проблема референтного
класса. При одном выборе референтных классов условные
вероятности согласуются с безусловной вероятностью, при других равноправных
выборах условные вероятности не согласуются с безусловной вероятностью. Для
многих практических задач условные вероятности являются вполне достаточными, и
в этом случае переход к безусловным вероятностям не нужен. Соответственно сам
парадокс Симпсона тогда является надуманной проблемой.
В-четвертых, с учетом базового характера условных
вероятностей построены вероятностные аксиоматические системы, где первичным
понятием является условная вероятность.
Возрастание роли условных вероятностей может оказать
влияние на философский анализ вероятностных парадоксов агрегации и на развитие
теории вероятностей. Парадоксы агрегации возникают в том случае, когда
закономерности, найденные для условных вероятностей, не согласуются с
закономерностями для безусловных вероятностей. Часто условные вероятности
адекватно описывают положение дел, поэтому переход к безусловным вероятностям
оказывается ненужным. Значит, парадокс автоматически не будет иметь места.
Существующие аксиоматические системы, построенные на
базе условных вероятностей, в математическом плане менее развиты, чем теория
вероятностей Колмогорова, в которой базовым понятием является безусловная
вероятность. Данная ситуация представляет собой вызов для специалистов в
области теории вероятностей, вероятностной логики и методологии статистики и
может привести к появлению обоснованных вероятностных теорий, в которых базовым
понятием будет условная вероятность.
Примечания
1. Venn J. The logic of chance. – N.Y.: Macmillian and Co, 1876. – Р. 194.
2. См.: Мизес Р.
Вероятность и статистика. – М.;Л, 1930.
3.
См.: Reichenbach
H. The theory of probability. – California, 1964.
4. См.: Шень А.Х.
Частотный подход к определению понятия последовательности //Семиотика и
информатика. – 1982. – Вып. 18. –
С. 14–42.
5. См.: Кайберг Г.
Вероятность и индуктивная логика. – М., 1978.
6. См.: Hajek A.
Conditional probability is the very good of life // Probability is the
very good of life. – Chicago; La Salle, Illinois, 2003; Id.
What conditional probability could not be // Synthese. – 2003. – P. 273–323.
7.
См.: Кайберг Г. Вероятность и индуктивная логика. –C. 47.
8.
См.: Van Fraassen
B. Laws and symmetry. – Oxford: Clarendon Press, 1989.
9.
См.: Carnap
R. Logical foundations of probability. – The
University of Chicago Press, 1963.
10.
См.: Van Fraassen
B. Laws and symmetry.
11. См.: Резников В.М., Карпович
В.Н. Философско-методологический анализ оснований причинных зависимостей. –
Новосибирск, 1998.
12.
См.: Hajek
A. Conditional probability is the very good of life; Id. What conditional
probability could not be.
Институт философии и права
СО РАН, г. Новосибирск
Reznikov, V.M. The referent class
problem and conditional probabilities
From
the traditional viewpoint, the problem of referent class is a peculiarity of
frequency probability conception. The present paper shows the validity of A.Hayek's hypothesis that this problem has a general character, in particular it arises when logic and
subjectivist conceptions of the probability theory are applied. The author
proves that the referent class problem is a characteristic feature of
conceptions based on unconditional probabilities. Therefore, one of possible
ways to solve the problem concerns construction of probabilistic
interpretations with conditional probability as the basic concept.