В.М.Резников

 

Философско-методологический анализ оснований
статистических методов в контексте корректных приложений
*

 

* Работа выполнена при поддержке РГНФ (грант № 97-03-04413).

 

Значимость вероятностно-статистических концепций связана с легитимностью вероятностной парадигмы в науке, универсальным характером вероятностных рассуждений от обыденного мышления до теоретического знания. В работе [1] показано, что вероятностная тематика лидирует по количеству публикаций в области философии математики. Значимость вероятностных подходов не ограничена областью философии математики. Так, например, преимущественно в западной философской литературе интенсивно исследуются каузальные отношения с помощью вероятностных формализаций [2-4]. Вероятностные методы широко используются в технике, медицине, экономике и других научных дисциплинах для решения таких важнейших проблем, как разработка стандартов качества продукции, определение эффективности лекарств и методов лечения, управление космическими аппаратами, составление инвестиционных портфелей и др.

Актуальность вероятностной тематики связана, с одной стороны, с широким использованием вероятностных методов, а с другой – с неудовлетворительным состоянием дел как по использованию статистического анализа в практике научных исследований, так и для анализа философских проблем. Коротко рассмотрим некоторые аспекты применения статистических методов для исследования проблемы каузальности. Отметим, что понятия независимости и каузальной связи являются предельными, и в некотором смысле, обратными по отношению друг к другу характеристиками зависимостей. А именно, причинная связь событий означает, что эти события связаны сильной сущностной связью. Независимость событий означает отсутствие сущностной связи. В этом случае поиск каузальной зависимости не имеет смысла. С другой стороны, независимость явлений может быть вызвана неучтенной общей причиной этих явлений. Посмотрим, является ли понятие статистической независимости адекватным для описания каузальности?

1. Каузальная независимость является принципиально несимметричной, а статистическая – симметричной: если фактор А не зависит от B, то и B не зависит от A.

2. Понятие статистической независимости не обладает количественной характеристикой. Можно говорить исключительно о независимости событий или о том, что события зависимы, но нельзя говорить о степени независимости.

3. В практике статистических исследований гипотеза о причинной независимости событий позволяет предполагать и статистическую независимость этих событий. В то же время, как правило, наличие статистической независимости не проверяется статистическими методами [5].

4. Имеет место определенное несоответствие содержательного понятия независимости понятию статистической независимости. Проиллюстрируем это несоответствие примером Колмогорова [6]. Рассмотрим следующее выражение:

Здесь xi – случайные величины, принимающие два разных значения, например, 1 и 0 с одинаковой вероятностью 1/2. Доказано, что величины xi, в некотором смысле связанные общим происхождением, являются статистически независимыми [7]. Отметим, что Колмогоров и Боровков полагают, что этот результат свидетельствует о том, что понятие статистической независимости имеет широкую область применения, не ограниченную содержательно независимыми процессами [6, 7]. По нашему мнению, этот пример свидетельствует о несовершенстве понятия статистической независимости.

Теперь перейдем к рассмотрению проблем корректного использования математической статистики в практике научных исследований. Вначале рассмотрим фактическое состояние дел, связанное с приложениями. В отечественной литературе этой проблеме уделено достаточно большое внимание в работах Алимова, Тутубалина и других [8, 9]. В недавно вышедшей работе дан анализ адекватности использования статистики в медицине и биологии [10]. В результате анализа 200 докторских и кандидатских диссертаций в области медицины и биологии обнаружилось, что в 65 процентах работ в основном ограничились вычислением средних и их ошибок, т.е. в большинстве работ использовались методы элементарной описательной статистики. Анализ статистических зависимостей исследовался не более чем в 3–4 процентах работ, при этом использовался простейший корреляционный анализ. Как правило, статистические критерии в этих работах использовались без проверки границ применимости этих методов. Так, сравнение средних по критерию Стьюдента использовалось в 16% работ, а проверка на соответствие данных нормальному распределению, при котором применение Стьюдента оправдано, не более чем в 3% работ. Авторы анализируемой заметки делают справедливый вывод о том, что уровень использования статистических методов в медицине не отвечает современным возможностям применения прикладной статистики [10, с.58]. По нашему мнению, эта ситуация выходит за рамки чисто академической и является социально важной. Например, в связи с использованием статистических методов для определения эффективности лекарственных препаратов. Чем вызвано неудовлетворительное состояние дел с приложениями статистических методов? Здесь можно выделить ряд факторов:

1) Отсутствие должного внимания к статистической науке как области операционального знания, необходимого для принятия решений в условиях неопределенности. В то же время современная ситуация в технике, экономике и других областях характеризуется, с одной стороны, необходимостью обработки колоссальных объемов данных, а с другой – принципиальной необходимостью принимать оптимальные решения в условиях недостатка нужной информации.

2) Вторая проблема связана с недостаточным вниманием к обучению статистике в медицинских и биологических вузах. Что касается среднего образования, то элементы теории вероятностей и математической статистики вплоть до последнего времени не входили в обязательную программу средней школы. Для сравнения отметим, что в Японии, начиная с 1972 г., школьники начинают осваивать теорию вероятностей, начиная со 2-го класса [10].

3) Третья причина, оказывающая серьезное влияние на проблемы приложений, имеет методологический характер. Дело в том, что трудности корректных приложений определяются неадекватностью некоторых базовых понятий и методов классической математической статистики [8, 9, 11, 12]. Мы полагаем, что понятие статистической независимости является базовым. Во-первых, создатель современной теории вероятностей А.Н.Колмогоров отмечал, что понятие независимости придает своеобразие математической статистике по сравнению с теорией меры [13]. Во-вторых, наличие независимости существенно упрощает вычисление ряда статистических характеристик. Так, например, дисперсия суммы независимых случайных величин равна сумме дисперсий этих величин. Функция распределения независимых случайных величин равна произведению функций распределения этих величин. В-третьих, именно для независимых случайных величин получены многие серьезные результаты, например, теорема, выражающая так называемый закон больших чисел. Раньше эту теорему оценивали как эпистемологически значимую [14].

Дадим определение понятию независимости для событий. События A и B являются незавсимыми, если имеет место следующее равенство:

P(AÇB) = P(A)* P(B)

Эквивалентное определение независимости заключается в выполнении следующего условия:

P(A/B) = P(A)

Покажем, что результаты, полученные с применением понятия ”статистическая независимость”, имеют ограниченное значение.

Во-первых, статистическая независимость не может быть получена из других определений. Она определяется через нелогическое равенство условной и безусловной вероятностей.

Во-вторых, она имеет только частичную экспликацию посредством коэффициента корреляции. Связь понятий независимости и коэффициента корреляции такова: если случайные величины независимы, то коэффициент корреляции равен нулю. В то же время равенство нулю коэффициента корреляции не обязательно влечет статистическую независимость [например, 15, с.180]. Отметим, что в частном случае, если случайные величины имеют нормальное распределение, то равенство нулю коэффициента корреляции этих случайных величин влечет их независимость.

В-третьих, понятие статистической независимости имеет исключительно тривиальную теоретико-множественную интерпретацию – статистически независимые события с положительными вероятностями имеют непустое пересечение. Покажем, что теорема о законе больших чисел не имеет эпистемологической значимости, а имеет лишь внутриматематический смысл. Вначале кратко рассмотрим эту теорему.

Пусть вероятность успеха при каждом повторении эксперимента равна р, соответственно вероятность неуспеха 1-p, а mn- число успехов при n независимых испытаниях с вероятностью успеха 0<р<1 в каждом испытании. Тогда при любом x>0 имеет место:


 


Эта формулировка закона больших чисел в схеме Бернулли [5].

Приведём аргументацию против эпистемологической значимости теоремы о законе больших чисел:

1) Как отмечает Тутубалин, прежде считалось иногда, что из этой математической теоремы вытекает экспериментальный факт устойчивости средних [16, стр.37]. Применительно к нашему случаю, этот результат трактуется как устойчивость частот. Далее автор [16] справедливо отмечает: "Ни из какой теоремы математики, физики и механики не вытекает тот или иной результат эксперимента, поскольку никогда на практике нельзя гарантировать выполнение условий теоремы" [16, стр.34].

2) В этой теореме используется понятие вероятности, которое является теоретическим.

3) Предполагается, что мы знаем вероятность успеха априори и точно, но в силу пункта 2 это неправильно.

Теперь дадим критический анализ адекватности методов доверительных интервалов и максимального правдоподобия, сокращенно - ММП. Краткое введение в эти подходы рассмотрим для типичной задачи статистики, а именно, оценки параметров распределения. Сущность метода максимального правдоподобия заключается в следующем. Пусть имеется выборка данных – x1, x2, …, xn, а q – неизвестное значение параметра дискретного (для простоты) распределения вероятностей. Параметр q определяется из следующего соотношения:

 


 


Обычно экспериментаторы для увеличения надежности результатов осуществляют несколько измерений одной и той же величины и наряду с первоначальной выборкой мы имеем другую: y1, y2, …, ym. Соответственно для этой выборки по методу ММП мы получаем свою оценку q1. Возникает следующий естественный, но серьезно не обсуждаемый в литературе вопрос: какую из оценок выбрать? Отметим, что метод ММП обеспечивает нахождение состоятельных оценок, т.е. оценок, сходящихся по вероятности к истинному значению параметра при n®¥. В работе Эльясберга значимость асимптотических оценок для ответственных приложений справедливо названа: "одним из мифов 20-го века" [17, с.93]. Теперь кратко охарактеризуем метод доверительных интервалов. Суть метода заключается в построении минимального по величине интервала, в который с заданной вероятностью гарантируется попадание неизвестного параметра распределения. Отметим следующие методологические проблемы этого метода.

1) Так как неизвестный параметр распределения является константой, то в фиксированный интервал этот параметр или попадает, или нет. Говорить о вероятности попадания, отличной от 0 и 1, не имеет смысла.

2) Если мы не знаем истинного значения оцениваемого параметра, то определив по разным выборкам несколько различных оценок параметра, мы сталкиваемся с проблемой выбора наилучшего доверительного интервала.

Отметим, что в мизесовском подходе понятие доверительного интервала имеет ясную интерпретацию. В рамках мизесовской концепции можно говорить о частоте, с которой разные доверительные интервалы, построенные для своих выборочных данных, покроют неизвестное значение параметра. При этом предполагается, что оценки границ интервалов являются устойчивыми для разных выборок при условии, что их объемы возрастают [8, 9].

Таким образом, некоторые основания стандартных методов не являются обоснованными. Математики безусловно знают о том, что построение доверительного интервала для постоянного, но неизвестного параметра не является содержательно безупречным. Почему математика весьма лояльна к этой ситуации? Дело в том, что кредо математики – это поиск логически безупречных доказательств, а содержательный смысл формальных процедур и, тем более, их прикладная значимость находятся на периферии интересов чистой математики. Метод ММП логически безупречен, но, с одной стороны, он гарантирует лишь асимптотически оптимальные оценки для бесконечных объемов данных, что является неприемлемым для реальной обработки данных, а с другой – получается, что этот метод фактически ориентирован на случай решающих разовых экспериментов, т.к. вопрос сравнения нескольких оценок с целью выбора наилучшей не разработан в статистической литературе. Разовые эксперименты значимы для современной науки, в частности, в области физики [18], но они не покрывают все потребности работающей науки, ориентированной на получение надежных результатов за счет повторяемости экспериментов. Как мы уже отмечали, многие результаты в статистике получены в предположении независимости. Понятие статистической независимости является базовым, оно не имеет достаточно полной экспликации через другие понятия и логически неопределимо через другие понятия. Кроме того, оно имеет бедную теоретико-множественную интерпретацию.

В заключение отметим, что уровень развития любой области знания определяется обоснованностью используемых в ней научных методов. Если наука развивает методы, логически безупречные, но оперирующие с малосодержательными понятиями или, если эти методы имеют границы применимости, не включающие практические проблемы, то эти методы в лучшем случае имеют определенное значение для исследований в области возможных миров. Развитие научных методов, безусловно, принадлежит сфере деятельности конкретных наук, но экспликация не вполне содержательных понятий науки и активизация научных интересов к реальным проблемам, а не к искусственным из области возможных миров, является важнейшей функцией методологии науки.

Литература

1. Барабашев А.Г. Философия математики в США: современное состояние.// Закономерности развития современной математики. – М., 1986. – С. 282–302.

2. Suppes P. Probabilistic Metaphysics. – Oxford: Basil blaskwell, 1984. – 251 p.

3. Dupre J., Cartwright N. Probability and causality //Nous. 1988. – Vol. 4. – № 22. – Р. 521–536,.

4. Карпович В.Н., Резников В.М. Некоторые аспекты формализации причинных связей.// Философия науки. – 1996. № 2. – С. 164–175.

5. Севастьянов Б.А. Курс теории вероятностей и математической статистики. М., 1982. – 255 с.

6. Колмогоров А.Н. Теория вероятностей // Математика, ее содержание, методы и значения. – М.: Изд-во АН СССР, 1956. – Т. 2.

7. Боровков А.А. Курс теории вероятностей. – М., 1972.

8. Алимов Ю.И., Кравцов Ю.А. Вероятность как физическая величина // Успехи физических наук. 1992. – Т. 162. – № 7. – С. 149–181.

9. Тутубалин В.Н. Границы применимости вероятностно-статистических методов и их возможности. – М.: 1977.

10. Леонов В.П., Ижевский П.В. Об использовании прикладной статистики при подготовке диссертационных работ по медицинским и биологическим специальностям // БГ ВАК. – М., 1997. № 5. – С. 56–61.

11. Резников В.М. Философско-методологический анализ понятия независимости в вероятностной теории причинности и в теории вероятностей // Философия науки. – 1998. – № 4. – С. 60–65.

12. Резников В.М., Стасышин В.М. Об использовании мизесовской статистики в задачах управления.// Третий Сибирский конгресс по прикладной и индустриальной математике: Тез. докл., ч. 3. – С. 70–71. – Новосибирск, 1998.

13. Колмогоров А.Н. Основные понятия теории вероятностей. – М., 1974. – 120 с.

14. Гнеденко Б.В. Курс теории вероятностей. – М., 1988. – 488 с.

15. Гмурман В.Е. Теория вероятностей и математическая статистика. – М., 1998.

16. Тутубалин В.Н. Теория вероятностей. – М., 1972. – 231 с.

17. Эльясберг П.Е. Измерительная информация: Сколько ее нужно? Как ее обрабатывать? – М., 1983.

18. Cartwright N. An empiricist defense of singular causes. Unpublished manuscript. - 32 p.