КОНЦЕПЦИЯ НАТУРАЛИЗАЦИИ МАТЕМАТИЧЕСКОГО ЗНАНИЯ
И ПРОБЛЕМА НОВОГО ЗНАНИЯ

 

В.В.Целищев

 

Проблему объяснения нового знания в математике можно назвать очередным скандалом в философии, наряду со “скандалом индукции” и другими трудно решаемыми проблемами. Большинству философов известны по поводу природы математического знания крайние точки зрения, например, позитивистский тезис о тавтологичности математических истин, или же тезис о решающей роли интуиции в познании математической реальности. Известны также множество промежуточных точек зрения по поводу получения нового знания в дедуктивных науках, ни одна из которых не может рассматриваться как достаточно убедительная. В данной статье представлена еще одна попытка понят механизм возникновения нового знания в математике. Содержание данной статьи состоит в выдвижении понятия задачи как основного понятия, позволяющего совместить два противоположных подхода к пониманию математики. Речь идет о понимании математики как естественнонаучной теории, и о понимании математики как некоторого универсального языка, или же исчисления. В качестве основного материала для демонстрации данного тезиса взят пример из вариационного исчисления.

Прежде всего, отметим основные черты обоих подходов к пониманию природы математических утверждений. Математика как естественнонаучная дисциплина предполагает, что ей присущи все методологические приемы и особенности науки, в частности, признание развития объекта исследования по мере расширения знания о нем. Это видение ориентировано на динамичное представление развивающихся структур знания, и согласно этой точке зрения объекты науки можно уподобить организмам, имеющим собственную историю и эволюцию. В ходе этой эволюции объекты претерпевают значительные изменения и превращения.

Понимание математики как универсального языка (можно добавить, природы) предполагает, прежде всего, постулирование фиксированной математической реальности, критерии существования математических объектов. При таком понимании объекты математики являются статичными, истины математики вневременными.

Ключевым пунктом расхождения двух подходов к пониманию математики является роль определения. При первом подходе определение вряд ли может играть нечто большее, чем просто эвристическую роль. При втором подходе определение является главным инструментом конструирования математических объектов.

Ключевым пунктом схождения двух подходов является проблема изменения смысла научных терминов по ходу развития науки, поднятая Фейерабендом и Куном. Но если в естественных науках можно настаивать на соизмеримости двух смыслов научных терминов, то в математике настаивать на этом весьма затруднительно.

Поэтому надо найти такой подход, который бы объяснил рост знания в математике. Новые результаты фиксированы определениями и доказательствами, но в то же время новые понятия вырастают из старых, и в процессе роста используется весь реквизит естественнонаучных (можно сказать, индуктивных) теорий – поиски простоты, индуктивные обобщения и пр.

Увязывание двух подходов к пониманию математики, произведенное с помощью двух решающих пунктов расхождения и схождения их, продемонстрировано на одном примере из вариационного исчисления. Рассмотрим пример, взятый из книги Л.Янга “Лекции по вариационному исчислению и теории оптимального управления”. – М., 1974. Пусть задана функция f трех переменных. Рассмотрим на плоскости (х, у) задачу отыскания минимума интеграла

 

I (c) = f (x, y, y’) dx

 

на классе кривых С, соединяющих две заданные точки. Кривые имеют вид y = y (x), где у (х) имеет производную y’(x). Эта задача станет нагляднее, если мы будем рассматривать кривые, заданные параметрическими функциями x (t), y (t) на соответствующих интервалах, на которых эти функции имеют производные x’(t), y ‘(t). В этом случае интеграл I(C), подлежащий минимизации, имеет вид:

 

            I (c) = F(x, y, x’, y’) dt

 

На практике f или F обычно бывают довольно простыми функциями, например

 

            f = √ (1 + y’2)                       или F = √ (x’2 + y’2)

 

В этом случае интеграл I(C) определяет длину кривой С. Задача состоит в том, чтобы определить длину конкретной кривой С, которая и доставляет искомый минимум. Как обычно, нужно доказать, что такая кривая вообще существует, то есть, нужно доказать теорему существования (для каждой конкретной задачи или класса задач).

Доказательство существования кривой, на которой интеграл достигает минимума, может показаться педантичной роскошью, поскольку такая кривая имеет наглядный смысл. В качестве платонистского объекта кривая вполне понятна и постижима: имеется определение кривой, она существует объективно, она требует своего открытия, и само математическое знание состоит в открытии, результат которого фиксируется определением. Само определение является семантической операцией, и семантика терминов играет важную роль. Действительно, такой объект как кривая с минимальным интегралом на ней должен существовать в качестве кривой, и семантика последнего термина уже определяет семантику первого термина. Безусловно, семантические рассмотрения определяются наглядностью, практическими соображениями и интуитивной ясностью. Мы предполагаем, что небольшие изменения в задаче не выведут нас за пределы понимания объекта платонистской реальности. Другими словами, мы ожидаем, что решением задач со слегка измененными условиями будут кривые, которые существуют в платонистской реальности, а обнаружение новых объектов не даст нам чего-то радикально отличного от кривой. Но если условия задачи изменяются значительно, мы можем получить новые объекты.

В отношении ожиданий подобного рода можно выделить две стратегии. С точки зрения математики как универсального языка, если доказана теорема существования, то объект существует реально, и может быть назван. Вопрос состоит в том, как его назвать? Что заставляет нас назвать новый объект при изменении условий задачи кривой? Семантические проблемы тут решаются определением. Для двух разных, хотя с интуитивной точки зрения похожих, объектов мы можем иметь два разных определения. Такое положение дел говорит о том, что указанный подход к пониманию математики является противоречивым. С одной стороны, он подразумевает платонистскую онтологию, а с другой стороны – полный произвол номиналистического толка, при котором каждый новый объект создается определением.

Ясно, что определения не являются произвольными, но они могут быть неудачными, бедными, противоречивыми, и т.д. Д. Гильберт говорил, что для теорем существования важны не столько процедуры доказательств, сколько хорошо продуманные определения. (Янг, с. 187 или 487). “Хорошо продуманные определения” явно выходит за пределы чисто семантических соображений, диктуемых пониманием математики как универсального языка. Здесь мы вынуждены обратить внимание на другой подход к пониманию математики, где математические объекты рассматриваются как “объекты естественного рода” (большинство объектов естественных наук являются как раз объектами естественных родов). Никакое определение не может исчерпать свойств этих объектов. Конечно, в случае математики мы не можем буквально считать ее объекты принадлежащими к категории объектов естественных родов. Но мы можем пойти на некоторый компромисс, и допустить, что объекты математики могут эволюционировать, и эта эволюция отражается в определениях. Этот динамизм отражается и на семантике, так что возможно, исходя из эволюционных рассмотрений, что новый объект будет называться все-таки кривой. Но для того, чтобы назвать новый объект кривой, нужны веские основания, которые выходят за пределы семантических рассмотрений. Эти основания зиждятся в натурализации математического знания, при которой математика понимается как типично естественная наука.

Натурализация математического знания позволяет устранить противоречие в рамках подхода к математическому знанию как к универсальному языку при приобретении нового знания. Если новый объект создается определением, тогда в этом есть некоторый акт произвола. Если же объект открывается, но нужно предположить, что определения вынужденно описывают уже существующие реально свойства. Таким образом, доказательство и открытие не всегда могут вести к одинаковому результатам. Для получения удовлетворительной картины математического знания нужды “хорошо продуманные определения”.

Здесь следует заметить довольно странный результат: в рамках понимания математики как универсального языка в противопоставлении с натурализованным пониманием математики различие между платонизмом и номинализмом исчезает. Другими словами, натурализация эпистемологии в применении к математике устраняет фундаментальнейшее различие традиционной философии математики. В этом можно усматривать преимущество проблемно ориентированного подхода к философии математики, где на первый план выдвигается понятие задачи.

Создание хорошо продуманных определений возможно за счет отказа от произвольных определений и более естественного понимания существования математических объектов, которое свойственно натурализованной эпистемологии математики. Но как избежать произвола в определении? Для этой цели рассмотрим изменение задачи, и получение контрпримеров определению объекта, являющегося решением исходной задачи.

Янг приводит пять контрпримеров (с. 219-224), заставляющих нас модифицировать понятие решения задачи об отыскании минимума функции. Все контрпримеры связаны с расширением класса функций, которое иногда вполне естественно. Вместе с тем, такое расширение иногда выглядит и не совсем естественным. В этом отношении характерно замечание Янга на с. 220: “Все это имеет такое же отношение к классическому варианту задачи о кратчайшем расстоянии, как задача отыскания самого большого англичанина к задаче определения самого крупного позвоночного”. А ведь речь идет об обобщении при переходе от класса гладких функций к классу таких функций, что интервал 0 ≤ t ≤ 1можно разбить на конечное множество отрезков, на каждом из которых функция x (t) либо монотонно возрастает, либо монотонно убывает. Это считается вполне скромным обобщением классического случая допустимых функций.

Другим расширением класса допустимых кривых является включение в него кривых, представленных разрывными функциями. Даже о простейших задачах поиска экстремумов, например, в задаче о минимальной поверхности вращения, имеющей вид (на плоскости t, x)

 

             dt = min               x (0) = 1 x (a) = b >1

 

нельзя получить I(C) ( I(C) – интеграл в классической вариационной теории) при разрывных функциях.

До сих пор контпримеры имели вполне “естественный” характер, и I(C) все-таки определяло кривую в “достаточно” расширенном, и одновременно умеренном смысле. На некотором этапе с виду невинные расширения задачи дают весьма радикальные отклонения от понятия кривой. Если кроме кривых, имеющих конечную длину (спрямляемые параметрические кривые) принять во внимание и некоторые кривые, имеющие бесконечную длину, то в результате в качестве решения некоторой задачи получаем две параллельные прямые, соединяющиеся в бесконечности. Такую структуру называть кривой не принято. Следует заметить, что мотивом появления такого неестественного понятия “кривой” является существование так называемых “дешевых” экстремалей. Определение “дешевых” экстремалей достаточно естественно: задача имеет дешевые экстремали, если для заданного ε > 0 существуют пара таких точек х1, х2, которые находятся друг от друга на расстоянии ½ х1- х2½< 1/e, и могут быть соединены такой экстремалью С, что I(C) < e. Как отмечает сам Янг, наличие “дешевых” экстремалей заметно отражается на задаче, и вместе с тем, “дешевые” экстремали имеют интуитивную основу.

Наконец, при рассмотрении некоторых задач решением может быть ломаная линия, а при определенных преобразованиях оно предстает в виде спиральной кривой, иногда с бесконечной длиной. При этом необходимо осуществить ревизию понятия кривой. Почему?

Дело в том, что всякий раз в контпримерах ставилась новая задача, вполне естественная с точки зрения обобщения исходных условий и определений. Обобщения достаточно невинные, и вместе с тем, мы приходим к тому, что в результате этих обобщений мы получаем решения, которые кривыми уже назвать трудно. Можно даже сказать, что в этих случаях у нас нет решений, поскольку нет “настоящих” кривых.

В этой истории с новыми задачами, рассматриваемыми как контрпримеры, есть два примечательных обстоятельства. Во-первых, это “малость” в изменении исходной задачи при постановке новой задачи, и как следствие, естественность этого перехода, и в противоположность этому, радикальное различие решений (если новое решение можно назвать решением, то есть, если его можно назвать кривой). Во-вторых, мы можем считать решения новых задач контрпримерами, монстрами, или же полагать, что надо расширить понимание кривой до такой степени, чтобы и объекты, кажущиеся монстрами, тоже считались кривыми. Оба указанных обстоятельства выглядят по разному в свете двух подходов к эпистемологии математики.

С точки зрения взгляда на математику как на универсальное исчисление нет ничего удивительного в первом обстоятельстве. Любая новая задача должна привести к новому решению (если, конечно, таковое существует). При таком подходе непонятна сама апелляция к “малости” изменения задачи, и так же непонятна апелляция к “радикальности” различий решений. Далее, с этой точки зрения у нас нет причин искать сходство объектов – результатов решений –старой и новой задач. С натурализованной точки зрения эти две апелляции вполне понятны и естественны, а искать сходство или различие вполне осмысленно. И вот тут мы переходим ко второму обстоятельству.

Что означает решение, рассматриваемое как контрпример? Согласно Д.Гильберту, “всякая задача вариационного исчисления имеет решение, если только слову “решение” придать соответствующий смысл”. Другими словами, и монстры могут рассматриваться как решения, если мы допустим расширения, скажем, понятия кривой до такой степени, чтобы допустить туда монстров. (Сама проблема допущения монстров может иметь характер исторического процесса, как это показано в известном примере Лакатоса в его “Доказательствах и опровержениях”, психологический характер, и т.д., но мы имеем здесь дело только с эпистемологическими вопросами).

Становится ясно, что оба варианта – рассмотрение контрпримеров как монстров, и рассмотрение монстров как членов нормально расширенного класса кривых – укладываются в рамки концепции математики как универсального языка. Весь вопрос заключается в том, что понимать под кривой.

Натурализованная эпистемология, конечно, отвергает такое понимание контрпримеров и монстров. Она признает некоторых монстров в качестве кривых, а для других отвергает этот статус. В любом случае натурализация предполагает некоторую селекционную работу, частью которой будут такие критерии как обобщение, простота, и т.п., о которых говорилось в начале статьи как свойственных естественным наукам. Но главное отличие натурализованной семантики состоит в понимании реальности.

С точки зрения математики как универсального языка, как уже говорилось, превалируют семантические соображения, и каждая новая задача создает свою реальность. С точки зрения натурализованной эпистемологии не все задачи “дотягивают” до реальности. Потому что здесь реальность понимается не как скопище платонистских объектов или номиналистических образований, а как реальность развивающихся организмов. Действительно, не всякая задача может рассматриваться как “нормальная”, дающая “нормальное” решение. Для этого требуется и доказательство теоремы существования, и нахождение нового объекта, и место для него в математической реальности.

Безусловно, не каждое признание объекта существующим будет правомочным, поскольку оно может быть произвольным, и не обеспечивающим монстру место в почтенном семействе кривых. Безусловно и то, что не всякое изменение задачи ведет к “интересной” реальности – ведь оно может привести к противоречивой картине, если решения вообще нет. Удачный выбор задачи и смена семантики являются результатом математического творчества. При этом значительную роль играет следование традиции (изменение семантики не может быть радикальным – все-таки новые объекты должны быть “кривыми”), и задачи должны быть интуитивно интересными, демонстрирующими здравый смысл математического предприятия.

Но тем не менее, реальность с соответствующими объектами создается новой задачей, и число реальностей множится постановкой новых задач (тут можно провести аналогию с многомировой интерпретацией квантовой механики, согласно которой новая реальность создается при каждом акте измерения). При этом реальности могут различаться по степени “успешности” – с хорошими объектами-решениями, с плохими, интересными и незаметными, тривиальными или креативными. Очевидно, семантические соображения должны как-то увязывать различные типы реальности. Можно даже представить некоторое отношение “достижимости” между этими реальностями, определенное в семантических терминов, по аналогии с семантикой для реалистической интерпретации модальной логики. Соответствующей семантикой мы свертываем, связываем или отделяем целые классы задач. Так, в результате введения целого класса контрпримеров, успешно встроенных в новую теорию “кривых”, мы имеем новую семантику термина “кривая”.

Но в процессе порождения новых реальностей и соответствующего изменения в семантике более важными представляются критерии, свойственные натурализованной эпистемологии. Старые и новые кривые должны иметь такое соотношение, которое в философии науки называется принципом соответствия. Более широкий класс кривых должен быть результатом обобщения. Обобщение понятий и экстраполяция законов на более общие понятия служат средством формирования новых гипотез. Если в сформировавшейся области знания обобщается система понятий, то естественна попытка расширить соответственно и область действия закона. Предполагается, что закон должен быть справедлив и для более общего понятия. По замечанию Ю.Ершова, когда Гильберт говорит об идеальных объектах, он считает, что при их введении с ними начинают работу как с конкретными объектами. Кроме того, новое понятие кривой должно упрощать теорию. “Одно замечание по поводу определений. С точки зрения номиналиста введенное определение ничего нового не дает. Если то, что доказывается – верно, то это следует из аксиом, то есть фактически уже известно. Здесь идея простоты проявляется следующим образом: из чисто утилитарных соображений введение подходящих понятий упрощает изложение, делает его обозримым, и в целом такое упрощение и является главным достижением. (Труды семинара по философии математики. Дата?).

Все эти соображения весьма конкретно иллюстрируются задачей о нахождении наилучшего пути при подъеме в гору. Существует решение Максвелла, согласно которому надо идти по “винту” с некоторым углом, а затем по геодезической. Но существует и другой путь – бесконечно малым зигзагом вдоль по геодезической. Но для получения решения подобного рода задачи нам нужно расширить класс допустимых кривых, то есть, рассмотреть класс кривых, содержащих бесконечно малый зигзаг.

Здесь встает вопрос о том, что значит расширить класс кривых. Это значит определить понятие кривой, что является задачей семантики. Здесь мы опять должны обратиться к гильбертовскому понятию “хорошо продуманного определения”. Янг иллюстрирует эту ситуацию понятием параметрической кривой Фреше. Обычно дается определение параметризации кривой, а затем задается эквивалентность двух параметризаций с тем, чтобы указать, когда две параметризации задают одну и ту же кривую, а когда – нет.

Параметризацией кривой называется непрерывная вектор-функция x (t), определенная на некотором интервале действительной оси, скажем t1 £ t £ t2. Если в x (t) подставить непрерывно строго возрастающую функцию t (t), определенную на t1 £ t £ t2, и такую, что t (t1) = t1 и t (t2) = t2, тогда получаем функцию x (t) = x (t (t)), которая является другой параметризацией той же самой кривой.

Замена параметра причиняет трудности в определении эквивалентности. Фреше задает определенные расстояния, и пространство кривых превращается в метрическое пространство. Эквивалентными параметризациями оказываются те, расстояние между которыми равно нулю. Но эта идея Фреше для вариационного исчисления не проходит. Тут нужно вычислять интеграл от лагранжиана L (x,x’) вдоль кривой С. А это значит, что нельзя использовать параметризацию до тех пор, пока не убедимся в существовании интеграла от L (x (t), x’ (t)). Поэтому надо модифицировать кривую Фреше.

Рассмотрим две кривые Фреше.

 

 

 

 

 

 

 

 

 

 

 

Одна задается порядком 1, 2, 3, 4 – кривая С1.

Вторая задается порядком 1, 3, 2, 4 – кривая С2.

В любой вариационной задаче I (С1) = I (С2).

Две параметрические кривые будут называться эквивалентными, если и только если, будут одинаковыми значения интеграла вдоль кривых от любого лагранжиана L. При этом класс параметрических кривых x (t), t1 £ t £ t2, эквивалентных данной, мы назовем кривой С.

То есть, фактически кривая – это операция I (C) криволинейного интегрирования вдоль кривой С. Таким образом, мы имеем обобщение понятия кривой, и здесь мы имеем новое определение, сделанное в типичном для натуралистического процесса виде. При этом получается гораздо более широкий класс кривых, которые являются решениями более широкого класса задач вариационного исчисления. Одновременно произведены все соответствующие семантические операции по называнию новых объектов кривыми.

Но такое называние должно еще продемонстрировать свои преимущества. Дело тут вот в чем. Обобщение класса кривых вполне естественно, в полном соответствии с процессом выдвижения гипотезы в научной теории. Вынужденно при этом производятся и изменения в семантике. Но такие изменения должны быть мотивированы чем-то большим, чем подобное вынуждение. Они должны создать новую сеть семантических понятий, пригодных для дедуктивной структуры. В результате семантических манипуляций мы должны иметь другую натуралистическую процедуру, скажем, упрощение.

В самом деле, новое понимание кривой должно продемонстрировать свою связи со старым понятием и свои преимущества над ним.

Рассмотрим векторное пространство x0 (А), элементами которой являются непрерывные действительные функции f (x), определенные в фиксированном ограниченном замкнутом пространстве А евклидова пространства. В качестве такой функции можно взять лагранжиан (с определенными уточнениями и оговорками). Зафиксируем кривую С и позволим изменяться функции f.


Для любой кривой С величина I (C), рассматриваемая при изменяющемся лагранжиане L, превращается в функцию g (f). Она имеет вид

 


            t1t2 L ( x(t), x’(t)) dt

 

Где x (t) – любая абсолютно непрерывная параметризация кривой, определенная на образе t1 £ t £ t2. Можно показать, что g (f) – это линейная ограниченная функция, а g – элемент дуального пространства x0* (А). Таким образом, кривая С представляет элемент g в пространстве x0* (А).

Итак, допустимые кривые превратились в некоторые элементы gÎx0*(А), а именно те из них, для которых существует по крайней мере одна такая абсолютно непрерывная функция f Îx0 (А) (t1 £ t £ t2), что для каждого элемента f Îx0 (А)

 

            g f = ∫t1t2 L ( x(t), x’(t)) dt

 

Теперь мы должны убедиться в том, что новый объект является более простым, нежели старый объект. Кривую С мы заменили операцией I (C) криволинейного интегрирования вдоль С, то есть, соответствующим элементом x0*(А).

По Янгу, достигнутое упрощение в понимании объектов математической реальности можно проиллюстрировать образом платоновской пещеры. “Классическое понятие кривой С точно соответствует кривым, которые мы видим и рисуем. Такие кривые могут извиваться и изгибаться вперед, назад, идти зигзагом, и кроме того, пересекать себя в множестве точек. Но все это представляет лишь тень подлинного объекта реальности. Если мы заменим это понятие понятием криволинейного интеграла I (C), тогда кривая превратится в элемент дуального пространства x0*(А). Наглядно эта ситуация представима таким образом

 

 


 


Конечно, мы не можем непосредственно увидеть этот элемент, поскольку видим только его тень С. Однако именно элемент g, не его тень С подчиняется критерию простоты, так как g – это линейная функция новой переменной f Îx0 (А)” (с. 243).

Таким образом, мы имеем некоторый критерий простоты. Дедуктивные преобразования привели нас к новым объектам, хотя и имеющим другую семантику, но все еще эквивалентным с дедуктивной точки зрения. Так что при взгляде на математику как универсальное исчисление мы опять сталкиваемся тут с парадоксом приобретения нового знания. А вот с точки зрения натурализованной эпистемологии математики новое знание состоит в достигнутом упрощении объекта. Упрощение тут двоякого сорта. Во-первых, получена линейная функция, а во-вторых, мы имеем более упорядоченную онтологию.

Рассматриваемая нами проблема объяснения нового знания в математике, таким образом, получает следующую трактовку.

1. Оценка того, что происходит при получении нового знания при математических преобразованиях, может вестись с двух альтернативных точек зрения на природу математического знания. Это взгляд на математику как на универсальное исчисление, где центральным понятием является понятие дедуктивного преобразования с сопутствующими семантическими изменениями в виде определений. Другой взгляд – это рассмотрение математики как естественнонаучной дисциплины, с присущей им эволюцией понимания объектов науки, где существенным является натурализованная эпистемология математического знания.

2. Оба подхода необходимы для понимания того, как получается новое математическое знание. Однако натурализация эпистемологии математики необходима там, где мы хотим понять эволюцию математической мысли. А именно в этом процессе кроется сущность приобретения нового знания.

3. Объединяющим элементом двух подходов является понятие задачи и проблемы. Категории, свойственные обоим подходам, довольно естественным образом объединяются, если в центр рассмотрения ставится понятие задачи.