Джон С. Николис
Электротехнических факультет Патраского университета Патрас, Греция
Хаотическая динамика лингвистических процессов и образование паттернов в поведении человека. Новая парадигма селективной передачи информации*
Взаимосвязь между символьным языком (будь то генетический код, естественный или компьютерный язык) и динамикой мышления, например, обработкой информации, всегда был (и в значительной степени продолжает оставаться) загадочным. Исторически первым, кто постулировал существование двусторонней взаимосвязи (функциональной обратной связи) между языком и обработкой информации, был лингвист Бенжамин Ли Уорф. В конце 50-х годов Уорф по существу показал, что скудный лингвистический репертуар резко ограничивает количество категорий, на которые пользователь языка делит внешний мир. На протяжении нескольких лет гипотеза Уорфа оставалась лингвистическим курьезом; правда, некоторые специалисты по структурной антропологии (работающие с аборигенами) восприняли ее вполне серьезно; они обнаружили, что в ряде случаев гипотеза Уорфа об относительности категорий явно подтверждается. Например, вместо семи условно отдельных категорий, на которые большинство индо-европейских языков подразделяет сплошной электромагнитный спектр, в диалекте “Басса” аборигенов Либерии существуют всего лишь две категории - поэтому эти аборигены могут воспринимать и назвать только два цвета, хотя физиологически аборигены отнюдь не страдают цветовой слепотой.
Такие примеры обнадеживают в следующем смысле: они наводят на мысль о том, что динамическое моделирование языка (располагающее обширным экспериментальным материалом из когнитивной психологии) может даже в худшем случае вершину церебрального айсберга - своего рода “программное обеспечение” обработки биологической информации. Какие минимальные средства необходимы нам из области нелинейной динамики в общем и хаотической динамики в частности, чтобы посмотреть макропараметры, характеризующие язык на синтаксическом уровне? Важно понять с самого начала, что сама потребность в символическом представлении динамического явления возникает из соображений чистой экономии, а именно из необходимости классифицировать явления такими способами, которые обладали бы достаточной компактностью и общностью (например, универсальностью) для того, чтобы допускать рассуждения по аналогии или унифицированное описание всего множества групп явлений, сходных с конкретным наблюдаемым явлением или изоморфных ему. Такой подход сразу приводит на память освященные многолетней традицией методы классической статистической механики, следуя которым мы принимаем за исходную заданную функцию плотности вероятности на микроскопическом уровне и вычисляем ее моменты и перекрестные моменты, тем самым образуя (в небольшом числе) коллективные свойства, которые выражают требуемые макропараметры или “параметры порядка” рассматриваемого явления.
Однако, во многих интересующих нас случаях, функции плотности вероятности весьма неоднородны или фрактальны. Отсюда проистекает либо невозможность сформировать немногочисленные коллективные свойства либо полное нарушение закона больших чисел.
Дойдя до этого места (нетерпеливый) читатель, возможно, сделает вывод, что от идеи создания динамической теории символьных процессов следует отказаться как от совершенно безнадежной. Апробированный временем метод построения абстракций путем взятия средних - отнюдь не единственный путь, по которому можно следовать. Более того, такой подход неверен в случае, когда несколько деталей паттерна, несколько ключевых слов в лингвистической схеме или несколько переменных динамической системы могут составлять львиную долю полного описания системы. В таких случаях взятие средних означало бы “стирание” характерных и имеющих решающее значение особенностей исследуемого паттерна и тем самым его полное замазывание. Эффективное уменьшение числа степеней свободы нелинейной динамической системы можно осуществить двумя более эффективными способами: во-первых, путем осознания одного замечательного свойства процессов фазового перехода, которое состоит в том, что в окрестности точки бифуркации динамика системы полностью определяется очень небольшим числом ключевых переменных, через которые могут быть выражены, и, во-вторых, путем указания на то, что в случае диссипативного хаоса число степеней свободы пространства состояний понижается, если существуют асимптотические устойчивые режимы (аттракторы). В такого рода случаях динамическая система, стартуя с некоторого множества начальных условий размерности N рано или поздно оказывается “самозаключенной” в некотором компактном подмножестве пространства состояний (аттракторе), который характеризуется гораздо более низкой размерностью.
Цель настоящей статьи заключается в том, чтобы предположить хаотическую модель минимальной сложности, которая, как я надеюсь, отражает наиболее заметные особенности лингвистической схемы (или, точнее, “подражает” им), будь то естественный язык, генетический код или искусственные тексты, как на синтаксическом, так и на семантическом уровнях.
Каковы же эти наиболее яркие, неотъемлемые характеристики лингвистической схемы на синтаксическом и семантическом уровнях? На синтаксическом уровне единственная цель языка состоит в грамматически правильном (допустимом) построении текстов (последовательностей слов, разделенных проблемами или паузами) с достаточной марковской памятью, которая должна позволить реципиенту построить код для обнаружения и исправления (одиночных или множественных) ошибок. Другая предпосылка заключается в том, что лингвистически допустимый текст должен обладать полярностью (палиндромы должны быть исключены). Например, текст на языке должен читаться слева на право или сверху вниз и т.д. Значению нет места на синтаксическом уровне.
С другой стороны, на семантическом уровне значение должно возникать, при однозначном разбиении множества недифференцированных “сырых” (идущих из окружающей среды) раздражителей, бомбардирующих рецепторы пользователя. Такое разбиение должно отображаться на множество сосуществующих категорий - воспоминаний или “резюме”, например, на притягивающие (и сжимающие) подмножества. Следовательно, какой-то механизм должен быть включен для обеспечения перемежающих скачков когнитивного процессора с аттрактора на аттрактор, тем самым для создания метаязыка коммуникации между существующими категориями - аттракторами.
Общей характеристикой как на синтаксическом, так и на семантическом уровнях является высокая селективность языка. Читая любой текст, например, написанный на естественном языке, располагающим L символами (включая пробел), мы неизменно отмечаем появление весьма небольшого подмножества априори возможных предложений длины Y (число элементов такого подмножества равно L y ). Если бы это было не так, то вероятность, например, в английском языке предложения умеренной длины в 300 символов была бы равна 27-300 , т. е. своего рода чудом! Аналогично, если бы все полипептидные цепи в генетическом коде были грамматически допустимы, то априорная вероятность встретить какой-нибудь данный протеин умеренной длины, например, состоящий из ~ 300 аминокислот, составила бы 20-30 , что также граничит с чудом! По некоторым причинам на практике реализуется (и , следовательно, грамматически допустимо) лишь небольшая доля всех L y возможных комбинаций. И тексты на естественных языках и генетические тексты обладают полярностью.
С другой стороны, на семантическом уровне аналогичный процесс фильтрации происходит когда (человеческий) процессор сканирует изображение. В отличие от методов, используемых искусственным интеллектом (который не прибегает к “растризации” изображения и уделяет равное внимание всем возможным особенностям изображения), мы с самого начала отбрасываем подавляющее большинство всех особенностей изображения, в результате чего нам процессор “сосредотачивает” свое внимание попеременно на небольшом подмножестве деталей, в частности, на “заметных” деталях. Наконец, не следует забывать о самосогласованности - характеристике любой лингвистической схемы, существующей, так сказать, на интерфейсе между синтаксическим и семантическим уровнями. Самосогласованность любого самореферентного лингвистического утверждения, доказательства которого на чисто логической основе может оказаться неразрешимой задачей, утрачивает свой неприступный характер, если в проблему включить динамику, например, если такое утверждение изоморфно отобразить на цифровую петлю обратной связи и затем изучить асимптотически устойчивые режимы (аттракторы) петли. Для тех подмножеств начальных условий, для которых аттракторы существуют, утверждение самосогласовано; в противном случае его логическое замыкание оказывается не имеющим доказательной силы.
Любой акт обработки информации включает в себе две различные фазы: фазу расширения и вазу сжатия, которые могут быть реализованы организмом либо последовательно, либо (как это происходит обычно) в унисон с помощью рекурсивной петли обратной связи.
Таким образом, для биологического процессора настоятельно необходимо обладать сосуществующими хаотическими странными аттракторами, чтобы удовлетворить этим двум требованиям (стационарные состояния и предельные циклы существуют только для фазы сжатия и полезны лишь как классификаторы если процессор уже задан или породил множество альтернативных откликов, т.е. реакции на “сырые раздражители” поступающие из окружающей среды).
Помимо прочего хаотический странный аттрактор служит своего рода deux ex machina, который своими положительными показателями Ляпунова создает разнообразие, или энтропию, усиливая первоначальные погрешности по соответствующим направлениям в пространстве состояний и порождает порядок (информацию), сжимая (уменьшая) погрешности в направлениях, характеризуемых отрицательными показателями Ляпунова. Более общо, мы можем утверждать для лингвистических процессов, что тонкое взаимодействие между непредсказуемостью (разнообразием) и надежностью (порядком), лежащее в основе любой лингвистической схемы типично для поведения некоторого класса нелинейных диссипативных динамических систем малой размерности. В таких системах возникающая непредсказуемость, обусловленная в сущности нелинейным характером протекающего в них процесса проявляется двояко.
В качестве компенсации существуют три механизма, смягчающие непредсказуемость и устанавливающих некоторый порядок.
К аттрактору, моделирующему дуальный аспект когнитивной системы (или “процессора”) предъявляются два основных требования: большой объем динамической памяти и хорошая сжимаемость. Устойчивые стационарные состояния и устойчивые предельные циклы информационной размерности нуль и один служат очень плохими модулями памяти для хранения динамической информации. Вместе с тем они идеальны в качестве устройств для сжатия информации или “фотографических” категоризаторов. С другой стороны странные аттракторы через гармоническую комбинацию расширяющихся и сжимающихся траекторий, очень пригодны для хранения динамической и селективной информации, причем, будучи “аттракторами”, они служат и как устройства для сжатия информации.
Классически странный аттрактор в одномерном пространстве - это самоподобное канторовское множество хотя не обязательно симметричное. Если такое множество характеризуется одной фрактальной или хаусдорфовой размерностью, то мультифракталы описываются двумя наборами масштабных показателей, одним - для фрактальной “пыли” интервала ( для множителя-носителя), другим - для вероятностей инвариантной меры.
Эти разновидности динамики мы надеемся использовать для построения примитивных лингвистических схем, в свойствах которых обнаруживается смесь порядка (простые грамматические правила) и разнообразия (непредсказуемость и информация). Для этого естественно ждать на единичном интервале с простым унимодальным (например, логическим) отображением произвольное разбиение на подъинтервалы, каждый подъинтервал соответствует какому-то символу. (В качестве одного из таких символов можно выбрать пробел, разделяющий строки символов на слова.) Однако, необходимо соблюдать осторожность. Чтобы построить алфавит, который остается инвариантным относительно потока (или каскада) итераций, поражающего текст, необходимо позаботиться о том, чтобы выбранное разбиение было марковским, т.е. разбиением на непересекающиеся подъинтервалы. Это означает, что граничные точки между двумя примыкающими друг к другу интервалами должны оставаться инвариантными относительно динамики. Порождая марковские строки, мы используем итерации (грубозернистых) отображений, обладающих гладкой инвариантной мерой. При этом мы не ищем какой-либо особой привязки к лингвистическим схемам. Однако мы не упускаем из виду вторую возможность: порождение марковских строк высокого порядка, явно обладающих нарушенной симметрией в одномерном случае. Идея состоит в том, что богатые информацией одномерные строки, обладающие асимметрией в физическом пространстве (например, непалиндромы) могут быть в принципе порождены хаотическим диссипативным потоком (характеризуемым необратимостью во времени). Необходимость нарушения симметрии при моделировании строк берет начало от естественных языков (где она является просто эмпирическим фактом) и обретает еще большее значение из-за (универсального) характера генетического кода.
Выбрав за исходную детерминистическую динамическую систему, функционирующую в хаотическом режиме, можно породить строки символов, подчиняющиеся вполне определенной марковской статистике. Комбинируя строки символов в слова, прерываемые пробелами (паузами), мы получаем статистику, характеризуемую степенным законом с отрицательным показателем, аналогичным закону Ципфа экспериментальной лингвистики. В последнее десятилетие или около того статистические степенные законы стали предметом интенсивных исследований в связи с самоподобными (фрактальными) процессами в физике , биологии, когнитивной психологии и социальных науках. Степенные законы с отрицательными показателями были приписаны распределению природных констант, что не удивительно, если принять во внимание, что природные константы выражают инвариантности относительно либо масштабных преобразований либо параллельных переносов (сдвигов) и вращений.
Обобщая, мы можем рассматривать динамическую теорию предодбора и предадаптации в процессе обработки биологической информации. Неоднородные диссипативные хаотические потоки обусловлены мультифрактальностью - как внутри аттрактора, так и в перемежающихся перескоках между существующими аттракторами (хранилищами памяти) в биологическом процессоре, отвечающем за жесткое ограничение числа возможных видов. Естественный отбор при таком подходе действует на небольшом подмножестве аттракторов, прошедших предотбор. Фазовые переходы на мультифрактальных множествах (носителях неоднородных перемежающихся хаотических потоков) могут рассматриваться как движущий механизм, стоящий за ненепрерывной предэволюцией в биологических системах, в которых происходит обработка лингвистической информации на обеих группах уровней - синтаксическом и семантическом.
Фазовый переход на мультифрактальном множестве сводится к резкому изменению распределения (нормируемой) инвариантной мерой на множестве- носителе и, следовательно, к резкому изменению весовых множителей каждого из символов, наложенного на множество (марковского) разбиения. Таким образом, мы предлагаем новый принцип отбора, действующий через неоднородную перемежаемость в фазовом пространстве (например, через мультифрактальный странный хаотический аттрактор) этот принцип отвечает за сильно нелинейный лингвистический процесс фильтрации, который существенно ограничивает
Наш принцип отбора носит априорный характер, в то время как естественный отбор носит характер апостериорного принципа, распространяющегося на фенотипы, например, на аттракторы, посредством смещения управляющих параметров, приводящего к генерированию (элиминации) слияния (кризисам) сосуществующих аттракторов-категорий.
Перевод Ю. А. Данилова