КАТЕГОРИЗАЦИЯ В ЕСТЕСТВЕННЫХ ЯЗЫКАХ ДЛЯ ГЛАГОЛОВ ПОВЫШЕННОЙ АРНОСТИ

Автор: Поляков О.М.

Категоризация в естественных языках для глаголов повышенной арности

к.т.н., доцент О. М. Поляков Санкт-Петербургский государственный университет аэрокосмического приборостроения

Санкт-Петербург, Россия Road.Dust. SPb@gmail.com

Аннотация. Клингвистика — новое аксиоматическое направление в когнитивных науках, которое занимается изучением моделирования мира сознанием. Основу аксиоматики составляют аксиомы категоризации. Аксиомы категоризации позволяют построить системы взаимосвязанных категорий, отталкиваясь от поведенческого аспекта объектов. Однако часто поведение объектов оказывается более сложным, чем бинарное взаимодействие.

Цель — математически обосновать категоризацию для отношений, арности большей двух, а также обосновать другие случаи высокой арности глаголов в языке. Сформулирован метод представления соответствия Галуа для арности, большей двух. Доказана теорема о сохранении информации об отношении в этом случае. Показано, что расширение соответствия Галуа на п-арный случай категоризации с точностью до пустой категории создает в точности такие же категории, что и бинарный случай. Определены математические условия возникновения псевдовысоких арностей глаголов в языках. Показано, что они сводятся к многозначным зависимостям, действующим между атрибутом подлежащего и дополнениями. В заключении сформулированы некоторые соображения относительно арностей глаголов в естественных языках.

Введение

Предсказательный характер деятельности сознания очевиден. Предсказание является главным эволюционным преимуществом человека, позволившим ему занять высшую ступень в иерархии живых существ на Земле. Предсказание невозможно без модели и, следовательно, определение принципов построения такой модели является важнейшим направлением в рамках развития когнитивных и кибернетических наук. Язык, как система, обслуживающая мышление, является в значительной степени производной от процесса моделирования мира. R-лингвистика пытается построить математически обоснованную модель деятельности сознания по структурированию знаний о мире. Это новый вид модели данных, обладающий способностью к прогнозу. Начальная аксиоматика посвящена категоризации, причем главным ее направлением является глагольная категоризация. К сожалению, соответствие Галуа, лежащее в основаниях такой категоризации, не распространяется на арность глаголов выше второй. Эта статья призвана восполнить указанный пробел. Кроме того, здесь будет математически описан широко представленный в языке случай псевдовысоких арностей глаголов.

Аксиоматика категоризации

В основе моделирования мира и формирования естественных языков лежит процесс формирования категорий. В [1] определена следующая аксиоматика формирования категорий. Пусть U — универсум объектов и 9 — оператор, который по любому множеству Х объектов из U (примеров категории) формирует категорию в виде множества объектов, удовлетворяющих двум аксиомам категоризации:

А1 X Q в(Х) (аксиома экстенсивности);

А2 если К — категория, то из X Q К следует в (X) Q Я"(аксиома корректности).

Аксиома экстенсивности означает, что множество примеров, формирующих категорию, всегда входит в категорию на том простом основании, что это примеры данной категории. В частности, в силу максимальности U и аксиомы А1 получаем U = 0 (U) (универсум является категорией). Аксиома корректности в свою очередь требует, чтобы никакое множество примеров категории в процессе категоризации не могло выйти за пределы этой категории. Другими словами, если К — категория «деревья», то никакое множество примеров деревьев не позволяет сформировать категорию «кусты» или «древокусты», хотя при некотором наборе примеров может сформироваться более узкая категория, скажем, «фруктовые деревья».

Как показано в [1], данная система аксиом эквивалентна системе аксиом замыкания:

А1 X Q в(Х) (аксиома экстенсивности);

С1 в(Х) = в(в(Х)) (аксиома идемпотентности);

С2 из X Q Уследует в(Х) Q в(У) (аксиома монотонности).

Кроме того, система замкнутых множеств (категорий) определяет муровское семейство [1, 2] относительно операции пересечения замкнутых множеств, являющееся полной решеткой [3], в которой роль sup выполняет точная нижняя грань.

Разумеется, оператор замыкания может быть задан различными способами [1], из которых важнейшим для лингвистики является глагольный, основанный на соответствии Галуа [3, 4], определенном для бинарных отношений (бинарных глаголов: подлежащее — глагол — прямое дополнение) или предикатов от двух переменных. В лингвистике глагольная категоризация практически всегда предшествует признаковой, а иногда, когда необходимые признаки найти не удается, глагольной категоризацией завершается процесс определения категории. Хорошо известен пример Л. Витгенштейна [5] с категорией «игра», которая не может быть выражена в признаках. Аналогично, например, категория «хищники» столь разнообразна, что не имеет общих признаков, характеризующих ее элементы. Росянка, лев, окунь и богомол являются хищниками, но не имеют общих признаков: их объединяет одинаковое поведение по трофическому отношению.

В [1] соответствие Галуа задается следующим образом.

Пусть 8 (и, V) — бинарное отношение с атрибутами и и V (8 £ Би ^ Dv, где Би и Dv — домены атрибутов и и V соответственно). Пусть также х е Би. Обозначим через х4 множество всех элементов у е для которых (х, у) е S. Аналогично символом у7 (у е Б^) обозначим множество элементов х е Би, для которых (х, у) е S. Операторы 4 и V распространяются на произвольные подмножества следующим образом:

= Пхе*ХЛ | (X £ ^); г7 = ПуеуУ7 | (Г £ ^).

Для пустого подмножества полагаем 04 = Dv и 07 = Би.

Нетрудно показать [1], что операторы 47 и 74 являются операторами замыкания на Би и Dv соответственно. При этом между муровскими множествами, определенными таким образом на Би и операторы 4 и V задают дуальный изоморфизм. В дальнейшем по аналогии с оператором топологического замыкания [6] систему муров-ских множеств, удовлетворяющую аксиомам А1 и А2 будем называть лингвистическим пространством (или просто пространством). В [1] определена также операция сведения пространств, которая состоит в том, что сведённое пространство образуется из всех категорий пространств-операндов, плюс все недостающие пересечения этих категорий. Сведённое пространство является наименьшим пространством, содержащим пространства-операнды.

Расширение соответствия Галуа на произвольную

конечную арность

В языке существуют не только унарные и бинарные глаголы. Как минимум широко распространены и тернарные глаголы, которые предполагают обязательное участие не только подлежащего, прямого, но и косвенного дополнения, например, глаголы передавать, дарить, просить, обвинять и т.д.

Пример 1. В таблице 1 приведено тернарное отношение «передавать» с атрибутами: КТО (передает) — 1, КОМУ (передает) —2, ЧТО (передает) — 3.

В качестве домена (универсума) для каждого атрибута отношения будем использовать проекцию S[i] ^ = 1, 2, 3) отношения на соответствующий атрибут (атрибуты). Отношение (табл. 1) можно рассматривать как бинарное между двумя проекциями, например, на 8[1] х S[2, 3]. Пространство и дуальное пространство для этого отношения изображено на рисунке 1, а.

В дуальном пространстве для S[2, 3] каждое понятие представляется бинарным отношением (рис. 1 , а, правое пространство), поэтому для каждой такой категории можно также построить пространство и дуальное пространство. Результат этого перехода от бинарных отношений-категорий к соответствующим пространствам изображен на рисунке 1, б.

Таблица 1

Отношение для глагола «передавать»

Кто (1) Кому (2) Что (3)

Х1 у1 Z1

Х2 у1 Z1

Х1 у2 Z1

Х2 у2 Z1

Х1 у1 Z2

Х3 у1 Z2

Рис. 1. Лингвистические пространства тернарного отношения

Подобную вложенную систему лингвистических пространств удобно представить в виде дерева (рис. 2). Здесь корень дерева соответствует пространству 1, первый уровень — пространству 2 и конечные вершины — простран1

ряра

На рисунке 2 дуги дерева отмечены именами категорий соответствующего пространства. Для примера: самый левый лист дерева кроме отметки номера категории имеет отметку пути от корня к листу. Например, запись Рг(Рк> Ру) означает, что тернарный глагол соединяет три категории: КТО передает — Р,1 = {х:, х2, хз}; КОМУ передает — Ру1 = {у:, у2}; ЧТО передает — Р^ = 0. Итак, каждый путь от корня дерева к концевой вершине содержит некоторую возможную (пока смысловую, а не языковую) фразу из категорий, связанных глаголом «передавать».

Определение 2. Дерево на рисунке 3 назовем понятийным иерархическим представлением (ПИП) глагола (отношения S).

Понятно, что для отношения любой арности можно построить такое дерево, причем арность определит его высоту. Кроме того, надо заметить, что в примере 1 первое пространство находилось в привилегированном положении, а именно: атрибут 1 был выбран первым в п-арном отношении, и ему было сопоставлено (п - 1)-арное отношение. Впрочем, в качестве первого атрибута можно было бы выбрать любой другой.

Определение 3. Пространство атрибута, выбранного в качестве первого, называется безусловным пространством этого атрибута. Собственно, в языке ему соответствует подлежащее. Все остальные пространства называются условными. Условность каждого из условных пространств определяется категориями (условиями) в ПИП, лежащими на пути от корня дерева до атрибута условного пространства.

Лемма 4. По любому ПИП можно восстановить исходное п-арное отношение.

Доказательство.

Для п = 2 пусть (х, у) е S, тогда (х, у) е (х47) х (х4), так что в ПИП это соответствует пути из корня дерева по дуге, отмеченной категорией х47, в концевую вершину, отмеченную категорией х4. Обратно, если (х, у) входит в декартово произведение Р1 х Р2 категорий, лежащих на пути из корня в некоторый лист, то по построению ПИП Р14 = Р2 и, значит, (х, у) е S. Пусть лемма справедлива для п = к и пусть отношение S имеет арность к+1. Рассмотрим

ству 3. Ветви дерева одного уровня слева направо соответствуют категориям соответствующего пространства, выбираемым слева направо и сверху вниз.

«РА Ру)

некоторое ПИП отношения S, у которого корень помечен номером г Каждая дочерняя вершина корня ПИП является корнем поддерева ПИП к-арного отношения 8(Р1) для некоторой категории (р1) пространства ^ По нашему предположению совпадает с объединением произведений понятий, помечающих ветви поддерева от корня поддерева до листьев поддерева, тогда, в соответствии с бинарным случаем, объединение всех произведений Р х Б(р[)) будет равно S.

Замечание 5. В ПИП отношения S на дугах могут встречаться пустые категории соответствующих пространств. В этом случае удаление из ПИП путей из корня в лист, содержащих такие понятия, с учетом доказательства леммы 4 не влияет на восстанавливающую способность ПИП. В связи в этим будем говорить, что два пространства почти равны, если они отличаются не более, чем на пустую категорию. Аналогично, одно пространство почти принадлежит другому, если все непустые категории одного пространства входят в другое пространство.

Определение 6. П-образующими лингвистического пространства называются категории, которые нельзя представить в виде пересечения других категорий.

Из определения 6 следует, что все категории лингвистического пространства либо являются П-образующими, либо могут быть получены пересечением некоторых П-образующих.

Предложение 7. Если Эи4 ф 0 (Эу7 ф 0), то для любой П -образующей найдется элемент у (х) такой, что у7 (х4) совпадает с этой образующей. Если же Эи4 = 0 (Эу7 = 0), то предложение справедливо для всех П-образующих, исключая Эи фу).

Доказательство.

Пусть Х — П-образующая, для которой Х4 = У ф 0. Тогда X = Пу^ у7. Если в У найдутся такие элементы у, что X с у7 и их пересечение равно Х, то Х не является П-образующей. Следовательно, в У нет таких элементов и Х совпадает с некоторой категорией у7 (у е У). Аналогично для П-образующих на Эу.

Ру1) IV Р,1 р*3 Р.2 р,1 Ш Р,1

Рис. 2. Понятийное иерархическое представление глагола «передавать»

Теорема 8. Пусть 8 — тернарное отношение. Для каждого х первого атрибута определим бинарное отношение БХ с Б[2] х Б[3] следующим образом: (у, 7) е 8х тогда и только тогда, когда (х, у, 7) е 8. Обозначим через Ц операцию сведения пространств, а сами пространства обозначим через Р с соответствующими индексами. Тогда Р3 — Цхе^] Рз, где отношение — означает отношение почти равенства из замечания 5, а Р3 обозначает пространство по третьему атрибуту отношения 8х. Аналогично для атрибута 2.

Доказательство.

В соответствии с предложением 7 выберем некоторые х, у. Тогда (х, у)4 — категория безусловного пространства Рз. Но тогда для 8х имеем у4 = (х, у)4 и (х, у)4 е Р3, а значит, в соответствии с определением операции сведения, (х,у)Л 6 ЦхеЭД Р3. В соответствии с предложением 7 получаем Р3 с ЦжеЭД Р3. Обратно, пусть Ъ Ф 0 и Ъ 6 Цжезд Р3. Тогда найдутся такие х1 6 Б[1], (I = 1, ..., к), что для каждого 1 и отношения 8х1 в условном

Разумеется, если в качестве начального взять, допустим, третий атрибут, то условные пространства по второму атрибуту изменятся, но их сведение по-прежнему с точностью до пустой категории даст безусловное пространство. Почему это так важно? Потому что безусловное пространство атрибута соответствует случаю, когда данный атрибут выступает в качестве подлежащего, а условные пространства характеризуют понятия, которые занимают место прямых и косвенных дополнений. Полученный результат позволяет нам быть уверенными, что изменение статуса атрибута в предложении не может породить новых категорий в сравнении с положением этого атрибута в качестве подлежащего. Случай арности большей трех получается индукцией по арности.

Теорема 9. Для любого п-арного отношения 8 (п > 2) и любого атрибута А категории условных пространств по этому атрибуту с точностью до пустой категории совпадают с безусловными категориями.

Доказательство.

Случай п = 3 соответствует теореме 8. Пусть теорема верна при любом т < пи пусть 8 имеет арность п + 1. Пусть также для (п + 1)-арного отношения 8 построено ПИП, имеющее п + 1 ярус. Выберем в ПИП произвольный атрибут, расположенный на 1-ом ярусе. Если 1 = 1, то формируемое пространство для этого атрибута по определению является безусловным. Если 1 = 2, то в каждом поддереве, начинающемся со второго уровня, согласно индукционному предположению лингвистическое пространство

пространстве на 8 [2] найдется категория У1, которой по условному глаголу соответствует категория Ъх1, такая, что Ъ = ПХ1 ЪХ1. Но ЪХ1 = Пу6-гХ1уЛх1 по соответствующему условному глаголу. То есть ЪХ1 = ПуеуЖ!( х1, у)4, а значит, ЪеРз.

Итак, для тернарных отношений сведение условных пространств с точностью до пустой категории равно безусловному пространству. Например, для отношения в таблице 1 безусловное пространство для второго атрибута (КОМУ) показано на рисунке 3, а. На рисунке 3, б изображены условные пространства для этого атрибута, а на рисунке 3 , в показано сведенное пространство для всех условных пространств, которое с точностью до пустой категории совпадает с безусловным пространством. Заметим, что, например, после фиксации категорий первого атрибута, условные пространства второго и третьего атрибутов находятся в равном положении независимо от их перестановки (рис. 1, б).

0 н

для каждой вершины второго уровня с точностью до пустой категории совпадает со сведением условных лингвистических пространств, на каком бы уровне от 3-го до п + 1 в другом ПИП они ни находились. Это в свою очередь означает, что, если бы 3 < 1 < п + 1, то, перестроив каждое поддерево второго уровня ПИП так, чтобы атрибут 1 занял место в вершине поддерева второго уровня, мы в силу индукционного предположения не породили и не потеряли бы категории в лингвистических пространствах этого атрибута. Итак, без потери общности достаточно рассмотреть только случай 1 = 2.

Каждой вершине второго уровня соответствует парное отношение без атрибута 1, которое получается выделением из отношения 8 кортежей, у которых первый атрибут принимает значения из категории Р1 с последующим проектированием этого отношения на атрибуты 2...п + 1. Для отношения 3(р1) строится лингвистическое пространство для каждой вершины второго уровня, причем при этом построении рассматривается соответствие Галуа между значениями второго атрибута и остальных атрибутов 3...п + 1 как единого атрибута, значениями которого являются кортежи длины п - 1 со значениями атрибутов 3. п + 1. Другими словами, мы можем рассматривать отношение 8 как тернарное отношение на атрибутах 1, 2 и (3...п + 1). Тогда по теореме 8 безусловное лингвистическое пространство атрибута 2 получается сведением (с точностью до пустой категории) лингвистических пространств, получаемых по отношениям $(Р10, которые в

№ У1У2 У1У2

У1 У1 0

0 б

Рис. 3 . Условные лингвистические пространства

свою очередь получаются сведением условных пространств, когда атрибут 2 занимает более низкое положение в ПИП. Но операция сведения является ассоциативной, что и завершает доказательство теоремы.

Псевдовысокие арности глаголов

Итак, категории сохраняют стабильность независимо от их места в предложении и арности глагола. Надо иметь в виду, что до сих пор мы рассматривали глаголы (предикаты), арность которых определяется природой отношений, соответствующих этим глаголам. Но в языке сплошь и рядом встречаются высокие арности (множественность косвенных дополнений), которые, однако, не связаны с природой глаголов. Эта ситуация часто вводит в заблуждение логиков [7], занимающихся языком, поскольку создается впечатление, что в языке может произвольным образом меняться размерность предикатов. Здесь мы рассмотрим механизм появления таких высоких арностей.

Может ли арность отношения возрастать без увеличения арности глагола? Почему глаголы большей частью бинарные? Эти, казалось бы, разные вопросы имеют в качестве источника один ответ: многозначные зависимости данных [8, 9]. Напомним, что в отношении S(ABC) выполняется многозначная зависимость (МЗ) A^>B, если и только если из того, что (A, B, C) е S, (A, B&, C&) е S следует (A, B, C&) е S. Здесь А, В и С — некоторые наборы атрибутов, причем В П С = 0. Такое «кортежное» симметричное определение позволяет сформулировать правило дополнения: МЗ A^>B в отношении S(ABC) выполняется тогда и только тогда, когда в этом отношении выполняется МЗ A^>C. Главное свойство МЗ состоит в том, что она обеспечивает декомпозицию отношения на две части без потерь: в отношении S(ABC) выполняется (МЗ) A^B, если и только если из проекций этого отношения S[AB] и S[AC] с помощью операции соединения можно восстановить исходное отношение S(ABC). Если С пусто, как, например, в S[AB], то по определению МЗ всегда выполняется A^>0 и, значит, по правилу дополнения в S[AB] всегда выполняется МЗ A^>B. Обилие в языке бинарных глаголов как раз и объясняется тем, что они вычленены с помощью МЗ из более общих наблюдаемых взаимодействий.

Что будет происходить, если к атрибутам A^>B в отношении будут добавляться дополнительные атрибуты с сохранением МЗ A^>B? Это будет означать, что новое отношение может быть без потери информации разложено на два отношения с атрибутами AB и атрибутами AC, где C — добавленные атрибуты. Итак, по отношению AB сохранятся уже существующие категории с глаголом между ними, а отношение AC может определить новые категории на А. Поскольку в новом общем отношении ABC одновременно действуют сразу два отношения S[AB] и S[AC], то категории на B и C будут определяться, исходя из бинарных отношений, а категории на A фактически будут представлять из себя пересечение категорий по одному и другому отношению.

обычно такой случай представляется двумя предложениями с глаголами отношений AB и AC. В тех случаях, когда можно использовать одно название глагола для обоих атрибутов B и C, объекты по атрибуту C превращаются в косвенные дополнения («девочка била мальчика палкой»). Теперь надо выяснить условия стабильности многозначных зависимостей при добавлении или изъятии некоторых атрибутов отношения. Без понимания этих условий говорить о косвенных дополнениях невозможно.

Обычно зависимости данных рассматриваются для фиксированных схем отношений, поэтому необходимо уточнить ситуацию, когда схема отношения меняется. Рассмотрим сначала случай уменьшения числа атрибутов в отношении, который, разумеется, не затрагивает МЗ Л^Б.

Предложение 10. Пусть в отношении S на атрибутах АВСD выполняется МЗ А^В. И пусть S& — проекция отношения S на атрибуты АВС. Тогда в S& справедлива МЗ А^В.

Доказательство.

Итак, пусть (х, у, ъ) е S& и (х, у&, ъ&) е S&, где х, у, ъ — значения атрибутов Л, Б, С соответственно. Поскольку S& — проекция отношения S на АВС, найдутся такие значения атрибута D V и у&, что (х, у, ъ, у) е S и (х, у&, ъ&, у&) е S. Поскольку в S выполняется МЗ А^>В, то (х, у, ъ&, у&) е S, а значит, (х, у, ъ&) е S&, и в S& также выполняется МЗ А^>В.

Итак, уменьшение числа атрибутов в отношении не отменяет справедливость многозначных зависимостей. При этом сохраняется не только МЗ А^>В, но и дополнительная к ней МЗ А^>СD. В самом деле, поскольку в проекции согласно предложению 10 выполняется МЗ А^>В, то по правилу дополнения выполняется и МЗ А^>С.

Рассмотрим теперь случай увеличения числа атрибутов в отношении. Здесь все не так очевидно, поскольку существуют встроенные многозначные зависимости, то есть такие МЗ, которые выполняются в проекции, но не выполняются в самом отношении. Пример такого отношения представлен в таблице 2.

Таблица 2

Встроенные МЗ _

A B C D A B C

a b c d a b c

a b& c d a b& c

a b c& d& a b c&

a b& c& d a b& c&

a& b& c& d& a& b& c&

В правом отношении на атрибутах ABC (проекция) выполняется МЗ А^>В, но она не выполняется в левом отношении на атрибутах ABCD. Такие МЗ как раз и называют встроенными. Итак, мы видим, что произвольное приписывание значений атрибута D к кортежам отношения на ABC может «разрушить» существующую МЗ.

Теорема 11. Пусть в отношении S& на атрибутах АВС выполняется МЗ А^В. И пусть к отношению S& добавляется атрибут D и кортежи отношения S& дополняются значениями атрибута D для получения отношения S. Если это добавление осуществляется так, что в S выполняется МЗ A^>D, то в S также выполняется и МЗ А^>В.

Доказательство.

Пусть (х, у, z, у) е S и (х, у&, 7&, у&) е S. Для того, чтобы в S выполнялась МЗ А^>В надо показать, что (х, у, 7&, у&) е S. Поскольку (х, у, z) е 8&, (х, у&, 7&) е 8& и в S& выполняется МЗ А^>В, то (х, у, 7&) е 8&, а значит, существует V&& такое, что (х, у, 7&, у&&) е S.

Поскольку (х, у, 7&, у&&) е S, (х, у&, 7&, у&) е S ив S выполняется МЗ А^Э, то (х, у, 7&, v&)еS, а значит, в S выполняется МЗ А^В.

Если С = 0, то условия теоремы 11 вырождаются в аксиому вывода «дополнение».

Теорема 11 говорит о том, что если косвенные дополнения добавлять аккуратно, то сохраняется не только би-нарность начального глагола, но и те пространства, которые он образует, поскольку сохранение МЗ А^В означает возможность выделить АВ без потери информации в отдельное первоначальное отношение. Это в свою очередь означает, что новые дополнения должны быть независимы от уже находящихся в отношении.

Рассмотрим пример с глаголом «бить» в предложении «девочка била мальчика». Здесь «бить» выступает в качестве бинарного глагола. Понятно, что имеется в виду конкретная девочка и конкретный мальчик. Категории «девочка» и «мальчик» в этом предложении фактически задают области определения переменных, которые принимают значения конкретных участников события. Если взять отношение между людьми и орудиями избиения и добавить его к этому предложению, то, например, получим: «девочка била мальчика палкой». На самом деле, новое отношение соответствует своему глаголу, и правильнее было бы сформулировать предложение так: «девочка била мальчика, используя палку». Однако, поскольку из контекста понятно, о каком глаголе идет речь, а падежи компенсируют пропажу глагола, то и первый вариант оказывается вполне допустимым. Область переменной «мальчика» и орудия избиения не изменились в новом предложении. Но вот область переменной «девочка» сузилась, поскольку далеко не всякая девочка использует в драке палку. Переменная орудия избиения не зависит от прямого дополнения. В самом деле, на вопрос: «Чем била девочка мальчика?» вы скорее всего пожмете плечами и ответите: «Да чем угодно». Это как раз и означает наличие многозначной зависимости. Косвенные дополнения в своем действии на подлежащие очень напоминают прилагательные, поскольку сужают область действия категории. Вместе с тем, есть и различие в действии прилагательного и косвенного дополнения, но его можно обсуждать лишь после исследования признаковых пространств.

Мы можем продолжить наращивать кажущуюся арность глагола «бить», добавляя новые дополнения: «на улице девочка била мальчика палкой по голове». И опять действующая в предложении область определения «девочка» сузилось, поскольку совсем немного девочек столь кровожадны, что готовы лупить на улице прилюдно беззащитного ребенка палкой по голове. Появление в языке таких псевдовысоких арностей довольно частое явление («я защищал дерево веслом от бобра»), и всегда в этих случаях за ширмой прячутся зависимости данных, а первоначальная арность глагола сохраняется. В этом принципиальное отличие таких косвенных дополнений от

«настоящих» косвенных дополнений, порожденных арностью глаголов.

Описанные выше примеры изменения арности глагола не надо путать с одним из семантических способов определения объектов с помощью уточнения его места в иерархии, которая, конечно, также связана с разложением, но только не глаголов, а самих объектов [10]. Например, фраза «деньги лежат в спальне в шкафу на второй полке сверху под полотенцами» совсем не характеризует арность глагола «лежать», а относится к разложению самих объектов: квартиры на комнаты и т.д.

Заключение

Мы рассмотрели два случая глаголов арности большей двух. При этом было показано, что часто высокие арности связаны просто с независимостью дополнений, поскольку многозначные зависимости скорее характеризуют не зависимость правой части от левой, а независимость левых частей МЗ [11], то есть дополнений. Выше было приведено несколько примеров «настоящих» тернарных глаголов. Возникает вопрос: «Существуют ли в языке глаголы арности большей трех?» Хотя теорема 9 снимает проблемы в математическом смысле, но вопрос остается открытым для самой лингвистики. Очевидно, что положение категории в кортеже некоторого отношения имеет принципиальное значение. Например, сказать, что «щука проглотила карася», или что «карась проглотил щуку» — вещи существенно различные. Поэтому для «настоящих» n-арных глаголов важно фиксировать место каждой категории в кортеже, а значит, необходимо как-то отражать эту информацию и в предложении. В различных языках проблема решается по-разному: эту роль либо выполняют предлоги с падежами, либо жесткая привязка к месту в предложении. Например, в выражениях «царь направил посла королю» и «царь направил королю посла» идентификация атрибута в кортеже определяется с помощью падежа. Если предположить, что выразительные способности английского языка в смысле отражения глаголов высокой арности, не уступают другим языкам, следует ожидать ограничения арности глаголов цифрой три. Это утверждение, разумеется, является лингвистической гипотезой. Кроме того, далеко не все глаголы языка образуют категории. Большинство глаголов языка используют категории, созданные другими глаголами. Существуют ли тернарные (и выше) глаголы, образующие категории? Этим открытым вопросом к лингвистике мы завершим рассмотрение данной темы.

Литература

1. Polyakov O. M. Linguistic Data Model for Natural Languages and Artificial Intelligence. Part 1. Categorization // ДИСКУРС. 2019. T. 5, № 4. C. 102-114.

DOI: 10.32603/2412-8562-2019-5-4-102-114.

2. Blyth T. S. Lattices and Ordered Algebraic Structures. London, Springer-Verlag, 2005, 315 p.

3. Биркгоф Г. Теория решеток / Пер. с англ. В. Н. Са-лей; под ред. Л. А. Скорнякова. — М.: Наука. Главная редакция физико-математической литературы, 1984. — 568 с.

4. Гретцер Г. Общая теория решеток / Пер. с англ. А. Д. Больбота и др.; под ред. Д. М. Смирнова. —

М.: Мир. Редакция литературы по математическим наукам, 1982. — 456 с.

5. Витгенштейн Л. Философские исследования. — М: Русский гуманитарный Интернет-университет, 2008. — 142 с.

6. Куратовский К. Топология: в 2-х т. / Пер. М. Я. Антоновского. — М.: Мир, 1966-1969.

Т. 1. — 1966. — 594 с.

7. Андреев А. В. Введение в формальную семантику: Учебное пособие. / А. В. Андреев, О. А. Митрофанова, К. В. Соколов; Санкт-Петербургский гос. ун-т, Филологический фак. — СПб.: СПбГУ, 2014. — 88 с.

8. Fagin R. Multivalued Dependencies and a New Normal Form for Relational Databases, ASM Transactions on Database Systems, 1977, Vol. 2, No. 3, Pp. 262-278.

9. Дейт К. Дж. Ведение в системы баз данных. Восьмое издание = An Introduction to Database Systems. 8th Edition / Пер. с англ. и ред. К. А. Птицына. — М.: Издательский дом «Вильямс», 2005. — 1328 p.

10. Блюм В. С. Лингвистическое пространство языка клинической медицины // Актуальные проблемы экономики и управления. 2018. Вып. 3 (19). С. 27-30.

11. Мейер Д. Теория реляционных баз данных / Пер. с англ. М. К. Валиева и др.; под ред. М. Ш. Цаленко. — М.: Мир. Редакция литературы по математическим наукам, 1987. — 608 с.

Categorization in Natural Languages for Verbs

of Increased Arity

PhD, Assoc. Prof. O. M. Polyakov Saint Petersburg State University of Aerospace Instrumentation Saint Petersburg, Russia Road.Dust.SPb@gmail.com

Abstract. R-linguistics is a new axiomatic direction in cognitive Sciences, which deals with the study of modeling the world by consciousness. The basis of axiomatics are the axioms of categorization. The axioms of categorization allow us to build systems of interrelated categories, starting from the behavioral aspect of objects. However, often the behavior of objects is more complex than binary interaction. To mathematically substantiate categorization for relations, arity greater than two, as well as to substantiate other cases of high arity of verbs in the language. A method for representing the Galois correspondence for an arity greater than two is Formulated. The theorem on the conservation of information about the relation in this case is proved. It is shown that the extension of the Galois correspondence to the n-ary case of categorization up to an empty category creates exactly the same categories as the binary case. The mathematical conditions for the emergence of pseudo-high arities of verbs in languages are determined. It is shown that they are reduced to multivalued dependencies acting between the subject attribute and additions. In conclusion, some considerations are formulated regarding the varieties of verbs in natural languages.

References

1. Polyakov O. M. Linguistic Data Model for Natural Languages and Artificial Intelligence. Part 1. Categorization, DISCOURSE [Diskurs], 2019, Vol. 5, No. 4, Pp. 102-114. DOI: 10.32603/2412-8562-2019-5-4-102-114.

2. Blyth T. S. Lattices and Ordered Algebraic Structures. London, Springer-Verlag, 2005, 315 p.

3. Birkhoff G. Lattice Theory [Teoriya reshetok], Moscow, Nauka Publishers, 1984, 568 p.

4. Grätzer G. General lattice theory [Obshchaya teoriya reshetok], Moscow, Mir Publishers, 1982, 456 p.

5. Wittgenstein L. Philosophical studies [Philosophskie is-sledovaniya], Moscow, Russian Humanities Internet University, 2008, 142 p.

6. Kuratowsky K. Topology [Topologiya], Vol. 1, Moscow, Mir Publishers, 1966, 594 p.

7. Andreyev A. V., Mitrofanova O. A., Sokolov K. V. Introduction to formal semantics: Study guide [Vvedenie v for-maTnuyu semantiku: Uchebnoe posobie], Saint Petersburg, St. Petersburg University, 2014, 88 p.

8. Fagin R. Multivalued Dependencies and a New Normal Form for Relational Databases, ASM Transactions on Database Systems, 1977, Vol. 2, No. 3, Pp. 262-278.

9. Date C. J. An Introduction to Database Systems. 8th Edition [Vvedenie v sistemy baz dannykh. Vos&moe iz-danie], Moscow, Willams Publishing House, 2005, 1328 p.

10. Blum V. S. Linguistic Space of the Language of Clinical Medicine [Lingvisticheskoe prostranstvo yazyka klinich-eskoy meditsiny], Actual Problems of Economics and Management [AktuaVnye problemy ekonomiki i upravleniya], 2018, Is. 3(19), Pp. 27-30.

11. Maier D. The Theory of Relational Databases [Teoriya relyatsionnykh baz dannykh], Moscow, Mir Publishers, 1987, 608 p.

r-ЛИНГВИСТИКА МНОГОЗНАЧНАЯ ЗАВИСИМОСТЬ КАТЕГОРИЗАЦИЯ ГЛАГОЛЫ ВЫСОКОЙ АРНОСТИ КОСВЕННЫЕ ДОПОЛНЕНИЯ r-linguistics multivalued dependence categorization verbs of high arity indirect additions

Другие работы в данной теме:

РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ С ОСОБЫМИ НАЧАЛЬНЫМИ ЗНАЧЕНИЯМИ

ОРГАНИЗАЦИЯ КОНТРОЛЯ ВРЕДНЫХ ВЫБРОСОВ В АТМОСФЕРУ НА ТЭС И КОТЕЛЬНЫХ

ОБЕСПЕЧЕНИЕ ЭНЕРГОСБЕРЕЖЕНИЯ ПРИ ОБЛУЧЕНИИ ЖИВОТНЫХ НА ОСНОВЕ УЧЕТА ИХ ВЕРОЯТНОСТНОГО ПОВЕДЕНИЯ

ИСПОЛЬЗОВАНИЕ ТЕОРИИ НЕЧЕТКИХ МНОЖЕСТВ В СОЦИОЛОГИИ

ПРИМЕНЕНИЕ ФРАКТАЛЬНЫХ МЕТОДОВ ДЛЯ АНАЛИЗА ДИНАМИЧЕСКИХ ДАННЫХ

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ ФРАКТАЛЬНЫХ ВРЕМЕННЫХ РЯДОВ

АВТОМАТИЗАЦИЯ ПРОЦЕССА ВЫЧИСЛЕНИЯ ПОКАЗАТЕЛЕЙ НАДЕЖНОСТИ ПРИ РАЗЛИЧНЫХ ЗАКОНАХ РАСПРЕДЕЛЕНИЯ И ДИСЦИПЛИНЫ ВОССТАНОВЛЕНИЯ ЭЛЕМЕНТОВ

СТАЦИОНАРНОСТЬ R-ГАРМОНИЧЕСКОГО СЛУЧАЙНОГО ПРОЦЕССА

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ПЕРЕРАСПРЕДЕЛЕНИЯ РЕСУРСА В ХОДЕ ФИЗИОЛОГИЧЕСКОЙ АДАПТАЦИИ САМОК СРЕДИЗЕМНОМОРСКОЙ ФРУКТОВОЙ МУХИ

АНАЛИЗ СИЛ, ДЕЙСТВУЮЩИХ НА ТАЗОВОЕ КОЛЬЦО, ПРИ ХОДЬБЕ ПО ЛЕСТНИЦЕ ВВЕРХ

МОДЕЛИРОВАНИЕ ПЛОТНОСТИ КОСТНОЙ ТКАНИ

ПРИМЕНЕНИЕ СЕТОЧНЫХ МЕТОДОВ РЕШЕНИЯ ЭВОЛЮЦИОННЫХ ЗАДАЧ ДЛЯ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ИНДУЦИРОВАННОЙ ЭЛЕКТРОННЫМ ЗОНДОМ ЗАРЯДКИ ДИЭЛЕКТРИКОВ

МЕТОДЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ НЕОДНОРОДНЫХ УРАВНЕНИЙ

МОДЕЛИРОВАНИЕ ПОВЕДЕНИЯ КУРСА ДОЛЛАРА НА ОСНОВЕ ВРЕМЕННЫХ РЯДОВ

РЕШЕНИЕ УРАВНЕНИЯ ВАН-ДЕР-ПОЛЯ МЕТОДОМ КРЫЛОВА – БОГОЛЮБОВА