Щеглов Виталий Николаевич : другие произведения.

Текст как объект исследования с помощью программы построения алгебраических моделей конструктивной логики

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:


 Ваша оценка:


Текст как объект исследования с помощью программы построения алгебраических моделей конструктивной логики

В. Н. Щеглов

      -- Наблюдается громадный рост числа различных публикаций в том числе и на стыке различных направлений.
      -- Цель работы состоит в получении автоматизированных выводов из больших массивов текстовой и числовой информации по заданной проблеме.
      -- Относительно близкими к предлагаемой работе являются, например, методы когнитивного моделирования концептосферы текста и методы абстрагирующего реферирования, однако в них пока нет необходимого уровня формализации для достижения цели по п. 2.
      -- Поставленная цель была реализована пока на численных (в частности, значений k-значной логики) массивах данных, отображающих демографические и медицинские аспекты поражения населения после аварии Чернобыльской АЭС с помощью разработанной программы построения алгебраических моделей конструктивной (интуиционистской) логики (АМКЛ). Работы по этому направлению выполняются в настоящее время на медицинском факультете Тульского гос. университета. Исследуются массивы данных порядка 100 переменных.
      -- Суть этой программы заключается в вычислении ограниченных наборов удобных для содержательной интерпретации кратких выводов, отображающих массивы исходных данных. Строки этих массивов описывают состояния исследуемых объектов, столбцы -- некоторые переменные. Первый столбец отображает номера строк или время регистрации соответствующих состояний, последний -- целевую функцию Z, отображающую каждое состояние исследуемого объекта. Чаще всего значения Z булевы, Z(0, 1). Строки, где Z = 1, можно назвать целевыми, а строки , где Z = 0, нецелевыми (или строками сравнения).
      -- Согласно алгоритму построения АМКЛ, каждая целевая строка сравнивается со своею окрестностью нецелевых (последовательно, начиная с ближайших), для каждой переменной х строятся открытые интервалы dx, которые по мере удаления от целевой строки в итоге обнуляются. Последний dx сохраняется, проверяется гипотеза "если dx, то Z =1", при ее истинности эта импликация сохраняется, иначе подобным образом определяется интервал для некоторой второй переменной. Проверяется в качестве гипотезы конъюнкция этих двух интервалов и т.д. вплоть до получения истинной импликации. Такие же операции производятся со всеми целевыми строками, далее определяется тупиковая дизъюнктивная форма для всех найденных импликаций. Аналогичным образом такая форма вычисляется и для нецелевых строк, все дизъюнкции этой формы заключаются в скобки и со знаком отрицания через дизъюнкцию присоединяются к тупиковой форме для целевых строк. Итоговую формулу (модель) назовем АМКЛ.
      -- При исследовании текстов при использовании существующей программы вычисления АМКЛ ожидаются значительные трудности, главное, это громадное увеличение числа переменных. На первых этапах модифицирования уже успешно используемого алгоритма АМКЛ следует опробовать следующие его изменения (при значительном увеличении вычислительных ресурсов).
      -- Исходные переменные (столбцы массива данных, далее обозначим этот массив как Z) принимают значения 0, 1, 2, ..., k-1, где k -- словарь, например, из произведений какого-либо выдающегося автора. Значения 0 первого столбца из Z пусть отображает отсутствие слов в предложениях (или в заданных периодах текста), которые записываются в виде строк в массиве Z данных. Значения второго столбца пусть отображает список последовательности во времени номеров 1, 2, ..., 10k строк массива. Все k переменных пусть отображаются комплексными числами z = (a, b), где а = 2, 3, ..., k номера слов (например, из словаря автора), и b = 1, 2, ..., 99 номера грамматических, стилистических и других особенностей слов и указание их места в предложении.
      -- Для массива функций Z' (отображающего исходный Z) в столбцах z' последовательности a' = 1, 2, ..., 10k пусть означают номера строк из Z (они те же и для Z'), для которых экспертами выделены некоторые особенности текста, выявляющих семантику, например, отдельных предложений или периодов из произведений выдающихся авторов. В последовательности номеров b' = 1, 2, ..., 99 кодируются краткие названия этих семантических особенностей текста. Далее вычисляется АМКЛ.
      -- Возможно, что такая модель может быть лишь первым шагом к познания творчества исследуемого автора. Необходима интерпретация ее (по крайней мере выводов с наибольшими оценками) с помощью подходящих информационно-поисковых систем для уточнения найденных семантических особенностей текста, повторного кодирования при использовании новых значений b' найденных семантических особенностей текста, затем повторного вычисления модели и т.д.
      -- Книгу В. Н. Щеглов "Творческое сознание: интуиционизм, алгоритмы и модели" (2004 г.) и статью "Творческое сознание: интерпретация алгоритма построения алгебраических моделей конструктивной (интуиционистской) логики" (2007 г.) см. в архиве http://publ.lib.ru/ARCHIVES/SCH/SCHEGLOV_Vitaliy_Nikolaevich/_Scheglov_V.N..html .
  
  

 Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список

Кожевенное мастерство | Сайт "Художники" | Доска об'явлений "Книги"