0
<< предыдущая заметкаследующая заметка >>
05 марта 2012
Отдохнул чтобы потом опять отдохнуть

Я остановился на том что хотел сразу строить единую систему без прохода через трудозатратные промежуточные этапы.Итак ,проблемы с текстом которые возникнут наверняка если я исполню все предыдущие проблемы.
1)Разделение сложных предложений на болеее мелкие
2)Знаки пунктуации ,дееепричастные и причастные обороты
3)Своеобразный стиль построения предложения
[Офффтоп:
Кстати,очень интересно что вообще у человечесвтва нелогичный язык ,что-то типо

«я взял со стола печенье.я съел печенье.я утолил свой голод.я пошёл к двери.если дверь откроется то я отойду в сторону».

Такой тип построение более пременим к науке и логике которой обычно пользуются учёные и технари ,однако в обыденном и художественном тексте всё иначе:

«Старая княгиня и княжна Маруся стояли в комнате молодого князя, ломали
пальцы и умоляли. Умоляли они так, как только могут умолять несчастные,
плачущие женщины: Христом-богом, честью, прахом отца.»

Значит есть что-то в языках и их построении относительно мыслей ,что передаёт какую-то информацию в более сложном виде.
Ну во-первых это элементарно скучно -«логичный язык»,как мы выяснили скучно бывает когда появляются полностью персказуемые сигналы на рецепторах,то есть «скучно» это метод системы закономерностей побуждающий к перводу внимания или поиску новых вещей,новых программ и закономерностей
]

Можно попытаться исследовать какой-нибудь обычный текст:

"
По пути из Задонска в Воронеж я догнал двух богомольцев — старика и старуху. Обоим им с виду было лет полтораста; они шли так медленно и неумело, тяжело двигая ступни по горячей пыли дороги, и оба имели в физиономиях и в одежде еле уловимое нечто; это нечто сразу позволяло заметить, что старики идут издалека.
— Из Тобольской губернии шагам... со господней помочью! — подтвердил старик мое предположение.
А старуха на ходу ласково оглянула меня добрыми, когда-то голубыми глазами и, добродушно улыбаясь, добавила, вздыхая:
— Из самого Н-ского заводу, деревеньки Лысой будем мы с отцом-то!
— То-то, чай изустали?
— Мы-то? Ничего! Пока двигаемся... ползем божьей милостью!..
— По обету, что ли, али так, старости ради?
— По обету, браток... Обещанье, значит, дали киевским и соловецким угодникам божиим... Да... — снова подтвердил старик. — Мать! посядем, вздохнем маленько? — обратился он к спутнице.»

Разделю на предложения этот текст и буду составлять с ним работу.

«По пути из Задонска в Воронеж я догнал двух богомольцев — старика и старуху.»

Как должна повлиять эта строка на высокоразвитый ИИ,вернее как это строка влияет на нас.
Первым делом мы узнаём:
1)из Задонска в Воронеж есть путь
2)есть Задонск
3)есть Воронеж
4)есть богомольцы
5)богомольцы-это старик и старуха
Вторым делом ,мы понимаем:
Сложилась интересная ситуация,в которой автору предстоит столкнуться с двумя богомольцами.Интерес этой ситуации в слове «богомольцами».Но если бы предложение выглядело бы так
«По пути из Задонска в Воронеж я догнал двух плотников» перед нами бы предстал образ среднерусских 19 века мужичков,рубаха-парней и мы примерно бы знали о чём мог поговорить Горький:
-политика
-сельская жизнь
Однако всё равно всё это предсказуемо.Перед нами предстают какие-то новые «интересные» люди — богомольцы-старики.С которыми мы не знаем что получиться у Горького,поэтому это представляет интерес. Однако даже если бы это были плотники это всё равно бы представляло интерес.
Я бы например это предложение из этого рассказа написал так:

Как бы я написал:«Когда я шёл из города Воронеж в город Задонск я встретил старуху и старика»

То есть мой стиль изложения с уточнениями конструкциями и описаниями ближе к технарскому а не к гуманитарному.Однако он даёт столько же «чистой» информации сколько и предложение из рассказа.Однако оно даёт совсем другую информацию обо мне,о моём характере,моей эмоциональной составляющей,какие у меня приоритеты и привычки.И эта составляющая тоже находиться в тексте который я пишу.


Программные выводы из первого предложения

1)Нужно составлять массивы связей между подлежащими и сказуемыми (хотя в принципе эта функция у меня есть).То есть
нам поможет знание того что:
Воду в чайнике можно кипятить
Чайник можно положить
Чайник можно раскрасить
Чайник можно купить
....
и при этом всём-
чайник не может бегать
чайник нельзя пугать
чайник нельзя сварить

Однако тут есть и свой контраргумент ,например какой-нибудь детский писатель оживит чайник в своём произведении что он начнёт бегать пугать,говорить а парсер его обработает.Нужно знать как такие знания понадобяться при проектировании программы.Это я изложу в конечном абзаце поста
2)Нужно составить список неопределённых слов ,но которые повторяются в тексте (такие как слова исключения и неопределённые системой) и в зависмости от предположенных связей добавлять их к основнм словам.Например:
«Хочу купить французского прогога» -ясно что «французский» в родительном падеже,а рядом неизвестное слово с окончанием
существительного родительного падежа.то есть +1 к возможно найденным новым словам.
3)Нужно составить список слов исключений но постоянно повторяющихся
4)Добавить конструкцию вида «существительное в любом падеже»+«тире либо двоеточие»+«сущестительные в именительном или винительном падеже»
которая будет определять части из которых состоит данное существительное.




Смысл программных выводов первого предложения

1)Зачем нам нужно знание того что чайник можно кипятить и он не может бегать.Это знание упрошает работу системы поиска закономерностей потому что это знание и есть закономерность ,то есть мы расширяем тем самым «критическуюб массу закономерностей»
.Например ИИ понадобиться
приготовить чай с вареньем->чтобы наесться и получить необходимые микроэлементы->чтобы жить дальше->чтобы не умереть
.Знание того что с помощью чайника кипятят воду для чая можно взять из конструкции и описания приготовления чая.Однако тогда зачем знать что чайник можно кипятить и нельзя им бегать? То есть в какой-то мере мы ошиблись в применении массивов которые хотим получить.Эти связи дают
сродство существительных и «перенос параметров» при генерации идей.Например мозг может подумать так:

«Хорошо, чайник можно положить и монитор от компьютера можно положить.Но чайник ещё можно раскрасить ,нельзя ли раскрасить монитор?»

-соотвественно из этих связей получаются «переносный» тип идей.Однако как бы решала подобную задачу чистая ситсема поиска закономереностей.Она бы вынуждена была проделать все известные действия над монитором чтобы определить список возможных действий предметов.Обычно когда человеку даёшь предмет,он внимательно его ощупывает и рассматривает с разных сторон,принюхивается,чувствует температуру и текстуру тактильными датчиками.Но он не может предсказать сразу какие действия возможны с этим предметом,для этого ему нужно прочитать какую-нибудь инструкцию чтобы сказать наверняка для чего этот составной предмет
[Оффтоп:в этом смысле один из смыслов кино как искусства показывать как взаимодейсвовать с чем-то новым ,что от этого нового ожидать.]
С другой стороны функция переноса это специфическая функция не всегда применяемая,она даёт какую-то степень синонимизации передаваемому слову,и какую-то степень антонимизациии.Вопрос в том ,куда её поставить в какое место программы и как её сформулировать.
2)Расширяетсся список известных слов и соответвенно увеличиавается адекватность верхних слоёв обработки текста
3)Некторые слова,а точнее их окончания могут не подчиняться принятой парадигме обработки окончаний и такие слова никогда не смогут войти в обработку,соответсенно нужно чтобы это было сделано


Обоим им с виду было лет полтораста; они шли так медленно и неумело, тяжело двигая ступни по горячей пыли дороги, и оба имели в физиономиях и в одежде еле уловимое нечто; это нечто сразу позволяло заметить, что старики идут издалека.

Второе предложение огромное.Вообще по уму и по хорошему мне просто нужно взять список законов русского языка и применить их к тексту,вместо того чтобы их искать.В принципе для облегчения анализа это предложение можно разделить на несколько маленьких,однако почему мы решили что такое облегчение анализа не подходит и для системы обработки текста.Мы вынуждены задаться вопросом:«Что нам даёт разделение сложного предложения на простые?».Оно даёт то что слова внутри каждого предложения взаимно замкнуты друг на друга,кроме местоимений и основных мыслей.Вообще каждое упоминание знака ";" можно изменить на точку

Обоим им с виду было лет полтораста. Они шли так медленно и неумело, тяжело двигая ступни по горячей пыли дороги, и оба имели в физиономиях и в одежде еле уловимое нечто.Это нечто сразу позволяло заметить, что старики идут издалека.


Предложения связаны с помощью специальных слов

им->Они->оба

нечто->нечто.

Если связь местоимений в скрипте движка и есть,то связи дополнений и других членов предложений нет.А между тем важно её создать.
Что мы узнаём из этих предложений:
1)Старушке и старику вместе около 150 лет
2)Можем предположить что каждому из них примерно 75 лет,так как обычно муж и жена примерно равного возраста.
3)«полтараста» -использован старый лексикон,что передаёт дух эпохи,а значит опять же подключает к нам образ,и мы можем моделировать эту ситуацию.

<< предыдущая заметка следующая заметка >>
Оставить комментарий