Правила формирования сложных связей из неструктурированного текста

Лавлинский Валерий Викторович; Зольникова Юлия Олеговна

doi:doi:10.12737/article_5c4f196f7f9592.03992856

Главная / Журналы / Моделирование систем и процессов / Том 11 Номер 3 / Правила формирования сложных связей из неструктурированного текста

Отправить рукопись

Цитировать

Цитирований:

ПРАВИЛА ФОРМИРОВАНИЯ СЛОЖНЫХ СВЯЗЕЙ ИЗ НЕСТРУКТУРИРОВАННОГО ТЕКСТА

Журнал: МОДЕЛИРОВАНИЕ СИСТЕМ И ПРОЦЕССОВ Том 11 № 3 , 2019

Рубрики: ТЕХНИЧЕСКИЕ НАУКИ

УДК 60 Прикладные науки. Общие вопросы

Лавлинский Валерий Викторович ¹

Зольникова Юлия Олеговна ²

Информация об авторах и публикации

Авторы:

1. Воронежский государственный лесотехнический университет имени Г.Ф. Морозова

Россия

2. Воронежский государственный лесотехнический университет имени Г.Ф. Морозова

Воронежская область, Россия

Тип:

Статья

DOI:

https://doi.org/10.12737/article_5c4f196f7f9592.03992856

Страницы:

с 34 по 39

Статус:

Опубликован

Получено:

28.01.2019

Одобрено:

28.01.2019

Опубликовано:

28.01.2019

Классификаторы:

УДК 60 Прикладные науки. Общие вопросы

Язык материала:

русский

Ключевые слова:

Грамматический разбор, извлечение смысловой информации, онтологии, неструктурированный текст, граф зависимостей.

Аннотация и ключевые слова

Аннотация (русский):
В статье рассматриваются правила для извлечения сложных смысловых связей из необработанного текста. Данные правила позволяют извлечь полезную информацию с внутренними предложениями. Данный вид связей характеризуется тем, что он имеет главное подлежащее, которое ссылается на внутреннее предложение через глагол. В работе приводится методология построения графа зависимостей для предложения.

Ключевые слова:
Грамматический разбор, извлечение смысловой информации, онтологии, неструктурированный текст, граф зависимостей.

Текст

I. Введение

Большинство сложных смысловых связей в тексте характеризуются явными или неявными зависимостями между частями предложения. Такие связи описываются графом зависимостей. Для формирования правил извлечения будем использовать методологию [1]:

Обращение к описаниям зависимостей из необработанного текста и выбор тех, которые соответствуют структуре данного типа комплексных связей.
Формирование условий, основанных на том, найдена ли метка зависимости (или очередность меток) в множестве ребер в графе зависимостей.
Формирование действий, основанных на решениях о том, какие вершины нужно извлечь в виде составляющих.
Установление предпосылок и следствий для формирования правила извлечения.

Рассмотрим выполнение этих шагов к каждой сложной связи с внутренними предложениями.

Список литературы

1. Software - The Stanford Natural Language Processing Group. -Режим доступа: http://nlp.stanford.edu/software/. - Загл. с экрана.

2. Соколов, Е. Г. Применение LSA/LSI методов для извлечения данных из неструктурированного текста / Е. Г. Соколов, М. М. Шарнин // Труды Международной научной конференции по физико-технической информатике CPT2018. - Царьград, 2018. - С. 59-63.

3. Методы автоматической классификации текстов по функциональным стилям / Л.М. Ермакова, М.А. Абашев, Р.В. Никитин, Р.И. Ушаков // Вестник Пермского университета. Серия: Математика. Механика. Информатика. - 2014. - № 4 (27). - С. 78-83.

4. Богатырев, М. Ю. Извлечение фактов из текстов естественного языка с применением концептуальных графовых моделей / М.Ю. Богатырев // Известия Тульского государственного университета. Технические науки. - 2016. - № 7-1. - С. 198-208.

5. Stulov, N. Patent landscapes & new technology trends in iot: extracting and visualizing data patterns / N. Stulov // Открытые семантические технологии проектирования интеллектуальных систем. - 2018. - Т. 2, № 8. - С. 293-297.

6. Метод автоматизированного извлечения адресов из неструктурированных текстов / А. В. Комарова, А. А. Менщиков, А. В. Полев, Ю. А. Гатчин // International Journal of Open Information Technologies. - 2017. - Т. 5, № 11. - С. 21-27.

7. Freitag, D. Boosted wrapper induction : In Proceedings of 17th National Conference on Artificial Intelligence / D.Freitag, N.Kushmerick. - 2000. - Pp.577-583

8. Kauchak, D. Sources of success for boosted wrapper induction / D. Kauchak, J.Smarr, C. Elkan // The Journal of Machine Learning Research. - 2004. - Т. 5. - Pp. 499-527.

9. Kushmerick, N. Wrapper induction for information extraction / N. Kushmerick, D. S. Weld, R.Doorenbos // Proceedings of the International Joint Conference on Artificial Intelligence (IJCAI’97). - 1997. - Pp.729-737.

10. Muslea, I. STALKER: Learning extraction rules for semistructured, web-based information sources. / I.Muslea, S. Minton, C. Knoblock // AAAI Workshop on AI and Information Integration. - 1998. - Pp.74-81.

Отправить рукопись

Цитировать

Цитирований:

I. Введение

Подтверждение

Регистрация