г. Москва и Московская область, Россия
, Россия
ОКСО 45.03.03 Фундаментальная и прикладная лингвистика
Объектом исследования при написании работы послужил корпус текстовых данных, собранных вместе с научным руководителем и алгоритмы обработки естественного языка анализа. Поток гипотез был проверен на текстах научных публикаций по компьютерным наукам (computer science) с помощью ряда экспериментов по моделированию, описанных в этой диссертации. Предметом исследования являются алгоритмы и результаты работы алгоритмов, направленные на предсказание перспективных тем и терминов, появляющихся в процессе времени в научной среде. Результатом данной работы является совокупность моделей машинного обучения, с помощью которых проведены эксперименты по выявлению перспективных терминов и семантических связей в корпусе текста. Полученные модели могут быть использованы для семантической обработки и анализа других предметных областей.
цитирование, импакт-фактор, научные публикации, машинное обучение
