Поиск :
Личный кабинет :
Электронный каталог: Туляков Евгений Васильевич - Программа для семантического анализа текстов
Туляков Евгений Васильевич - Программа для семантического анализа текстов
Нет экз.
Электронный ресурс
Автор: Туляков Евгений Васильевич
Программа для семантического анализа текстов : выпускная квалификационная работа : Бакалаврская работа
Издательство: Московский государственный психолого-педагогический университет, 2021 г.
ISBN отсутствует
Автор: Туляков Евгений Васильевич
Программа для семантического анализа текстов : выпускная квалификационная работа : Бакалаврская работа
Издательство: Московский государственный психолого-педагогический университет, 2021 г.
ISBN отсутствует
Электронный ресурс
Туляков, Евгений Васильевич.
Программа для семантического анализа текстов : выпускная квалификационная работа : Бакалаврская работа / Евгений Васильевич Туляков. – Москва : Московский государственный психолого-педагогический университет, 2021. – 62 с. – URL: http://psychlib.ru/inc/absid.php?absid=402600 . – 02.03.03 - Математическое обеспечение и администрирование информационных систем. Направленность программы "Информационные системы и базы данных".
Одной из наиболее интересных областей знаний в сфере компьютерных наук является разработка методов, применяемых для анализа естественных языков. Специалистами в области анализа данных и компьютерной лингвистики было разработано достаточно большое количество алгоритмов и математических моделей, которые активно применяются для создания поисковых систем, сервисов машинного перевода, баз знаний и т. д. темой данной квалификационной работы является разработка программы для семантического анализа текстов. Данная работа состоит из введения, двух глав, описывающих теоретические аспекты проводимых исследований, а также третьей главы, посвящённой разработки программного продукта семантического анализа текстов на естественном языке. Введение описывает цель и задачи данной выпускной квалификационной работы, а также основания для выбора данной темы. В первой главе происходит сравнение и анализ математических моделей дистрибутивной (векторной) семантики. Рассматривается основополагающая гипотеза, стоящая за процессом выявления семантической схожести слов. Более подробно описывается модель Word2Wec и её преимущества над традиционными методами дистрибутивного анализа. Рассматривается метрика семантического сходства, а также пример визуализации векторного представления слов на плоскости.
One of the most interesting areas of knowledge in the field of computer science is the development of methods used for the analysis of natural languages. Specialists in the field of data analysis and computational linguistics have developed a fairly large number of algorithms and mathematical models that are actively used to create search engines, machine translation services, knowledge bases, etc.The topic of this qualification work is the development of a program for semantic analysis of texts. This work consists of an introduction, two chapters describing the theoretical aspects of the ongoing research, as well as the third chapter devoted to the development of a software product for semantic analysis of texts in natural language. The introduction describes the purpose and objectives of this final qualification work, as well as the reasons for choosing this topic. In the first chapter, the mathematical models of distributive (vector) semantics are compared and analyzed. The fundamental hypothesis behind the process of identifying semantic similarity of words is considered. A more detailed description of the Word2Wec model and its advantages over traditional methods of distributional analysis. We consider the metric of semantic similarity, as well as an example of visualization of the vector representation of words on the plane.
Общий = Математика
Общий = Информатика, вычислительная техника
Общий = Языкознание
Туляков, Евгений Васильевич.
Программа для семантического анализа текстов : выпускная квалификационная работа : Бакалаврская работа / Евгений Васильевич Туляков. – Москва : Московский государственный психолого-педагогический университет, 2021. – 62 с. – URL: http://psychlib.ru/inc/absid.php?absid=402600 . – 02.03.03 - Математическое обеспечение и администрирование информационных систем. Направленность программы "Информационные системы и базы данных".
Одной из наиболее интересных областей знаний в сфере компьютерных наук является разработка методов, применяемых для анализа естественных языков. Специалистами в области анализа данных и компьютерной лингвистики было разработано достаточно большое количество алгоритмов и математических моделей, которые активно применяются для создания поисковых систем, сервисов машинного перевода, баз знаний и т. д. темой данной квалификационной работы является разработка программы для семантического анализа текстов. Данная работа состоит из введения, двух глав, описывающих теоретические аспекты проводимых исследований, а также третьей главы, посвящённой разработки программного продукта семантического анализа текстов на естественном языке. Введение описывает цель и задачи данной выпускной квалификационной работы, а также основания для выбора данной темы. В первой главе происходит сравнение и анализ математических моделей дистрибутивной (векторной) семантики. Рассматривается основополагающая гипотеза, стоящая за процессом выявления семантической схожести слов. Более подробно описывается модель Word2Wec и её преимущества над традиционными методами дистрибутивного анализа. Рассматривается метрика семантического сходства, а также пример визуализации векторного представления слов на плоскости.
One of the most interesting areas of knowledge in the field of computer science is the development of methods used for the analysis of natural languages. Specialists in the field of data analysis and computational linguistics have developed a fairly large number of algorithms and mathematical models that are actively used to create search engines, machine translation services, knowledge bases, etc.The topic of this qualification work is the development of a program for semantic analysis of texts. This work consists of an introduction, two chapters describing the theoretical aspects of the ongoing research, as well as the third chapter devoted to the development of a software product for semantic analysis of texts in natural language. The introduction describes the purpose and objectives of this final qualification work, as well as the reasons for choosing this topic. In the first chapter, the mathematical models of distributive (vector) semantics are compared and analyzed. The fundamental hypothesis behind the process of identifying semantic similarity of words is considered. A more detailed description of the Word2Wec model and its advantages over traditional methods of distributional analysis. We consider the metric of semantic similarity, as well as an example of visualization of the vector representation of words on the plane.
Общий = Математика
Общий = Информатика, вычислительная техника
Общий = Языкознание