menu
Портал ИТМ: База знаний, ИТ решения, мероприятия

Интеллектуальный анализ и тематическое моделирование проблемноориентированного корпуса медицинских текстов.

Докладчик: Гаянова Майя Марсовна

ФАЙЛ PDF

Интеллектуальный анализ и тематическое моделирование проблемноориентированного корпуса медицинских текстов.

XXIII Ежегодный международный конгресс «Информационные технологии в медицине», #ИТМ2022, Москва
14 октября 2022, 16:45,Зал Юпитер.
Секция: 2.9. ВСЕРОССИЙСКАЯ НАУЧНО-ПРАКТИЧЕСКАЯ КОНФЕРЕНЦИЯ ПО ИСКУССТВЕННОМУ ИНТЕЛЛЕКТУ В МЕДИЦИНЕ (МедКИИ 2022) .
Докладчик
Гаянова Майя Марсовна, доцент кафедры Вычислительной математики и кибернетики факультета информатика и робототехника ФГБОУ ВО Уфимского государственного авиационного технического университета», к.т.н., Уфа

В статье рассмотрены проблемы интеллектуального анализа и тематического моделирования проблемно-ориентированного корпуса текстовых документов на русском языке на примере научных публикаций в рецензируемых изданиях по тематике описания различных аспектов болезней органов дыхания. Рассматриваемые методы интеллектуального анализа направлены на построение модели эффективной предобработки и последующего тематического моделирования корпуса научных статей, доступных на платформе elibrary.ru, за период с 1997 по 2022 г. Выявлены особенности представления публикаций, значимость семантики, заложенной в таблицах, рисунках и тексте статьи, для задачи тематического моделирования. Приведены результаты анализа известных публикаций, освещающих подходы к интеллектуальной предобработке и тематическому моделированию медицинских текстов, написанных на английском и русском языках. Представлена структурно-функциональная организация системы построения (сбора, предобработки и формализации) проблемно-ориентированного корпуса текстов и нейросетевой языковой модели для анализа текстов конкретной предметной области. Рассмотрены основные этапы предобработки текстового корпуса и извлечения структурированных данных. Формализованное представление текстов получено с помощью нейросетевой модели-трансформера с применением технологий переноса обучения (transferlearning).
Проведен эксперимент на корпусе медицинских текстов заданной тематики (более 1 тыс. публикаций) без предварительной разметки с целью выявления основных направлений публикаций, ключевых терминов и ретроспективного анализа эволюции тем исследований в долгосрочном и краткосрочном периоде. Проведена интерпретация полученных результатов.


Раздел: Презентации

14.10.2022
Мероприятие: ИТМ 2022
Тематика:
  • ИИ и СППВР