Нейросетевой механизм кросс-внимания в задачах извлечения информации из текстов на примере биомедицинских данных
10 июня 2021 года
07:41
Нейросетевой механизм кросс-внимания в задачах извлечения информации из текстов на примере биомедицинских данных
Текст новости:
Актуальность темы. В настоящее время в связи с бурным раз­ витием сети Интернет и электронных коллекций научных публикаций накоплен огромный объем неструктурированной информации, представ­ ленной текстами на естественных языках. В связи с этим становится все более востребованной разработка автоматических методов обработки текстов с целью извлечения структурированных данных, которые в даль­ нейшем могут быть использованы для извлечение фактов, анализа мнений пользователей, поиска информации и других задач. Важнейшими задачами автоматического извлечения информации из текстов являются классификация и извлечение отношений. Задача клас­ сификации текста заключается в группировке текстов по определенным заранее заданным классам. Задача классификации может рассматриваться на уровне документа, параграфа, предложения и сущности. Задача извле­ чения отношений заключается в определении семантических связей между двумя понятиями (сущностями). Методы классификации текста и извлечения отношений применяют­ ся для решения широкого круга прикладных задач, включающих анализ мнений пользователей о продукте, фильтрации спама, подбор контекстной рекламы, автоматическое реферирование, тегирование контента на сайте, сортировка обращений пользователей в службы поддержки, построение лингвистических баз данных и т.д. Одной из наиболее значимых областей применения методов классификации и извлечения отношений являются задачи медицинской науки, в частности, задачи фармакологии и персона­ лизированной медицины. В области биомедицины классификация текста применяется для по­ иска новой информации о побочных реакциях лекарственных веществ, не указанных в инструкции, а также для обнаружения использовании лекарств с нарушением предписаний инструкции1 . Задача извлечения отношений применяется для построения биомедицинских баз данных, определения действия лекарственных веществ по отношению к системам организма, излечения новых отношений между лекарствами и симптомами для построения гипотез. Информация, полученная в результате извлече­ ния отношений, может также использоваться как часть входных данных для других задач, таких как извлечение событий, классификация диагно­ зов, принятие клинических решений и в вопросно-ответных системах. Классификация текста и извлечение отношений между сущностями в биомедицинских текстах исследовались в трудах российских и зарубеж­ ных учёных, таких как Саркер А, Гонсалез Г., Гинн Р., Никфарджам 1 Utilizing social media data for pharmacovigilance: a review / A. Sarker [и др.] // Journal of biomedical informatics. 2015. т. 54. с. 202—212. 3

Связанные объекты: #A (найти в новостях).

Текст со страницы (автоматическое получение):
ПРИЕМНАЯ
ВЫСШАЯ АТТЕСТАЦИОННАЯ КОМИССИЯ
при Министерстве науки и высшего образования Российской Федерации
Высшая аттестационная комиссия при Министерстве науки и высшего образования Российской Федерации создана в целях обеспечения государственной научной аттестации
ВЫСШАЯ АТТЕСТАЦИОННАЯ КОМИССИЯ
Автоматическая система мониторинга и отбора информации
Источник
Другие материалы рубрики


Ресурсы
Модели