Новый вычислительный инструмент под названием ProtFus сканирует научные данные для проверки прогнозов активности слитых белков – белков, кодируемых в результате объединения двух генов, которые ранее кодировали два отдельных белка. Сомнат Тагор из лаборатории Френкеля-Моргенштерна в университете Бар-Илан, Израиль, и его коллеги рассказали о ProtFus изданию PLOS Computational Biology.
Различные виды слитых белков могут естественным образом возникать в организме человека, иногда приводя к раку. Понимание взаимодействия между слитыми и другими белками может улучшить персонализированное лечение рака. Тем не менее, количество научных работ, посвященных этому взаимодействию, быстро растет, и стандартный формат для представления этой информации отсутствует. Таким образом, организация и архивация этих данных представляет собой значительную проблему.
Инструмент ProtFus использует интеллектуальный анализ текста и машинное обучение для анализа научной литературы из онлайновой поисковой системы PubMed. Он способен идентифицировать слитые белки, которые могут иметь несколько имен, и идентифицировать экспериментально подтвержденные взаимодействия между слитыми и другими белками. При применении к тестовому набору из 1817 слитых белков ProtFus выявил 2908 взаимодействий по 18 типам рака, которые были опубликованы в научных текстах в PubMed.
ProtFus также основывается на инструменте, ранее разработанном исследователями для прогнозирования взаимодействий слитого белка на основе известных свойств его родительских белков. ProtFus использует интересующий гибридный белок и ранее разработанный инструмент ChiPPI для прогнозирования взаимодействий, а затем проверяет эти взаимодействия с помощью поиска PubMed.
«Наши результаты демонстрируют потенциал для анализа текста в крупномасштабных научных статьях с использованием новой инфраструктуры больших данных с возможностью обновления в режиме реального времени на основе ежедневно публикуемых статей», – говорит доктор Милана Френкель-Моргенштерн, автор исследования. «ProtFus помогает изучать изменения белковых сетей отдельных онкологических пациентов», – подчеркивает Сомнат Тагор.
Источник: https://www.sciencedaily.com/releases/2019/08/190822141844.htm