Метод поиска структурной гетерогенности сайтов связывания транскрипционных факторов с использованием альтернативных de novo моделей на примере FOXA2

Результат исследования: Научные публикации в периодических изданияхстатьярецензирование

Аннотация

В настоящее время самой распространенной моделью поиска сайтов связывания транскрипционных факторов (ССТФ) в пиках ChIP-seq является позиционная весовая матрица (position weight matrix, PWM). Но эта модель не учитывает взаимосвязи между частотами встреч нуклеотидов в разных позициях ССТФ, поэтому не способна гарантировать определение всех возможных структурных вариантов ССТФ. На сегодняшний день уже предложены альтернативные модели, например BaMM и InMoDe, которые учитывают такие взаимосвязи. Однако применение этих моделей обычно сводилось к сравнению их точности с точностью традиционной модели PWM, тогда как анализ совместной встречаемости и относительного расположения ССТФ разных моделей в пиках не производился. В нашей работе мы предлагаем конвейер программ MultiDeNA, позволяющий сочетать разные модели de novo поиска ССТФ для выявления структурной гетерогенности ССТФ в данных ChIP-seq. Разработанный конвейер включает этапы построения моделей на основе заданного набора пиков, оценки точности распознавания моделей с помощью перекрестных тестов, выбора порогов, сканирования пиков ChIP-seq и классификацию пиков по результатам сканирования. С применением конвейера нами проведен анализ 22 экспериментов ChIP-seq для ТФ FOXA2 с помощью четырех моделей: PWM, diPWM, BaMM и InMoDe. Показано, что сочетание моделей позволяет существенно увеличить общее количество распознанных пиков (на 26.3 %) по сравнению с применением только PWM; при этом основной вклад в распознавание внесла модель BaMM. В значительной доле пиков разные модели распознают совпадающие ССТФ; однако для моделей PWM, diPWM, BaMM и InMoDe медианы доли пиков, которые содержали ССТФ только одной модели, составили 1.08, 0.49, 4.15 и 1.73 % соответственно. Таким образом, совокупность ССТФ FOXA2 не описывается полностью только одной моделью, что свидетельствует о наличии структурной гетерогенности в ССТФ у FOXA2.
Переведенное названиеApplication of alternative de novo motif recognition models for analysis of structural heterogeneity of transcription factor binding sites: A case study of FOXA2 binding sites
Язык оригиналарусский
Номер статьи1
Страницы (с-по)7-17
Число страниц11
ЖурналVavilovskii Zhurnal Genetiki i Selektsii
Том25
Номер выпуска1
DOI
СостояниеОпубликовано - фев 2021

Предметные области OECD FOS+WOS

  • 1.06.KM ГЕНЕТИКА И НАСЛЕДСТВЕННОСТЬ
  • 3 МЕДИЦИНСКИЕ НАУКИ И ЗДРАВООХРАНЕНИЕ
  • 1.06 БИОЛОГИЧЕСКИЕ НАУКИ

ГРНТИ

  • 34 БИОЛОГИЯ

Fingerprint

Подробные сведения о темах исследования «Метод поиска структурной гетерогенности сайтов связывания транскрипционных факторов с использованием альтернативных de novo моделей на примере FOXA2». Вместе они формируют уникальный семантический отпечаток (fingerprint).

Цитировать