Слайды с пилотного семинара в высшей школе экономики.
Слайд варианта динамической сети можно посмотреть здесь: http://gyazo.com/22669956269833c6eb68582ffb8f9409
http://mirob.interactome.ru
Новые разработки QIAGEN для молекулярно-генетических исследований в онкологии...
Семинар по генным сетям. Mirob.
1.
2. “Анализ и визуализация генных сетей”
Александр Фокин
Институт Биологии Развития им. Н.К.Кольцова РАН,
РНИМУ им. Н.И. Пирогова
3. Генная сеть — группа координировано экспрессирующихся генов, их белковых
продуктов и микроРНК, контролирующих выполнение определенных функций
организма, а также механизмы взаимосвязей между собой .
Работа генной сети регулирует биохимические, физиологические и другие
процессы внутри клетки.
Кроме этого, генные сети тесно переплетены между собой и активно влияют на
работу друг друга.
5. Нужно уметь задавать правильные вопросы:
• Что и зачем мы хотим получить из огромного количества
информации?
• Как это сделать?
6. Что пошло не так внутри клетки конкретного организма?
• биомаркеры
прогностические
диагностические
Кто виноват?
• гены-мишени/мутации
• сигнальные каскады
Как исправить?
• лекарственные препараты
• гайд-лайны
35. Что дальше
● Динамическая визуализация генных сетей
● Градации по экспрессионным уровням на генной сети
● Анализ “сырых” данных в облаке (Arrays & RNA-seq)
● GWAS анализ
● Имплементация основных мировых гайд-лайнов
лечения онкозаболеваний
● Распределенные вычисления
Полноценный workflow от загрузки любых данных,
до понятного отчета.
Для построения генной сети нужно собирать и обрабатывать данные из разных источников.
Часто эти данные бывают «сырые», например с чипов или полученные с секвенаторов.
Но, для почти всех задач уже есть решения или информация частично собрана. Нужно лишь знать где она лежит, что из себя представляет и как правильно ее сопоставить с другими источниками.
Большинство алгоритмов связанных со статистикой и анализом графов были разработаны еще в середине прошлого века. Почти все новые алгоритмы – это модификаци старых или составление более сложных из нескольких простых.
Т.е. Продолжается игра в конструктор – мы не «изобретаем велосипед», а собираем из того, что уже есть. Зачем создавать то, что уже создано? Лучше использовать готовые вещи и модифицировать их под конкретные задачи.
Чтобы посмотреть, как выглядит то, что у нас получилось мы повесили GraphViz:
Надо сказать, когда появился первый визуальный фидбек, наши аннотаторы сразу заработали веселее: больше мотивов работать, когда ты сразу можешь увидеть, как каждый твой новый линк строит сложную систему геной сети.
Но затем, как-то незаметно и быстро контент увеличивался, а генные сети усложнялись еще быстрее. Начали появлятся монстры по популярным генам.
Подключили лидера в области визуализаци графов в биообластях -- Cytoscape, точнее его web версию Cytoscape Web. Что важно: появилась возможность двигать узлы.
Связали узлы в единые сущности. Но в базе данных оставили триединую структуру -- еще пригодится.
Но тут непонятно: сигнал вроде есть, а какой он? и что за механизм?
Пример построение сети по данным из внешних баз данных: HPRD и BioGrid
Видно, что много дублей и это в основном, межбелковые взаимодействия. К тому же предсказательные.
Эту часть мы еще будем дорабатывать.
Все равно много-много информации на одном экране. По этому нужно исползовать любые возможности отсечь ненужную информацию!
(несмотря на то, что у нас только валидированные взаимодействия, которые с очень высокой вероятностью гарантируют прохождение сигнала)
А нам еще нужно добавить болезни, мутации, метаболиты, фьюжн-гены и возможно что-то еще.
Использовать биоинформатические разработки надо очень осторожно.
В канаде есть неплохая бесплатная база данных по снипам SNPper, в которой коротко и ясно собрана необходимая информация по снипам из dbSNP и UCSC браузера.
именно на этой базе мы решили протесировать одну из наших разработок: