SlideShare a Scribd company logo
1 of 63
Bioinformática
para Zumbis
Quem é você?
Marcos Castro
Contato: mcastrosouza@live.com
Objetivo: que os conceitos sejam tão claros
de forma que até a sua avó possa entender
perfeitamente!
Bioinformática… O que é isso?
Pergunta errada…
Bioinformática… O que eu posso fazer com isso?
Pergunta correta!
Quanto à definição de Bioinformática, cada um
tem sua própria definição. Ao final da
apresentação você poderá definir a sua também!
Exemplo: se eu for da área de IA, posso dizer que
Bioinformática é a aplicação de técnicas de
machine learning para dados biológicos.
Sou da Computação:
print(‘Bioinformatica’[3:])
Sou da Biologia:
print(‘Bioinformatica’[0:3])
A Bioinformática é multidisciplinar :)
Keep calm…
Bioinformata
➜Basicamente é um profissional que entende
de biologia e trabalha com informação
tratando e interpretando os dados.
➜Exemplo: coletar informações clínicas de
pacientes para fazer estudos sobre alguma
doença com o objetivo de indicar um
tratamento mais eficaz.
Bioinformática - Formação
➜Poucos lugares do mundo têm graduação
em Bioinformática.
➜Normalmente as pessoas tem graduação
em algum curso bem estabelecido e fazem
pós em Bioinformática.
Hello Bioinformática
➜Relembrando os tempos de colégio...
➜O DNA tem 4 bases: Adenina, Citosina,
Timina e Guanina.
➜Guanina sempre liga com Citosina.
➜Adenina sempre liga com Timina.
➜O DNA é uma string muito grande...
Hello Bioinformática
➜DNA é grande?? Não tem problema, meu
computador tem memória, olha só:
Hello Bioinformática
➜Ok, tentamos alocar todo o genoma
humano (algo em torno de 3.2 GB) e já
começamos a ter problemas.
➜Um genoma sequenciado pode possuir 180
GB num formato FASTQ por exemplo.
➜FASTQ é um dos vários formatos de
arquivos para armazenamento de sequências
biológicas.
Hello Bioinformática
➜O RNA é o primo do DNA.
➜Ao invés da Timina, ele possui Uracila.
➜O RNA é utilizado para síntese de proteínas.
Dogma Central da Biologia Molecular
Hello Bioinformática
➜A Bioinformática está intimamente
relacionada com a Genética.
➜A Genética é a ciência que estuda os genes.
➜Gene é uma sequência de nucleotídeos.
➜Genoma é um conjunto de genes.
A sua “receita” são as informações contidas
nos genes que você herda dos seus pais.
As letrinhas A, C, T, G, ligadas entre si e se
repetindo, são responsáveis pelo que somos,
por nossas proteínas, pelas características
que nos fazem diferentes uns dos outros.
Sequenciamento
➜Objetivo: determinar a ordem dos
nucleotídeos de uma amostra de DNA.
➜Genoma sequenciado = determinação da
ordem dos genes.
Por que sequenciar?
➜Para obter informações sobre a linha
evolutiva dos organismos.
➜Exemplo: saber quem tem DNA mais
parecido com quem.
➜Essas informações podem nos levar a obter
novos medicamentos, vacinas, novos
métodos de diagnóstico etc.
Métodos de sequenciamento
➜Objetivo: determinar a ordem das quatro
bases nitrogenadas: Adenina, Citosina,
Guanina e Timina.
➜Sanger foi o primeiro (década de 70).
➜Sanger é um método que pode levar
bastante tempo...
Métodos de sequenciamento
➜Novos métodos de sequenciamento têm
surgido, métodos bem mais rápidos!
➜Mas calma... o Sanger não morreu.
➜Escolher um método de sequenciamento é
como escolher uma linguagem de
programação, não existe a melhor, depende
do que você vai resolver.
Métodos de sequenciamento
➜Exemplo: se você quer sequenciar um
fragmento pequeno (exemplo: gene),
compensa usar Sanger.
➜Se você quer sequenciar um genoma,
compensa mais utilizar novos métodos de
sequenciamento, pois em menos tempo
consegue-se sequenciar uma quantidade
maior de dados.
Métodos de sequenciamento
➜Para você ter uma ideia, os primeiros
sequenciadores de DNA liam um gene em 45
dias.
➜Com novos métodos, você consegue
sequenciar mais de 300 genes em 27 horas.
Sequenciadores
➜Sequenciadores tem capacidade de gerar X
bases sequenciadas (depende do modelo).
➜Varia o tamanho do fragmento que cada
um consegue sequenciar.
➜Quantos fragmentos? Depende da técnica,
mas o que importa é o tamanho desse
fragmento.
Sequenciadores
➜Então como ler milhões de bases?
➜Gera-se uma enorme quantidade de
fragmentos que tenham sobreposição entre si
para ler a quantidade necessária.
➜Para uma bactéria necessita de fragmentos
menores (genoma é menor), para humanos
necessita de fragmentos maiores.
Sequenciadores
➜Temos um monte de fragmentos...
➜Mas como montar esse quebra-cabeça?
➜Entraríamos no que chamamos de
montagem de DNA, mas isso é um outro
assunto...
Sequenciadores
➜Futuramente deve surgir um sequenciador
para ler milhões de bases e aí, quando isso
acontecer, o problema de montagem deixa
de existir.
➜E todos os softwares de montagem que
foram feitos? Vão para lixeira :-)
Tecnologias NGS
➜NGS = next generation sequencing
➜Melhorias: rapidez, custo...
➜Para se ter uma ideia, consegue-se
sequenciar um genoma humano por 1000
dólares.
➜Exemplo de sequenciador NGS: Illumina.
Tecnologias NGS
➜Tecnologias NGS geram milhares de
fragmentos de DNA (reads).
➜Grande volume de dados (Big Data).
➜O que fazer com esse dilúvio de dados?
➜Novos algoritmos, softwares, ferramentas...
Big Data
➜Antigamente você obtinha os dados, tinha
uma planilha e dava pra analisar tudo sem
grandes problemas.
➜Hoje em dia, você aperta um botão e tem
uma máquina que ao invés de gerar uma só
planilha, gera milhares.
➜Como observar milhões de dados?
Big Data - Definição
➜“Quantidade de dados suficientemente
grande que leve a uma mudança nas formas
tradicionais de análise de dados.”
➜As tecnologias NGS levaram a essa
mudança? Sim! A grande quantidade de
dados (big data) levou a essa mudança.
Big Data
➜Basicamente qualquer coisa no planeta
gera dados hoje em dia.
➜Você gera dados constantemente...
➜Espero que não nesse momento... 
Big Data
➜Com tecnologias NGS não é diferente.
➜Gera-se um grande volume de dados.
➜Precisamos de eficiência e eficácia!
➜Não adianta somente ter os dados, é
preciso saber o que fazer com eles.
➜Dados é o novo petróleo!
Big Data
➜Os dados precisam ser coletados...
➜... armazenados ...
➜... relacionados ...
➜... analisados ...
➜... para que você tenha ideias para resolver
problemas.
Uso dos dados
➜Com o entendimento dos dados genéticos
de um paciente por exemplo, pode-se auxiliar
no tratamento ou diagnóstico de alguma
doença.
➜A análise dos dados exige a participação da
computação e biologia: bioinformática.
➜O gargalo não é mais obter os dados, mas
sim analisar esses dados.
Eu gosto de algoritmos!!
➜Tudo bem, desafios é o que não faltam!!
➜Exemplo: os primeiros algoritmos de
alinhamento de sequências biológicas foram
baseados em programação dinâmica.
➜A Biologia já nos ajudou bastante com
inspiração para algoritmos genéticos, redes
neurais etc., que tal ajudarmos ela a resolver
problemas biológicos?
Machine learning
➜Aprender automaticamente a partir de um
grande volume de dados.
➜Existem várias técnicas:
Redes Neurais
KNN
Data Mining
(...)
Machine learning
➜Por muitos anos, sub-áreas da Biologia tem
inspirado várias técnicas de aprendizado de
máquina (AM).
➜Atualmente, várias pesquisas na Biologia
vêm utilizando essas técnicas de aprendizado
de máquina.
➜Conte-me mais sobre isso...
Machine learning
➜Exemplo: alinhamento de sequências.
➜O alinhamento é o processo de comparar
sequências.
➜Métodos de alinhamento que utilizam
programação dinâmica têm um custo elevado,
embora garantam a melhor solução.
Machine learning
➜Já os chamados métodos heurísticos,
embora não garantam a melhor solução,
podem garantir boas soluções a um custo
bem menor.
➜Existem métodos que utilizam algoritmos
genéticos (que é uma heurística) para fazer o
alinhamento de sequências.
Linguagem de Programação
➜Não existe a melhor linguagem de
programação para Bioinformática.
➜Veja uma linguagem de programação como
uma ferramenta.
➜Linguagem de programação é como time de
futebol, você tem a sua preferida, mas nem
sempre ela vai bem.
Linguagem de Programação
➜Vários projetos em Bioinformática vêm
utilizando Python e R. Perl também é
bastante utilizada.
➜A Bioinformática possui centenas de
ferramentas escritas nas mais variadas
linguagens: C/C++, Python, R, Perl, Java etc.
Python
➜Sou suspeito para falar sobre Python.
➜Python possui baterias inclusas e módulos
de terceiros que irão facilitar bastante a sua
vida.
➜Em se tratando de Bioinformática, possui o
BioPython que faz parte dos Bio Projects
(existe também BioPerl, BioJava etc.).
Python
➜Estatística? Pandas
➜Machine Learning? Scikit-learn, PyBrain
➜Plotar gráficos? Matplotlib
➜Processamento numérico? NumPy
➜Python está preparado para computação
científica!
Ferramentas
➜Apesar de existirem diversas ferramentas
para Bioinformática, você também pode
escrever a sua.
➜Exemplo de uma ferramenta para o
agrupamento (data mining) de sequências
biológicas:
https://goo.gl/2wPGGT
Ferramentas
➜Apesar de ter bastante coisa pronta, é de
suma importância que você saiba alguma
linguagem de programação, mesmo que seja
para construir simples scripts.
Linux
➜Por causa da grande quantidade de dados,
provavelmente você irá rodar programas em
servidores.
➜É aconselhável ter intimidade com os
comandos do terminal do Linux.
No que eu venho trabalhando?
➜Grafos De Bruijn
➜Objetivo: detecção de variações genéticas.
➜Planta: cana-de-açúcar.
➜Apresentação sobre o tema:
http://goo.gl/lcrnPx
Implementação De Bruijn Graphs em Python:
https://github.com/marcoscastro/bruijn_graph
Precisamos de você!
É bom saber...
➜Um pouco de cada:
Matemática
Estatística
Computação (Stackoverflow)
Biologia
Case de sucesso em Bioinformática
➜Genomika
Case de sucesso em Bioinformática
➜Genomika
➜A empresa faz análises clínicas dentre
outras coisas.
https://www.genomika.com.br
Aprendendo Bioinformática com Rosalind
➜Problemas de Bioinformática.
➜Qualquer linguagem de programação.
➜Tem problemas fáceis, médios, difíceis...
➜Ranking geral e ranking por país.
http://rosalind.info/
Big Data
➜Quer aprender mais sobre Big Data?
➜Curso de Big Data em Saúde no Brasil:
https://www.coursera.org/course/bigdatabrasil
Ciência de Dados
➜Quer aprender sobre Ciência de Dados?
➜Introdução à Ciência de Dados:
http://goo.gl/qkpBnz
(com direito a certificado)
Curso de Bioinformática com Biopython
➜Aprendendo Bioinformática com Python:
https://goo.gl/V3uhLz
(com direito a certificado)
Dica de livro
Aprender o que eu já sei não tem graça!
Obrigado!
Alguns contatos:
mcastrosouza@live.com
http://bioinformatica.blog.br/
https://github.com/marcoscastro

More Related Content

What's hot

Aula 1 introdução a microbiologia
Aula 1 introdução a microbiologiaAula 1 introdução a microbiologia
Aula 1 introdução a microbiologia
Rubistenia Araújo
 
1ª aula biologia celular
1ª aula biologia celular1ª aula biologia celular
1ª aula biologia celular
Flávio Silva
 
Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)
Bio
 
V.1 Introdução a ecologia
V.1 Introdução a ecologiaV.1 Introdução a ecologia
V.1 Introdução a ecologia
Rebeca Vale
 
CéLulas Tronco (Power Point)
CéLulas Tronco (Power Point)CéLulas Tronco (Power Point)
CéLulas Tronco (Power Point)
Bio
 

What's hot (20)

Aula Introdução à Citologia
Aula Introdução à CitologiaAula Introdução à Citologia
Aula Introdução à Citologia
 
Células procariontes e eucariontes
Células procariontes e eucariontesCélulas procariontes e eucariontes
Células procariontes e eucariontes
 
Aula fungos 2018
Aula fungos 2018Aula fungos 2018
Aula fungos 2018
 
Aula de microbiologia ppt
Aula de microbiologia   pptAula de microbiologia   ppt
Aula de microbiologia ppt
 
Células troncos
Células troncosCélulas troncos
Células troncos
 
Aula 1 introdução a microbiologia
Aula 1 introdução a microbiologiaAula 1 introdução a microbiologia
Aula 1 introdução a microbiologia
 
III. 1 Histórico Biotecnologia
III. 1 Histórico BiotecnologiaIII. 1 Histórico Biotecnologia
III. 1 Histórico Biotecnologia
 
Taxonomia bacteriana-e-estrutura-de-células-procarióticas
Taxonomia bacteriana-e-estrutura-de-células-procarióticasTaxonomia bacteriana-e-estrutura-de-células-procarióticas
Taxonomia bacteriana-e-estrutura-de-células-procarióticas
 
Slides da aula de Biologia (Marcelo) sobre Biotecnologia
Slides da aula de Biologia (Marcelo) sobre BiotecnologiaSlides da aula de Biologia (Marcelo) sobre Biotecnologia
Slides da aula de Biologia (Marcelo) sobre Biotecnologia
 
Microbiologia 1
Microbiologia 1Microbiologia 1
Microbiologia 1
 
1ª aula biologia celular
1ª aula biologia celular1ª aula biologia celular
1ª aula biologia celular
 
Introdução a genetica
Introdução a geneticaIntrodução a genetica
Introdução a genetica
 
Sistematica e filogenia
Sistematica e filogeniaSistematica e filogenia
Sistematica e filogenia
 
Aula de Parasitologia Básica
Aula de Parasitologia BásicaAula de Parasitologia Básica
Aula de Parasitologia Básica
 
Composição química dos seres vivos
Composição química dos seres vivosComposição química dos seres vivos
Composição química dos seres vivos
 
Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)Biotecnologia e Engenharia Genética (Power Point)
Biotecnologia e Engenharia Genética (Power Point)
 
V.1 Introdução a ecologia
V.1 Introdução a ecologiaV.1 Introdução a ecologia
V.1 Introdução a ecologia
 
CéLulas Tronco (Power Point)
CéLulas Tronco (Power Point)CéLulas Tronco (Power Point)
CéLulas Tronco (Power Point)
 
Introducao à Biotecnologia I
Introducao à Biotecnologia IIntroducao à Biotecnologia I
Introducao à Biotecnologia I
 
Neodarwinismo e Evolução Humana
Neodarwinismo e Evolução HumanaNeodarwinismo e Evolução Humana
Neodarwinismo e Evolução Humana
 

Viewers also liked

Introdução a bioinformatica
Introdução a bioinformaticaIntrodução a bioinformatica
Introdução a bioinformatica
UERGS
 
Sistemas. presentacion bioinformática
Sistemas. presentacion bioinformáticaSistemas. presentacion bioinformática
Sistemas. presentacion bioinformática
MariaAlejandraC23
 
Jenkins e a Integração Contínua
Jenkins e a Integração ContínuaJenkins e a Integração Contínua
Jenkins e a Integração Contínua
Denis Vieira
 
Bioinformatica
BioinformaticaBioinformatica
Bioinformatica
CarolNav
 
Rethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing eraRethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing era
Leandro Lemos
 

Viewers also liked (20)

A importância da Bioinformática
A importância da BioinformáticaA importância da Bioinformática
A importância da Bioinformática
 
Ferramentas para Bioinformática
Ferramentas para BioinformáticaFerramentas para Bioinformática
Ferramentas para Bioinformática
 
Bioinformática com Rosalind utilizando Python
Bioinformática com Rosalind utilizando PythonBioinformática com Rosalind utilizando Python
Bioinformática com Rosalind utilizando Python
 
Árvores de Decisão
Árvores de DecisãoÁrvores de Decisão
Árvores de Decisão
 
Bioinformática com Biopython
Bioinformática com BiopythonBioinformática com Biopython
Bioinformática com Biopython
 
Introdução a bioinformatica
Introdução a bioinformaticaIntrodução a bioinformatica
Introdução a bioinformatica
 
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
Como seu DNA com a Bioinformática pode revolucionar o diagnóstico clínico no ...
 
Agrupamento de sequências biológicas
Agrupamento de sequências biológicasAgrupamento de sequências biológicas
Agrupamento de sequências biológicas
 
Testes em Bioinformática
Testes em BioinformáticaTestes em Bioinformática
Testes em Bioinformática
 
Bioinformatics en español
Bioinformatics en españolBioinformatics en español
Bioinformatics en español
 
Sistemas. presentacion bioinformática
Sistemas. presentacion bioinformáticaSistemas. presentacion bioinformática
Sistemas. presentacion bioinformática
 
Jenkins e a Integração Contínua
Jenkins e a Integração ContínuaJenkins e a Integração Contínua
Jenkins e a Integração Contínua
 
Bioinformática
BioinformáticaBioinformática
Bioinformática
 
Bioinformatica
BioinformaticaBioinformatica
Bioinformatica
 
Arquivos FASTQ
Arquivos FASTQArquivos FASTQ
Arquivos FASTQ
 
Grafos De Bruijn para identificação de variações genéticas usando GBS
Grafos De Bruijn para identificação de variações genéticas usando GBSGrafos De Bruijn para identificação de variações genéticas usando GBS
Grafos De Bruijn para identificação de variações genéticas usando GBS
 
Nazareno ufla 14 agrocafe
Nazareno ufla 14 agrocafeNazareno ufla 14 agrocafe
Nazareno ufla 14 agrocafe
 
Rethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing eraRethinking microbial diversity analysis in the high throughput sequencing era
Rethinking microbial diversity analysis in the high throughput sequencing era
 
Bioinformática aplicada nas análises da microbiota do rúmen
Bioinformática aplicada nas análises da microbiota do rúmenBioinformática aplicada nas análises da microbiota do rúmen
Bioinformática aplicada nas análises da microbiota do rúmen
 
Novas tecnologias sequenciamento fronteiras biologia unb 10112010
Novas tecnologias sequenciamento fronteiras biologia unb 10112010Novas tecnologias sequenciamento fronteiras biologia unb 10112010
Novas tecnologias sequenciamento fronteiras biologia unb 10112010
 

Similar to Bioinformática

InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de DoençasInfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
Carlos Carvalho
 

Similar to Bioinformática (20)

Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a Bioinformática
 
Linhas de Código e a Ciência
Linhas de Código e a CiênciaLinhas de Código e a Ciência
Linhas de Código e a Ciência
 
Desafios matemáticos e computacionais da neurociência
Desafios matemáticos e computacionais da neurociênciaDesafios matemáticos e computacionais da neurociência
Desafios matemáticos e computacionais da neurociência
 
Como interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com PythonComo interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com Python
 
Esteganografia
EsteganografiaEsteganografia
Esteganografia
 
1228690340 ds
1228690340 ds1228690340 ds
1228690340 ds
 
ACC-Bioinformatica-Seminario
ACC-Bioinformatica-SeminarioACC-Bioinformatica-Seminario
ACC-Bioinformatica-Seminario
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
 
TDC2018SP | UX Design - Ajudando quem nao sabe programar a criar expressoes p...
TDC2018SP | UX Design - Ajudando quem nao sabe programar a criar expressoes p...TDC2018SP | UX Design - Ajudando quem nao sabe programar a criar expressoes p...
TDC2018SP | UX Design - Ajudando quem nao sabe programar a criar expressoes p...
 
Palestra sobre Bioinformática
Palestra sobre BioinformáticaPalestra sobre Bioinformática
Palestra sobre Bioinformática
 
Sequenciação do genoma Humano
Sequenciação do genoma HumanoSequenciação do genoma Humano
Sequenciação do genoma Humano
 
InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de DoençasInfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
InfoPI 2013 - Minicurso - A Bioinformática na Cura de Doenças
 
Exploring the Applications and Potential of Bioinformatics
Exploring the Applications and Potential of BioinformaticsExploring the Applications and Potential of Bioinformatics
Exploring the Applications and Potential of Bioinformatics
 
Como Python ajudou a automatizar o nosso laboratório v.2
Como Python ajudou a automatizar o nosso laboratório v.2Como Python ajudou a automatizar o nosso laboratório v.2
Como Python ajudou a automatizar o nosso laboratório v.2
 
estratc3a9gias-de-leitura.ppt
estratc3a9gias-de-leitura.pptestratc3a9gias-de-leitura.ppt
estratc3a9gias-de-leitura.ppt
 
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
 
Como ler textos_em_inglês (1)
Como ler textos_em_inglês (1)Como ler textos_em_inglês (1)
Como ler textos_em_inglês (1)
 
Ebook logica-de-programacao-para-iniciantes
Ebook logica-de-programacao-para-iniciantesEbook logica-de-programacao-para-iniciantes
Ebook logica-de-programacao-para-iniciantes
 
Avanços e perspectivas em Bioinformática
Avanços e perspectivas em BioinformáticaAvanços e perspectivas em Bioinformática
Avanços e perspectivas em Bioinformática
 
Int. à Bioinformática (FMU - 08/05/2012)
Int. à Bioinformática (FMU - 08/05/2012)Int. à Bioinformática (FMU - 08/05/2012)
Int. à Bioinformática (FMU - 08/05/2012)
 

More from Marcos Castro

More from Marcos Castro (20)

Colored de Bruijn Graphs
Colored de Bruijn GraphsColored de Bruijn Graphs
Colored de Bruijn Graphs
 
Maratona de Programação
Maratona de ProgramaçãoMaratona de Programação
Maratona de Programação
 
Redes Neurais Artificiais
Redes Neurais ArtificiaisRedes Neurais Artificiais
Redes Neurais Artificiais
 
Problema do Caixeiro Viajante
Problema do Caixeiro ViajanteProblema do Caixeiro Viajante
Problema do Caixeiro Viajante
 
Metaheurística Simulated Annealing
Metaheurística Simulated AnnealingMetaheurística Simulated Annealing
Metaheurística Simulated Annealing
 
Expressões Regulares com Python 3
Expressões Regulares com Python 3Expressões Regulares com Python 3
Expressões Regulares com Python 3
 
Algoritmos gulosos
Algoritmos gulososAlgoritmos gulosos
Algoritmos gulosos
 
Programação dinâmica
Programação dinâmicaProgramação dinâmica
Programação dinâmica
 
Busca em largura - BFS
Busca em largura - BFSBusca em largura - BFS
Busca em largura - BFS
 
Análise Assintótica
Análise AssintóticaAnálise Assintótica
Análise Assintótica
 
Listas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionáriosListas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionários
 
Python - Set
Python - SetPython - Set
Python - Set
 
Python - Dicionários
Python - DicionáriosPython - Dicionários
Python - Dicionários
 
Tabela Hash
Tabela HashTabela Hash
Tabela Hash
 
Binary heap
Binary heapBinary heap
Binary heap
 
Fila de prioridades
Fila de prioridadesFila de prioridades
Fila de prioridades
 
Backtracking - Gerar todos os subconjuntos
Backtracking - Gerar todos os subconjuntosBacktracking - Gerar todos os subconjuntos
Backtracking - Gerar todos os subconjuntos
 
Longest palindromic subsequence (LPS)
Longest palindromic subsequence (LPS)Longest palindromic subsequence (LPS)
Longest palindromic subsequence (LPS)
 
Problema da Mochila 0-1 (Knapsack problem)
Problema da Mochila 0-1 (Knapsack problem)Problema da Mochila 0-1 (Knapsack problem)
Problema da Mochila 0-1 (Knapsack problem)
 
Algoritmo de Knuth-Morris-Pratt - KMP
Algoritmo de Knuth-Morris-Pratt - KMPAlgoritmo de Knuth-Morris-Pratt - KMP
Algoritmo de Knuth-Morris-Pratt - KMP
 

Recently uploaded

apostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médioapostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médio
rosenilrucks
 
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptxTeoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
TailsonSantos1
 
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
LeloIurk1
 
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdfGEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
RavenaSales1
 
matematica aula didatica prática e tecni
matematica aula didatica prática e tecnimatematica aula didatica prática e tecni
matematica aula didatica prática e tecni
CleidianeCarvalhoPer
 

Recently uploaded (20)

apostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médioapostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médio
 
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptxTeoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
 
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxSlides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
 
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
 
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcanteCOMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
 
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
 
Camadas da terra -Litosfera conteúdo 6º ano
Camadas da terra -Litosfera  conteúdo 6º anoCamadas da terra -Litosfera  conteúdo 6º ano
Camadas da terra -Litosfera conteúdo 6º ano
 
migração e trabalho 2º ano.pptx fenomenos
migração e trabalho 2º ano.pptx fenomenosmigração e trabalho 2º ano.pptx fenomenos
migração e trabalho 2º ano.pptx fenomenos
 
Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!
 
PROJETO DE EXTENSÃO I - Radiologia Tecnologia
PROJETO DE EXTENSÃO I - Radiologia TecnologiaPROJETO DE EXTENSÃO I - Radiologia Tecnologia
PROJETO DE EXTENSÃO I - Radiologia Tecnologia
 
Aula sobre o Imperialismo Europeu no século XIX
Aula sobre o Imperialismo Europeu no século XIXAula sobre o Imperialismo Europeu no século XIX
Aula sobre o Imperialismo Europeu no século XIX
 
About Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de HotéisAbout Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de Hotéis
 
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdfPROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
 
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdfGEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
 
matematica aula didatica prática e tecni
matematica aula didatica prática e tecnimatematica aula didatica prática e tecni
matematica aula didatica prática e tecni
 
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfApresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
 
Slides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptx
Slides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptxSlides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptx
Slides Lição 05, Central Gospel, A Grande Tribulação, 1Tr24.pptx
 
Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...
Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...
Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...
 
Seminário Biologia e desenvolvimento da matrinxa.pptx
Seminário Biologia e desenvolvimento da matrinxa.pptxSeminário Biologia e desenvolvimento da matrinxa.pptx
Seminário Biologia e desenvolvimento da matrinxa.pptx
 
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdfRecomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
 

Bioinformática

  • 2. Quem é você? Marcos Castro Contato: mcastrosouza@live.com
  • 3. Objetivo: que os conceitos sejam tão claros de forma que até a sua avó possa entender perfeitamente!
  • 4. Bioinformática… O que é isso? Pergunta errada…
  • 5. Bioinformática… O que eu posso fazer com isso? Pergunta correta!
  • 6. Quanto à definição de Bioinformática, cada um tem sua própria definição. Ao final da apresentação você poderá definir a sua também!
  • 7. Exemplo: se eu for da área de IA, posso dizer que Bioinformática é a aplicação de técnicas de machine learning para dados biológicos.
  • 10. A Bioinformática é multidisciplinar :)
  • 12. Bioinformata ➜Basicamente é um profissional que entende de biologia e trabalha com informação tratando e interpretando os dados. ➜Exemplo: coletar informações clínicas de pacientes para fazer estudos sobre alguma doença com o objetivo de indicar um tratamento mais eficaz.
  • 13. Bioinformática - Formação ➜Poucos lugares do mundo têm graduação em Bioinformática. ➜Normalmente as pessoas tem graduação em algum curso bem estabelecido e fazem pós em Bioinformática.
  • 14. Hello Bioinformática ➜Relembrando os tempos de colégio... ➜O DNA tem 4 bases: Adenina, Citosina, Timina e Guanina. ➜Guanina sempre liga com Citosina. ➜Adenina sempre liga com Timina. ➜O DNA é uma string muito grande...
  • 15. Hello Bioinformática ➜DNA é grande?? Não tem problema, meu computador tem memória, olha só:
  • 16. Hello Bioinformática ➜Ok, tentamos alocar todo o genoma humano (algo em torno de 3.2 GB) e já começamos a ter problemas. ➜Um genoma sequenciado pode possuir 180 GB num formato FASTQ por exemplo. ➜FASTQ é um dos vários formatos de arquivos para armazenamento de sequências biológicas.
  • 17. Hello Bioinformática ➜O RNA é o primo do DNA. ➜Ao invés da Timina, ele possui Uracila. ➜O RNA é utilizado para síntese de proteínas.
  • 18. Dogma Central da Biologia Molecular
  • 19. Hello Bioinformática ➜A Bioinformática está intimamente relacionada com a Genética. ➜A Genética é a ciência que estuda os genes. ➜Gene é uma sequência de nucleotídeos. ➜Genoma é um conjunto de genes.
  • 20. A sua “receita” são as informações contidas nos genes que você herda dos seus pais.
  • 21. As letrinhas A, C, T, G, ligadas entre si e se repetindo, são responsáveis pelo que somos, por nossas proteínas, pelas características que nos fazem diferentes uns dos outros.
  • 22. Sequenciamento ➜Objetivo: determinar a ordem dos nucleotídeos de uma amostra de DNA. ➜Genoma sequenciado = determinação da ordem dos genes.
  • 23. Por que sequenciar? ➜Para obter informações sobre a linha evolutiva dos organismos. ➜Exemplo: saber quem tem DNA mais parecido com quem. ➜Essas informações podem nos levar a obter novos medicamentos, vacinas, novos métodos de diagnóstico etc.
  • 24. Métodos de sequenciamento ➜Objetivo: determinar a ordem das quatro bases nitrogenadas: Adenina, Citosina, Guanina e Timina. ➜Sanger foi o primeiro (década de 70). ➜Sanger é um método que pode levar bastante tempo...
  • 25. Métodos de sequenciamento ➜Novos métodos de sequenciamento têm surgido, métodos bem mais rápidos! ➜Mas calma... o Sanger não morreu. ➜Escolher um método de sequenciamento é como escolher uma linguagem de programação, não existe a melhor, depende do que você vai resolver.
  • 26. Métodos de sequenciamento ➜Exemplo: se você quer sequenciar um fragmento pequeno (exemplo: gene), compensa usar Sanger. ➜Se você quer sequenciar um genoma, compensa mais utilizar novos métodos de sequenciamento, pois em menos tempo consegue-se sequenciar uma quantidade maior de dados.
  • 27. Métodos de sequenciamento ➜Para você ter uma ideia, os primeiros sequenciadores de DNA liam um gene em 45 dias. ➜Com novos métodos, você consegue sequenciar mais de 300 genes em 27 horas.
  • 28. Sequenciadores ➜Sequenciadores tem capacidade de gerar X bases sequenciadas (depende do modelo). ➜Varia o tamanho do fragmento que cada um consegue sequenciar. ➜Quantos fragmentos? Depende da técnica, mas o que importa é o tamanho desse fragmento.
  • 29. Sequenciadores ➜Então como ler milhões de bases? ➜Gera-se uma enorme quantidade de fragmentos que tenham sobreposição entre si para ler a quantidade necessária. ➜Para uma bactéria necessita de fragmentos menores (genoma é menor), para humanos necessita de fragmentos maiores.
  • 30. Sequenciadores ➜Temos um monte de fragmentos... ➜Mas como montar esse quebra-cabeça? ➜Entraríamos no que chamamos de montagem de DNA, mas isso é um outro assunto...
  • 31. Sequenciadores ➜Futuramente deve surgir um sequenciador para ler milhões de bases e aí, quando isso acontecer, o problema de montagem deixa de existir. ➜E todos os softwares de montagem que foram feitos? Vão para lixeira :-)
  • 32. Tecnologias NGS ➜NGS = next generation sequencing ➜Melhorias: rapidez, custo... ➜Para se ter uma ideia, consegue-se sequenciar um genoma humano por 1000 dólares. ➜Exemplo de sequenciador NGS: Illumina.
  • 33. Tecnologias NGS ➜Tecnologias NGS geram milhares de fragmentos de DNA (reads). ➜Grande volume de dados (Big Data). ➜O que fazer com esse dilúvio de dados? ➜Novos algoritmos, softwares, ferramentas...
  • 34. Big Data ➜Antigamente você obtinha os dados, tinha uma planilha e dava pra analisar tudo sem grandes problemas. ➜Hoje em dia, você aperta um botão e tem uma máquina que ao invés de gerar uma só planilha, gera milhares. ➜Como observar milhões de dados?
  • 35. Big Data - Definição ➜“Quantidade de dados suficientemente grande que leve a uma mudança nas formas tradicionais de análise de dados.” ➜As tecnologias NGS levaram a essa mudança? Sim! A grande quantidade de dados (big data) levou a essa mudança.
  • 36. Big Data ➜Basicamente qualquer coisa no planeta gera dados hoje em dia. ➜Você gera dados constantemente... ➜Espero que não nesse momento... 
  • 37. Big Data ➜Com tecnologias NGS não é diferente. ➜Gera-se um grande volume de dados. ➜Precisamos de eficiência e eficácia! ➜Não adianta somente ter os dados, é preciso saber o que fazer com eles. ➜Dados é o novo petróleo!
  • 38. Big Data ➜Os dados precisam ser coletados... ➜... armazenados ... ➜... relacionados ... ➜... analisados ... ➜... para que você tenha ideias para resolver problemas.
  • 39. Uso dos dados ➜Com o entendimento dos dados genéticos de um paciente por exemplo, pode-se auxiliar no tratamento ou diagnóstico de alguma doença. ➜A análise dos dados exige a participação da computação e biologia: bioinformática. ➜O gargalo não é mais obter os dados, mas sim analisar esses dados.
  • 40. Eu gosto de algoritmos!! ➜Tudo bem, desafios é o que não faltam!! ➜Exemplo: os primeiros algoritmos de alinhamento de sequências biológicas foram baseados em programação dinâmica. ➜A Biologia já nos ajudou bastante com inspiração para algoritmos genéticos, redes neurais etc., que tal ajudarmos ela a resolver problemas biológicos?
  • 41. Machine learning ➜Aprender automaticamente a partir de um grande volume de dados. ➜Existem várias técnicas: Redes Neurais KNN Data Mining (...)
  • 42. Machine learning ➜Por muitos anos, sub-áreas da Biologia tem inspirado várias técnicas de aprendizado de máquina (AM). ➜Atualmente, várias pesquisas na Biologia vêm utilizando essas técnicas de aprendizado de máquina. ➜Conte-me mais sobre isso...
  • 43. Machine learning ➜Exemplo: alinhamento de sequências. ➜O alinhamento é o processo de comparar sequências. ➜Métodos de alinhamento que utilizam programação dinâmica têm um custo elevado, embora garantam a melhor solução.
  • 44. Machine learning ➜Já os chamados métodos heurísticos, embora não garantam a melhor solução, podem garantir boas soluções a um custo bem menor. ➜Existem métodos que utilizam algoritmos genéticos (que é uma heurística) para fazer o alinhamento de sequências.
  • 45. Linguagem de Programação ➜Não existe a melhor linguagem de programação para Bioinformática. ➜Veja uma linguagem de programação como uma ferramenta. ➜Linguagem de programação é como time de futebol, você tem a sua preferida, mas nem sempre ela vai bem.
  • 46. Linguagem de Programação ➜Vários projetos em Bioinformática vêm utilizando Python e R. Perl também é bastante utilizada. ➜A Bioinformática possui centenas de ferramentas escritas nas mais variadas linguagens: C/C++, Python, R, Perl, Java etc.
  • 47. Python ➜Sou suspeito para falar sobre Python. ➜Python possui baterias inclusas e módulos de terceiros que irão facilitar bastante a sua vida. ➜Em se tratando de Bioinformática, possui o BioPython que faz parte dos Bio Projects (existe também BioPerl, BioJava etc.).
  • 48. Python ➜Estatística? Pandas ➜Machine Learning? Scikit-learn, PyBrain ➜Plotar gráficos? Matplotlib ➜Processamento numérico? NumPy ➜Python está preparado para computação científica!
  • 49. Ferramentas ➜Apesar de existirem diversas ferramentas para Bioinformática, você também pode escrever a sua. ➜Exemplo de uma ferramenta para o agrupamento (data mining) de sequências biológicas: https://goo.gl/2wPGGT
  • 50. Ferramentas ➜Apesar de ter bastante coisa pronta, é de suma importância que você saiba alguma linguagem de programação, mesmo que seja para construir simples scripts.
  • 51. Linux ➜Por causa da grande quantidade de dados, provavelmente você irá rodar programas em servidores. ➜É aconselhável ter intimidade com os comandos do terminal do Linux.
  • 52. No que eu venho trabalhando? ➜Grafos De Bruijn ➜Objetivo: detecção de variações genéticas. ➜Planta: cana-de-açúcar. ➜Apresentação sobre o tema: http://goo.gl/lcrnPx Implementação De Bruijn Graphs em Python: https://github.com/marcoscastro/bruijn_graph
  • 54. É bom saber... ➜Um pouco de cada: Matemática Estatística Computação (Stackoverflow) Biologia
  • 55. Case de sucesso em Bioinformática ➜Genomika
  • 56. Case de sucesso em Bioinformática ➜Genomika ➜A empresa faz análises clínicas dentre outras coisas. https://www.genomika.com.br
  • 57. Aprendendo Bioinformática com Rosalind ➜Problemas de Bioinformática. ➜Qualquer linguagem de programação. ➜Tem problemas fáceis, médios, difíceis... ➜Ranking geral e ranking por país. http://rosalind.info/
  • 58. Big Data ➜Quer aprender mais sobre Big Data? ➜Curso de Big Data em Saúde no Brasil: https://www.coursera.org/course/bigdatabrasil
  • 59. Ciência de Dados ➜Quer aprender sobre Ciência de Dados? ➜Introdução à Ciência de Dados: http://goo.gl/qkpBnz (com direito a certificado)
  • 60. Curso de Bioinformática com Biopython ➜Aprendendo Bioinformática com Python: https://goo.gl/V3uhLz (com direito a certificado)
  • 62. Aprender o que eu já sei não tem graça!