Uma equipe de pesquisa identificou os genes responsáveis pela infecção viral presentes no mosquito Aedes aegypti utilizando apenas dados obtidos em bancos públicos. O trabalho foi desenvolvido pelos pesquisadores Artur Queiroz e Kiyoshi Fukutani – integrantes da Plataforma de Análise High Throughput (PAH) – associados à Plataforma Bioinformática de Alto Rendimento de Dados Biológicos, do Cidacs, capitaneada também pelo coautor do estudo e pesquisador do centro Pablo Ramos
A equipe reduziu o número de genes correlacionados especificamente com dengue, febre amarela e febre do Nilo, todas transmitidas pelo vetor, das centenas registradas na literatura científica para somente quatro, eliminando o efeito do processo alimentar na análise. Assim, o achado permitirá novas formas de controle vetorial e a produção de testes rápidos para detectar os mosquitos infectados.
A descoberta está detalhada no estudo Meta-analysis of Aedes aegypti expression datasets: comparing virus infection and blood fed transcriptomes to identify markers of virus presence, que estará disponível em acesso aberto até meados de janeiro no periódico Frontiers in Bioengineering and Biotechnology. Além de pesquisadores do Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs) e do Laboratório de Imunoparasitologia, ambos da Fiocruz Bahia, assinam o estudo pesquisadores da USP (Universidade de São Paulo), Universidade Federal de Uberlândia e da Universidade Tecnológica Federal do Paraná.
Sem alimento – O estudo conduzido pela equipe buscou identificar genes específicos da infecção viral no Aedes aegypti, independentemente da alimentação do vetor. “O mosquito se infecta durante a alimentação. Dessa forma, os genes associados ao processo alimentar poderiam estar escondendo os correlacionados ao processo infeccioso”, explica o pesquisador da USP Kiyoshi Fukutani, um dos coautores do estudo. “Ninguém anteriormente conseguiu remover esse processo da análise”, complementa o pesquisador do Cidacs Artur Queiroz.
Para chegar ao resultado, os pesquisadores utilizaram algoritmos para analisar 13 mil genes disponíveis em duas bases de dados (datasets) públicas, oriundas de outros estudos que coletaram a amostra desejada: mosquitos infectados; não-infectados; alimentados e não-alimentados. Comparando estes grupos, os pesquisadores chegaram a 110 genes com alta correlação.
Foi uma metodologia de Aprendizado de Máquina (Machine Learning), chamada Árvore de Decisão, que ajudou o grupo a refinar mais os resultados, chegando aos quatro genes. Desses, há um gene que, sozinho, é capaz de distinguir todas as amostras infectadas e, aposta o estudo, “deve ter um papel fundamental para discriminar a infecção viral”. Para validar a descoberta, os pesquisadores ainda compararam a análise com outros quatro datasets.
Com dados – Os pesquisadores Artur Queiroz e Kiyoshi Fukutani integram a Plataforma de Análise High Throughput (PAH), associado à Plataforma Bioinformática de Alto Rendimento de Dados Biológicos, do Cidacs, capitaneado também pelo coautor do estudo e pesquisador do centro Pablo Ramos. “O intuito do nosso grupo é montar protocolos de análise de expressão genética, vias de enriquecimento e redes de interação de genes. Pegamos dados disponíveis em bancos de dados públicos e reanalisamos com outras hipóteses”, explica Queiroz.
A grande aposta do grupo – e também do Cidacs – é que produzir novas pesquisas com dados públicos em um ambiente computacional voltado para análise de grandes volumes de dados (big data) ajuda a responder com mais acurácia e em menos tempo grandes questões científicas do campo da saúde. “Os dados estão disponíveis, mas poucos os reutilizam”, afirma Fukutani, apontando a dificuldade de se trabalhar com Big Data como uma possível limitação técnica, além do pouco interesse da comunidade científica em reanalisar dados de outros pesquisadores. “O potencial para este tipo de pesquisa é enorme”, conclui.
O próximo passo do grupo é utilizar o mesmo framework (conjunto dos 110 genes com alta correlação) para aplicar em novos dados oriundos das pesquisas com zika. Ainda que o potencial do que pode ser feito com o já publicado pela equipe seja animador: com a identificação desse pequeno grupo de genes, é possível até desenvolver soluções que neutralizem a infecção viral do mosquito.
Para que o achado saia dos servidores computacionais para às ruas, com aplicação no controle das infecções causadas pelo Aedes aegypti, falta ainda mais um passo: que outro grupo de pesquisadores, dessa vez os que utilizam jalecos e tubinhos, conduzam os testes in vitro. “Fizemos toda a avaliação e validação in silico [através de simulação computacional]. Nosso estudo está robusto”, conclui Queiroz.
Fonte: Fiocruz