MINING_RNA: SISTEMA WEB PARA MINERAÇÃODE DADOS EM ESTUDOS TRANSCRIPTÔMICOS APARTIR DE MICROARRANJOS
Bioinformática, Microarranjo, GEO, Sistema WEB, Mineração de Dados.
Após a conclusão do mapeamento do genoma humano, em combinação com o crescente avanço tecnológico foi possível uma evolução significativa no âmbito da bioinformática. Esse progresso proporcionou o aprofundamento de diversos tipos de estudos e tecnologias de análise biológica, dentre estas o microarranjo. O aumento de pesquisas utilizando essa tecnologia para análise de DNA gerou uma multiplicação na quantidade de dados gerados. Aliado a necessidade publicar os dados brutos da pesquisa, impulsionou a necessidade da criação de bancos de dados públicos onde essas informações pudessem ser indexadas e resgatadas. Essas bases de dados são uma grande fonte de dados transcriptômicos que infelizmente acabam sendo subutilizadas. É comum que os softwares para reanálise desses dados não possuam uma interface gráfica e/ou apresentem lacunas em suas funcionalidades. O objetivo deste trabalho é o desenvolvimento de um sistema WEB para mineração de dados em estudos transcriptômicos a partir de microarranjos armazenados no banco de dados biológico GEO, esse sistema foi denominado de Mining_RNA. Para o desenvolvimento do sistema foi necessária uma revisão de literatura para listar as lacunas que pudessem ser exploradas por uma nova ferramenta, esta etapa culminou no levantamento de requisitos e planejamento da arquitetura que seria seguida para o desenvolvimento do sistema, este, foi desenvolvido com as linguagens de programação PHP e Python para respectivamente visualizar e o processar os dados. Os resultados obtidos no sistema foram validados comparando-os com o sistema GEO2R, mantido pelo NCBI e confrontados também com os resultados originais do estudo analisado. O sistema desenvolvido nessa pesquisa possibilita que, através de uma usabilidade passo-a-passo juntamente com uma série de filtros possam ser calculadas a expressão diferencial entre os genes de um estudo, possibilitando ainda a análise do cálculo do teste-t e do valor-p para cada gene do estudo analisado. A partir da validação dos dados gerados foi possível perceber que o sistema teve uma eficácia aproximada de 98% na comparação com o GEO2R e de mais de 90% na comparação com o estudo original. Os resultados somados dessa validação sinalizaram que o sistema desenvolvido pode ser uma forte aliada dos pesquisadores para a reanálise de estudos biológicos, possibilitando uma nova forma de analisar os dados e gerando resultados tão confiáveis quanto ferramentas já consolidadas.