Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina

One of the most important goals of bioinformatics is the ability to identify genes in uncharacterized DNA sequences on world wide database. Gene expression on prokaryotes initiates when the RNA-polymerase enzyme interacts with DNA regions called promoters. In these regions are located the main regul...

全面介紹

Na minha lista:
書目詳細資料
主要作者: Monteiro, Meika Iwata
其他作者: Gonçalves, Luiz Marcos Garcia
格式: Dissertação
語言:por
出版: Universidade Federal do Rio Grande do Norte
主題:
在線閱讀:https://repositorio.ufrn.br/jspui/handle/123456789/15416
標簽: 添加標簽
沒有標簽, 成為第一個標記此記錄!
id ri-123456789-15416
record_format dspace
institution Repositório Institucional
collection RI - UFRN
language por
topic Aprendizado de Máquina
Reconhecimento de Promotores
Bioinformática
Learning Machine
Promoters identification
Bioinformatics
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
spellingShingle Aprendizado de Máquina
Reconhecimento de Promotores
Bioinformática
Learning Machine
Promoters identification
Bioinformatics
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Monteiro, Meika Iwata
Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
description One of the most important goals of bioinformatics is the ability to identify genes in uncharacterized DNA sequences on world wide database. Gene expression on prokaryotes initiates when the RNA-polymerase enzyme interacts with DNA regions called promoters. In these regions are located the main regulatory elements of the transcription process. Despite the improvement of in vitro techniques for molecular biology analysis, characterizing and identifying a great number of promoters on a genome is a complex task. Nevertheless, the main drawback is the absence of a large set of promoters to identify conserved patterns among the species. Hence, a in silico method to predict them on any species is a challenge. Improved promoter prediction methods can be one step towards developing more reliable ab initio gene prediction methods. In this work, we present an empirical comparison of Machine Learning (ML) techniques such as Na¨ýve Bayes, Decision Trees, Support Vector Machines and Neural Networks, Voted Perceptron, PART, k-NN and and ensemble approaches (Bagging and Boosting) to the task of predicting Bacillus subtilis. In order to do so, we first built two data set of promoter and nonpromoter sequences for B. subtilis and a hybrid one. In order to evaluate of ML methods a cross-validation procedure is applied. Good results were obtained with methods of ML like SVM and Naïve Bayes using B. subtilis. However, we have not reached good results on hybrid database
author2 Gonçalves, Luiz Marcos Garcia
author_facet Gonçalves, Luiz Marcos Garcia
Monteiro, Meika Iwata
format masterThesis
author Monteiro, Meika Iwata
author_sort Monteiro, Meika Iwata
title Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
title_short Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
title_full Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
title_fullStr Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
title_full_unstemmed Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
title_sort predição de promotores de bacillus subtilis usando técnicas de aprendizado de máquina
publisher Universidade Federal do Rio Grande do Norte
publishDate 2014
url https://repositorio.ufrn.br/jspui/handle/123456789/15416
work_keys_str_mv AT monteiromeikaiwata predicaodepromotoresdebacillussubtilisusandotecnicasdeaprendizadodemaquina
_version_ 1773964358410305536
spelling ri-123456789-154162017-11-02T12:43:39Z Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina Monteiro, Meika Iwata Gonçalves, Luiz Marcos Garcia http://lattes.cnpq.br/6479379685092821 http://lattes.cnpq.br/1562357566810393 Souto, Marcílio Carlos Pereira de http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032E1 Oliveira, Jauvane Cavalcante de http://lattes.cnpq.br/4054756781423727 Dória Neto, Adrião Duarte http://lattes.cnpq.br/1987295209521433 Aprendizado de Máquina Reconhecimento de Promotores Bioinformática Learning Machine Promoters identification Bioinformatics CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA One of the most important goals of bioinformatics is the ability to identify genes in uncharacterized DNA sequences on world wide database. Gene expression on prokaryotes initiates when the RNA-polymerase enzyme interacts with DNA regions called promoters. In these regions are located the main regulatory elements of the transcription process. Despite the improvement of in vitro techniques for molecular biology analysis, characterizing and identifying a great number of promoters on a genome is a complex task. Nevertheless, the main drawback is the absence of a large set of promoters to identify conserved patterns among the species. Hence, a in silico method to predict them on any species is a challenge. Improved promoter prediction methods can be one step towards developing more reliable ab initio gene prediction methods. In this work, we present an empirical comparison of Machine Learning (ML) techniques such as Na¨ýve Bayes, Decision Trees, Support Vector Machines and Neural Networks, Voted Perceptron, PART, k-NN and and ensemble approaches (Bagging and Boosting) to the task of predicting Bacillus subtilis. In order to do so, we first built two data set of promoter and nonpromoter sequences for B. subtilis and a hybrid one. In order to evaluate of ML methods a cross-validation procedure is applied. Good results were obtained with methods of ML like SVM and Naïve Bayes using B. subtilis. However, we have not reached good results on hybrid database Um dos grandes desafios da Bioinformática é manipular e analisar os dados acumulados nas bases de dados mundiais. A expressão dos genes em procariotos é iniciada quando a enzima RNA polimerase une-se com uma região próxima ao gene, chamada de promotor, onde é localizado os principais elementos regulatórios do processo de transcrição. Apesar do crescente avanço das técnicas experimentais (in vitro) em biologia molecular, caracterizar e identificar um número significante de promotores ainda é uma tarefa difícil. Os métodos computacionais existentes enfrentam a falta de um número adequado de promotores conhecidos para identificar padrões conservados entre as espécies. Logo, um método para predizê-los em qualquer organismo procariótico ainda é um desafio. Neste trabalho, apresentamos uma comparação empírica de técnicas individuais de aprendizado de máquina, tais como: Classificador Bayesiano Ingênuo, Árvores de Decisão, Máquinas de Vetores de Suporte, Redes Neurais do tipo VotedPerceptron, PART e k-Vizinhos Mais Próximos e sistemas multiclassificadores (Bagging e Adaboosting) e Modelo Oculto de Markov à tarefa de predição de promotores procariotos em Bacilos subtilis. Utilizamos a validação cruzada para avaliar todos os métodos de AM. Para esses testes, foram construídas base de dados com seqüências de promotores e não-promotores do Bacillus subtilis e uma base de dados híbrida. Os métodos de AM obtiveram bons resultados com o SVM e o Naïve Bayes. Não conseguimos entretanto, obter resultados relevantes para a base de dados híbrida 2014-12-17T14:56:02Z 2007-02-12 2014-12-17T14:56:02Z 2005-12-13 masterThesis MONTEIRO, Meika Iwata. Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina. 2005. 92 f. Dissertação (Mestrado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2005. https://repositorio.ufrn.br/jspui/handle/123456789/15416 por Acesso Aberto application/pdf application/pdf Universidade Federal do Rio Grande do Norte BR UFRN Programa de Pós-Graduação em Engenharia Elétrica Automação e Sistemas; Engenharia de Computação; Telecomunicações