Comitês de agrupamentos aplicados a dados de expressão gênica /

Resumo: o principal objetivo deste trabalho é investigar a viabilidade da aplicação de técnicas de combinação de agrupamentos (comitês de agrupamento) a dados de expressão gênica. Mais especificamente serão realizados experimentos com três métodos diferentes de comitês de agrupamentos que vêm sendo...

ver descrição completa

Na minha lista:
Detalhes bibliográficos
Principais autores: Silva, Shirlly Christiany Macedo., Souto, Marcílio Carlos Pereira., Universidade Federal do Rio Grande do Norte.
Formato: Dissertação
Publicado em:
Assuntos:
Endereço do item:https://repositorio.ufrn.br/bitstream/123456789/18027/1/ShirllyCMS.pdf
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
Descrição
Resumo:Resumo: o principal objetivo deste trabalho é investigar a viabilidade da aplicação de técnicas de combinação de agrupamentos (comitês de agrupamento) a dados de expressão gênica. Mais especificamente serão realizados experimentos com três métodos diferentes de comitês de agrupamentos que vêm sendo bastante usados na literatura: matriz de co-associação, re-rotulagem e votação, e comitês baseados em particionamento de grafo. A entrada para esses métodos de combinação serão as partições geradas por três algoritmos de agrupamento, os quais representam diferentes paradigmas: k-médias, Expectation-Maximization (EM), e o algoritmo hierárquico com ligação média. Todos esse algoritmos vêm sendo amplamente utilizados no contexto de dados de expressão gênica. De forma geral, os resultados obtidos indicam um desempenho superior das técnicas de comitês em relação às técnicas de agrupamento individuais, principalmente no contexto de comitês heterogêneos, isto é, comitês formados por partições base geradas por diferentes algoritmos de agrupamentos.#$&Abstract: The main goal of this work is to investigate the suitability of applying cluster ensemble techniques (ensembles or committees) to gene expression data. More specificaIly, we will develop experiments with three different cluster ensembles methods, which have been used in many works in literature: co-association matrix, re-Iabeling and voting, and ensembles based on graph partitioning. The inputs for these methods wiIl be the partitions generated by three clustering algorithms, representing different paradigms: k-means, Expectation-Maximization (EM), and hierarchical method with average linkage. These algorithms have been widely applied to gene expression data. In general, the results obtained with our experiments indicate that the cluster ensemble methods present a better performance when compared to the individual techniques. This happens mainly for the heterogeneous ensembles, that is, ensembles built with base partitions generated with different clustering algorithms.