Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado

Clustering is a powerful tool for automated analysis of data. It addresses the following general problem: given a set of entities, find subsets, or clusters, which are homogeneous and/or well separated. The biggest challenge of data clustering is to find a criterion to present good separation of...

ver descrição completa

Na minha lista:
Detalhes bibliográficos
Autor principal: Randel, Rodrigo Alves
Outros Autores: Aloise, Daniel
Formato: Dissertação
Idioma:por
Publicado em: Brasil
Assuntos:
Endereço do item:https://repositorio.ufrn.br/jspui/handle/123456789/22569
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
id ri-123456789-22569
record_format dspace
spelling ri-123456789-225692017-11-04T02:59:59Z Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado Randel, Rodrigo Alves Aloise, Daniel http://lattes.cnpq.br/5740757705550380 http://lattes.cnpq.br/5093210888872414 Dória Neto, Adrião Duarte http://lattes.cnpq.br/1987295209521433 Lavor, Carlile Campos http://lattes.cnpq.br/2019624495480547 Agrupamento de dados semi-supervisionado Mineração de dados k-medianas CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃO Clustering is a powerful tool for automated analysis of data. It addresses the following general problem: given a set of entities, find subsets, or clusters, which are homogeneous and/or well separated. The biggest challenge of data clustering is to find a criterion to present good separation of data into homogeneous groups, so that these groups bring useful information to the user. To solve this problem, it is suggested that the user can provide a priori information about the data set. Clustering under this assumption is called semi-supervised clustering. This work explores the semi-supervised clustering problem using a new model: the data is clustered by solving the k-medians problem. Results shows that this new approach was able to efficiently cluster the data in many different domains. Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) Agrupamento de dados é uma poderosa ferramenta para análise automática de dados. Essa técnica se propõe a resolver o seguinte problema: dado um conjunto de entidades, encontrar subconjuntos, denominados clusters, que são homogêneos e/ou bem separados. O maior desafio do agrupamento de dados é encontrar um critério que apresente boa separação de dados em grupos homogêneos, e que estes agrupamentos possam trazer informações úteis ao usuário. Para resolver este problema, é sugerido que o usuário possa fornecer informações prévias a respeito do conjunto de dados que auxiliem/guiem o processo de agrupamento. Realizar o agrupamento de dados utilizando essas informações auxiliares é denominado de agrupamento de dados semi-supervisionado (ADSS). Este trabalho explora o problema de ADSS utilizando um novo modelo: os dados são agrupados através da resolução do problemas das k-medianas. Resultados mostram que essa abordagem foi capaz de agrupar os dados de forma eficiente para problemas de ADSS em diversos domínios diferentes. 2017-04-06T20:17:18Z 2017-04-06T20:17:18Z 2016-12-12 masterThesis RANDEL, Rodrigo Alves. Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado. 2016. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2016. https://repositorio.ufrn.br/jspui/handle/123456789/22569 por Acesso Aberto application/pdf Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
institution Repositório Institucional
collection RI - UFRN
language por
topic Agrupamento de dados semi-supervisionado
Mineração de dados
k-medianas
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃO
spellingShingle Agrupamento de dados semi-supervisionado
Mineração de dados
k-medianas
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃO
Randel, Rodrigo Alves
Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado
description Clustering is a powerful tool for automated analysis of data. It addresses the following general problem: given a set of entities, find subsets, or clusters, which are homogeneous and/or well separated. The biggest challenge of data clustering is to find a criterion to present good separation of data into homogeneous groups, so that these groups bring useful information to the user. To solve this problem, it is suggested that the user can provide a priori information about the data set. Clustering under this assumption is called semi-supervised clustering. This work explores the semi-supervised clustering problem using a new model: the data is clustered by solving the k-medians problem. Results shows that this new approach was able to efficiently cluster the data in many different domains.
author2 Aloise, Daniel
author_facet Aloise, Daniel
Randel, Rodrigo Alves
format masterThesis
author Randel, Rodrigo Alves
author_sort Randel, Rodrigo Alves
title Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado
title_short Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado
title_full Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado
title_fullStr Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado
title_full_unstemmed Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado
title_sort utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado
publisher Brasil
publishDate 2017
url https://repositorio.ufrn.br/jspui/handle/123456789/22569
work_keys_str_mv AT randelrodrigoalves utilizacaodoproblemadaskmedianascomocriterioparaoagrupamentodedadossemisupervisionado
_version_ 1773963189319368704