Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados

In this thesis we propose a new approach to unsupervised data clustering and classification. The proposed approach is based on typicality and eccentricity concepts. This concepts are used by recently introduced TEDA algorithm for outlier detection. To perform data clustering and classification, i...

ver descrição completa

Na minha lista:
Detalhes bibliográficos
Autor principal: Bezerra, Clauber Gomes
Outros Autores: Oliveira, Luiz Affonso Henderson Guedes de
Formato: doctoralThesis
Idioma:por
Publicado em: Brasil
Assuntos:
Endereço do item:https://repositorio.ufrn.br/jspui/handle/123456789/24360
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
id ri-123456789-24360
record_format dspace
institution Repositório Institucional
collection RI - UFRN
language por
topic Detecção de outliers
Agrupamento de dados
Classificação de dados
Stream de dados
TEDA
Tipicidade
Excentricidade
Data cloud
Auto-Cloud
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃO
spellingShingle Detecção de outliers
Agrupamento de dados
Classificação de dados
Stream de dados
TEDA
Tipicidade
Excentricidade
Data cloud
Auto-Cloud
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃO
Bezerra, Clauber Gomes
Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
description In this thesis we propose a new approach to unsupervised data clustering and classification. The proposed approach is based on typicality and eccentricity concepts. This concepts are used by recently introduced TEDA algorithm for outlier detection. To perform data clustering and classification, it is proposed a new statistical algorithm, called Auto-Cloud. The data samples analyzed by Auto-Cloud are grouped in the form of unities called data clouds, which are structures without pre-defined shape or boundaries. Auto-Cloud allows each data sample to belong to multiple data clouds simultaneously. Auto-Cloud is an autonomous and evolving algorithm, which does not requires previous training or any prior knowledge about the data set. Auto-Cloud is able to create and merge data clouds autonomously, as data samples are obtained, without any human interference. The algorithm is suitable for data clustering and classification of online data streams and application that require real-time response. Auto-Cloud is also recursive, which makes it fast and with little computational effort. The data classification process works like a fuzzy classifier using the degree of membership between the analyzed data sample to each data cloud created in clustering process. The class to which each data sample belongs is determined by the cloud with the highest activation with respect to that sample. To validate the proposed method, we apply it to several existing datasets for data clustering and classification. Moreover, the method was also used in a fault detection in industrial processes application. In this case, we use real data obtained from a real world industrial plant.
author2 Oliveira, Luiz Affonso Henderson Guedes de
author_facet Oliveira, Luiz Affonso Henderson Guedes de
Bezerra, Clauber Gomes
format doctoralThesis
author Bezerra, Clauber Gomes
author_sort Bezerra, Clauber Gomes
title Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
title_short Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
title_full Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
title_fullStr Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
title_full_unstemmed Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
title_sort uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
publisher Brasil
publishDate 2017
url https://repositorio.ufrn.br/jspui/handle/123456789/24360
work_keys_str_mv AT bezerraclaubergomes umaabordagembaseadaemtipicidadeeexcentricidadeparaagrupamentoeclassificacaodestreamsdedados
_version_ 1773963738810941440
spelling ri-123456789-243602022-04-18T21:57:30Z Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados Bezerra, Clauber Gomes Oliveira, Luiz Affonso Henderson Guedes de http://lattes.cnpq.br/7987212907837941 Martins, Allan de Medeiros ttp://lattes.cnpq.br/4402694969508077 http://lattes.cnpq.br/1125827309642732 Silva, Diego Rodrigo Cabral Lemos, André Paim http://lattes.cnpq.br/2426104312592166 Costa, Bruno Sielly Jales http://lattes.cnpq.br/2486327435960311 Detecção de outliers Agrupamento de dados Classificação de dados Stream de dados TEDA Tipicidade Excentricidade Data cloud Auto-Cloud CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃO In this thesis we propose a new approach to unsupervised data clustering and classification. The proposed approach is based on typicality and eccentricity concepts. This concepts are used by recently introduced TEDA algorithm for outlier detection. To perform data clustering and classification, it is proposed a new statistical algorithm, called Auto-Cloud. The data samples analyzed by Auto-Cloud are grouped in the form of unities called data clouds, which are structures without pre-defined shape or boundaries. Auto-Cloud allows each data sample to belong to multiple data clouds simultaneously. Auto-Cloud is an autonomous and evolving algorithm, which does not requires previous training or any prior knowledge about the data set. Auto-Cloud is able to create and merge data clouds autonomously, as data samples are obtained, without any human interference. The algorithm is suitable for data clustering and classification of online data streams and application that require real-time response. Auto-Cloud is also recursive, which makes it fast and with little computational effort. The data classification process works like a fuzzy classifier using the degree of membership between the analyzed data sample to each data cloud created in clustering process. The class to which each data sample belongs is determined by the cloud with the highest activation with respect to that sample. To validate the proposed method, we apply it to several existing datasets for data clustering and classification. Moreover, the method was also used in a fault detection in industrial processes application. In this case, we use real data obtained from a real world industrial plant. Nesta tese apresentamos uma nova abordagem para realizar o agrupamento e a classificação de um conjunto de dados de forma não supervisionada. A abordagem proposta utiliza os conceitos de tipicidade e excentricidade usados pelo algoritmo TEDA na detecção de outliers. Para realizar o agrupamento e a classificação é proposto um algoritmo estatístico chamado Auto-Cloud. As amostras analisadas pelo Auto-Cloud são agrupadas em unidades chamadas de data clouds, que são estruturas que não possuem formato ou limites definidos. O Auto-Cloud permite que cada amostra analisada possa pertencer simultaneamente a várias data clouds. O Auto-Cloud é um algoritmo autônomo e evolutivo, que não necessita de treinamento ou qualquer conhecimento prévios sobre o conjunto de dados analisado. Ele permite a criação e a fusão das data clouds de forma autônoma, à medida que as amostras são lidas, sem qualquer intervenção humana. As características do algoritmo fazem com que ele seja indicado para o agrupamento e classificação de streams de dados e para aplicações que requerem respostas em tempo-real. O Auto- Cloud também é um algoritmo recursivo, o que o torna rápido e exige pouca quantidade de memória. Já no processo de classificação dos dados, o Auto-Cloud trabalha como um classificador fuzzy, calculando o grau de pertinência entre a amostra analisada e cada data cloud criada no processo de agrupamento. A classe a que pertence cada amostra é determinada pela data cloud com maior grau de pertinência com relação a amostra. Para validar o método proposto, aplicamos o mesmo em vários conjuntos de dados existentes na literatura sobre o assunto. Além disso, o método também foi validado numa aplicação de detecção e classificação de falhas em processos industriais, onde foram utilizados dados reais, obtidos de uma planta industrial. 2017-11-23T23:24:44Z 2017-11-23T23:24:44Z 2017-05-24 doctoralThesis BEZERRA, Clauber Gomes. Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados. 2017. 108f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2017. https://repositorio.ufrn.br/jspui/handle/123456789/24360 por Acesso Aberto application/pdf Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO