Parallel implementation proposal of clustering algorithms in hardware

Este trabalho apresenta um estudo sob algoritmos de clusterização de dados implementados em hardware dedicado para aplicações em geral, objetivando aumentar a velocidade de processamento. Algoritmos de clusterização têm sido amplamente adotados para encontrar a padrões entre dados, em diferentes ár...

ver descrição completa

Na minha lista:
Detalhes bibliográficos
Autor principal: Dias, Leonardo Alves
Outros Autores: Fernandes, Marcelo Augusto Costa
Formato: doctoralThesis
Idioma:pt_BR
Publicado em: Universidade Federal do Rio Grande do Norte
Assuntos:
Endereço do item:https://repositorio.ufrn.br/handle/123456789/31003
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
id ri-123456789-31003
record_format dspace
institution Repositório Institucional
collection RI - UFRN
language pt_BR
topic Massive Data sets
Data Clustering
Parallel Systems
Hardware
spellingShingle Massive Data sets
Data Clustering
Parallel Systems
Hardware
Dias, Leonardo Alves
Parallel implementation proposal of clustering algorithms in hardware
description Este trabalho apresenta um estudo sob algoritmos de clusterização de dados implementados em hardware dedicado para aplicações em geral, objetivando aumentar a velocidade de processamento. Algoritmos de clusterização têm sido amplamente adotados para encontrar a padrões entre dados, em diferentes áreas. No entanto, estes algoritmos normalmente implicam em uma alta complexidade de processamento e, além disso, a quantidade de dados armazenados atualmente é massiva. Sendo assim, a necessidade de processamento de dados com alto throughput tornou-se ainda mais importante, especialmente para aplicações em tempo real. Uma solução que foi adotada para aumentar a velocidade de processamento é o uso de técnicas paralelas implementadas em hardware dedicado, que provou ser mais eficiente em comparação com sistemas sequenciais. Logo, este trabalho propõe a implementação totalmente paralela dos algoritmos de clusterização de dados em hardware para otimizar o tempo de processamento dos sistemas em diversas áreas, possibilitando aplicações para sistemas com quantidade massiva de dados. Uma nova proposta de implementação dos algoritmos de clusterização K-means e SelfOrganising Map são apresentadas, juntamente a análises dos resultados relacionados ao throughput e o recurso de hardware para diferentes parâmetros, mostrando um aumento na velocidade de processamento de milhões de pontos de dados e neurônios atualizados por segundo. As implementações apresentadas aqui apontam para uma nova direção associada a implementação de algoritmos de clusterização e poderá ser utilizada em outros algoritmos.
author2 Fernandes, Marcelo Augusto Costa
author_facet Fernandes, Marcelo Augusto Costa
Dias, Leonardo Alves
format doctoralThesis
author Dias, Leonardo Alves
author_sort Dias, Leonardo Alves
title Parallel implementation proposal of clustering algorithms in hardware
title_short Parallel implementation proposal of clustering algorithms in hardware
title_full Parallel implementation proposal of clustering algorithms in hardware
title_fullStr Parallel implementation proposal of clustering algorithms in hardware
title_full_unstemmed Parallel implementation proposal of clustering algorithms in hardware
title_sort parallel implementation proposal of clustering algorithms in hardware
publisher Universidade Federal do Rio Grande do Norte
publishDate 2020
url https://repositorio.ufrn.br/handle/123456789/31003
work_keys_str_mv AT diasleonardoalves parallelimplementationproposalofclusteringalgorithmsinhardware
_version_ 1773967166610079744
spelling ri-123456789-310032020-12-20T08:00:15Z Parallel implementation proposal of clustering algorithms in hardware Dias, Leonardo Alves Fernandes, Marcelo Augusto Costa http://lattes.cnpq.br/3328422790889056 http://lattes.cnpq.br/3475337353676349 Silva, Ivanovitch Medeiros Dantas da http://lattes.cnpq.br/3608440944832201 Araújo, Daniel Sabino Amorim de http://lattes.cnpq.br/4744754780165354 Verba, Nandor Sakuyama, Carlos Alberto Valderrama Massive Data sets Data Clustering Parallel Systems Hardware Este trabalho apresenta um estudo sob algoritmos de clusterização de dados implementados em hardware dedicado para aplicações em geral, objetivando aumentar a velocidade de processamento. Algoritmos de clusterização têm sido amplamente adotados para encontrar a padrões entre dados, em diferentes áreas. No entanto, estes algoritmos normalmente implicam em uma alta complexidade de processamento e, além disso, a quantidade de dados armazenados atualmente é massiva. Sendo assim, a necessidade de processamento de dados com alto throughput tornou-se ainda mais importante, especialmente para aplicações em tempo real. Uma solução que foi adotada para aumentar a velocidade de processamento é o uso de técnicas paralelas implementadas em hardware dedicado, que provou ser mais eficiente em comparação com sistemas sequenciais. Logo, este trabalho propõe a implementação totalmente paralela dos algoritmos de clusterização de dados em hardware para otimizar o tempo de processamento dos sistemas em diversas áreas, possibilitando aplicações para sistemas com quantidade massiva de dados. Uma nova proposta de implementação dos algoritmos de clusterização K-means e SelfOrganising Map são apresentadas, juntamente a análises dos resultados relacionados ao throughput e o recurso de hardware para diferentes parâmetros, mostrando um aumento na velocidade de processamento de milhões de pontos de dados e neurônios atualizados por segundo. As implementações apresentadas aqui apontam para uma nova direção associada a implementação de algoritmos de clusterização e poderá ser utilizada em outros algoritmos. Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES This work presents a study on data clustering algorithms implemented in dedicated hardware for applications in general, aiming to increase the processing speed. Clustering algorithms have been widely adopted to find patterns between data in different areas. However, these algorithms usually imply high processing complexity and, in addition, the amount of data currently stored is massive. Therefore, the need for high-throughput data processing has become even more critical, especially for real-time applications. One solution that has been adopted to increase processing speed is the use of parallel techniques implemented on dedicated hardware, which has proved to be more efficient compared to sequential systems. Therefore, this work proposes the fully parallel implementation of data clustering algorithms in hardware to optimize the processing time of systems in several areas, enabling applications for systems with a massive amount of data. A new proposal for implementations of the clustering algorithms K-means and Self-Organizing Maps are presented, together with an analysis of the results related to throughput and the hardware resource for different parameters, showing a speedup of millions of data points and connections updated per second. The implementations presented here point to a new direction associated with the implementation of clustering algorithms and can be used in other algorithms. 2020-12-15T18:19:49Z 2020-12-15T18:19:49Z 2020-10-05 doctoralThesis DIAS, Leonardo Alves. Parallel implementation proposal of clustering algorithms in hardware. 2020. 90f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020. https://repositorio.ufrn.br/handle/123456789/31003 pt_BR Acesso Aberto application/pdf Universidade Federal do Rio Grande do Norte Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO