Apresentação de Gabriel Marinho sobre algoritmos de Classificação por Stream Guiados por Clusterização
Na última reunião do grupo de pesquisa em Computação de Alto Desempenho (HPC), Gabriel Marinho fez uma apresentação sobre “Stream Classification Algorithm Guided by Clustering”, destacando os avanços e desafios na classificação de dados em tempo real. Marinho abordou a importância de entender e adaptar-se a ambientes não estacionários e a latência de verificação para aprimorar a precisão dos modelos de classificação em aplicações práticas.
Explorando conceitos complexos como ambientes não estacionários, mudanças de conceito e latência de verificação, Marinho apresentou um algoritmo que utiliza uma pequena quantidade de rótulos disponíveis e se adapta incrementalmente às mudanças de conceito. Este método não apenas enfrenta o desafio de ambientes dinâmicos mas também abre novas possibilidades para a aplicação de classificação de dados em tempo real.
A apresentação detalhou o processo de criação de modelos de classificação, iniciando com a formação de centróides baseados em mediana e ajustando-se através de algoritmos de clusterização como o K-Means. Marinho enfatizou a flexibilidade do algoritmo, capaz de se adaptar a mudanças através da reclassificação de dados armazenados em buffer e da atualização contínua dos modelos com base na concordância entre rótulos antigos e novos.
Além de apresentar os fundamentos teóricos e a estrutura do algoritmo, Marinho compartilhou sua implementação em Julia, destacando a utilização de pacotes específicos para otimizar o processamento e a classificação dos dados. A comparação dos resultados obtidos com os do artigo original mostrou uma consistência notável, com apenas pequenas variações, validando a eficácia da implementação em Julia.
Apresentação feita por Gabriel Marinho sobre Stream Classification Algorithm Guided by Clustering está disponível no canal do Youtube.