Análise de sensibilidade paramétrica do algorítmo Knnimpute
Carregando...
Arquivos
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
105
Resumo
Um dos problemas que afetam os bancos de dados sãos os dados faltantes. Para a resolução de tal problema existem diversos métodos de tratamento e um deles é a imputação de dados, que foi o foco deste presente trabalho, no qual foi utilizado um algoritmo específico para imputação, chamado KNNIMPUTE, implementado dentro do software Matlab R2010a. O algoritmo citado possui parâmetros variáveis que são a métrica de distância e o valor de k vizinhos mais próximos ao dado faltante, utilizados para calcular o elemento a ser imputado. O objetivo central deste trabalho foi encontrar quais as variáveis de métrica de distância e valor de k, dentro do algoritmo KNNIMPUTE, que obteriam os melhores resultados de imputação. Utilizando-se de uma metodologia experimental, foram realizados seguidos experimentos com diferentes bases, dentro do software Matlab R2010a, efetuando-se alterações nos parâmetros de métrica de distância e valor de k. Na medição da acurácia de imputação, foram utilizados os critério da raiz quadrada do erro quadrático médio (RMSE, do inglês Root Mean Square Error) e do erro absoluto médio (MAE, do inglês Mean Absolute Error), em que menores valores de MAE e RMSE indicam uma maior acurácia. Após a realização dos experimentos, concluiu-se que a métrica de distância cosine e o valor de k=5, foram os parâmetros que trouxeram os melhores resultados para as bases utilizadas, sendo essa configuração, apenas uma sugestão para início de um processo de imputação, utilizando o algoritmo KNNIMPUTE, não uma regra geral.
Descrição
Palavras-chave
Citação
TAKANO, Carlos Eduardo. Análise de sensibilidade paramétrica do algorítmo Knnimpute. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Banco de Dados) - Faculdade de Tecnologia de Indaiatuba "Dr. Archimedes Lammoglia", Indaiatuba, 2012.