• Flickr Governo de São Paulo
  • Linkedin Governo de São Paulo
  • TikTok Governo de São Paulo
  • Twitter Governo de São Paulo
  • Youtube Governo de São Paulo
  • Instagram Governo de São Paulo
  • Facebook Governo de São Paulo
  • /governosp

Estudo de machine learning para análise de dados usando PySpark

dc.contributor.advisorDEZANI, Henrique
dc.contributor.advisorDEZANI, Adriana Alvarenga
dc.contributor.authorMORAES, Gustavo Perez de
dc.contributor.otherSIMONATO, Adriano Luís
dc.contributor.otherFONSECA, Everthon Silva
dc.date.accessioned2024-09-06T18:17:57Z
dc.date.available2024-09-06T18:17:57Z
dc.date.issued2024-06-21
dc.description.abstractEste artigo apresenta a utilização da API PySpark da linguagem de programação Python, aplicadas à análise de dados e Machine Learning. Para entender suas funcionalidades, também é feita uma breve apresentação de conceitos teóricos de estatística, além de breve introdução de sintaxe e exemplos de utilização da linguagem de programação Python e também da API PySpark. Tais análises serão aplicadas através de algoritmos de Árvores de Decisão à base de dados Covertype, obtida no repositório online UC Irvine Machine Learning Repository, e tratadas de acordo com a técnica de Binarização. Os resultados das análises, bem como índices de precisão e Matriz de Confusão foram apresentados para serem analisados, a fim de esclarecer os pontos positivos de se utilizar as técnicas aplicadas e comprovar sua eficiência.pt_BR
dc.description.abstractThis article presents the use of the PySpark API of the Python programming language, applied to data analysis and Machine Learning. To understand its functionalities, a brief presentation of theoretical and statistical concepts is made, as well as a brief introduction of syntax and examples of using the Python programming language and also the PySpark API. Such analyzes will be applied using Decision Tree algorithms to the CoverType database, obtained from the online repository UC Irvine Machine Learning Repository, and treated according to the Binarization technique. The results of the analyzes, as well as precision indices and Confusion Matrix were presented for analysis, in order to clarify the positive points of using the applied techniques and prove their efficiency.pt_BR
dc.description.sponsorshipCurso Superior de Tecnologia em Informática para Negóciospt_BR
dc.identifier.citationMORAES, Gustavo Perez de. Estudo de machine learning para análise de dados usando PySpark. 2024. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Informática para Negócios) – Faculdade de Tecnologia de São José do Rio Preto, São José do Rio Preto, 2024.pt_BR
dc.identifier.urihttps://ric.cps.sp.gov.br/handle/123456789/23368
dc.language.isopt_BRpt_BR
dc.publisher121pt_BR
dc.subjectMachine learningpt_BR
dc.subjectAnálise de dadospt_BR
dc.subjectAmbientes de programaçãopt_BR
dc.subjectEstatística para inteligência artificialpt_BR
dc.subject.otherInformação e Comunicaçãopt_BR
dc.titleEstudo de machine learning para análise de dados usando PySparkpt_BR
dc.title.alternativeMachine learning study for data analysis using PySparkpt_BR
dc.typeArtigo científicopt_BR

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
informaticanegocios_2024_1_gustavoperezdemoraes_estudodemachinelearningparaanalisededadosusando.pdf
Tamanho:
607.79 KB
Formato:
Adobe Portable Document Format
Descrição:

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
365 B
Formato:
Item-specific license agreed upon to submission
Descrição:
Governo do Estado de SP