• Flickr Governo de São Paulo
  • Linkedin Governo de São Paulo
  • TikTok Governo de São Paulo
  • Twitter Governo de São Paulo
  • Youtube Governo de São Paulo
  • Instagram Governo de São Paulo
  • Facebook Governo de São Paulo
  • /governosp

Extração de entidades nomeadas com maximização de entropia (Opennlp)

dc.contributor.advisorRIBEIRO, Patrícia Bellin
dc.contributor.authorMEDEIROS, Richerland Pinto
dc.date.accessioned2023-05-30T17:36:28Z
dc.date.available2023-05-30T17:36:28Z
dc.date.issued2014-12
dc.description.abstractCom o advento do aumento da inclusão tecnológica, somado ao aparecimento das redes sociais, o volume de informação textual cresceu expressivamente nos últimos anos e, com isso, a possibilidade de uso de informações proveniente dessas massas de dados tem se mostrado uma interessante ferramenta estratégica. Tais dados se apresentam de forma desestruturada, ou seja, o uso dessas valiosas informações é dificultado pela complexidade de interpretação da real informação inserido nessas massas de dados. O presente artigo visa apresentar a técnica estatística de maximização de entropia, para a extração de entidades nomeadas, possibilitando a tabulação de características, referenciadas por entidades dentro de massas de dados. Foram utilizados nos testes como base para o treinamento do modelo de extração os corpora públicos Amazônia e FlorestaVirgem ambos no formato Árvores Deitadas. Conclui-se que a abordagem de aprendizado de máquina estatístico, maximização de entropia, para a extração de informações, é eficiente quando levado em consideração o treinamento de um corpus especifico para o domínio de pesquisa.pt_BR
dc.description.abstractThrough the advent of the technological inclusion, added to the emergence of social networks, the volume of information in the form of text grew dramatically over the last few years and information from these data mass become an interesting strategy tool. This data presents itself on a non-organized form, meaning that the use of such valuable information is hampered by the difficulty to interpret the real information inserted into these masses. The present article aims to present the maximization entropy statistical method for the extraction of named entities enabling tabulation of characteristics referenced by entities in data mass. It has been used for the tests as training base an extraction model for public corpora Amazonia and FlorestaVirgem, both in the Árvores Deitadas format. Is concluded that the statistical machine learning approach for information extraction is efficient when is considered the corpus trained on specific domain text.pt_BR
dc.description.sponsorshipCurso Superior de Tecnologia em Banco de Dadospt_BR
dc.identifier.citationMEDEIROS, Richerland Pinto. Extração de entidades nomeadas com maximização de entropia (Opennlp). Trabalho de conclusão de curso (Curso Superior de Tecnologia em Banco de Dados) - Faculdade de Tecnologia FATEC Bauru, Bauru, 2014.pt_BR
dc.identifier.urihttps://ric.cps.sp.gov.br/handle/123456789/12828
dc.language.isopt_BRpt_BR
dc.publisher196pt_BR
dc.subjectInclusão socialpt_BR
dc.subjectTecnologia da informaçãopt_BR
dc.subjectRedes sociaispt_BR
dc.subjectProcessamento de textopt_BR
dc.subjectEntidades estudantispt_BR
dc.subject.otherInformação e Comunicaçãopt_BR
dc.titleExtração de entidades nomeadas com maximização de entropia (Opennlp)pt_BR
dc.title.alternativeExtraction of named entities with entropy maximization (Opennlp)pt_BR
dc.typeArtigo científicopt_BR

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
bancodedados_2014_2_richerlandmedeiros_extracaodeentidadesnomeadas.pdf
Tamanho:
1.11 MB
Formato:
Adobe Portable Document Format
Descrição:

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
365 B
Formato:
Item-specific license agreed upon to submission
Descrição:
Governo do Estado de SP