APLICAÇÃO DE MÉTRICAS DE AVALIAÇÃO DE RESULTADOS NA OBTENÇÃO DE PALAVRAS-CHAVE EM ARTIGOS DE NATUREZA BIOTECNOLÓGICA

Autores

  • Rafael Barcellos Pessanha Crespo
  • Sahudy Montenegro González

Palavras-chave:

Recuperação de informação, Métricas de avaliação, Biotecnologia

Resumo

Ao buscar no portal do NCBI, o problema dos pesquisadores jaz em obter artigos que sejam realmente relevantes à sua busca. A exibição de palavras-chave que descrevam os artigos retornados em uma pesquisa pode melhorar o processo de busca. Este projeto propõe a extração automática de palavras-chave dos resumos desses artigos. Em especial, este trabalho visa avaliar a qualidade dos resultados do algoritmo de extração, através de métricas de avaliação utilizadas para a recuperação de informação.A metodologia desta pesquisa inclui: revisão bibliográfica sobre recuperação de informação; estudo sobre métricas de avaliação nesta área; programar as métricas escolhidas para a avaliação; validação dos resultados do algoritmo de obtenção de palavras-chave. A tarefa principal da recuperação de informação é identificar aqueles documentos da coleção que são relevantes para a busca feita pelo usuário. Para conseguir ter a melhor resposta possível, é feita uma avaliação dos sistemas de busca, através de métricas. Estas métricas se baseiam em dados previamente estabelecidos como corretos e nos dados que são obtidos com a execução da recuperação. Neste caso, os dados são as palavras-chave.Nos artigos estudados, a grande parte das métricas de avaliação de recuperação de informação são baseadas nas técnicas de precision e recall. Precision é a proporção de documentos recuperados que são relevantes. Recall é a proporção de documentos relevantes que foram recuperados. Outras métricas estudadas foram o fallout e o Mean Average Precision (MAP). O fallout é a proporção de documentos não relevantes que foram recuperados e MAP é a média das precisões calculadas no ponto de cada um dos documentos relevantes. O trabalho está na fase de revisão bibliográfica. Assim, está sendo adquirido conhecimento sobre o assunto, para selecionar as métricas que atendem melhor o problema apresentado.É de interesse dos pesquisadores da biotecnologia melhorar a busca no portal, com resultados efetivos e confiáveis. Com as técnicas de avaliação de resultados, espera-se mensurar corretamente os resultados obtidos na extração de palavras-chave e auxiliar com eficácia a pesquisa de artigos ao PubMed.

Publicado

03-04-2012