Este documento descreve um sistema de busca semântica na web para localizar, processar e recuperar artigos científicos com base nas necessidades dos usuários. O sistema usa uma ontologia para representar conceitos do domínio e melhorar a correspondência entre os termos de busca e os metadados dos artigos. Testes iniciais mostraram que o sistema pode fornecer resultados mais relevantes do que sistemas de busca tradicionais.
Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos
1. PLATAFORMA SEMÂNTICA DE
RECUPERAÇÃO DA INFORMAÇÃO
APLICADA A EXTRAÇÃO DE
ARTIGOS CIENTÍFICOS
Caio Saraiva Coneglian
caio.coneglian@gmail.com
Prof. Dr. Elvis Fusco
fusco@univem.edu.br
2. Contextualização
Sistemas de Informação de Recuperação atuais
são incapazes de recuperar informações de
uma forma adequada no contexto de
ambientes informacionais digitais tendo a Web
como plataforma (Big Data).
Os ambientes computacionais de informação
atendem plenamente as necessidades
informacionais dos usuários?
3. Objetivo
Criar um agente de busca semântica na WEB
que permita:
Localização;
Tratamento e
Recuperação da Informação.
Domínio da busca por documentos
bibliográficos de pesquisas, de modo a
proporcionar a intersecção entre os metadados
de publicações científicas e as necessidades
informacionais dos usuários, proposto por
Fusco (2010).
4. Metodologia
Levantamento de requisitos informacionais
para acesso às pesquisas científicas;
Definição da metodologia de construção de
ontologias;
Modelagem da ontologia de aplicação;
Implementação do protótipo do agente
semântico de recuperação de informações
baseado em conceitos semânticos;
Análise dos resultados de recuperação do
protótipo (prova de conceito).
7. Ontologia
Segundo Clark (1999), uma ontologia é
organizada em hierarquias de conceitos;
E utilizando a classificação de Gomes-Perez
(1999), a ontologia do projeto é uma Ontologia
de Aplicação, que busca solucionar um
problema específico de um domínio.
8. Implementação Ontologia
Para realizar a implementação da ontologia,
foi seguido o modelo proposto por Noy (2001),
em que são realizados 7 passos na construção
de ontologias;
Como domínio para a construção desta
ontologia, foi utilizada busca de publicações
científicas na base de dados IEEE;
Foi utilizado o programa Protégé para realizar
a implementação da ontologia.
10. Implementação do Agente
O robô de busca extrai os metadados de
artigos da página do IEEE Xplore
(http://ieeexplore.ieee.org).
Após a extração, é realizada a análise dos
metadados baseados nos conceitos descritos
na ontologia.
12. Testes
Para a realização dos testes, foram realizadas
buscas de publicações na área de banco de
dados. Por exemplo: publicações sobre
datawarehouse;
Neste exemplo, o SRI do IEEE recupera 25
artigos, porém apenas 7 são retornados pela
busca semântica, pois são os de fato
aderentes à necessidade informacional do
usuário.
Figura 5: Relações da classe do termo pesquisado
14. Resultados
O uso de ontologias permite estender o
processo de Recuperação da Informação com a
utilização de conceitos semânticos;
Os resultados obtidos por este agente
proporcionam uma maior intersecção entre os
documentos e as necessidades informacionais
dos usuários;
Demonstrou-se uma alternativa prática de
implementação da Web Semântica no processo
de Recuperação da Informação.
15. Referências Bibliográficas
Clark, D. Mad cows, metathesaurim and meaning, IEEE Intelligent
Systems. 1999.
Fusco, E. Modelos conceituais de dados como parte do processo da
catalogação: perspectiva de uso dos FRBR no desenvolvimento de
catálogos bibliográficos digitais. 2012.
Gómez-Pérez, A. Ontological engineering A state of the art. Expert
Update: Knowledge Based Systems and Applied Artificial
Intelligence 2.3. 33-43. 1999.
Noy, N. F. et al. Creating Semantic Web Contents with Protégé-
2000. IEEE. 2001.
16. PLATAFORMA SEMÂNTICA DE
RECUPERAÇÃO DA INFORMAÇÃO
APLICADA A EXTRAÇÃO DE
ARTIGOS CIENTÍFICOS
Caio Saraiva Coneglian
caio.coneglian@gmail.com
Prof. Dr. Elvis Fusco
fusco@univem.edu.br