SlideShare a Scribd company logo
1 of 16
PLATAFORMA SEMÂNTICA DE
RECUPERAÇÃO DA INFORMAÇÃO
APLICADA A EXTRAÇÃO DE
ARTIGOS CIENTÍFICOS
Caio Saraiva Coneglian
caio.coneglian@gmail.com
Prof. Dr. Elvis Fusco
fusco@univem.edu.br
Contextualização
 Sistemas de Informação de Recuperação atuais
são incapazes de recuperar informações de
uma forma adequada no contexto de
ambientes informacionais digitais tendo a Web
como plataforma (Big Data).
 Os ambientes computacionais de informação
atendem plenamente as necessidades
informacionais dos usuários?
Objetivo
 Criar um agente de busca semântica na WEB
que permita:
 Localização;
 Tratamento e
 Recuperação da Informação.
 Domínio da busca por documentos
bibliográficos de pesquisas, de modo a
proporcionar a intersecção entre os metadados
de publicações científicas e as necessidades
informacionais dos usuários, proposto por
Fusco (2010).
Metodologia
 Levantamento de requisitos informacionais
para acesso às pesquisas científicas;
 Definição da metodologia de construção de
ontologias;
 Modelagem da ontologia de aplicação;
 Implementação do protótipo do agente
semântico de recuperação de informações
baseado em conceitos semânticos;
 Análise dos resultados de recuperação do
protótipo (prova de conceito).
Plataforma
Figura 1: Arquitetura de Contextualização do Agente Semântico de Extração
Modelo de Extração
Figura 2: Modelo de extração do agente semântico
Ontologia
 Segundo Clark (1999), uma ontologia é
organizada em hierarquias de conceitos;
 E utilizando a classificação de Gomes-Perez
(1999), a ontologia do projeto é uma Ontologia
de Aplicação, que busca solucionar um
problema específico de um domínio.
Implementação Ontologia
 Para realizar a implementação da ontologia,
foi seguido o modelo proposto por Noy (2001),
em que são realizados 7 passos na construção
de ontologias;
 Como domínio para a construção desta
ontologia, foi utilizada busca de publicações
científicas na base de dados IEEE;
 Foi utilizado o programa Protégé para realizar
a implementação da ontologia.
Implementação Ontologia
Figura 3: Diagrama da Ontologia
Implementação do Agente
 O robô de busca extrai os metadados de
artigos da página do IEEE Xplore
(http://ieeexplore.ieee.org).
 Após a extração, é realizada a análise dos
metadados baseados nos conceitos descritos
na ontologia.
Lógica de Extração
Figura 4: Lógica de Extração do Robô de Busca
Testes
 Para a realização dos testes, foram realizadas
buscas de publicações na área de banco de
dados. Por exemplo: publicações sobre
datawarehouse;
 Neste exemplo, o SRI do IEEE recupera 25
artigos, porém apenas 7 são retornados pela
busca semântica, pois são os de fato
aderentes à necessidade informacional do
usuário.
Figura 5: Relações da classe do termo pesquisado
Testes
Figura 6: Resultado de uma busca, pesquisando o termo “Datawarehouse”
Resultados
 O uso de ontologias permite estender o
processo de Recuperação da Informação com a
utilização de conceitos semânticos;
 Os resultados obtidos por este agente
proporcionam uma maior intersecção entre os
documentos e as necessidades informacionais
dos usuários;
 Demonstrou-se uma alternativa prática de
implementação da Web Semântica no processo
de Recuperação da Informação.
Referências Bibliográficas
 Clark, D. Mad cows, metathesaurim and meaning, IEEE Intelligent
Systems. 1999.
 Fusco, E. Modelos conceituais de dados como parte do processo da
catalogação: perspectiva de uso dos FRBR no desenvolvimento de
catálogos bibliográficos digitais. 2012.
 Gómez-Pérez, A. Ontological engineering A state of the art. Expert
Update: Knowledge Based Systems and Applied Artificial
Intelligence 2.3. 33-43. 1999.
 Noy, N. F. et al. Creating Semantic Web Contents with Protégé-
2000. IEEE. 2001.
PLATAFORMA SEMÂNTICA DE
RECUPERAÇÃO DA INFORMAÇÃO
APLICADA A EXTRAÇÃO DE
ARTIGOS CIENTÍFICOS
Caio Saraiva Coneglian
caio.coneglian@gmail.com
Prof. Dr. Elvis Fusco
fusco@univem.edu.br

More Related Content

Similar to Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

PORTAL DE BUSCA INTEGRADA DO SIBIUSP
PORTAL DE BUSCA INTEGRADA DO SIBIUSPPORTAL DE BUSCA INTEGRADA DO SIBIUSP
PORTAL DE BUSCA INTEGRADA DO SIBIUSP
Celia Rosa
 
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
Fabiana Andrade Pereira
 

Similar to Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos (20)

Dissertação
Dissertação Dissertação
Dissertação
 
NCBIoNotifier: Um Aplicativo Móvel para Notificar Pesquisadores Sobre Atualiz...
NCBIoNotifier: Um Aplicativo Móvel para Notificar Pesquisadores Sobre Atualiz...NCBIoNotifier: Um Aplicativo Móvel para Notificar Pesquisadores Sobre Atualiz...
NCBIoNotifier: Um Aplicativo Móvel para Notificar Pesquisadores Sobre Atualiz...
 
Ai congresso academico-ufal-2010 revisando
Ai congresso academico-ufal-2010 revisandoAi congresso academico-ufal-2010 revisando
Ai congresso academico-ufal-2010 revisando
 
Ai congresso academico-ufal-2010 revisando
Ai congresso academico-ufal-2010 revisandoAi congresso academico-ufal-2010 revisando
Ai congresso academico-ufal-2010 revisando
 
Webmedia2007 V4
Webmedia2007 V4Webmedia2007 V4
Webmedia2007 V4
 
A modelagem de dados no processo da catalogação sob a perspectiva do uso dos ...
A modelagem de dados no processo da catalogação sob a perspectiva do uso dos ...A modelagem de dados no processo da catalogação sob a perspectiva do uso dos ...
A modelagem de dados no processo da catalogação sob a perspectiva do uso dos ...
 
Atlas analise de dados
Atlas analise de dadosAtlas analise de dados
Atlas analise de dados
 
Arquitetura da informação para blogs
Arquitetura da informação para blogsArquitetura da informação para blogs
Arquitetura da informação para blogs
 
PORTAL DE BUSCA INTEGRADA DO SIBIUSP
PORTAL DE BUSCA INTEGRADA DO SIBIUSPPORTAL DE BUSCA INTEGRADA DO SIBIUSP
PORTAL DE BUSCA INTEGRADA DO SIBIUSP
 
Wperformance 2015 (2)
Wperformance   2015 (2)Wperformance   2015 (2)
Wperformance 2015 (2)
 
Repositório Institucional - Refbase
Repositório Institucional - RefbaseRepositório Institucional - Refbase
Repositório Institucional - Refbase
 
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
 
7 AULA_SRI.ppt
7 AULA_SRI.ppt7 AULA_SRI.ppt
7 AULA_SRI.ppt
 
Introdução a web semântica, ontologia e máquinas de busca
Introdução a web semântica, ontologia e máquinas de buscaIntrodução a web semântica, ontologia e máquinas de busca
Introdução a web semântica, ontologia e máquinas de busca
 
Artigo sistema automático de disseminação seletiva de informação
Artigo sistema automático de disseminação seletiva de informaçãoArtigo sistema automático de disseminação seletiva de informação
Artigo sistema automático de disseminação seletiva de informação
 
Web Semântica
Web SemânticaWeb Semântica
Web Semântica
 
Georreferenciamento das Ocorrencias Públicas
Georreferenciamento das Ocorrencias PúblicasGeorreferenciamento das Ocorrencias Públicas
Georreferenciamento das Ocorrencias Públicas
 
Sistemas de recuperação de informação
Sistemas de recuperação de informação Sistemas de recuperação de informação
Sistemas de recuperação de informação
 
Um sistema inteligente baseado em ontologia para apoio ao esclarecimento de...
Um sistema inteligente baseado em ontologia para  apoio  ao esclarecimento de...Um sistema inteligente baseado em ontologia para  apoio  ao esclarecimento de...
Um sistema inteligente baseado em ontologia para apoio ao esclarecimento de...
 
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
 

More from Elvis Fusco

Inteligência Coletiva
Inteligência ColetivaInteligência Coletiva
Inteligência Coletiva
Elvis Fusco
 

More from Elvis Fusco (20)

APLs da Indústria de Alimentos e do Amendoim
APLs da Indústria de Alimentos e do AmendoimAPLs da Indústria de Alimentos e do Amendoim
APLs da Indústria de Alimentos e do Amendoim
 
Formação Digital para a Era Digital: Transformação Digital
Formação Digital para a Era Digital: Transformação DigitalFormação Digital para a Era Digital: Transformação Digital
Formação Digital para a Era Digital: Transformação Digital
 
Modelo de Sustentabilidade do Ecossistema de Inovação de Marília
Modelo de Sustentabilidade do Ecossistema de Inovação de MaríliaModelo de Sustentabilidade do Ecossistema de Inovação de Marília
Modelo de Sustentabilidade do Ecossistema de Inovação de Marília
 
Ecosistema Brasileño de Innovación: Estudio de caso del Sistema Paulista de I...
Ecosistema Brasileño de Innovación: Estudio de caso del Sistema Paulista de I...Ecosistema Brasileño de Innovación: Estudio de caso del Sistema Paulista de I...
Ecosistema Brasileño de Innovación: Estudio de caso del Sistema Paulista de I...
 
Palestra sobre Ecossistemas de Inovação
Palestra sobre Ecossistemas de InovaçãoPalestra sobre Ecossistemas de Inovação
Palestra sobre Ecossistemas de Inovação
 
Palestra "Inovação em Pequenas e Médias Empresas"
Palestra "Inovação em Pequenas e Médias Empresas"Palestra "Inovação em Pequenas e Médias Empresas"
Palestra "Inovação em Pequenas e Médias Empresas"
 
Lei de Incentivo à Inovação de Marília
Lei de Incentivo à Inovação de MaríliaLei de Incentivo à Inovação de Marília
Lei de Incentivo à Inovação de Marília
 
Programa Futuro Universitário Empreendedor
Programa Futuro Universitário EmpreendedorPrograma Futuro Universitário Empreendedor
Programa Futuro Universitário Empreendedor
 
Associativismo em Tecnologia da Informação
Associativismo em Tecnologia da InformaçãoAssociativismo em Tecnologia da Informação
Associativismo em Tecnologia da Informação
 
APL TI Marília
APL TI MaríliaAPL TI Marília
APL TI Marília
 
Pós-graduação em Desenvolvimento Web e Aplicativos Móveis
Pós-graduação em Desenvolvimento Web e Aplicativos MóveisPós-graduação em Desenvolvimento Web e Aplicativos Móveis
Pós-graduação em Desenvolvimento Web e Aplicativos Móveis
 
Carreira e Mercado em Tecnologia da Informação
Carreira e Mercado em Tecnologia da InformaçãoCarreira e Mercado em Tecnologia da Informação
Carreira e Mercado em Tecnologia da Informação
 
Redes Sociais e Monitoramento de Mídias Digitais
Redes Sociais e Monitoramento de Mídias DigitaisRedes Sociais e Monitoramento de Mídias Digitais
Redes Sociais e Monitoramento de Mídias Digitais
 
1º Encontro de Negócios Multissetorial
1º Encontro de Negócios Multissetorial1º Encontro de Negócios Multissetorial
1º Encontro de Negócios Multissetorial
 
Parque Tecnológico de Marília
Parque Tecnológico de MaríliaParque Tecnológico de Marília
Parque Tecnológico de Marília
 
Big Data
Big DataBig Data
Big Data
 
Representação e recuperação da informação no contexto das tecnologias informa...
Representação e recuperação da informação no contexto das tecnologias informa...Representação e recuperação da informação no contexto das tecnologias informa...
Representação e recuperação da informação no contexto das tecnologias informa...
 
As Áreas de Atuação do Profissional de TI
As Áreas de Atuação do Profissional de TIAs Áreas de Atuação do Profissional de TI
As Áreas de Atuação do Profissional de TI
 
Inteligência Coletiva
Inteligência ColetivaInteligência Coletiva
Inteligência Coletiva
 
Evento de Lançamento Oficial da ASSERTI
Evento de Lançamento Oficial da ASSERTIEvento de Lançamento Oficial da ASSERTI
Evento de Lançamento Oficial da ASSERTI
 

Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

  • 1. PLATAFORMA SEMÂNTICA DE RECUPERAÇÃO DA INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS CIENTÍFICOS Caio Saraiva Coneglian caio.coneglian@gmail.com Prof. Dr. Elvis Fusco fusco@univem.edu.br
  • 2. Contextualização  Sistemas de Informação de Recuperação atuais são incapazes de recuperar informações de uma forma adequada no contexto de ambientes informacionais digitais tendo a Web como plataforma (Big Data).  Os ambientes computacionais de informação atendem plenamente as necessidades informacionais dos usuários?
  • 3. Objetivo  Criar um agente de busca semântica na WEB que permita:  Localização;  Tratamento e  Recuperação da Informação.  Domínio da busca por documentos bibliográficos de pesquisas, de modo a proporcionar a intersecção entre os metadados de publicações científicas e as necessidades informacionais dos usuários, proposto por Fusco (2010).
  • 4. Metodologia  Levantamento de requisitos informacionais para acesso às pesquisas científicas;  Definição da metodologia de construção de ontologias;  Modelagem da ontologia de aplicação;  Implementação do protótipo do agente semântico de recuperação de informações baseado em conceitos semânticos;  Análise dos resultados de recuperação do protótipo (prova de conceito).
  • 5. Plataforma Figura 1: Arquitetura de Contextualização do Agente Semântico de Extração
  • 6. Modelo de Extração Figura 2: Modelo de extração do agente semântico
  • 7. Ontologia  Segundo Clark (1999), uma ontologia é organizada em hierarquias de conceitos;  E utilizando a classificação de Gomes-Perez (1999), a ontologia do projeto é uma Ontologia de Aplicação, que busca solucionar um problema específico de um domínio.
  • 8. Implementação Ontologia  Para realizar a implementação da ontologia, foi seguido o modelo proposto por Noy (2001), em que são realizados 7 passos na construção de ontologias;  Como domínio para a construção desta ontologia, foi utilizada busca de publicações científicas na base de dados IEEE;  Foi utilizado o programa Protégé para realizar a implementação da ontologia.
  • 9. Implementação Ontologia Figura 3: Diagrama da Ontologia
  • 10. Implementação do Agente  O robô de busca extrai os metadados de artigos da página do IEEE Xplore (http://ieeexplore.ieee.org).  Após a extração, é realizada a análise dos metadados baseados nos conceitos descritos na ontologia.
  • 11. Lógica de Extração Figura 4: Lógica de Extração do Robô de Busca
  • 12. Testes  Para a realização dos testes, foram realizadas buscas de publicações na área de banco de dados. Por exemplo: publicações sobre datawarehouse;  Neste exemplo, o SRI do IEEE recupera 25 artigos, porém apenas 7 são retornados pela busca semântica, pois são os de fato aderentes à necessidade informacional do usuário. Figura 5: Relações da classe do termo pesquisado
  • 13. Testes Figura 6: Resultado de uma busca, pesquisando o termo “Datawarehouse”
  • 14. Resultados  O uso de ontologias permite estender o processo de Recuperação da Informação com a utilização de conceitos semânticos;  Os resultados obtidos por este agente proporcionam uma maior intersecção entre os documentos e as necessidades informacionais dos usuários;  Demonstrou-se uma alternativa prática de implementação da Web Semântica no processo de Recuperação da Informação.
  • 15. Referências Bibliográficas  Clark, D. Mad cows, metathesaurim and meaning, IEEE Intelligent Systems. 1999.  Fusco, E. Modelos conceituais de dados como parte do processo da catalogação: perspectiva de uso dos FRBR no desenvolvimento de catálogos bibliográficos digitais. 2012.  Gómez-Pérez, A. Ontological engineering A state of the art. Expert Update: Knowledge Based Systems and Applied Artificial Intelligence 2.3. 33-43. 1999.  Noy, N. F. et al. Creating Semantic Web Contents with Protégé- 2000. IEEE. 2001.
  • 16. PLATAFORMA SEMÂNTICA DE RECUPERAÇÃO DA INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS CIENTÍFICOS Caio Saraiva Coneglian caio.coneglian@gmail.com Prof. Dr. Elvis Fusco fusco@univem.edu.br