SlideShare a Scribd company logo
1 of 4
BUSCADOR
A) CARACTERÍSTICAS
Los buscadores, o motores de búsqueda son aplicaciones web que buscan en una base
de datos, clasifican y organizan información que se relaciona para mostrarla al usuario.
Funcionan mediante programas que buscan en bases de datos y a través de índices, que
clasifican la información por temas.
Facilitan la manera de encontrar los recursos (imágenes, páginas, videos, etc.), para lo
cual consta de los siguientes componentes:
Índices de búsqueda: Las páginas son clasificadas por categorías y subcategorías de
acuerdo a su contenido, es por esto que la base de datos tiene una lista de direcciones de
páginas web que contienen dicho contenido.
Motores de búsqueda: La búsqueda lo hace un programa, que se lo conoce como
motor, que visita las páginas y relaciona la dirección de la página con las primeras 100
palabras que se encuentran en ella.
Para poder clasificar por categorías, se debe identificar y clasificar la página web y esto
se realiza de dos formas, tanto manualmente como de una forma automática, para la
manual, se deberá ingresar, título de la página, URL, descripción y tipo de información.
En cambio para la automática se dispone de un robot que visita y analiza la página
principal y todas las páginas enlazadas, este programa o robot, lee las etiquetas
o metadatos y extrae toda la información contenida en ellas y así poder ordenar
las palabras clave como el título, idioma, autor, localización, temas, etc.
Los motores de búsqueda utilizan un robot de búsqueda, que son programas que se
dedican a recorrer la Web automáticamente, recopilando todo el texto que encuentran, y
de esta manera ir creando bases de datos en las que los usuarios podrán realizar
búsquedas mediante la introducción de palabras clave. Los robots recorren los distintos
servidores de forma recursiva, a través de los enlaces que proporcionan las páginas, para
que su base de datos se mantenga siempre actualizada.
Los motores tienen la opción de limitar las búsquedas, utilizando un formulario sencillo
de búsqueda, que permite ingresar el texto de la siguiente forma: todas las palabras,
algunas palabras y la frase exacta. También utilizando operadores, tanto posicionales
como lógicos.
Operadores lógicos: AND, el cual ordena buscar una página web o documento que
contenga ambas palabras clave, y otros como OR y NOT.
Operadores posicionales: estos operadores nos permiten medir la distancia entre las
palabras clave que se desean buscar en la página web o documento, como:
NEAR: Las palabras clave de la búsqueda aparecen separadas por más de 80
caracteres o 10-25 palabras.
FAR: Las palabras clave de la búsqueda aparecen con 10-25 palabras o más de
distancia.
ADJ: Las palabras clave juntos, sea en el orden que sea.
BEFORE: Las palabras clave deben aparecer en el orden especificado, pero
pueden encontrarse a cualquier distancia en el mismo documento.
FOLLOWED BY: Las palabras tendrán que aparecer en el mismo orden que
ingresa en la búsqueda.
PHRASE: Se utiliza comillas para obtener el mismo resultado, es decir trata las
palabras clave como una frase.
B) ARQUITECTURA
1) Robot: Los buscadores, utilizan robots, para crear las bases de datos; estos son
programas que recorren la web y obtienen documentos HTML u otro tipo de formatos
como pdf, imágenes, etc., de forma automática, es decir acceden a las páginas web y
recolectan determinada información sobre su contenido, donde se incluya determinadas
palabras clave, estos documentos junto con sus direcciones URL, son clasificados y
almacenados en las bases de datos, a partir de un listado de URLs, los robots utilizan
algoritmos para determinar la frecuencia de las visitas a los enlaces para verificar las
modificaciones que se han realizado [1].
Tipos de robots:
 Arañas (Spiders): Programa usado para rastrear la red, lee la estructura de
hipertexto y accede a todos los enlaces en el sitio web.
 Hormigas (WebAnts): Trabajan de forma distribuida, explorando a la vez
diferentes porciones de la Web.
 Vagabundos (Wanderes): Realizan estadísticas sobre la Web, como por
ejemplo, número de servidores, servidores conectados, número de webs, etc.
 Robots de conocimiento (Knowbots): localizan referencias hipertextuales
dirigidas hacia un documento o servidor concreto.
 Orugas (Web crawlers): Da al programa un grupo de direcciones iniciales, la
araña descarga estas direcciones, analiza las páginas y busca enlaces a páginas
nuevas
Los robots utilizan algoritmos para seleccionar los enlaces, como algoritmos de
profundidad, amplitud y algoritmos heurísticos, basados en la información sobre enlaces
de mayor relevancia y popularidad.
2) Indexador: Programa que recibe las páginas recuperadas por un robot, estos
programas almacenan los titulo HTML y otros los primeros párrafos.
Para ayudar a los robots a indizar las páginas, se utilizan mecanismos como: Crear un
archivo de texto (robots.txt) que se ubica en el directorio raíz, el cual permitirá al
administrador de un sitio web controlar el acceso de los robots a su sitio. También se
utiliza la meta etiqueta "robots".
Por ejemplo: <META NAME>="robots" CONTENT="index,follow">
La etiqueta robots cuenta con atributos que se pueden utilizar:
Index: indica al robot de búsqueda que indice la página y la añada a la base de datos.
All: indica que se indexen todas las páginas.
Follow: indica que han de seguirse los enlaces que están en la página.
Las acciones opuestas son "noindex" y "nofollow".
3) Motor de búsqueda: Programa que analiza las palabras claves ingresadas por los
usuarios y busca los documentos relacionados, los motores de búsqueda ordena los
resultados de diferentes maneras, por Localización, presenta documentos en la que
constan todas las palabras buscadas, Frecuencia de aparición, presenta documentos con
mayor número de apariciones de las palabras clave.
4) Interfaz: es una página web, con un formulario, en el que se presenta una caja de
texto para ingresar la consulta, es decir las palabras clave, y un botón para enviar la
consulta. Los resultados igual se presentan en una página web, con ítems que contienen
una pequeña descripción.
C) TECNOLOGÍAS
Las tecnologías que se van a utilizar para la creación del buscador se utilizará la técnica
Rest y también constituirá:
Base de datos MySql para el almacenamiento de la url de los OCW conjuntamente con
los s educativos que ofrecen.
La colección de herramientas Bootstrap para el diseño de la página web, y la
presentación de los recursos.
El entorno de desarrollo Netbeans para la creación del HTML, y la programación con el
lenguaje Java.
Bibliografía
[1] Arquitectura de un buscador. sf. Consultado el 29 de noviembre del 2014.
Recuperado de:
http://buscadores.fullblog.com.ar/arquitectura_de_un_buscador_531191953898.html
[2] Carlos, P. (2004). La selección de palabras clave para el posicionamiento en
buscadores. Hipertext.net. Recuperado de http://www.hipertext.net
[3] Lamarca, M. (2013). Hipertexto: El nuevo concepto de documento en la cultura de
la imagen. Recuperado de http://www.hipertexto.info/documentos/buscar.htm
[4].Ramos, J. (2010). Spider, crawler, arañas y rastreadores, primeros pasos para un
seo. Recuperado de http://userstrend.com/seo/spider-seo/
[5]. Stark, N. sf. Motores de Busqueda en Internet. Consultado: 28 de noviembre del
2014.
Recuperado de: http://www.unlu.edu.ar/~tyr/tyr/TYR-motor/stark-motor.pdf

More Related Content

What's hot

Estrategias y herramientas para una mejor busqueda en
Estrategias y herramientas para una mejor busqueda enEstrategias y herramientas para una mejor busqueda en
Estrategias y herramientas para una mejor busqueda enlopvi
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busquedacatagu88
 
Herramientas de búsqueda
Herramientas de búsquedaHerramientas de búsqueda
Herramientas de búsquedabrenno maccotta
 
Motor de busqueda y navegadores.
Motor de busqueda y navegadores.Motor de busqueda y navegadores.
Motor de busqueda y navegadores.Miguel Serrato
 
Metodos de busqueda en internet
Metodos de busqueda en internetMetodos de busqueda en internet
Metodos de busqueda en internetNICOLASCADENA
 
Metodos de busqueda en internet
Metodos de busqueda en internetMetodos de busqueda en internet
Metodos de busqueda en internetomarfabian94
 
Buscadores y Metabuscadores
Buscadores y MetabuscadoresBuscadores y Metabuscadores
Buscadores y MetabuscadoresIsraelLM
 
Metodos de busqueda en internet
Metodos de busqueda en internetMetodos de busqueda en internet
Metodos de busqueda en internetr2.joed
 
Las Mejores Herramientas
Las Mejores HerramientasLas Mejores Herramientas
Las Mejores HerramientasGiomar Lázaro
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busquedaFlusse
 
Metodos de busqueda en internet trabajo
Metodos de busqueda en internet trabajoMetodos de busqueda en internet trabajo
Metodos de busqueda en internet trabajoantonietta24
 
Motores de búsqueda
Motores de búsquedaMotores de búsqueda
Motores de búsquedaeoiticsepiyce
 
Motores De Busqueda 2
Motores De Busqueda 2Motores De Busqueda 2
Motores De Busqueda 2patrixi21
 

What's hot (19)

Estrategias y herramientas para una mejor busqueda en
Estrategias y herramientas para una mejor busqueda enEstrategias y herramientas para una mejor busqueda en
Estrategias y herramientas para una mejor busqueda en
 
Buscadores
BuscadoresBuscadores
Buscadores
 
TAREA 9
TAREA 9TAREA 9
TAREA 9
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busqueda
 
Buscadores
BuscadoresBuscadores
Buscadores
 
Herramientas de búsqueda
Herramientas de búsquedaHerramientas de búsqueda
Herramientas de búsqueda
 
Buscadores
BuscadoresBuscadores
Buscadores
 
Motor de busqueda y navegadores.
Motor de busqueda y navegadores.Motor de busqueda y navegadores.
Motor de busqueda y navegadores.
 
Buscadores
BuscadoresBuscadores
Buscadores
 
Metodos de busqueda en internet
Metodos de busqueda en internetMetodos de busqueda en internet
Metodos de busqueda en internet
 
Metodos de busqueda en internet
Metodos de busqueda en internetMetodos de busqueda en internet
Metodos de busqueda en internet
 
Buscadores y Metabuscadores
Buscadores y MetabuscadoresBuscadores y Metabuscadores
Buscadores y Metabuscadores
 
Metodos de busqueda en internet
Metodos de busqueda en internetMetodos de busqueda en internet
Metodos de busqueda en internet
 
Las Mejores Herramientas
Las Mejores HerramientasLas Mejores Herramientas
Las Mejores Herramientas
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busqueda
 
Metodos de busqueda en internet trabajo
Metodos de busqueda en internet trabajoMetodos de busqueda en internet trabajo
Metodos de busqueda en internet trabajo
 
Motores de búsqueda
Motores de búsquedaMotores de búsqueda
Motores de búsqueda
 
Motores De Busqueda 2
Motores De Busqueda 2Motores De Busqueda 2
Motores De Busqueda 2
 
Dh
DhDh
Dh
 

Viewers also liked

Programa agenda 21 escolar web 02042012
Programa agenda 21 escolar web 02042012Programa agenda 21 escolar web 02042012
Programa agenda 21 escolar web 020420122011Edu
 
Dashlane cellie
Dashlane cellieDashlane cellie
Dashlane cellieCell'IE
 
Menu de Pâques 2013 - Tome 2
Menu de Pâques 2013  -  Tome 2Menu de Pâques 2013  -  Tome 2
Menu de Pâques 2013 - Tome 2Meilleur du Chef
 
Présentation dut gea
Présentation dut geaPrésentation dut gea
Présentation dut geajojojonnhy
 
Enteresan aletler
Enteresan aletlerEnteresan aletler
Enteresan aletleribmss
 
Workfolio Diego Macia
Workfolio Diego MaciaWorkfolio Diego Macia
Workfolio Diego MaciaDiego Macia
 
Sélection de 50 idées cadeaux par les médiathèques des Ulis et de la CAPS...
Sélection de 50 idées cadeaux par les médiathèques des Ulis et de la CAPS...Sélection de 50 idées cadeaux par les médiathèques des Ulis et de la CAPS...
Sélection de 50 idées cadeaux par les médiathèques des Ulis et de la CAPS...Florence Carre
 
UD6 CIRCUITO DE ARRANQUE
UD6 CIRCUITO DE ARRANQUEUD6 CIRCUITO DE ARRANQUE
UD6 CIRCUITO DE ARRANQUEma_momparler
 
Mission d’évaluation et d’expertise du programme Pratic
Mission d’évaluation et d’expertise du programme PraticMission d’évaluation et d’expertise du programme Pratic
Mission d’évaluation et d’expertise du programme PraticSilicon Comté
 
Reynald Werquin - L’espace public communicant
Reynald Werquin -  L’espace public communicant Reynald Werquin -  L’espace public communicant
Reynald Werquin - L’espace public communicant Les Interconnectés
 
Diaporama présentation
Diaporama présentationDiaporama présentation
Diaporama présentationcdigrazailles
 
presentation
presentationpresentation
presentationcatyaL
 
Alter'incub ESS 2014
Alter'incub ESS 2014Alter'incub ESS 2014
Alter'incub ESS 2014avitrolles
 
SDTAN du Territoire de Belfort
SDTAN du Territoire de BelfortSDTAN du Territoire de Belfort
SDTAN du Territoire de BelfortSilicon Comté
 

Viewers also liked (20)

Programa agenda 21 escolar web 02042012
Programa agenda 21 escolar web 02042012Programa agenda 21 escolar web 02042012
Programa agenda 21 escolar web 02042012
 
Perpensar2
Perpensar2Perpensar2
Perpensar2
 
Dashlane cellie
Dashlane cellieDashlane cellie
Dashlane cellie
 
Menu de Pâques 2013 - Tome 2
Menu de Pâques 2013  -  Tome 2Menu de Pâques 2013  -  Tome 2
Menu de Pâques 2013 - Tome 2
 
Présentation dut gea
Présentation dut geaPrésentation dut gea
Présentation dut gea
 
1
11
1
 
Enteresan aletler
Enteresan aletlerEnteresan aletler
Enteresan aletler
 
Reinado de isabel ii
Reinado de isabel iiReinado de isabel ii
Reinado de isabel ii
 
Workfolio Diego Macia
Workfolio Diego MaciaWorkfolio Diego Macia
Workfolio Diego Macia
 
Sélection de 50 idées cadeaux par les médiathèques des Ulis et de la CAPS...
Sélection de 50 idées cadeaux par les médiathèques des Ulis et de la CAPS...Sélection de 50 idées cadeaux par les médiathèques des Ulis et de la CAPS...
Sélection de 50 idées cadeaux par les médiathèques des Ulis et de la CAPS...
 
UD6 CIRCUITO DE ARRANQUE
UD6 CIRCUITO DE ARRANQUEUD6 CIRCUITO DE ARRANQUE
UD6 CIRCUITO DE ARRANQUE
 
Mission d’évaluation et d’expertise du programme Pratic
Mission d’évaluation et d’expertise du programme PraticMission d’évaluation et d’expertise du programme Pratic
Mission d’évaluation et d’expertise du programme Pratic
 
Reynald Werquin - L’espace public communicant
Reynald Werquin -  L’espace public communicant Reynald Werquin -  L’espace public communicant
Reynald Werquin - L’espace public communicant
 
Diaporama présentation
Diaporama présentationDiaporama présentation
Diaporama présentation
 
presentation
presentationpresentation
presentation
 
Alter'incub ESS 2014
Alter'incub ESS 2014Alter'incub ESS 2014
Alter'incub ESS 2014
 
Gestón del conocimiento
Gestón del conocimientoGestón del conocimiento
Gestón del conocimiento
 
Bmma2014wrapup8
Bmma2014wrapup8Bmma2014wrapup8
Bmma2014wrapup8
 
SDTAN du Territoire de Belfort
SDTAN du Territoire de BelfortSDTAN du Territoire de Belfort
SDTAN du Territoire de Belfort
 
Listas
ListasListas
Listas
 

Similar to Cómo funcionan los buscadores

Metodos de busqueda y operadores boleanos
Metodos de busqueda y operadores boleanosMetodos de busqueda y operadores boleanos
Metodos de busqueda y operadores boleanosLiz-k Gz
 
Jose velasquez
Jose velasquezJose velasquez
Jose velasquezjosevg7
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busquedadiegoalf94
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busquedadiegoalf94
 
Buscadores y metabuscadores uta
Buscadores y metabuscadores utaBuscadores y metabuscadores uta
Buscadores y metabuscadores utaJoha Jácome
 
Buscadores y metabuscadores
Buscadores y metabuscadoresBuscadores y metabuscadores
Buscadores y metabuscadoresFranklin Pico
 
Motores de busqueda (2)
Motores de busqueda (2)Motores de busqueda (2)
Motores de busqueda (2)sebitas0923
 
GBI Segunda Parte parcial.
GBI Segunda Parte parcial.GBI Segunda Parte parcial.
GBI Segunda Parte parcial.iramosmoral
 
Metodos de busqueda en internet
Metodos de busqueda en internetMetodos de busqueda en internet
Metodos de busqueda en internetr2.joed
 
Motores de busqueda (2)
Motores de busqueda (2)Motores de busqueda (2)
Motores de busqueda (2)sebitas0923
 
Motores de busqueda (2)
Motores de busqueda (2)Motores de busqueda (2)
Motores de busqueda (2)oscar mauricio
 

Similar to Cómo funcionan los buscadores (20)

Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busqueda
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busqueda
 
Metodos de busqueda y operadores boleanos
Metodos de busqueda y operadores boleanosMetodos de busqueda y operadores boleanos
Metodos de busqueda y operadores boleanos
 
Buscadores
BuscadoresBuscadores
Buscadores
 
Bucadores
BucadoresBucadores
Bucadores
 
Jose
JoseJose
Jose
 
Jose velasquez
Jose velasquezJose velasquez
Jose velasquez
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busqueda
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busqueda
 
Buscadores y metabuscadores uta
Buscadores y metabuscadores utaBuscadores y metabuscadores uta
Buscadores y metabuscadores uta
 
Buscadores y metabuscadores
Buscadores y metabuscadoresBuscadores y metabuscadores
Buscadores y metabuscadores
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busqueda
 
Motores de busqueda (2)
Motores de busqueda (2)Motores de busqueda (2)
Motores de busqueda (2)
 
Motores de busqueda
Motores de busquedaMotores de busqueda
Motores de busqueda
 
Motores de busqueda
Motores de busquedaMotores de busqueda
Motores de busqueda
 
GBI Segunda Parte parcial.
GBI Segunda Parte parcial.GBI Segunda Parte parcial.
GBI Segunda Parte parcial.
 
Metodos de busqueda en internet
Metodos de busqueda en internetMetodos de busqueda en internet
Metodos de busqueda en internet
 
Motores de busqueda (2)
Motores de busqueda (2)Motores de busqueda (2)
Motores de busqueda (2)
 
Motores de busqueda
Motores de busquedaMotores de busqueda
Motores de busqueda
 
Motores de busqueda (2)
Motores de busqueda (2)Motores de busqueda (2)
Motores de busqueda (2)
 

More from Israel Rey

Análisis de Procesos
Análisis de ProcesosAnálisis de Procesos
Análisis de ProcesosIsrael Rey
 
Construir un BSC
Construir un BSCConstruir un BSC
Construir un BSCIsrael Rey
 
Caso CoE y Gobierno BPM
Caso CoE y Gobierno BPMCaso CoE y Gobierno BPM
Caso CoE y Gobierno BPMIsrael Rey
 
Mejora Continua en Multifabrik
Mejora Continua en MultifabrikMejora Continua en Multifabrik
Mejora Continua en MultifabrikIsrael Rey
 
Integración: Proceso siniestro de una aseguradora
Integración: Proceso siniestro de una aseguradoraIntegración: Proceso siniestro de una aseguradora
Integración: Proceso siniestro de una aseguradoraIsrael Rey
 
Aplicación de BPM para iniciativas Blockchain
Aplicación de BPM para iniciativas BlockchainAplicación de BPM para iniciativas Blockchain
Aplicación de BPM para iniciativas BlockchainIsrael Rey
 
Análisis BPMS
Análisis BPMSAnálisis BPMS
Análisis BPMSIsrael Rey
 
Decálogo de Beneficios Implantación BPM
Decálogo de Beneficios Implantación BPMDecálogo de Beneficios Implantación BPM
Decálogo de Beneficios Implantación BPMIsrael Rey
 
Mapas cognitivos y Mapas causales para comprender el proceso de negocio
Mapas cognitivos y Mapas causales para comprender el proceso de negocioMapas cognitivos y Mapas causales para comprender el proceso de negocio
Mapas cognitivos y Mapas causales para comprender el proceso de negocioIsrael Rey
 
Automatización e implementación de Procesos en un Motor BPM
Automatización e implementación de Procesos en un Motor BPMAutomatización e implementación de Procesos en un Motor BPM
Automatización e implementación de Procesos en un Motor BPMIsrael Rey
 
Análisis de Procesos con Adonis
Análisis de Procesos con AdonisAnálisis de Procesos con Adonis
Análisis de Procesos con AdonisIsrael Rey
 
Modelización y Análisis de Procesos bajo BPMN
Modelización y Análisis de Procesos bajo BPMNModelización y Análisis de Procesos bajo BPMN
Modelización y Análisis de Procesos bajo BPMNIsrael Rey
 
Software testing
Software testingSoftware testing
Software testingIsrael Rey
 
Instalación de Jmeter
Instalación de JmeterInstalación de Jmeter
Instalación de JmeterIsrael Rey
 
Qa Testing - Cucumber
Qa Testing - CucumberQa Testing - Cucumber
Qa Testing - CucumberIsrael Rey
 
Crear archivo war desde Jenkins
Crear archivo war desde JenkinsCrear archivo war desde Jenkins
Crear archivo war desde JenkinsIsrael Rey
 
Crear war en jenkins
Crear war en jenkinsCrear war en jenkins
Crear war en jenkinsIsrael Rey
 
Innovación educativa enfocada a la acción tutorial
Innovación educativa enfocada a la acción tutorialInnovación educativa enfocada a la acción tutorial
Innovación educativa enfocada a la acción tutorialIsrael Rey
 
Requerimientos de usuario y del sistema
Requerimientos de usuario y del sistemaRequerimientos de usuario y del sistema
Requerimientos de usuario y del sistemaIsrael Rey
 

More from Israel Rey (20)

Análisis de Procesos
Análisis de ProcesosAnálisis de Procesos
Análisis de Procesos
 
Construir un BSC
Construir un BSCConstruir un BSC
Construir un BSC
 
Caso CoE y Gobierno BPM
Caso CoE y Gobierno BPMCaso CoE y Gobierno BPM
Caso CoE y Gobierno BPM
 
Mejora Continua en Multifabrik
Mejora Continua en MultifabrikMejora Continua en Multifabrik
Mejora Continua en Multifabrik
 
Integración: Proceso siniestro de una aseguradora
Integración: Proceso siniestro de una aseguradoraIntegración: Proceso siniestro de una aseguradora
Integración: Proceso siniestro de una aseguradora
 
Aplicación de BPM para iniciativas Blockchain
Aplicación de BPM para iniciativas BlockchainAplicación de BPM para iniciativas Blockchain
Aplicación de BPM para iniciativas Blockchain
 
Análisis BPMS
Análisis BPMSAnálisis BPMS
Análisis BPMS
 
Decálogo de Beneficios Implantación BPM
Decálogo de Beneficios Implantación BPMDecálogo de Beneficios Implantación BPM
Decálogo de Beneficios Implantación BPM
 
Modelado DMN
Modelado DMNModelado DMN
Modelado DMN
 
Mapas cognitivos y Mapas causales para comprender el proceso de negocio
Mapas cognitivos y Mapas causales para comprender el proceso de negocioMapas cognitivos y Mapas causales para comprender el proceso de negocio
Mapas cognitivos y Mapas causales para comprender el proceso de negocio
 
Automatización e implementación de Procesos en un Motor BPM
Automatización e implementación de Procesos en un Motor BPMAutomatización e implementación de Procesos en un Motor BPM
Automatización e implementación de Procesos en un Motor BPM
 
Análisis de Procesos con Adonis
Análisis de Procesos con AdonisAnálisis de Procesos con Adonis
Análisis de Procesos con Adonis
 
Modelización y Análisis de Procesos bajo BPMN
Modelización y Análisis de Procesos bajo BPMNModelización y Análisis de Procesos bajo BPMN
Modelización y Análisis de Procesos bajo BPMN
 
Software testing
Software testingSoftware testing
Software testing
 
Instalación de Jmeter
Instalación de JmeterInstalación de Jmeter
Instalación de Jmeter
 
Qa Testing - Cucumber
Qa Testing - CucumberQa Testing - Cucumber
Qa Testing - Cucumber
 
Crear archivo war desde Jenkins
Crear archivo war desde JenkinsCrear archivo war desde Jenkins
Crear archivo war desde Jenkins
 
Crear war en jenkins
Crear war en jenkinsCrear war en jenkins
Crear war en jenkins
 
Innovación educativa enfocada a la acción tutorial
Innovación educativa enfocada a la acción tutorialInnovación educativa enfocada a la acción tutorial
Innovación educativa enfocada a la acción tutorial
 
Requerimientos de usuario y del sistema
Requerimientos de usuario y del sistemaRequerimientos de usuario y del sistema
Requerimientos de usuario y del sistema
 

Cómo funcionan los buscadores

  • 1. BUSCADOR A) CARACTERÍSTICAS Los buscadores, o motores de búsqueda son aplicaciones web que buscan en una base de datos, clasifican y organizan información que se relaciona para mostrarla al usuario. Funcionan mediante programas que buscan en bases de datos y a través de índices, que clasifican la información por temas. Facilitan la manera de encontrar los recursos (imágenes, páginas, videos, etc.), para lo cual consta de los siguientes componentes: Índices de búsqueda: Las páginas son clasificadas por categorías y subcategorías de acuerdo a su contenido, es por esto que la base de datos tiene una lista de direcciones de páginas web que contienen dicho contenido. Motores de búsqueda: La búsqueda lo hace un programa, que se lo conoce como motor, que visita las páginas y relaciona la dirección de la página con las primeras 100 palabras que se encuentran en ella. Para poder clasificar por categorías, se debe identificar y clasificar la página web y esto se realiza de dos formas, tanto manualmente como de una forma automática, para la manual, se deberá ingresar, título de la página, URL, descripción y tipo de información. En cambio para la automática se dispone de un robot que visita y analiza la página principal y todas las páginas enlazadas, este programa o robot, lee las etiquetas o metadatos y extrae toda la información contenida en ellas y así poder ordenar las palabras clave como el título, idioma, autor, localización, temas, etc. Los motores de búsqueda utilizan un robot de búsqueda, que son programas que se dedican a recorrer la Web automáticamente, recopilando todo el texto que encuentran, y de esta manera ir creando bases de datos en las que los usuarios podrán realizar búsquedas mediante la introducción de palabras clave. Los robots recorren los distintos servidores de forma recursiva, a través de los enlaces que proporcionan las páginas, para que su base de datos se mantenga siempre actualizada. Los motores tienen la opción de limitar las búsquedas, utilizando un formulario sencillo de búsqueda, que permite ingresar el texto de la siguiente forma: todas las palabras, algunas palabras y la frase exacta. También utilizando operadores, tanto posicionales como lógicos. Operadores lógicos: AND, el cual ordena buscar una página web o documento que contenga ambas palabras clave, y otros como OR y NOT. Operadores posicionales: estos operadores nos permiten medir la distancia entre las palabras clave que se desean buscar en la página web o documento, como: NEAR: Las palabras clave de la búsqueda aparecen separadas por más de 80 caracteres o 10-25 palabras. FAR: Las palabras clave de la búsqueda aparecen con 10-25 palabras o más de distancia.
  • 2. ADJ: Las palabras clave juntos, sea en el orden que sea. BEFORE: Las palabras clave deben aparecer en el orden especificado, pero pueden encontrarse a cualquier distancia en el mismo documento. FOLLOWED BY: Las palabras tendrán que aparecer en el mismo orden que ingresa en la búsqueda. PHRASE: Se utiliza comillas para obtener el mismo resultado, es decir trata las palabras clave como una frase. B) ARQUITECTURA 1) Robot: Los buscadores, utilizan robots, para crear las bases de datos; estos son programas que recorren la web y obtienen documentos HTML u otro tipo de formatos como pdf, imágenes, etc., de forma automática, es decir acceden a las páginas web y recolectan determinada información sobre su contenido, donde se incluya determinadas palabras clave, estos documentos junto con sus direcciones URL, son clasificados y almacenados en las bases de datos, a partir de un listado de URLs, los robots utilizan algoritmos para determinar la frecuencia de las visitas a los enlaces para verificar las modificaciones que se han realizado [1]. Tipos de robots:  Arañas (Spiders): Programa usado para rastrear la red, lee la estructura de hipertexto y accede a todos los enlaces en el sitio web.  Hormigas (WebAnts): Trabajan de forma distribuida, explorando a la vez diferentes porciones de la Web.  Vagabundos (Wanderes): Realizan estadísticas sobre la Web, como por ejemplo, número de servidores, servidores conectados, número de webs, etc.  Robots de conocimiento (Knowbots): localizan referencias hipertextuales dirigidas hacia un documento o servidor concreto.  Orugas (Web crawlers): Da al programa un grupo de direcciones iniciales, la araña descarga estas direcciones, analiza las páginas y busca enlaces a páginas nuevas Los robots utilizan algoritmos para seleccionar los enlaces, como algoritmos de profundidad, amplitud y algoritmos heurísticos, basados en la información sobre enlaces de mayor relevancia y popularidad. 2) Indexador: Programa que recibe las páginas recuperadas por un robot, estos programas almacenan los titulo HTML y otros los primeros párrafos. Para ayudar a los robots a indizar las páginas, se utilizan mecanismos como: Crear un archivo de texto (robots.txt) que se ubica en el directorio raíz, el cual permitirá al administrador de un sitio web controlar el acceso de los robots a su sitio. También se utiliza la meta etiqueta "robots". Por ejemplo: <META NAME>="robots" CONTENT="index,follow">
  • 3. La etiqueta robots cuenta con atributos que se pueden utilizar: Index: indica al robot de búsqueda que indice la página y la añada a la base de datos. All: indica que se indexen todas las páginas. Follow: indica que han de seguirse los enlaces que están en la página. Las acciones opuestas son "noindex" y "nofollow". 3) Motor de búsqueda: Programa que analiza las palabras claves ingresadas por los usuarios y busca los documentos relacionados, los motores de búsqueda ordena los resultados de diferentes maneras, por Localización, presenta documentos en la que constan todas las palabras buscadas, Frecuencia de aparición, presenta documentos con mayor número de apariciones de las palabras clave. 4) Interfaz: es una página web, con un formulario, en el que se presenta una caja de texto para ingresar la consulta, es decir las palabras clave, y un botón para enviar la consulta. Los resultados igual se presentan en una página web, con ítems que contienen una pequeña descripción. C) TECNOLOGÍAS Las tecnologías que se van a utilizar para la creación del buscador se utilizará la técnica Rest y también constituirá: Base de datos MySql para el almacenamiento de la url de los OCW conjuntamente con los s educativos que ofrecen. La colección de herramientas Bootstrap para el diseño de la página web, y la presentación de los recursos. El entorno de desarrollo Netbeans para la creación del HTML, y la programación con el lenguaje Java.
  • 4. Bibliografía [1] Arquitectura de un buscador. sf. Consultado el 29 de noviembre del 2014. Recuperado de: http://buscadores.fullblog.com.ar/arquitectura_de_un_buscador_531191953898.html [2] Carlos, P. (2004). La selección de palabras clave para el posicionamiento en buscadores. Hipertext.net. Recuperado de http://www.hipertext.net [3] Lamarca, M. (2013). Hipertexto: El nuevo concepto de documento en la cultura de la imagen. Recuperado de http://www.hipertexto.info/documentos/buscar.htm [4].Ramos, J. (2010). Spider, crawler, arañas y rastreadores, primeros pasos para un seo. Recuperado de http://userstrend.com/seo/spider-seo/ [5]. Stark, N. sf. Motores de Busqueda en Internet. Consultado: 28 de noviembre del 2014. Recuperado de: http://www.unlu.edu.ar/~tyr/tyr/TYR-motor/stark-motor.pdf