1. File/
N
adiesabemuybiendequésetrata,pero,como
dijo recientemente Scott Prevost, director de
desarrollo del motor de búsqueda Bing, de
Microsoft, “sea lo que sea, la Web 3.0 ya está
aquí”. Mientras apenas empezamos a enten-
der qué es la Web 2.0, gurús, tecnólogos, científicos y em-
prendedores debaten acerca de las aplicaciones y tecnolo-
gías que facilitarán y acelerarán el desarrollo de la tercera
generación de la Web: una Web abierta, ubicua, inteligente,
conectada con el mundo físico, capaz de comprender el len-
guaje natural, reconocer el contexto, y razonar e interpretar
las necesidades del usuario para ofrecerle una experiencia
personalizada, más productiva e intuitiva.
“Imagine —sugiere Jeffrey Pollock, autor de Semantic
Web For Dummies (Wiley, 2009), ex ingeniero de software
del Departamento de Defensa de los Estados Unidos y ac-
tual director de la división de middleware de Oracle— que
el texto, los gráficos, las fotos que ve en el navegador no
corresponden a una página estática sino que provienen de
diferentes sitios de la red y fueron combinados de manera
únicaparasusojos.EsaeslanaturalezadelaWebsemán-
tica:lareutilizaciónylamezcla.Lasideas,losconceptoso
datos pueden ser recopilados y reorganizados de infinitas
formas para darles nuevo significado según las necesida-
des de cada persona.”
Yihong Ding, investigador de la Web semántica y colabo-
radorenelsitiodenoticiasdetecnologíaZDNet,coincidecon
Pollock. “Estamos en un momento de transición; pasando
de una Web definida por el editor a otra determinada por el
usuario —argumenta—. En su versión 1.0 (1990-1999), los
espacios web eran páginas que representaban la visión de
la empresa u organización propietaria del dominio. En la 2.0
(2000-2009), los espacios pasaron a ser las cuentas perso-
nales de los usuarios, aunque alojadas en sitios pensados y
diseñadosporuneditor.Yenla3.0(2010-2019),losespacios
webseránunacolecciónderecursosdediferentessitiosque
Foto: Istock
La era del
razonamiento
artificialLas nuevas tecnologías están
cambiando la estructura de la
Web, ordenándola en torno de
estándares para transformarla
en una gran base de datos
interconectada con el mundo real,
y dotándola de inteligencia para
comprender el significado
de la información e
interactuar con los usuarios.
Por Florencia Lafuente,
periodista especializada en negocios.
2. se organizarán en tiempo real, de acuerdo
con la visión del usuario.”
El sueño posmoderno
Aunque la Web semántica —como defi-
nen los especialistas a esta red dinámica y
pensante— todavía está en una fase preli-
minar, la idea no es nueva; ha sido tema de
discusióndesde1999,cuandoTimothyBer-
ners-Lee,directordelWorldWideWebCon-
sortium (W3C), organización que promueve
los estándares de la Web, acuñó el término.
Berners-Lee, creador del lenguaje de hi-
pertexto HTML, el protocolo HTTP y el sis-
tema de localización de objetos (URL), dijo
en ese entonces: “Tengo un sueño para la
Web en el que las computadoras serán ca-
paces de analizar el contenido y entender
las transacciones entre las personas y las
máquinas. Se llama ‘Web semántica’, pero
aúndebedesarrollarse.Cuandoseconvier-
ta en realidad, nuestras vidas serán mane-
jadas por computadoras. El agente inteli-
gente que tanto ha buscado la humanidad
finalmente se materializará”.
Berners-Lee estimó que su sueño se
concretaría en 2020, más o menos la fecha
en que la versión 5 del lenguaje de progra-
mación de la Web, el HTML, estará comple-
ta(hoypuedenusarsealgunasdesusespe-
cificaciones).
Junto con la evolución de las tecnologías
2.0, las funcionalidades sintácticas simplifi-
cadas del HTML 5 para codificar contenido
multimedia están cumpliendo las promesas
de la Web. Este lenguaje establece estánda-
resparalaprogramaciónyfijareglasparael
usode,porejemplo,etiquetasdevideo,audio
ycanvas(elementoparagenerargráficosdi-
námicos en la misma página, sin necesidad
de recurrir a aplicaciones complementa-
rias), con lo que no sólo resuelve los proble-
mas de interoperabilidad entre sitios y apli-
caciones,sinoquetambiénfacilitaeldiseñoy
manejodelcontenido3Dyabrelaspuertasal
maravilloso mundo de la realidad virtual, en
el que las redes como SecondLife y el uso de
avatares serán aplicaciones comunes.
Pollock se explaya: “Con las nuevas tec-
nologías de procesamiento del lenguaje
natural (o NLP, sigla de Natural Language
Processing),lanocióndebúsquedasporIn-
ternet cambiará radicalmente: en lugar de
hacer consultas por palabras clave se po-
3. File/
drán buscar ideas o conceptos, porque las máquinas enten-
derán el significado de la palabra escrita”.
Los sistemas de NLP se usan hoy en actividades que de-
mandan el procesamiento de grandes cantidades de datos,
como en detección de fraudes, prevención del lavado de dine-
ro y terrorismo, análisis de inteligencia de negocios, marke-
ting y publicidad, investigación científica y medicina. Mediante
laaplicacióndecomplejosalgoritmosaltextodesordenado,los
motores de NLP son capaces de generar datos estructurados
omodelosdedatos.Sostienenlosexpertosqueestossistemas
son la única tecnología viable para automatizar la extracción
de información valiosa del actual caos de la Web. Y, según la
organización worldwidewebsize.com, la anarquía es extensa:
enenerode2011había12.830millonesdesitiosregistrados.
Peer39yAdPepper,dosstart-upsquehacenusodelatec-
nología semántica para diseñar soluciones
de marketing y publicidad, están cosechan-
do los beneficios del NLP. Ambas ofrecen
servicios de análisis contextual para la
colocacióndeanunciosonlinepersona-
lizados.Peer39,porejemplo,empleó
tecnologías de NLP y aprendizaje
computacional para desarro-
llar una serie de algoritmos
que escanean la Web y anali-
zan el contenido de las páginas
en busca del contexto adecuado y
preciso para cada anuncio.
Por su parte, para crear la red pu-
blicitaria semántica iSense, Ad Pepper
armó un equipo de 40 lingüistas y lexicó-
grafosque,diccionarioenmano,sededica-
ron durante cuatro años a asignar palabras
a una serie de categorías de conocimiento,
con el objeto de crear un marco concep-
tual que permitiera al sistema analizar y
entender los términos y temas conteni-
dos en una página web.
Sin duda, el potencial de la Web semántica es enorme.
Puede cambiar todos los aspectos de la vida humana, la
forma de operar de las empresas, la investigación y el desa-
rrollo, el acceso a los productos y servicios, la información y
la noción de privacidad. No obstante, todavía hay obstáculos
significativos por sortear.
Juego abierto
En el centro del ecosistema 3.0 se unen los dos extre-
mosdelacadenatecnológica.Porunlado,elfront-end,olas
aplicaciones que interactúan con el usuario. Por el otro, el
back-end, o los sistemas de administración y procesamien-
to de datos que manejan las aplicaciones. El navegador, por
ejemplo,eslaaplicaciónfront-endporexcelenciadelaWeb;
y, aunque hoy estos programas ofrecen innumerables ex-
tensiones o componentes (plug-ins) que mejoran la nave-
gación,elsistemanotieneaúnlainteligenciaparaentender
u organizar la información que maneja el usuario. A medida
que las aplicaciones y el contenido web se ordenen en torno
de estándares semánticos, un gran paso hacia la red inteli-
gente habrá sido dado.
Applefuepioneraenadoptarestándaresyfuncionalidades
semánticasprovistasporelHTML5parasunavegadorSafari.
TambiénlohicieronGoogle,paraChrome,Mozilla,paraFire-
fox, y Opera. En 2009, además, Google lanzó Google Squared,
una herramienta de categorización semántica de datos que,
en segundos, analiza la información de la Web, selecciona y
presentalosresultadosdelabúsquedaenunahojadecálculo.
Corporaciones como Oracle, IBM, Microsoft, Salesforce y
SAP están integrando la tecnología semántica a sus paque-
tes de software corporativos. Apple también avanza para do-
minarelespaciomóvil.Enabrilde
2010 compró Siri, un asistente
personal móvil inteligente que
usatecnologíasemántica,dere-
conocimientodevozeinteligencia
artificial.Setratadeunaaplicación
gratuita conectada a un ecosistema
rico en servicios web. ¿Le cayó mal
lacomidaenelrestaurante?Consólo
pedirle a Siri que lo lleve a su casa, el
sistemallamaráauntaxiyseencar-
gará de que lo dejen en la puerta.
Decenas de start-ups intentan
posicionarse con novedosos pro-
ductos y servicios para la nueva
Web.Unalistarápidadeejem-
plos: el innovador buscador
de respuestas Wolfram
Alpha; la red social de co-
nocimientoTwine;Meaning-
Tool,laherramientadebúsquedaqueaprendedelusuario,
dePropego;elbuscadordepersonasZoomInfo,ylabasede
metadatos Freebase, de Metaweb, construida por una co-
munidaddeusuariosonlineyadquiridaporGoogleen2010.
Al momento de esta compra, Freebase contaba con más de
12 millones de “cosas” catalogadas en su base de datos y
relacionadas semánticamente entre sí. Poco antes de que-
darse con Freebase, Google había adquirido la empresa de
publicidad móvil AdMob y al servicio social de búsquedas
Aardvark, que permite a los usuarios hacer una pregunta
cualquiera (por ejemplo: “Querría visitar algunos lugares
no turísticos en Berlín. ¿Alguna sugerencia?”) y obtener
una respuesta en tiempo real por parte de los miembros
conectados a la red.
Foursquare, creada en 2009, es una red social para dis-
positivosinalámbricosbasadaenlalocalizacióngeográfica.
Mediante aplicaciones móviles que hacen uso de sistemas
de GPS, los usuarios se “registran” en la red cada vez que
entran a un establecimiento, ya sean tiendas, restaurantes,
en lugar de hacer
consultas por palabras
clave se podrán
buscar ideas o
conceptos, porque las
máquinas entenderán
el significado de la
palabra escrita.
4. hoteles o museos. Si envían información y comentarios del
lugarenelqueestán,puedenganarpuntosypremios.Lared
también funciona como un servicio publicitario que mues-
traanunciossegúnelcontexto,comopromocionesespecia-
les de determinados productos. Foursquare está integrada
a Twitter y Facebook, de modo que todos los contactos del
usuario pueden agregar sus propios comentarios.
Otra aplicación de redes sociales, GetGlue, una barra
de herramientas para navegadores desarrollada por la red
de entretenimiento AdaptiveBlue, brinda a los usuarios la
posibilidad de saber si el contenido por el que están nave-
gando ya fue consultado antes por sus amigos y si emitie-
ronopinionesalrespecto.GetGluetambiénhacerecomen-
daciones sobre tópicos que podrían ser de interés para el
navegante de acuerdo con el perfil de búsqueda. A su vez,
MeaningTool,dePropego,esunaaplicacióninteligenteque
permitealosnavegantescrearsuspropiosárbolessemán-
ticosy“enseñarle”alsistemanuevosconceptosparafiltrar
y categorizar texto, sitios y personas.
La Comunidad KDE (K Desktop Environment), un grupo
internacional de expertos en tecnología, creó una platafor-
ma gráfica abierta y una serie de aplicaciones con capaci-
dadessemánticasquefuncionansobresistemasoperativos
tan diversos como Linux, Windows, Mac OS X y Solaris. El
grupo apunta a transformar el “escritorio” de la computa-
dora en una aplicación semántica en sí misma. Entre otras
funcionalidades, KDE permite al usuario indexar todos los
archivos de su computadora en la Web para consultarlos de
manera más inteligente —por medio de herramientas se-
mánticas online—, y además posibilita que otros usuarios
también etiqueten esos archivos y creen una ontología del
contenido de su computadora. En la jerga, “ontología” hace
LAS ERAS DE LA TECNOLOGÍA
El siguiente gráfico muestra la evolución de los ecosistemas tecnológicos (plataformas, protocolos,
lenguajes, técnicas de desarrollo) y la riqueza social de sus aplicaciones, de la PC a la Web 3.0.
Fuente: Semantic Web For Dummies, de Jeffrey Pollock. Basado en un gráfico creado por Nova Spivack.
Era de la PC
Era de la WWW
Era de la Web semántica
Computación
de escritorio
Web 1.0
Web 2.0
Web 3.0
Riquezadelasconexionesdedatos
Riqueza de las conexiones sociales
FTP
E-mail
SGM
SQL
Gopher
HTTP/HTML
00/Java
XML/J2EE
SOAP/WSDL
AJAX/JSON
ATOM
RDF/OWL
SPARQL
Rule Interchange Linked Data
(formato para intercambio
de reglas entre lenguajes y datos)
Sistemas de archivos
1980-1990
Servidores
Bases de datos
1990-2000
Trabajo en equipo
Intranets
Portales
2000-2010
Blogs/Wikis
Redes sociales
Computación en la “nube” y SaaS
2010-2020
Web como base de datos
Agentes personales
inteligentes
5. File/
referencia al vocabulario de metadatos que permite a la
gente organizar la información a través de etiquetas,
de forma tal de eliminar la ambigüedad del lenguaje
para que los agentes inteligentes de software —por
ejemplo,unbuscadorsemántico—interpretenlos
datos con precisión.
La principal barrera para que la Web 3.0 se
desarrolle tiene que ver, justamente, con la
organización de los datos. Cuanta mayor
densidad de información, cuantos más
datos interconectados y etiquetados se-
mánticamente, y cuantos más metada-
tos relacionados con los modelos con-
ceptuales, más significados podrán
extraerse del contenido. Blogs, wikis,
sitios, anuncios publicitarios, resul-
tados de búsquedas, videos, servi-
cios de noticias, de reservas de via-
jes, pronóstico del tiempo, datos
demográficos, mensajes en Twit-
ter, e-mails, actualizaciones de
Facebook, fotos de Flickr, perfi-
les de usuarios; todo el conteni-
do de la Web debe estar codifica-
do con los mismos estándares y
dispuesto en formatos legibles
por las computadoras.
Igualdad para todos
Los primeros desarrollos que
hoypuedendefinirsecomolosestán-
dares de la Web 3.0 surgieron del pro-
grama Agent Markup Language (DAML)
de la Agencia de Proyectos de Investigación
Avanzada de Defensa (DARPA), el esfuerzo se-
creto del Departamento de Defensa estadouni-
dense por construir su propia versión de la Web, en
2000.Elproyecto,finalmenteterminado,dioaluzloses-
tándares RDF (Resource Description Framework), el len-
guaje semántico usado para describir datos, metadatos e
incluso otros lenguajes; a OWL (Web Ontology Language),
una extensión del modelo RDF diseñada para representar
conocimientos ricos y complejos sobre las cosas, grupos
de cosas y relaciones entre ellas, y a SPARQL (Protocol and
RDF Query Language), el lenguaje de consulta para RDF,
más poderoso que SQL.
Unodelosprimerospasoshacialosestándaressemánti-
cosfuedadoporunjugadorimpensado:Microsoft.Enenero
de 2010, durante una conferencia sobre la Web 3.0 en Ca-
lifornia, Scott Prevost confirmó los planes de la compañía
de concentrarse en el desarrollo de capacidades para la
nueva generación de la Web. Prevost ingresó a la empre-
sa en 2008, cuando Microsoft compró por US$ 100 millones
la firma de software de NLP que el tecnólogo había funda-
do en 2006: Powerset. La organización había creado un
motor de búsqueda semántico sólo para Wikipedia, tec-
nología que, en última instancia, Microsoft integró a su
propio buscador, Bing.
Otro jugador que estableció un mojón con su desarro-
llo de vanguardia fue Wolfram Research, del físico británi-
co Stephen Wolfram, creador de Wolfram Alpha, un nove-
doso buscador de respuestas semántico lanzado en 2009.
El sistema trabaja sobre la base de algoritmos matemá-
ticos y estadísticos para responder con precisión a las
preguntas del usuario. Sus respuestas provienen de
una base de datos propia, construida por in-
vestigadores y equipos de especialistas cuya
laborpareceinfinita:sumetaessistematizar
la totalidad del conocimiento humano.
Twine, la “red social de conocimiento”, así
definida por su creador, Nova Spivack, era el
producto estrella de Radar Networks, hoy
parte del sitio de búsquedas semánticas Evri,
que adquirió la firma en 2010. Radar Net-
works fue fundada por Spivack en 2003. Em-
prendedor serial, promotor de la Web 3.0 y
nieto de Peter Drucker, Spivack relata que
su abuelo lo ayudó a imaginar la Web del
futuro, un espacio donde todo se rela-
ciona con todo. Twine, a diferencia de
otras redes sociales, no sólo vincula
personas, sino cualquier elemento
que sea de interés para el usua-
rio: lugares, compañías, pro-
ductos, sitios, videos, fotos,
mensajes. Pero, además de
su interés por Twine, Evri quería
a Radar Networks por su producto “T2”, un pro-
yecto tan ambicioso como el de Stephen Wolfram:
construir un índice semántico de la Web.
EnotroplanoestáCalais,deThomsonReuters.El
buscador facilita la consulta de noticias por ideas o
conceptos definidos por el propio usuario, y después
las relaciona con otros recursos semánticos disponi-
bles en la Web para categorizarlas de acuerdo con ontolo-
gías de conceptos, personas, lugares, eventos o cualquier
otra cosa. El servicio de Calais apunta a las corporaciones.
Muchas empresas lo usan para detectar tendencias y com-
portamientos del mercado.
Un competidor de Calais es Extractiv, que sirve para
escanear la Web en busca de datos “sentimentales”; es
decir, información acerca de lo que siente la gente sobre
los productos y servicios.
Con más de 45 millones de personas y cinco millones de
compañíasregistradasensubasededatos,ZoomInfosepo-
sicionócomounbuscadordeindividuoseinformacióndene-
gocios. Su motor semántico está constantemente hurgan-
do la Web para detectar datos sobre personas, compañías,
todo
el
contenido
de la Web
debe estar
codificado
con los mismos
estándares y
dispuesto
en formatos
legibles
por las
computadoras.