Multiplica la exactitud de tu analítica de texto usando las herramientas de personalización de MeaningCloud.
Webinar MeaningCloud, 12 de mayo de 2015.
Vídeo del webinar: https://vimeo.com/127816897
(This presentation is also available in English: http://www.slideshare.net/MeaningCloud/meaningcloud-webinar-boost-your-text-analytics-accuracy)
Website MeaningCloud: http://www.meaningcloud.com
Las familias más ricas de África en el año (2024).pdf
Multiplica la Exactitud de tu Analítica de Texto - MeaningCloud Webinar
1. La analítica de textos más
precisa con MeaningCloud
Multiplica la exactitud de tu analítica de texto
con nuestras herramientas de personalización
Webinar Daedalus / MeaningCloud, 12 de mayo de 2015
3. Agenda
Analítica de texto. Exactitud, precisión y cobertura
Recursos lingüísticos personalizados para mejorar la exactitud
Herramientas de personalización de MeaningCloud
Conclusiones y preguntas
4. Analítica de texto
Extraer significado “actuable” de contenido no estructurado
Automatización de tareas típicamente manuales
OpinionesTemas
Hechos
Conceptos
Organizaciones
Personas
Análisis
Semántico
Relaciones
5. ¿Qué precisión tiene todo esto?
La precisión es “relativa”
Las personas no tenemos una precisión del 100%
Tests con analistas humanos: acuerdo 85-95%
Además de precisión, cobertura (recall)
Alta precisión
Alta cobertura
Alta precisión
Baja cobertura
Baja precisión
Alta cobertura
Identificado por algoritmo
6. Exactitud: precisión y cobertura
Precisión y cobertura están
inversamente relacionadas
Buscar compromiso
Los requisitos dependen de la aplicación
Monitorización de marca en medios sociales: alta precisión, baja cobertura
Lucha antiterrorista: alta cobertura, baja precisión
7. Estado del arte en analítica de texto
Medidas de precisión
Extracción de topics (ej.: entidades): 70-85%
Clasificación: 70-80%
Análisis de sentimiento: 60-70%
La mejora de calidad depende de la adaptación de las herramientas y
recursos a la aplicación/tarea
13. Escenario VoC / Customer Insights
Redes sociales, foros
Verbatims encuestas
Interacciones Contact Center:
voz, email…
Estructurar y
extraer significado
¿Qué empresas/
marcas mencionan?
¿De qué están
hablando?
¿Cuál es su opinión?
Análisis
Insights
14. Opiniones
La frase “¡Tiene el tipo
de interés más alto del
mercado!” es…
Positiva, si habla de
depósitos
Negativa, si habla de
hipotecas
Recursos lingüísticos específicos mejoran la
exactitud
Menciones
Nombres de bancos y
entidades financieras, p.
ej.: Santander, BBVA
Nombres de productos, p.
ej.: Cuenta Naranja,
Libreta Estrella…
Temas
Ejemplo: análisis de las opiniones de clientes de un banco
Productos
Pasivo
Cuenta
Depósito
Activo
Crédito
Hipoteca
Canal
Oficina
Teléfono
Internet
15. Qué vamos a hacer
Diccionario Banca
Nombres de bancos, nombres de productos (entidades)
Nombres de productos genéricos, p.ej.: hipoteca (conceptos)
Modelos de clasificación
Modelo Canales: teléfono, web…
Modelos de sentimiento (avance)
18. Creando un nuevo diccionario
Posibilidad de
importar diccionario
desde fichero
19. Creando una nueva entidad
Alias: NO es necesario
introducir
explícitamente alias
“inmediatos”( ej.:
tildes), motor genera
variantes
Usa tu propia
ontología
Posible incorporar
información
semántica adicional
22. Importación de diccionarios
La mejor manera de incorporar a MeaningCloud un diccionario preexistente
Forma Alias ID Atributos de Información semántica
23. Resultado: las APIs identifican topics del
diccionario
Identifica información semántica
Producto: Cuenta Nómina
Tipo: Cuenta corriente
Banco: ING
25. Creando un nuevo modelo
Posibilidad de
importar modelo
desde fichero
26. Definiendo una
categoría: enfoque híbrido
Basado en Reglas
Basado en Entrenamiento
Se puede optar por uno de
los enfoques o combinarlos,
según la aplicación
27. Definiendo una categoría: entrenamiento
Se alimenta con textos de entrenamiento precodificados
Basado en tecnología machine learning
28. Definiendo una categoría: reglas
Términos que
Aumentan la
relevancia
Disminuyen la
relevancia
Son imprescindibles
Están prohibidos
29. Cómo mejorar precisión y cobertura aplicando
reglas + entrenamiento
Estadístico Basado en reglas Híbrido
Ventajas Muy rápido si ya tienes
textos etiquetados
Buenos resultados para
textos largos
No hay falsos positivos
Muy buenos
resultados para
casuísticas limitadas
Se puede poner en marcha
fácilmente a partir de textos
de ejemplo
No necesita definición
exhaustiva de reglas
Desventajas “Caja negra”
Falsos positivos difíciles
de corregir
Sesgo en resultados
según entrenamiento
Costoso partiendo
desde cero
Falsos negativos según
la calidad de las reglas
Escala con dificultades
Requiere conocimiento
exhaustivo de dominio
34. Sentimiento: uso de diccionarios personales de
entidades y conceptos
Polaridad asociada a la entidad
Cuenta Nómina
35. Diccionarios personalizados de Sentimiento
(PRONTO)
No todos los términos tienen la misma polaridad en todos los dominios
Ej.: en el dominio de artículos de lujo “barato” no tiene necesariamente una polaridad
positiva (como en otros dominios)
En modelo de Sentimiento para dominio Lujo: “barato” N
Un mismo término puede tener distintas polaridades, según el contexto
Tenemos esta funcionalidad en pruebas. Si quieres participar en la beta privada envía un
email a support@meaningcloud.com
Término Contexto Polaridad
cerrar Bolsa, marcador NEUTRO
cerrar Contrato, compraventa P
cerrar Empresa N
36. Conclusiones
¿Cómo mejorar la exactitud?
Herramientas gráficas
Posibilidad de incorporar tus diccionarios y modelos
Amplia cobertura: menciones, temas, opiniones…
Usuarios autónomos
La mayor exactitud al alcance de tu mano
37. Democratizando la extracción de significado
Análisis semántico de alta
calidad
Combinación optimizada de
tecnologías
Recursos semánticos
actualizados continuamente
APIs de alto nivel, ej.:
reputación corporativa…
Personalización al dominio del
cliente: clasificación,
diccionarios, sentimiento
Asequible y sin riesgos
Tecnología madura y
probada
Posible probar y usar Gratis
(40.000 peticiones/mes)
Pago por uso
Sin compromisos ni
permanencias
Planes comerciales a partir
de 99 $/mes
Para desarrolladores y
usuarios no técnicos
Add-in para Excel
APIs servicios web
estándar
Plug-ins y SDKs para
diversos entornos y
lenguajes
Plug-and-play
OpinionesTemas
Hechos
Conceptos
Organizaciones
Personas
Relaciones
38. ¡Muchas gracias por vuestra atención!
Preguntas, sugerencias, etc.
Antonio Matarranz
Director Comercial
amatarranz@daedalus.es
Daedalus, S.A.
Tel: +34 913324301
http://www.meaningcloud.com
http://www.daedalus.es