SlideShare a Scribd company logo
1 of 44
Download to read offline
Creando una Sección de FAQS y su
Marcado de Datos Estructurados en 30
Minutos
Hamlet Batista
@hamletbatista
Traducción de Twitter
Debería ser: “Una tarea
de #SEO aburrida”
@hamletbatista
Traducción de Google Chrome
Aldea
Batista
@hamletbatista
Las Traducciones Automáticas
1. Ahorran mucho tiempo
2. Usan técnicas avanzadas de redes neuronales
3. Tienen muy buena calidad, pero necesitan
trabajo de edición
@hamletbatista
Estas Tecnologías son Abiertas y Gratuitas
1. Google T5 https://bit.ly/3kPOcOH
2. Facebook BART https://bit.ly/2FUYXAB
@hamletbatista
Agenda
Vamos a ver aplicaciones prácticas de generación de texto para SEO:
1. Preparación de entorno con Google Colab
2. Sacando texto para sumarizar y traducir
3. Usando sumarización con BART y T5
4. Haciendo traducciones con T5
5. Traduciendo con el API de Google Translate
6. Casos problemáticos en Español: Preguntas Frecuentes y Generación
de Preguntas
7. Creación de marcado estructurado
8. Un poco de teoría de cómo todo esto funciona tan bien
9. Donde aprender más @hamletbatista
Preparación de entorno con Google Colaboratory
https://github.com/hamletbatista/seonderground
@hamletbatista
Preparación de entorno con Google Colaboratory
https://bit.ly/334wKQy
@hamletbatista
Preparación de entorno con Google Colaboratory
Entorno de
Ejecución >
Cambiar tipo de
entorno de ejecución
@hamletbatistahttps://bit.ly/36dl3sO
Preparación de entorno con Google Colaboratory
@hamletbatistahttps://bit.ly/36dl3sO
Sacando texto para sumarizar y traducir
@hamletbatista
Sacando texto para sumarizar y traducir
@hamletbatista
Sacando texto para sumarizar y traducir
@hamletbatista
@hamletbatista
Usando sumarización con BART
@hamletbatista
Usando sumarización con BART
resumen = sumarizador_bart(texto[:1024], min_length=50, max_length=250)
Resumen[0]["summary_text"]
Elaine Palacio, 18, apareció in edición especial de septiembre of Vogue Italia .
Tiene contratos con marcas como Victoria’s Secret, Reebok y Burberry .
“Vogue” escogió a famosas como Cindy Crawford, Bella Hadid y Emily Ratajk .
Funciona!
@hamletbatista
Usando sumarización con T5 (base)
sumarizador_t5 = pipeline("summarization", model="t5-base",
tokenizer="t5-base")
resumen = sumarizador_t5(texto, min_length=50, max_length=250)
Resumen[0]["summary_text"]
i'm black, I'm Afro Can't be more Honored to be part of this amazing story,
thank you . #vogueitalia100 covers, 100 people, 100 stories, 1 Elaine .
@hamletbatista
No
funciona!
@hamletbatista
Usando sumarización con T5 (large)
sumarizador_t5 = pipeline("summarization", model="t5-large", tokenizer="t5-
large")
resumen = sumarizador_t5(texto, min_length=50, max_length=250)
Resumen[0]["summary_text"]
Elaine Palacio Mosquera, de 18 aos, es una modelo afro-colombiana que
elegió en la edición especial de septiembre de la revista “Vogue” Italia. “Me
reinita, te lo dije”, dijo Mara Flor Rentera a su nieta Elaine palacio en Divina!
@hamletbatista
Funciona!
@hamletbatista
Haciendo traducciones con T5
@hamletbatista
Haciendo traducciones con T5 de Español a
Portugués
@hamletbatista
Haciendo traducciones con T5 de Español a
Portuges
es_to_pt_traducción = pipeline("translation_en_to_de", model="mrm8488/t5-
small-finetuned-translation-es-to-pt",
tokenizer="mrm8488/t5-small-finetuned-translation-es-to-pt")
'' a modelo de 18 anos especial da revista '' '' . têm contratos com
marcas como a Victoria’s Secret , reebok e a burberry . '' '' eu ainda ,
'' eu ainda , eu aconteceu em vogueitalia . ''
@hamletbatista
Haciendo traducciones con T5 de Español a
Portuges
@hamletbatista
Como Traducir a más Lenguajes (Difícil)
1. Buscar o generar datos de los
idiomas a traducir
2. Entrenar un tokenizador para crear
un vocabulario
3. Entrenar un lenguaje modelo que
use el vocabulario
https://bit.ly/2Gj8QaP
@hamletbatista
Como Traducir Usando la API de Google
Translate (Fácil)
@hamletbatista
Como Traducir Usando la API de Google
Translate (Fácil)
from googletrans import Translator
translator = Translator()
result = translator.translate(texto)
The 18-year-old Colombian model appeared in the special
September issue of “Vogue” Italia magazine. He has contracts with
brands such as Victoria’s Secret, Reebok and Burberry.
@hamletbatista
Casos Problemáticos: Generación de Preguntas
Frecuentes
https://bit.ly/3czrCH2
@hamletbatista
Casos Problemáticos: Generación de Preguntas
Frecuentes
https://bit.ly/3czrCH2
@hamletbatista
Casos Problemáticos: Generación de Preguntas
Frequentes
[{'answer': 'Ministerio P ⁇ blico',
'question': 'Who said “Vamos con todo y por todos”?'},
{'answer': '7:00',
'question': 'At what time of day do the dominicans go to visit the
plazas?'},
{'answer': 'Las declaraciones juradas',
'question': 'What is en la palestra p ⁇ blica luego de que los
monxadtos que tienen registrados alarm'},
{'answer': 'Ministerio P ⁇ blico dice nadie está exento de juicio por
corrupción Si los fantasmas',
'question': 'What does the Ministerio P ⁇ blico say?'}]
@hamletbatista
No
funciona!
@hamletbatista
Casos Problemáticos: Generación de Preguntas
Frequentes
Solución más sencilla:
1. Traducir el texto al Inglés
2. Generar la preguntas y respuestas en Inglés
3. Traducir la generación al Español
https://bit.ly/3czrCH2
@hamletbatista
Casos Problemáticos: Generación de Preguntas
Frecuentes
@hamletbatista
Casos Problemáticos: Generación de Preguntas
Frequentes
faqs_traducidas = list()
for faq in faqs:
pregunta = translator.translate(faq["question"], dest="es")
respuesta = translator.translate(faq["answer"], dest="es")
faqs_traducidas.append({"pregunta": pregunta.text,
"respuesta": respuesta.text})
@hamletbatista
Casos Problemáticos: Generación de Preguntas
Frecuentes
@hamletbatista
Funciona!
@hamletbatista
Creando el Marcado Estructurado
@hamletbatista
Creando el Marcado Estructurado
@hamletbatista
Creando el Marcado Estructurado
@hamletbatista
Creando el Marcado Estructurado
@hamletbatista
Un Poco de Teoría de Cómo Todo esto
Funciona tan bien
¿Ha realizado pruebas de aptitud o coeficiente
intelectual en las que se le presenta una
secuencia de números y necesita adivinar el
siguiente?
1. Los tokenizadores neurales primero
convierten el texto en números (vectores)
2. El modelo toma la secuencia de números y
predice el siguiente que hace más lógica
3. El proceso sigue de forma iterativa hasta
que se genera el tamaño de secuencia
indicada
4. Los tokenizadores convierten los números a
texto
@hamletbatista
Un Poco de Teoría de Cómo Todo esto
Funciona tan bien
Como se trata de un concepto muy abstracto,
utilizaré una analogía del GPS para explicarlo en
términos simples.
Puede buscar una empresa por su nombre en el
mundo físico o por su dirección o coordenadas
GPS.
Cuando busca una empresa por su nombre, es
como cuando Bing y Google buscan las páginas
de contenido por las palabras clave escritas.
Pero con los números/vetores podemos hacer
una búsqueda mas precisa usando coordenadas.
@hamletbatista
@hamletbatista
Donde Aprender más
1. https://www.searchenginejournal.com/natural-language-generation-changes-
seo/371739/
2. https://www.searchenginejournal.com/generate-quality-faqs-faqpage-schemas-
with-python/380004/
3. https://blogs.bing.com/webmaster/july-2020/How-to-Optimize-Your-Content-
for-Search-Questions-using-Deep-Learning
4. https://www.youtube.com/watch?v=oY1HIMvzXCM
5. https://www.slideshare.net/hamletbatista/the-python-cheat-sheet-for-the-
busy-marketer
Automatización de SEO con RankSense
www.ranksense.com
www.cloudflare.com
/apps/ranksense
@hamletbatista

More Related Content

Similar to Creando una Sección de FAQS y su Marcado de Datos Estructurados en 30 Minutos

Similar to Creando una Sección de FAQS y su Marcado de Datos Estructurados en 30 Minutos (20)

Clase Programación WEB
Clase Programación WEBClase Programación WEB
Clase Programación WEB
 
Conociendo php (201009)
Conociendo php (201009)Conociendo php (201009)
Conociendo php (201009)
 
Introducción al desarrollo web
Introducción al desarrollo webIntroducción al desarrollo web
Introducción al desarrollo web
 
Trabajo de cat karo
Trabajo de cat karoTrabajo de cat karo
Trabajo de cat karo
 
Practico 1 taller CAT
Practico 1 taller CATPractico 1 taller CAT
Practico 1 taller CAT
 
HTML5 Enfoque Semantico
HTML5 Enfoque SemanticoHTML5 Enfoque Semantico
HTML5 Enfoque Semantico
 
Jessik
JessikJessik
Jessik
 
Jessik
JessikJessik
Jessik
 
Tema 3 - Introducción a HTML
Tema 3 - Introducción a HTMLTema 3 - Introducción a HTML
Tema 3 - Introducción a HTML
 
Html
HtmlHtml
Html
 
Html
HtmlHtml
Html
 
Manual rapido html
Manual rapido htmlManual rapido html
Manual rapido html
 
Curso HTML CSS 1/4
Curso HTML CSS 1/4Curso HTML CSS 1/4
Curso HTML CSS 1/4
 
Encuentro Linux 2011
Encuentro Linux 2011Encuentro Linux 2011
Encuentro Linux 2011
 
taller de software CAT
taller de software CATtaller de software CAT
taller de software CAT
 
Tercera unidad
Tercera unidadTercera unidad
Tercera unidad
 
Tercera unidad
Tercera unidadTercera unidad
Tercera unidad
 
Tercera unidad
Tercera unidadTercera unidad
Tercera unidad
 
Tercera unidad
Tercera unidadTercera unidad
Tercera unidad
 
Productividad en la traducción: un mito hecho realidad
Productividad en la traducción: un mito hecho realidadProductividad en la traducción: un mito hecho realidad
Productividad en la traducción: un mito hecho realidad
 

More from Hamlet Batista

A Deep Dive Into SEO Tactics For Modern Javascript Frameworks
A Deep Dive Into SEO Tactics For Modern Javascript FrameworksA Deep Dive Into SEO Tactics For Modern Javascript Frameworks
A Deep Dive Into SEO Tactics For Modern Javascript FrameworksHamlet Batista
 
Automated Duplicate Content Consolidation with Google Cloud Functions
Automated Duplicate Content Consolidation with Google Cloud FunctionsAutomated Duplicate Content Consolidation with Google Cloud Functions
Automated Duplicate Content Consolidation with Google Cloud FunctionsHamlet Batista
 
Quality Content at Scale Through Automated Text Summarization of UGC
Quality Content at Scale Through Automated Text Summarization of UGCQuality Content at Scale Through Automated Text Summarization of UGC
Quality Content at Scale Through Automated Text Summarization of UGCHamlet Batista
 
Automating Google Lighthouse
Automating Google LighthouseAutomating Google Lighthouse
Automating Google LighthouseHamlet Batista
 
The Python Cheat Sheet for the Busy Marketer
The Python Cheat Sheet for the Busy MarketerThe Python Cheat Sheet for the Busy Marketer
The Python Cheat Sheet for the Busy MarketerHamlet Batista
 
Doing More with Less: Automated, High-Quality Content Generation
Doing More with Less: Automated, High-Quality Content GenerationDoing More with Less: Automated, High-Quality Content Generation
Doing More with Less: Automated, High-Quality Content GenerationHamlet Batista
 
How to scale SEO work NOBODY wants to do (including your competitors) to rapi...
How to scale SEO work NOBODY wants to do (including your competitors) to rapi...How to scale SEO work NOBODY wants to do (including your competitors) to rapi...
How to scale SEO work NOBODY wants to do (including your competitors) to rapi...Hamlet Batista
 
Agile SEO: Faster SEO Results
Agile SEO: Faster SEO ResultsAgile SEO: Faster SEO Results
Agile SEO: Faster SEO ResultsHamlet Batista
 
Scaling Keyword Research to Find Content Gaps
Scaling Keyword Research to Find Content GapsScaling Keyword Research to Find Content Gaps
Scaling Keyword Research to Find Content GapsHamlet Batista
 
Query Classification on Steroids with BERT
Query Classification on Steroids with BERTQuery Classification on Steroids with BERT
Query Classification on Steroids with BERTHamlet Batista
 
Solving Complex JavaScript Issues and Leveraging Semantic HTML5
Solving Complex JavaScript Issues and Leveraging Semantic HTML5Solving Complex JavaScript Issues and Leveraging Semantic HTML5
Solving Complex JavaScript Issues and Leveraging Semantic HTML5Hamlet Batista
 
Python for Data-driven Storytelling
Python for Data-driven StorytellingPython for Data-driven Storytelling
Python for Data-driven StorytellingHamlet Batista
 
Scaling automated quality text generation for enterprise sites
Scaling automated quality text generation for enterprise sitesScaling automated quality text generation for enterprise sites
Scaling automated quality text generation for enterprise sitesHamlet Batista
 
The New Renaissance of JavaScript
The New Renaissance of JavaScriptThe New Renaissance of JavaScript
The New Renaissance of JavaScriptHamlet Batista
 
Data and Evidence-driven SEO
Data and Evidence-driven SEOData and Evidence-driven SEO
Data and Evidence-driven SEOHamlet Batista
 
Advanced Data-Driven SEO
Advanced Data-Driven SEOAdvanced Data-Driven SEO
Advanced Data-Driven SEOHamlet Batista
 
Technical SEO "Overoptimization"
Technical SEO "Overoptimization"Technical SEO "Overoptimization"
Technical SEO "Overoptimization"Hamlet Batista
 
Why Pay for Performance When You Can Lead the World To Your Door for Free?
Why Pay for Performance When You Can Lead the World To Your Door for Free?Why Pay for Performance When You Can Lead the World To Your Door for Free?
Why Pay for Performance When You Can Lead the World To Your Door for Free?Hamlet Batista
 

More from Hamlet Batista (20)

A Deep Dive Into SEO Tactics For Modern Javascript Frameworks
A Deep Dive Into SEO Tactics For Modern Javascript FrameworksA Deep Dive Into SEO Tactics For Modern Javascript Frameworks
A Deep Dive Into SEO Tactics For Modern Javascript Frameworks
 
Automated Duplicate Content Consolidation with Google Cloud Functions
Automated Duplicate Content Consolidation with Google Cloud FunctionsAutomated Duplicate Content Consolidation with Google Cloud Functions
Automated Duplicate Content Consolidation with Google Cloud Functions
 
Quality Content at Scale Through Automated Text Summarization of UGC
Quality Content at Scale Through Automated Text Summarization of UGCQuality Content at Scale Through Automated Text Summarization of UGC
Quality Content at Scale Through Automated Text Summarization of UGC
 
SEO Meets Automation
SEO Meets AutomationSEO Meets Automation
SEO Meets Automation
 
Automating Google Lighthouse
Automating Google LighthouseAutomating Google Lighthouse
Automating Google Lighthouse
 
The Python Cheat Sheet for the Busy Marketer
The Python Cheat Sheet for the Busy MarketerThe Python Cheat Sheet for the Busy Marketer
The Python Cheat Sheet for the Busy Marketer
 
Doing More with Less: Automated, High-Quality Content Generation
Doing More with Less: Automated, High-Quality Content GenerationDoing More with Less: Automated, High-Quality Content Generation
Doing More with Less: Automated, High-Quality Content Generation
 
How to scale SEO work NOBODY wants to do (including your competitors) to rapi...
How to scale SEO work NOBODY wants to do (including your competitors) to rapi...How to scale SEO work NOBODY wants to do (including your competitors) to rapi...
How to scale SEO work NOBODY wants to do (including your competitors) to rapi...
 
Agile SEO: Faster SEO Results
Agile SEO: Faster SEO ResultsAgile SEO: Faster SEO Results
Agile SEO: Faster SEO Results
 
Scaling Keyword Research to Find Content Gaps
Scaling Keyword Research to Find Content GapsScaling Keyword Research to Find Content Gaps
Scaling Keyword Research to Find Content Gaps
 
Query Classification on Steroids with BERT
Query Classification on Steroids with BERTQuery Classification on Steroids with BERT
Query Classification on Steroids with BERT
 
Solving Complex JavaScript Issues and Leveraging Semantic HTML5
Solving Complex JavaScript Issues and Leveraging Semantic HTML5Solving Complex JavaScript Issues and Leveraging Semantic HTML5
Solving Complex JavaScript Issues and Leveraging Semantic HTML5
 
Python for Data-driven Storytelling
Python for Data-driven StorytellingPython for Data-driven Storytelling
Python for Data-driven Storytelling
 
Scaling automated quality text generation for enterprise sites
Scaling automated quality text generation for enterprise sitesScaling automated quality text generation for enterprise sites
Scaling automated quality text generation for enterprise sites
 
The New Renaissance of JavaScript
The New Renaissance of JavaScriptThe New Renaissance of JavaScript
The New Renaissance of JavaScript
 
Data and Evidence-driven SEO
Data and Evidence-driven SEOData and Evidence-driven SEO
Data and Evidence-driven SEO
 
Python for SEO
Python for SEOPython for SEO
Python for SEO
 
Advanced Data-Driven SEO
Advanced Data-Driven SEOAdvanced Data-Driven SEO
Advanced Data-Driven SEO
 
Technical SEO "Overoptimization"
Technical SEO "Overoptimization"Technical SEO "Overoptimization"
Technical SEO "Overoptimization"
 
Why Pay for Performance When You Can Lead the World To Your Door for Free?
Why Pay for Performance When You Can Lead the World To Your Door for Free?Why Pay for Performance When You Can Lead the World To Your Door for Free?
Why Pay for Performance When You Can Lead the World To Your Door for Free?
 

Recently uploaded

Presentación comercial SARA ANDRADE - PRODUCTORA
Presentación comercial SARA ANDRADE - PRODUCTORAPresentación comercial SARA ANDRADE - PRODUCTORA
Presentación comercial SARA ANDRADE - PRODUCTORASARA ANDRADE - PRODUCTORA
 
PROYECTO FINAL NETFLIX. ESTRATEGIAS DE PROMOCIÓN
PROYECTO FINAL NETFLIX. ESTRATEGIAS DE PROMOCIÓNPROYECTO FINAL NETFLIX. ESTRATEGIAS DE PROMOCIÓN
PROYECTO FINAL NETFLIX. ESTRATEGIAS DE PROMOCIÓNp357106
 
Trabajo Final Brisia Yael Bencomo Martínez 314871.pdf
Trabajo Final Brisia Yael Bencomo Martínez 314871.pdfTrabajo Final Brisia Yael Bencomo Martínez 314871.pdf
Trabajo Final Brisia Yael Bencomo Martínez 314871.pdfp314871
 
8 EL MERCADO CENTRAL DE BUENOS AIRES.pdf
8  EL MERCADO CENTRAL DE BUENOS AIRES.pdf8  EL MERCADO CENTRAL DE BUENOS AIRES.pdf
8 EL MERCADO CENTRAL DE BUENOS AIRES.pdfSARA BUENDIA RIOJA
 
Estrategias de promoción aplicado a Nintendo
Estrategias de promoción aplicado a NintendoEstrategias de promoción aplicado a Nintendo
Estrategias de promoción aplicado a Nintendofreddy236k
 
Agencia Marketing Branding Examen Google Perfil Negocio Febrero 2024
Agencia Marketing Branding Examen Google Perfil Negocio Febrero 2024Agencia Marketing Branding Examen Google Perfil Negocio Febrero 2024
Agencia Marketing Branding Examen Google Perfil Negocio Febrero 2024Marketing BRANDING
 
Deck__Primer-Marketo-User-Group-presencial-en-España.pdf
Deck__Primer-Marketo-User-Group-presencial-en-España.pdfDeck__Primer-Marketo-User-Group-presencial-en-España.pdf
Deck__Primer-Marketo-User-Group-presencial-en-España.pdfebaquedano1
 
Compendio final de promoción aplicado a Oishii.
Compendio final de promoción aplicado a Oishii.Compendio final de promoción aplicado a Oishii.
Compendio final de promoción aplicado a Oishii.gazarakun
 
Manual de empleados (Uno de los mejores beneficios de trabajar en McDonald's ...
Manual de empleados (Uno de los mejores beneficios de trabajar en McDonald's ...Manual de empleados (Uno de los mejores beneficios de trabajar en McDonald's ...
Manual de empleados (Uno de los mejores beneficios de trabajar en McDonald's ...rodriguezperezcarlos1
 
Suplemento Exibal Alimentos elaborados para el éxito
Suplemento Exibal Alimentos elaborados para el éxitoSuplemento Exibal Alimentos elaborados para el éxito
Suplemento Exibal Alimentos elaborados para el éxitoeluniversocom
 
TRABAJO FINAL OFFICE Depot Estrategia de promoción
TRABAJO FINAL OFFICE Depot Estrategia de promociónTRABAJO FINAL OFFICE Depot Estrategia de promoción
TRABAJO FINAL OFFICE Depot Estrategia de promociónerocrogo
 

Recently uploaded (11)

Presentación comercial SARA ANDRADE - PRODUCTORA
Presentación comercial SARA ANDRADE - PRODUCTORAPresentación comercial SARA ANDRADE - PRODUCTORA
Presentación comercial SARA ANDRADE - PRODUCTORA
 
PROYECTO FINAL NETFLIX. ESTRATEGIAS DE PROMOCIÓN
PROYECTO FINAL NETFLIX. ESTRATEGIAS DE PROMOCIÓNPROYECTO FINAL NETFLIX. ESTRATEGIAS DE PROMOCIÓN
PROYECTO FINAL NETFLIX. ESTRATEGIAS DE PROMOCIÓN
 
Trabajo Final Brisia Yael Bencomo Martínez 314871.pdf
Trabajo Final Brisia Yael Bencomo Martínez 314871.pdfTrabajo Final Brisia Yael Bencomo Martínez 314871.pdf
Trabajo Final Brisia Yael Bencomo Martínez 314871.pdf
 
8 EL MERCADO CENTRAL DE BUENOS AIRES.pdf
8  EL MERCADO CENTRAL DE BUENOS AIRES.pdf8  EL MERCADO CENTRAL DE BUENOS AIRES.pdf
8 EL MERCADO CENTRAL DE BUENOS AIRES.pdf
 
Estrategias de promoción aplicado a Nintendo
Estrategias de promoción aplicado a NintendoEstrategias de promoción aplicado a Nintendo
Estrategias de promoción aplicado a Nintendo
 
Agencia Marketing Branding Examen Google Perfil Negocio Febrero 2024
Agencia Marketing Branding Examen Google Perfil Negocio Febrero 2024Agencia Marketing Branding Examen Google Perfil Negocio Febrero 2024
Agencia Marketing Branding Examen Google Perfil Negocio Febrero 2024
 
Deck__Primer-Marketo-User-Group-presencial-en-España.pdf
Deck__Primer-Marketo-User-Group-presencial-en-España.pdfDeck__Primer-Marketo-User-Group-presencial-en-España.pdf
Deck__Primer-Marketo-User-Group-presencial-en-España.pdf
 
Compendio final de promoción aplicado a Oishii.
Compendio final de promoción aplicado a Oishii.Compendio final de promoción aplicado a Oishii.
Compendio final de promoción aplicado a Oishii.
 
Manual de empleados (Uno de los mejores beneficios de trabajar en McDonald's ...
Manual de empleados (Uno de los mejores beneficios de trabajar en McDonald's ...Manual de empleados (Uno de los mejores beneficios de trabajar en McDonald's ...
Manual de empleados (Uno de los mejores beneficios de trabajar en McDonald's ...
 
Suplemento Exibal Alimentos elaborados para el éxito
Suplemento Exibal Alimentos elaborados para el éxitoSuplemento Exibal Alimentos elaborados para el éxito
Suplemento Exibal Alimentos elaborados para el éxito
 
TRABAJO FINAL OFFICE Depot Estrategia de promoción
TRABAJO FINAL OFFICE Depot Estrategia de promociónTRABAJO FINAL OFFICE Depot Estrategia de promoción
TRABAJO FINAL OFFICE Depot Estrategia de promoción
 

Creando una Sección de FAQS y su Marcado de Datos Estructurados en 30 Minutos

  • 1. Creando una Sección de FAQS y su Marcado de Datos Estructurados en 30 Minutos Hamlet Batista @hamletbatista
  • 2. Traducción de Twitter Debería ser: “Una tarea de #SEO aburrida” @hamletbatista
  • 3. Traducción de Google Chrome Aldea Batista @hamletbatista
  • 4. Las Traducciones Automáticas 1. Ahorran mucho tiempo 2. Usan técnicas avanzadas de redes neuronales 3. Tienen muy buena calidad, pero necesitan trabajo de edición @hamletbatista
  • 5. Estas Tecnologías son Abiertas y Gratuitas 1. Google T5 https://bit.ly/3kPOcOH 2. Facebook BART https://bit.ly/2FUYXAB @hamletbatista
  • 6. Agenda Vamos a ver aplicaciones prácticas de generación de texto para SEO: 1. Preparación de entorno con Google Colab 2. Sacando texto para sumarizar y traducir 3. Usando sumarización con BART y T5 4. Haciendo traducciones con T5 5. Traduciendo con el API de Google Translate 6. Casos problemáticos en Español: Preguntas Frecuentes y Generación de Preguntas 7. Creación de marcado estructurado 8. Un poco de teoría de cómo todo esto funciona tan bien 9. Donde aprender más @hamletbatista
  • 7. Preparación de entorno con Google Colaboratory https://github.com/hamletbatista/seonderground @hamletbatista
  • 8. Preparación de entorno con Google Colaboratory https://bit.ly/334wKQy @hamletbatista
  • 9. Preparación de entorno con Google Colaboratory Entorno de Ejecución > Cambiar tipo de entorno de ejecución @hamletbatistahttps://bit.ly/36dl3sO
  • 10. Preparación de entorno con Google Colaboratory @hamletbatistahttps://bit.ly/36dl3sO
  • 11. Sacando texto para sumarizar y traducir @hamletbatista
  • 12. Sacando texto para sumarizar y traducir @hamletbatista
  • 13. Sacando texto para sumarizar y traducir @hamletbatista
  • 15. @hamletbatista Usando sumarización con BART resumen = sumarizador_bart(texto[:1024], min_length=50, max_length=250) Resumen[0]["summary_text"] Elaine Palacio, 18, apareció in edición especial de septiembre of Vogue Italia . Tiene contratos con marcas como Victoria’s Secret, Reebok y Burberry . “Vogue” escogió a famosas como Cindy Crawford, Bella Hadid y Emily Ratajk .
  • 17. Usando sumarización con T5 (base) sumarizador_t5 = pipeline("summarization", model="t5-base", tokenizer="t5-base") resumen = sumarizador_t5(texto, min_length=50, max_length=250) Resumen[0]["summary_text"] i'm black, I'm Afro Can't be more Honored to be part of this amazing story, thank you . #vogueitalia100 covers, 100 people, 100 stories, 1 Elaine . @hamletbatista
  • 19. Usando sumarización con T5 (large) sumarizador_t5 = pipeline("summarization", model="t5-large", tokenizer="t5- large") resumen = sumarizador_t5(texto, min_length=50, max_length=250) Resumen[0]["summary_text"] Elaine Palacio Mosquera, de 18 aos, es una modelo afro-colombiana que elegió en la edición especial de septiembre de la revista “Vogue” Italia. “Me reinita, te lo dije”, dijo Mara Flor Rentera a su nieta Elaine palacio en Divina! @hamletbatista
  • 21. Haciendo traducciones con T5 @hamletbatista
  • 22. Haciendo traducciones con T5 de Español a Portugués @hamletbatista
  • 23. Haciendo traducciones con T5 de Español a Portuges es_to_pt_traducción = pipeline("translation_en_to_de", model="mrm8488/t5- small-finetuned-translation-es-to-pt", tokenizer="mrm8488/t5-small-finetuned-translation-es-to-pt") '' a modelo de 18 anos especial da revista '' '' . têm contratos com marcas como a Victoria’s Secret , reebok e a burberry . '' '' eu ainda , '' eu ainda , eu aconteceu em vogueitalia . '' @hamletbatista
  • 24. Haciendo traducciones con T5 de Español a Portuges @hamletbatista
  • 25. Como Traducir a más Lenguajes (Difícil) 1. Buscar o generar datos de los idiomas a traducir 2. Entrenar un tokenizador para crear un vocabulario 3. Entrenar un lenguaje modelo que use el vocabulario https://bit.ly/2Gj8QaP @hamletbatista
  • 26. Como Traducir Usando la API de Google Translate (Fácil) @hamletbatista
  • 27. Como Traducir Usando la API de Google Translate (Fácil) from googletrans import Translator translator = Translator() result = translator.translate(texto) The 18-year-old Colombian model appeared in the special September issue of “Vogue” Italia magazine. He has contracts with brands such as Victoria’s Secret, Reebok and Burberry. @hamletbatista
  • 28. Casos Problemáticos: Generación de Preguntas Frecuentes https://bit.ly/3czrCH2 @hamletbatista
  • 29. Casos Problemáticos: Generación de Preguntas Frecuentes https://bit.ly/3czrCH2 @hamletbatista
  • 30. Casos Problemáticos: Generación de Preguntas Frequentes [{'answer': 'Ministerio P ⁇ blico', 'question': 'Who said “Vamos con todo y por todos”?'}, {'answer': '7:00', 'question': 'At what time of day do the dominicans go to visit the plazas?'}, {'answer': 'Las declaraciones juradas', 'question': 'What is en la palestra p ⁇ blica luego de que los monxadtos que tienen registrados alarm'}, {'answer': 'Ministerio P ⁇ blico dice nadie está exento de juicio por corrupción Si los fantasmas', 'question': 'What does the Ministerio P ⁇ blico say?'}] @hamletbatista
  • 32. Casos Problemáticos: Generación de Preguntas Frequentes Solución más sencilla: 1. Traducir el texto al Inglés 2. Generar la preguntas y respuestas en Inglés 3. Traducir la generación al Español https://bit.ly/3czrCH2 @hamletbatista
  • 33. Casos Problemáticos: Generación de Preguntas Frecuentes @hamletbatista
  • 34. Casos Problemáticos: Generación de Preguntas Frequentes faqs_traducidas = list() for faq in faqs: pregunta = translator.translate(faq["question"], dest="es") respuesta = translator.translate(faq["answer"], dest="es") faqs_traducidas.append({"pregunta": pregunta.text, "respuesta": respuesta.text}) @hamletbatista
  • 35. Casos Problemáticos: Generación de Preguntas Frecuentes @hamletbatista
  • 37. Creando el Marcado Estructurado @hamletbatista
  • 38. Creando el Marcado Estructurado @hamletbatista
  • 39. Creando el Marcado Estructurado @hamletbatista
  • 40. Creando el Marcado Estructurado @hamletbatista
  • 41. Un Poco de Teoría de Cómo Todo esto Funciona tan bien ¿Ha realizado pruebas de aptitud o coeficiente intelectual en las que se le presenta una secuencia de números y necesita adivinar el siguiente? 1. Los tokenizadores neurales primero convierten el texto en números (vectores) 2. El modelo toma la secuencia de números y predice el siguiente que hace más lógica 3. El proceso sigue de forma iterativa hasta que se genera el tamaño de secuencia indicada 4. Los tokenizadores convierten los números a texto @hamletbatista
  • 42. Un Poco de Teoría de Cómo Todo esto Funciona tan bien Como se trata de un concepto muy abstracto, utilizaré una analogía del GPS para explicarlo en términos simples. Puede buscar una empresa por su nombre en el mundo físico o por su dirección o coordenadas GPS. Cuando busca una empresa por su nombre, es como cuando Bing y Google buscan las páginas de contenido por las palabras clave escritas. Pero con los números/vetores podemos hacer una búsqueda mas precisa usando coordenadas. @hamletbatista
  • 43. @hamletbatista Donde Aprender más 1. https://www.searchenginejournal.com/natural-language-generation-changes- seo/371739/ 2. https://www.searchenginejournal.com/generate-quality-faqs-faqpage-schemas- with-python/380004/ 3. https://blogs.bing.com/webmaster/july-2020/How-to-Optimize-Your-Content- for-Search-Questions-using-Deep-Learning 4. https://www.youtube.com/watch?v=oY1HIMvzXCM 5. https://www.slideshare.net/hamletbatista/the-python-cheat-sheet-for-the- busy-marketer
  • 44. Automatización de SEO con RankSense www.ranksense.com www.cloudflare.com /apps/ranksense @hamletbatista