Sin magia o secretos, Hamlet Batista, fundador y CEO de RankSense nos estará mostrando en tiempo real como realizar un correcto marcado de datos estructurados en FAQ, lo cual te permitirá mejorar tu visibilidad de cara a las intenciones de búsqueda de los usuarios en los buscadores.
4. Las Traducciones Automáticas
1. Ahorran mucho tiempo
2. Usan técnicas avanzadas de redes neuronales
3. Tienen muy buena calidad, pero necesitan
trabajo de edición
@hamletbatista
5. Estas Tecnologías son Abiertas y Gratuitas
1. Google T5 https://bit.ly/3kPOcOH
2. Facebook BART https://bit.ly/2FUYXAB
@hamletbatista
6. Agenda
Vamos a ver aplicaciones prácticas de generación de texto para SEO:
1. Preparación de entorno con Google Colab
2. Sacando texto para sumarizar y traducir
3. Usando sumarización con BART y T5
4. Haciendo traducciones con T5
5. Traduciendo con el API de Google Translate
6. Casos problemáticos en Español: Preguntas Frecuentes y Generación
de Preguntas
7. Creación de marcado estructurado
8. Un poco de teoría de cómo todo esto funciona tan bien
9. Donde aprender más @hamletbatista
7. Preparación de entorno con Google Colaboratory
https://github.com/hamletbatista/seonderground
@hamletbatista
15. @hamletbatista
Usando sumarización con BART
resumen = sumarizador_bart(texto[:1024], min_length=50, max_length=250)
Resumen[0]["summary_text"]
Elaine Palacio, 18, apareció in edición especial de septiembre of Vogue Italia .
Tiene contratos con marcas como Victoria’s Secret, Reebok y Burberry .
“Vogue” escogió a famosas como Cindy Crawford, Bella Hadid y Emily Ratajk .
17. Usando sumarización con T5 (base)
sumarizador_t5 = pipeline("summarization", model="t5-base",
tokenizer="t5-base")
resumen = sumarizador_t5(texto, min_length=50, max_length=250)
Resumen[0]["summary_text"]
i'm black, I'm Afro Can't be more Honored to be part of this amazing story,
thank you . #vogueitalia100 covers, 100 people, 100 stories, 1 Elaine .
@hamletbatista
19. Usando sumarización con T5 (large)
sumarizador_t5 = pipeline("summarization", model="t5-large", tokenizer="t5-
large")
resumen = sumarizador_t5(texto, min_length=50, max_length=250)
Resumen[0]["summary_text"]
Elaine Palacio Mosquera, de 18 aos, es una modelo afro-colombiana que
elegió en la edición especial de septiembre de la revista “Vogue” Italia. “Me
reinita, te lo dije”, dijo Mara Flor Rentera a su nieta Elaine palacio en Divina!
@hamletbatista
23. Haciendo traducciones con T5 de Español a
Portuges
es_to_pt_traducción = pipeline("translation_en_to_de", model="mrm8488/t5-
small-finetuned-translation-es-to-pt",
tokenizer="mrm8488/t5-small-finetuned-translation-es-to-pt")
'' a modelo de 18 anos especial da revista '' '' . têm contratos com
marcas como a Victoria’s Secret , reebok e a burberry . '' '' eu ainda ,
'' eu ainda , eu aconteceu em vogueitalia . ''
@hamletbatista
25. Como Traducir a más Lenguajes (Difícil)
1. Buscar o generar datos de los
idiomas a traducir
2. Entrenar un tokenizador para crear
un vocabulario
3. Entrenar un lenguaje modelo que
use el vocabulario
https://bit.ly/2Gj8QaP
@hamletbatista
27. Como Traducir Usando la API de Google
Translate (Fácil)
from googletrans import Translator
translator = Translator()
result = translator.translate(texto)
The 18-year-old Colombian model appeared in the special
September issue of “Vogue” Italia magazine. He has contracts with
brands such as Victoria’s Secret, Reebok and Burberry.
@hamletbatista
30. Casos Problemáticos: Generación de Preguntas
Frequentes
[{'answer': 'Ministerio P ⁇ blico',
'question': 'Who said “Vamos con todo y por todos”?'},
{'answer': '7:00',
'question': 'At what time of day do the dominicans go to visit the
plazas?'},
{'answer': 'Las declaraciones juradas',
'question': 'What is en la palestra p ⁇ blica luego de que los
monxadtos que tienen registrados alarm'},
{'answer': 'Ministerio P ⁇ blico dice nadie está exento de juicio por
corrupción Si los fantasmas',
'question': 'What does the Ministerio P ⁇ blico say?'}]
@hamletbatista
32. Casos Problemáticos: Generación de Preguntas
Frequentes
Solución más sencilla:
1. Traducir el texto al Inglés
2. Generar la preguntas y respuestas en Inglés
3. Traducir la generación al Español
https://bit.ly/3czrCH2
@hamletbatista
41. Un Poco de Teoría de Cómo Todo esto
Funciona tan bien
¿Ha realizado pruebas de aptitud o coeficiente
intelectual en las que se le presenta una
secuencia de números y necesita adivinar el
siguiente?
1. Los tokenizadores neurales primero
convierten el texto en números (vectores)
2. El modelo toma la secuencia de números y
predice el siguiente que hace más lógica
3. El proceso sigue de forma iterativa hasta
que se genera el tamaño de secuencia
indicada
4. Los tokenizadores convierten los números a
texto
@hamletbatista
42. Un Poco de Teoría de Cómo Todo esto
Funciona tan bien
Como se trata de un concepto muy abstracto,
utilizaré una analogía del GPS para explicarlo en
términos simples.
Puede buscar una empresa por su nombre en el
mundo físico o por su dirección o coordenadas
GPS.
Cuando busca una empresa por su nombre, es
como cuando Bing y Google buscan las páginas
de contenido por las palabras clave escritas.
Pero con los números/vetores podemos hacer
una búsqueda mas precisa usando coordenadas.
@hamletbatista
43. @hamletbatista
Donde Aprender más
1. https://www.searchenginejournal.com/natural-language-generation-changes-
seo/371739/
2. https://www.searchenginejournal.com/generate-quality-faqs-faqpage-schemas-
with-python/380004/
3. https://blogs.bing.com/webmaster/july-2020/How-to-Optimize-Your-Content-
for-Search-Questions-using-Deep-Learning
4. https://www.youtube.com/watch?v=oY1HIMvzXCM
5. https://www.slideshare.net/hamletbatista/the-python-cheat-sheet-for-the-
busy-marketer
44. Automatización de SEO con RankSense
www.ranksense.com
www.cloudflare.com
/apps/ranksense
@hamletbatista