SlideShare a Scribd company logo
1 of 29
Download to read offline
Recomendação de conteúdo
com Apache Mahout
Quem somos nós?
Estudo de Caso
Configuração editorial
Exibição genérica
Coleta de feedback
Estamos recomendando
algo de interesse do
usuário?
Por que recomendar algo
para alguém?
Ajudar
Facilitar
Induzir
Com base em
quais critérios?
Quando há informações
Quando não há informações
Feedback
Impactos
UX
Positivos
Fidelização
Negativos
Efeito bolha
How it works
Processamento
distribuído
Open source
Apache Hadoop
Objetivo de criar aplicações
de ML rapidamente
Apache Mahout
Benefícios do Mahout
Aplicação
simples e ágil
Compatível com o hadoop para
processamento distribuído
Algorítimos de ML
Parece complexo…
➔ Reg. Acesso
➔ Recomendação
GCE
GAE
Integração GCE / GAE
BD Storage
Run
Sync
Mahout
Hadoop
21
1
Processar a
Recomendação
2
695156844314820 733886336030387 1 1461380400
1857712592933254 1659840805718841 1 1457751600
459836780240009 738977595379058 1 1460084400
715051021259018 1597532753452474 1 1457665200
2129884632821879 1726026021769732 5 1458961200
2211950224976468 2049611670763120 1 1458529200
2262258856060242 127962519162750 1 1457406000
2547022900948044 1719916616890884 1 1459738800
1351232552007122 439772798224598 1 1462071600
2320345584423341 2910045585351627 1 1460689200
1336788031028127 2102694821459710 1 1458442800
USER ID CONTENT ID RATE TIMESTAMP
Filtragem Colaborativa
hadoop jar /opt/mahout-distribution-0.9
/mahout-core-0.9-job.jar org.apache.mahout.
cf.taste.hadoop.item.RecommenderJob -s
SIMILARITY_COOCCURRENCE --input dados.csv
--output output
Métricas...
3MILHÕES
de acessos
Acessos
desproporcionais
Acessos
1314126830928733
695156844314820 733886336030387 1 1461380400
1857712592933254 1659840805718841 1 1457751600
459836780240009 738977595379058 1 1460084400
715051021259018 1597532753452474 1 1457665200
2129884632821879 1726026021769732 5 1458961200
2211950224976468 2049611670763120 1 1458529200
2262258856060242 127962519162750 1 1457406000
2547022900948044 1719916616890884 1 1459738800
1351232552007122 439772798224598 1 1462071600
2320345584423341 2910045585351627 1 1460689200
1336788031028127 2102694821459710 1 1458442800
USER ID CONTENT ID RATE TIMESTAMP
Próximos passos...
João Vitor Vendrame
joao.vendrame@dextra-sw.com
Danilo Pinheiro
danilo.pinheiro@dextra-sw.com
https://github.com/jvgengo/devcamp_apache_mahout

More Related Content

Similar to Oficial - Recomendação de Conteúdo com Apache Mahout - Remastered

Google Analytics para Blogs
Google Analytics para BlogsGoogle Analytics para Blogs
Google Analytics para BlogsHelena Sordili
 
Reformulação do Website da TcheCotrijuí
Reformulação do Website da TcheCotrijuíReformulação do Website da TcheCotrijuí
Reformulação do Website da TcheCotrijuíguest08c9fd6
 
Mapeamento dos Processos - Gestão - Curso online
Mapeamento dos Processos - Gestão - Curso onlineMapeamento dos Processos - Gestão - Curso online
Mapeamento dos Processos - Gestão - Curso onlineGAC CURSOS ONLINE
 
Web Analytics para Desenvolvedores - TDC 2011
Web Analytics para Desenvolvedores - TDC 2011Web Analytics para Desenvolvedores - TDC 2011
Web Analytics para Desenvolvedores - TDC 2011dp6
 
Estudo do Mercado de Web Analytics no Brasil - 2009 - WA Consulting
Estudo do Mercado de Web Analytics no Brasil - 2009 - WA ConsultingEstudo do Mercado de Web Analytics no Brasil - 2009 - WA Consulting
Estudo do Mercado de Web Analytics no Brasil - 2009 - WA ConsultingMarcelo Azeredo
 
Tableau Drive, Uma nova metodologia para implantações corporativas
Tableau Drive, Uma nova metodologia para implantações corporativasTableau Drive, Uma nova metodologia para implantações corporativas
Tableau Drive, Uma nova metodologia para implantações corporativasTableau Software
 

Similar to Oficial - Recomendação de Conteúdo com Apache Mahout - Remastered (9)

Google Analytics para Blogs
Google Analytics para BlogsGoogle Analytics para Blogs
Google Analytics para Blogs
 
Reformulação do Website da TcheCotrijuí
Reformulação do Website da TcheCotrijuíReformulação do Website da TcheCotrijuí
Reformulação do Website da TcheCotrijuí
 
Workshop de SEO
Workshop de SEOWorkshop de SEO
Workshop de SEO
 
Mapeamento dos Processos - Gestão - Curso online
Mapeamento dos Processos - Gestão - Curso onlineMapeamento dos Processos - Gestão - Curso online
Mapeamento dos Processos - Gestão - Curso online
 
Seo e HTML5
Seo e HTML5Seo e HTML5
Seo e HTML5
 
Web Analytics para Desenvolvedores - TDC 2011
Web Analytics para Desenvolvedores - TDC 2011Web Analytics para Desenvolvedores - TDC 2011
Web Analytics para Desenvolvedores - TDC 2011
 
Estudo do Mercado de Web Analytics no Brasil - 2009 - WA Consulting
Estudo do Mercado de Web Analytics no Brasil - 2009 - WA ConsultingEstudo do Mercado de Web Analytics no Brasil - 2009 - WA Consulting
Estudo do Mercado de Web Analytics no Brasil - 2009 - WA Consulting
 
Tableau Drive, Uma nova metodologia para implantações corporativas
Tableau Drive, Uma nova metodologia para implantações corporativasTableau Drive, Uma nova metodologia para implantações corporativas
Tableau Drive, Uma nova metodologia para implantações corporativas
 
Google BigQuery
Google BigQueryGoogle BigQuery
Google BigQuery
 

More from danilopinheirosan

More from danilopinheirosan (6)

Palestra UX Etec - 22_04
Palestra UX Etec - 22_04Palestra UX Etec - 22_04
Palestra UX Etec - 22_04
 
Eu penso, tu pensas, ele pensa
Eu penso, tu pensas, ele pensaEu penso, tu pensas, ele pensa
Eu penso, tu pensas, ele pensa
 
mgm_moving_motivators
mgm_moving_motivatorsmgm_moving_motivators
mgm_moving_motivators
 
Feedback Canvas
Feedback CanvasFeedback Canvas
Feedback Canvas
 
Learning3.0
Learning3.0Learning3.0
Learning3.0
 
TEDex - Eu procrastino, Nós procrastinamos
TEDex - Eu procrastino, Nós procrastinamosTEDex - Eu procrastino, Nós procrastinamos
TEDex - Eu procrastino, Nós procrastinamos
 

Oficial - Recomendação de Conteúdo com Apache Mahout - Remastered