Recommender system introduction

Recommender System
Introduction
xiangliang@hulu.com

What is good recommender
system?

Outline
• What is recommender system?
– Mission
– History
– Problems
• What is good recommender system?
– Experiment Methods
– Evaluation Metric

How to solve information overload
• Catalog
– Yahoo, DMOZ

• Search Engine
– Google, Bing

Mission
• Help user find item of their interest.
• Help item provider deliver their item to
right user.
• Help website improve user engagement.

Search Engine vs. Recommender
System
• User will try search engine if
– they have specific needs
– they can use keywords to describe needs
• User will try recommender system if
– they do not know what they want now
– they can not use keywords to describe needs

History: Before 1992
• Content Filtering
– An architecture for large scale information
systems [1985] (Gifford, D.K)
– MAFIA: An active mail-filter agent for an
intelligent document processing support [1990]
(Lutz, E.)
– A rule-based message filtering system [1988]
(Pollock, S. )

History: 1992-1998
• Tapestry by Xerox Palo Alto [1992]
– First system designed by collaborative filtering
• Grouplens [1994]
– First recommender system using rating data
• Movielens [1997]
– First movie recommender system
– Provide well-known dataset for researchers

History: 1992-1998
• Fab : content-based collaborative
recommendation
– First unified recommender system
• Empirical Analysis of Predictive Algorithms
for Collaborative Filtering [1998] (John S.
Breese)
– Systematically evaluate user-based
collaborative filtering

History: 1999-2005
• Amazon proposed item-based collaborative
filtering (Patent is filed in 1998 and issued
in 2001) [link]
• Thomas Hofmann proposed pLSA [1999]
and apply similar method on collaborative
filtering [2004]
• Pandora began music genome project
[2000]

History: 1999-2005
• Lastfm using Audioscrobbler to generate
user taste profile on musics.
• Evaluating collaborative filtering
recommender systems [2004] (Jonathan L.
Herlocker)

History: 2005-2009
• Toward the Next Generation of
Recommender Systems: A Survey of the
State-of-the-Art and Possible Extensions.
[2005] (Alexander Tuzhilin)
• Netflix Prize [link]
– Latent Factor Model (SVD, RSVD, NSVD, SVD++)
– Temporal Dynamic Collaborative Filtering
– Yehuda Koren [link]’s team get prize

History: 2005-2009
• ACM Conference on Recommender System
[2007] (Minneapolis, Minnesota, USA)
• Digg, Youtube try recommender system.

History: 2010-now
• Context-Aware Recommender Systems
• Music Recommendation and Discovery
• Recommender Systems and the Social Web
• Information Heterogeneity and Fusion in
Recommender Systems
• Human Decision Making in Recommender Systems
• Personalization in Mobile Applications
• Novelty and Diversity in Recommender Systems
• User-Centric Evaluation

History: 2010-now
• Facebook launches instant personalization
[2010]
– Clicker
– Bing
– Trip Advisor
– Rotten Tomatoes
– Pandora
– ……

Problems
• Main Problems
– Top-N Recommendation
– Rating Prediction

Problems
• Top-N Recommendation
– Input
user item
A a
B a
B b
… …

– Output

Problems
• Top-N Recommendation
– Input
user item rating
A a
B a
B b
… … …

– Output

Experiment Methods
• Offline Experiment
• User Survey
• Online Experiment
– AB Testing

Experiment Methods
• Offline Experiment

DataSet

Train Test

• Advantage:
• Only rely on dataset
•
• Disadvantage:
• Offline metric can not reflect business goal

Experiment Methods
• User Survey
– Advantage:
• Can get subjective metrics
• Lower risk than online testing
– Disadvantage:
• Higher cost than offline experiments
• Some results may not have statistical significance
• Users may have different behaviors under testing
environment or real environment
• It’s difficult to design double blink experiments.

Experiment Methods
• On line experiments (AB Testing)
– Advantage:
• Can get metrics related to business goal
– Disadvantage:
• High risk/cost
• Need large user set to get statistical significant result

Experiment Metrics
• User Satisfaction
• Prediction Accuracy
• Coverage
• Diversity
• Novelty
• Serendipity
• Trust
• Robust
• Real-time

Experiment Metrics
• User Satisfaction
– Subjective metric
– Measured by user survey or online experiments

Experiment Metrics
• Prediction Accuracy
– Measured by offline experiments
– Top-N Recommendation
• Precision / Recall

– Rating Prediction
• MAE, RMSE

Experiment Metrics
• Coverage
– Measure the ability of recommender system to
recommend long-tail items.

| R (u , N ) |
u U
Coverage
|I|

– Entropy, Gini Index

Experiment Metrics
• Diversity
cover users’ different interests.
– Different similarity metric generate different
diversity metric.

Experiment Metrics
• Diversity (Example)

Watch History Related Items

Experiment Metrics
• Novelty
introduce long tail items to users.
– International Workshop on Novelty and
Diversity in Recommender Systems [link]
– Music Recommendation and Discovery in the
Long Tail [Oscar Celma]

Experiment Metrics
• Serendipity
– A recommendation result is serendipity if:
• it’s not related with user’s historical interest
• it’s novelty to user
• user will find it’s interesting after user view it

Experiment Metrics
• Trust
– If user trust recommender system, they will
interact with it.
– Ways to improve trust:
• Transparency
• Social
• Trust System (Epinion)

Experiment Metrics
• Robust
– The ability of recommender system to prevent
attack.
– Neil Hurley. Tutorial on Robustness of
Recommender System. ACM RecSys 2011.

Experiment Metrics
• Real-time
– Generate new recommendations when user
have new behaviors immediately.

Too many metric!
Which is most important?

How to do trade-off
• Business goal
• Our belief
• Making new algorithms by 3 steps
experiments:
– Offline testing
– User survey
– Online testing

Recommender system introduction

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (13)

Similar to Recommender system introduction

Similar to Recommender system introduction (20)

More from Liang Xiang

More from Liang Xiang (6)

Recently uploaded

Recently uploaded (20)

Recommender system introduction