2. スケジュール
5/13, 14
Workshop → 9個くらい並列
W4A(Web for All) (テーマはPersonalisation(Security, Accessibility))
BIG ビッグデータ系の招待講演
5/15〜17
Keynote
ResearchTrack → 5個くらい並列
W3C
Web of Health 健康・医療分野の発表
The Future of the Open Web
Poster & Demo
The Web Conference(旧WWW) 2019: 5/13〜17
3. ResearchTrack
● Crowdsourcing and Human Computation
● Economics, Monetization, and Online Markets
● Health on the Web
● Intelligent Systems and Infrastructure
● Search
● Security, Privacy, and Trust
● Semantics and Knowledge
● Social Network Analysis and Graph Algorithms
● User Modeling, Personalization, and Experience
● Web and Society
● Web Mining and Content Analysis
● Web of Things, Ubiquitous, and Mobile Computing
7. 紹介する研究
5/13, 14
Workshop
W4A(Web for All)
BIG ビッグデータ系
5/15〜17
Keynote
ResearchTrack
W3C
Web of Health 健康・医療分野
The Future of the Open Web
Poster & Demo
ここから
5つの研究を紹介
8. ❏ BIG
・検索ランキング
“Machine Learning-Powered Search Ranking of Airbnb Experiences.”
❏ [Personalization] In ResearchTrack
・ユーザ側・アイテム側両方の情報を使った推薦
“Dual Neural Personalized Ranking”
・環境の変化に対応したバンディット
“Dynamic Ensemble of Contextual Bandits to Satisfy Users' Changing Interests”
❏ W4A
・旅行先の推薦
“Location Embeddings for Next Trip Recommendation.”
・Webページの画像の代替テキストの評価
“Combining Semantic Tools for Automatic Evaluation of Alternative Texts”
紹介する研究
9. ❏ BIG
・検索ランキング
“Machine Learning-Powered Search Ranking of Airbnb Experiences.”
❏ [Personalization] In ResearchTrack
・ユーザ側・アイテム側両方の情報を使った推薦
“Dual Neural Personalized Ranking”
・環境の変化に対応したバンディット
“Dynamic Ensemble of Contextual Bandits to Satisfy Users' Changing Interests”
❏ W4A
・旅行先の推薦
“Location Embeddings for Next Trip Recommendation.”
・Webページの画像の代替テキストの評価
“Combining Semantic Tools for Automatic Evaluation of Alternative Texts”
紹介する研究
75. ❏ BIG
・検索ランキング
“Machine Learning-Powered Search Ranking of Airbnb Experiences.”
❏ [Personalization] In ResearchTrack
・ユーザ側・アイテム側両方の情報を使った推薦
“Dual Neural Personalized Ranking”
・環境の変化に対応したバンディット
“Dynamic Ensemble of Contextual Bandits to Satisfy Users' Changing Interests”
❏ W4A
・旅行先の推薦
“Location Embeddings for Next Trip Recommendation.”
・Webページの画像の代替テキストの評価
“Combining Semantic Tools for Automatic Evaluation of Alternative Texts”
紹介する研究
76. 自動的にWebページのアクセシビリティを評価することは重要
Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
すぐに結果がわかるし、コスト削減もできて、ページの一貫性を保つことができる
が、
コンテンツのセマンティックスは解釈できないので、その妥当性までは確認できない。
(例えば、画像のalt属性があってるかどうか)
研究の背景について
77. Simply Accessible 2015 reportによると
Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
● 66.36% → 有益な画像だが代替テキストがない
● 20.33% → 代替テキストが役立たず
● 10.35% → 代替テキスト付きの飾り付け画像
● 2.96% → 代替テキストが他のコンテンツの使い回し
Webページ中の画像と代替テキストにありがちな問題点
78. Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
● 情報伝達
→ 代替テキストはその内容を記述するべき
● 飾り付け画像
→ 情報はない。null。だから代替テキストもいらない。
● 機能画像(ナビゲーション的な??)
→ 代替テキストはその行動を記述するべき(「詳細ページへ」的な??)
Webページ中の画像の目的とは
代替テキストは、125文字未満の簡易な文言にすべし
Webページの文脈を考慮して情報欠損しないように
"image of"とか"graphic of"とか付けるな
79. Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
画像と代替テキストの対応が大事で、
画像に対して代替テキストの質がどの程度のものか評価できるシステムが
あれば嬉しい
(目的が「情報伝達」である画像に限るが、、)
提案する内容
80. Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
以下のような点について調べるアルゴリズムを提案
・画像と代替テキストの概念やドメインの関係
・画像のメタデータと代替テキストの関係
・記述の長さ
提案する内容
具体的には、
画像から概念を抽出し、代替テキストとの類似度を計算する。
抽出した概念からドメイン(人物画像ならPerson)を判定して、代替テキストとの類似度計算
81. Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
提案する内容
使ったツール
・Clarifai: 画像の概念とドメイン抽出
・Swoogle: 概念と代替テキストのセマンティックな関連性
・spaCy: 代替テキストから固有表現
・Sematch: 固有表現と画像の概念を結びつける
82. Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
提案する内容
・画像と代替テキストの概念やドメインの関係
CONCEPTS
portrait
one
people
adult
politician
woman
face
business
festival
leader
代替テキスト
Theresa May delivers a
major speech on Brexit today
概念の抽出 画像の概念と代替テキスト
の類似度を計算Clarifai
Swoogle
83. Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
提案する内容
・画像と代替テキストの概念やドメインの関係
CONCEPTS
portrait
one
people
adult
politician
woman
face
business
festival
leader
代替テキスト
Theresa May delivers a
major speech on Brexit today
画像から抽出した概念
画像の概念と代替テキストのドメイン
との類似度を計算
ドメイン
Person
84. Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
提案する内容
・画像と代替テキストの概念やドメインの関係
CONCEPTS
portrait
one
people
adult
politician
woman
face
business
festival
leader
代替テキスト
Theresa May delivers a
major speech on Brexit today
画像から抽出した概念
画像の概念と代替テキストのドメイン
との類似度を計算
ドメイン
Person
spaCy
固有表現の抽出
85. Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
実験
訓練データ:収集した画像と代替テキスト45個
(代替テキストの質を “very bad”, “bad”, “good”, “very good”の4段階に分類)
テストデータ:149個の画像と代替テキスト
→ badとgoodの二値分類したときの精度評価
86. Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
実験
Accuracy: 0.832
Precision: 0.853
Recall: 0.795
F-measure: 0.823
なかなかいい
→ 提案したアルゴリズムで自動的に代替テキストの評価ができそう
87. Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
実験
できていない点
・使ったセマンティックサービスの性能に依存する
・英語のみ対応
・ページの文脈は使っていない
・画像の目的が情報伝達かそれ以外かは考慮していない
参考ページ
マッシュアップなのでわかりやすいw