SlideShare a Scribd company logo
1 of 14
1 日本情報通信株式会社
廣川 陣
1年目がWatsonを調べてみた!
~Discovery編~
1
Speaker
2
日本情報通信株式会社
ソリューションビジネス本部 ソフトウェアテクニカルセールス部
先進テクノロジーグループ
廣川 陣(Jin Hirokawa)
入社1年目
チームの戦力になるために日々奮闘中
出身地:大田区
Discoveryの概要
3
大量のデータを検索するとともに、データからパターン
や傾向を読み取り、適切な意思決定を支援します。
いろいろな形式の文書を解釈して良い感じに情報を付加
してくれるから、検索精度を上げてくれるし洞察も与え
てくれる素敵な検索エンジン
Discoveryの主機能
4
• 文書取込機能:HTML/PDF/WORD/JSONに対応
• エンリッチ機能:取り込んだ文書に対してタグ付けを行う
• ストレージ機能:データをクラウド上に保存する
• 検索機能:タグ付けした情報を含め、類似度スコア付きのデータ検索が可能
Discovery主機能(Crawler)
5
文書取込方法
・管理UI
Drag&Dropで取込可能
・API
API経由でファイルアップロード可能
・クローラ
javaベースのクローラがあり、自動文書取込が可能
Document Conversionと同等の機能を持った文書取込機能
管理UI
HTML/PDF/WORD/JSONに対応
TEXT/HTML/DBデータなどに対応
Discovery主機能(Enrich)
6
・概念(Concepts)
・エンティティ(Entities)
・キーワード(Keywords)
・カテゴリー(Categories)
・評判(Sentiment)
・感情(Emotion)
・関係(Relations)
・意味役割(Semantic Roles)
・その他(Metadata)
NLUを呼出し、その結果をメタ情報の一つとして登録
エンリッチ(抽出する単語の意味)を指定
・現在は英語とスペイン語が対応
・認識できるエンティティとカテ
ゴリーは事前に定義された項目
・Watson Knowledge Studioと
組み合わせる事でエンリッチし
たいフィールドを自由にカスタマ
イズする事が可能
※EntityとRelationのみ日本語可
NLUによる追加可能情報
Discovery主機能(Query)
7
• Discovery Query Language
エンリッチされたカラムに対して検索可能
• 自然文検索 (Natural Language Query)
従来のキーワードによる検索及び自然文での検索が可能
• 関連性学習 (Relevancy Training)
質問と回答候補の関連性を学習させることにより、最適なランキングモ
デルに育てる事が可能(自然文検索のみ)
エンリッチ機能で付加された情報を含めてデータ検索が可能
Top10やsumなどの集約関数
対象文書を絞り込む
Visual Query Builder
8
UIツールで検索方法を指定
Discovery Query Language
9
エンリッチ機能で抽出したカラムに対して検索
DQL
自然文検索
10
自然文検索に対してスコア付きで回答する
関連性学習
11
トレーニング画面
自然文検索の回答に対して適・不適を選択
所定の品質になるとトレーニング可能になる
Discovery News
12
• データの登録が必要なく、すぐに活用可能
• 10万のニュースソースから毎日約 30万件の記事とブロ
グを追加して常に更新され、過去60日間の履歴を保持
• NLUによるエンリッチ済のデータセットが用意されてい
る
Retrieve and Rankとの違い
13
• NLU、WKSの機能が利用可能なので、抽出したカラムに対して検索す
る事ができる
• 文書の形式変更や初期設定が不要
• UI画面がついた
• API経由で検索をかける際にPOSTではなくGETを使うため文字制限があ
る※
• 辞書登録ができないため、専門的な用語がとれない※
• 全文検索のためシステムによって付与される情報も検索対象となる※
※私が確認した限りでは
まとめ
14
• 1年目のWatson初心者でも簡単に使えるUI
• Retrieve and Rankの機能を持ち合わせてい
るが制約がある。
• エンリッチされた情報を使えるので、通常の検索エンジ
ンと⽐較して⾼度な検索が可能

More Related Content

What's hot

リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みRecruit Technologies
 
「ユーザーを理解するって言うほどカンタンじゃないよね」 UXデザイン・UXリサーチをもう一度ちゃんと理解しよう!
「ユーザーを理解するって言うほどカンタンじゃないよね」 UXデザイン・UXリサーチをもう一度ちゃんと理解しよう!「ユーザーを理解するって言うほどカンタンじゃないよね」 UXデザイン・UXリサーチをもう一度ちゃんと理解しよう!
「ユーザーを理解するって言うほどカンタンじゃないよね」 UXデザイン・UXリサーチをもう一度ちゃんと理解しよう!Yoshiki Hayama
 
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイントリクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイントRecruit Technologies
 
トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本
トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本
トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本Hajime Fujita
 
ビズリーチの機械学習基盤
ビズリーチの機械学習基盤ビズリーチの機械学習基盤
ビズリーチの機械学習基盤Naoto Migita
 
ユーザーエクスペリエンスは計測可能なのか? 〜UX計測に関する論文レビュー
ユーザーエクスペリエンスは計測可能なのか? 〜UX計測に関する論文レビューユーザーエクスペリエンスは計測可能なのか? 〜UX計測に関する論文レビュー
ユーザーエクスペリエンスは計測可能なのか? 〜UX計測に関する論文レビューMasaya Ando
 
IT系エンジニアのためのプレゼンテーション入門
IT系エンジニアのためのプレゼンテーション入門IT系エンジニアのためのプレゼンテーション入門
IT系エンジニアのためのプレゼンテーション入門Masahito Zembutsu
 
プロダクトマネージャのお仕事
プロダクトマネージャのお仕事プロダクトマネージャのお仕事
プロダクトマネージャのお仕事Shohei Hido
 
これからSpringを使う開発者が知っておくべきこと
これからSpringを使う開発者が知っておくべきことこれからSpringを使う開発者が知っておくべきこと
これからSpringを使う開発者が知っておくべきこと土岐 孝平
 
APIテスト自動化とテストピラミッド
APIテスト自動化とテストピラミッドAPIテスト自動化とテストピラミッド
APIテスト自動化とテストピラミッド友隆 浅黄
 
品質を加速させるために、テスターを増やす前から考えるべきQMファンネルの話(3D版)
品質を加速させるために、テスターを増やす前から考えるべきQMファンネルの話(3D版)品質を加速させるために、テスターを増やす前から考えるべきQMファンネルの話(3D版)
品質を加速させるために、テスターを増やす前から考えるべきQMファンネルの話(3D版)Yasuharu Nishi
 
プログラミング初心者がOpenCVと機械学習でOCRエンジン自作に挑戦する話
プログラミング初心者がOpenCVと機械学習でOCRエンジン自作に挑戦する話プログラミング初心者がOpenCVと機械学習でOCRエンジン自作に挑戦する話
プログラミング初心者がOpenCVと機械学習でOCRエンジン自作に挑戦する話marika_hotani
 
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~MicroAd, Inc.(Engineer)
 
Apiドキュメンテーションツールを使いこなす【api blueprint編】
Apiドキュメンテーションツールを使いこなす【api blueprint編】Apiドキュメンテーションツールを使いこなす【api blueprint編】
Apiドキュメンテーションツールを使いこなす【api blueprint編】dcubeio
 
機械学習システムのアーキテクチャアラカルト
機械学習システムのアーキテクチャアラカルト機械学習システムのアーキテクチャアラカルト
機械学習システムのアーキテクチャアラカルトBrainPad Inc.
 
IntuneとWSUSを使ってWindows Updateをやってみる。
IntuneとWSUSを使ってWindows Updateをやってみる。IntuneとWSUSを使ってWindows Updateをやってみる。
IntuneとWSUSを使ってWindows Updateをやってみる。shotayamamura1
 

What's hot (20)

リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
 
「ユーザーを理解するって言うほどカンタンじゃないよね」 UXデザイン・UXリサーチをもう一度ちゃんと理解しよう!
「ユーザーを理解するって言うほどカンタンじゃないよね」 UXデザイン・UXリサーチをもう一度ちゃんと理解しよう!「ユーザーを理解するって言うほどカンタンじゃないよね」 UXデザイン・UXリサーチをもう一度ちゃんと理解しよう!
「ユーザーを理解するって言うほどカンタンじゃないよね」 UXデザイン・UXリサーチをもう一度ちゃんと理解しよう!
 
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイントリクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
 
トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本
トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本
トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本
 
Spring Framework勉強会
Spring  Framework勉強会Spring  Framework勉強会
Spring Framework勉強会
 
ビズリーチの機械学習基盤
ビズリーチの機械学習基盤ビズリーチの機械学習基盤
ビズリーチの機械学習基盤
 
ユーザーエクスペリエンスは計測可能なのか? 〜UX計測に関する論文レビュー
ユーザーエクスペリエンスは計測可能なのか? 〜UX計測に関する論文レビューユーザーエクスペリエンスは計測可能なのか? 〜UX計測に関する論文レビュー
ユーザーエクスペリエンスは計測可能なのか? 〜UX計測に関する論文レビュー
 
IT系エンジニアのためのプレゼンテーション入門
IT系エンジニアのためのプレゼンテーション入門IT系エンジニアのためのプレゼンテーション入門
IT系エンジニアのためのプレゼンテーション入門
 
プロダクトマネージャのお仕事
プロダクトマネージャのお仕事プロダクトマネージャのお仕事
プロダクトマネージャのお仕事
 
RESTfulとは
RESTfulとはRESTfulとは
RESTfulとは
 
これからSpringを使う開発者が知っておくべきこと
これからSpringを使う開発者が知っておくべきことこれからSpringを使う開発者が知っておくべきこと
これからSpringを使う開発者が知っておくべきこと
 
OCRは古い技術
OCRは古い技術OCRは古い技術
OCRは古い技術
 
APIテスト自動化とテストピラミッド
APIテスト自動化とテストピラミッドAPIテスト自動化とテストピラミッド
APIテスト自動化とテストピラミッド
 
品質を加速させるために、テスターを増やす前から考えるべきQMファンネルの話(3D版)
品質を加速させるために、テスターを増やす前から考えるべきQMファンネルの話(3D版)品質を加速させるために、テスターを増やす前から考えるべきQMファンネルの話(3D版)
品質を加速させるために、テスターを増やす前から考えるべきQMファンネルの話(3D版)
 
プログラミング初心者がOpenCVと機械学習でOCRエンジン自作に挑戦する話
プログラミング初心者がOpenCVと機械学習でOCRエンジン自作に挑戦する話プログラミング初心者がOpenCVと機械学習でOCRエンジン自作に挑戦する話
プログラミング初心者がOpenCVと機械学習でOCRエンジン自作に挑戦する話
 
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
 
Apiドキュメンテーションツールを使いこなす【api blueprint編】
Apiドキュメンテーションツールを使いこなす【api blueprint編】Apiドキュメンテーションツールを使いこなす【api blueprint編】
Apiドキュメンテーションツールを使いこなす【api blueprint編】
 
JIRAを使ったフツウのPJ実践
JIRAを使ったフツウのPJ実践JIRAを使ったフツウのPJ実践
JIRAを使ったフツウのPJ実践
 
機械学習システムのアーキテクチャアラカルト
機械学習システムのアーキテクチャアラカルト機械学習システムのアーキテクチャアラカルト
機械学習システムのアーキテクチャアラカルト
 
IntuneとWSUSを使ってWindows Updateをやってみる。
IntuneとWSUSを使ってWindows Updateをやってみる。IntuneとWSUSを使ってWindows Updateをやってみる。
IntuneとWSUSを使ってWindows Updateをやってみる。
 

Viewers also liked

Watson Build Challengeに参加してみた
Watson Build Challengeに参加してみたWatson Build Challengeに参加してみた
Watson Build Challengeに参加してみたWataru Koyama
 
Slack Appsでやれる事を確認した。年内日本語化されるんで、急ぎで!
Slack Appsでやれる事を確認した。年内日本語化されるんで、急ぎで!Slack Appsでやれる事を確認した。年内日本語化されるんで、急ぎで!
Slack Appsでやれる事を確認した。年内日本語化されるんで、急ぎで!Yasuyuki Ogawa
 
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017Carol Smith
 
GitLabを16万8千光年ワープさせた話(改)
GitLabを16万8千光年ワープさせた話(改)GitLabを16万8千光年ワープさせた話(改)
GitLabを16万8千光年ワープさせた話(改)Wataru NOGUCHI
 
Kubernets on Bluemix + DevOpsでコンテナCIやってみた
Kubernets on Bluemix + DevOpsでコンテナCIやってみたKubernets on Bluemix + DevOpsでコンテナCIやってみた
Kubernets on Bluemix + DevOpsでコンテナCIやってみたShoichiro Sakaigawa
 
Twilio bluemix hands-on 資料
Twilio bluemix hands-on 資料Twilio bluemix hands-on 資料
Twilio bluemix hands-on 資料Masaya Fujita
 
Watson × IBM Bluemix で簡単アプリ開発
Watson × IBM Bluemix で簡単アプリ開発Watson × IBM Bluemix で簡単アプリ開発
Watson × IBM Bluemix で簡単アプリ開発softlayerjp
 
地震対策ハッカソン キズナコントラクト
地震対策ハッカソン  キズナコントラクト地震対策ハッカソン  キズナコントラクト
地震対策ハッカソン キズナコントラクト彩友美 小岩
 
カンバン駆動開発 - Trello, Slackで始めるKDD
カンバン駆動開発 - Trello, Slackで始めるKDDカンバン駆動開発 - Trello, Slackで始めるKDD
カンバン駆動開発 - Trello, Slackで始めるKDDKazuya Takahashi
 
IBM Connections Engagement Center
IBM Connections Engagement CenterIBM Connections Engagement Center
IBM Connections Engagement CenterTIMETOACT GROUP
 
Microsoft 365 で両立するセキュリティと働き方改革
Microsoft 365 で両立するセキュリティと働き方改革Microsoft 365 で両立するセキュリティと働き方改革
Microsoft 365 で両立するセキュリティと働き方改革Hiroyuki Komachi
 
“利用者”として使ってみた!Office 365で実現する”自己満足”システム
“利用者”として使ってみた!Office 365で実現する”自己満足”システム“利用者”として使ってみた!Office 365で実現する”自己満足”システム
“利用者”として使ってみた!Office 365で実現する”自己満足”システムTakeru Imaizumi
 
NPO に Office365 Nonprofit 版導入してみました。
NPO に Office365 Nonprofit 版導入してみました。NPO に Office365 Nonprofit 版導入してみました。
NPO に Office365 Nonprofit 版導入してみました。Takanori Tsuruta
 
スタートアップこそOffice365で業務効率化
スタートアップこそOffice365で業務効率化スタートアップこそOffice365で業務効率化
スタートアップこそOffice365で業務効率化Yasutaka Hamada
 
Waston が拓く UX の新しい地平 〜 UX デザイナーが IBM Waston を使ってみた 〜:2017年4月22日 AI eats UX me...
Waston が拓く UX の新しい地平 〜 UX デザイナーが IBM Waston を使ってみた 〜:2017年4月22日 AI eats UX me...Waston が拓く UX の新しい地平 〜 UX デザイナーが IBM Waston を使ってみた 〜:2017年4月22日 AI eats UX me...
Waston が拓く UX の新しい地平 〜 UX デザイナーが IBM Waston を使ってみた 〜:2017年4月22日 AI eats UX me...Yoshiki Hayama
 
AWSマイスターシリーズReloaded -Amazon Glacier-
AWSマイスターシリーズReloaded -Amazon Glacier-AWSマイスターシリーズReloaded -Amazon Glacier-
AWSマイスターシリーズReloaded -Amazon Glacier-Amazon Web Services Japan
 
Watsonに、俺の推しアイドルがかわいいと、わかってほしかった:2017年12月3日 IBM Cloud (Bluemix) 冬の大勉強会
Watsonに、俺の推しアイドルがかわいいと、わかってほしかった:2017年12月3日 IBM Cloud (Bluemix) 冬の大勉強会Watsonに、俺の推しアイドルがかわいいと、わかってほしかった:2017年12月3日 IBM Cloud (Bluemix) 冬の大勉強会
Watsonに、俺の推しアイドルがかわいいと、わかってほしかった:2017年12月3日 IBM Cloud (Bluemix) 冬の大勉強会Yoshiki Hayama
 
SoftLayer Bluemix Summit 2015: BluemixでWatsonをつかいたおせ!
SoftLayer Bluemix Summit 2015: BluemixでWatsonをつかいたおせ!SoftLayer Bluemix Summit 2015: BluemixでWatsonをつかいたおせ!
SoftLayer Bluemix Summit 2015: BluemixでWatsonをつかいたおせ!Miki Yutani
 

Viewers also liked (20)

Watson Build Challengeに参加してみた
Watson Build Challengeに参加してみたWatson Build Challengeに参加してみた
Watson Build Challengeに参加してみた
 
Slack Appsでやれる事を確認した。年内日本語化されるんで、急ぎで!
Slack Appsでやれる事を確認した。年内日本語化されるんで、急ぎで!Slack Appsでやれる事を確認した。年内日本語化されるんで、急ぎで!
Slack Appsでやれる事を確認した。年内日本語化されるんで、急ぎで!
 
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
 
GitLabを16万8千光年ワープさせた話(改)
GitLabを16万8千光年ワープさせた話(改)GitLabを16万8千光年ワープさせた話(改)
GitLabを16万8千光年ワープさせた話(改)
 
GitLab Prometheus
GitLab PrometheusGitLab Prometheus
GitLab Prometheus
 
Kubernets on Bluemix + DevOpsでコンテナCIやってみた
Kubernets on Bluemix + DevOpsでコンテナCIやってみたKubernets on Bluemix + DevOpsでコンテナCIやってみた
Kubernets on Bluemix + DevOpsでコンテナCIやってみた
 
Twilio bluemix hands-on 資料
Twilio bluemix hands-on 資料Twilio bluemix hands-on 資料
Twilio bluemix hands-on 資料
 
Watson × IBM Bluemix で簡単アプリ開発
Watson × IBM Bluemix で簡単アプリ開発Watson × IBM Bluemix で簡単アプリ開発
Watson × IBM Bluemix で簡単アプリ開発
 
QGIS応用操作.
QGIS応用操作.QGIS応用操作.
QGIS応用操作.
 
地震対策ハッカソン キズナコントラクト
地震対策ハッカソン  キズナコントラクト地震対策ハッカソン  キズナコントラクト
地震対策ハッカソン キズナコントラクト
 
カンバン駆動開発 - Trello, Slackで始めるKDD
カンバン駆動開発 - Trello, Slackで始めるKDDカンバン駆動開発 - Trello, Slackで始めるKDD
カンバン駆動開発 - Trello, Slackで始めるKDD
 
IBM Connections Engagement Center
IBM Connections Engagement CenterIBM Connections Engagement Center
IBM Connections Engagement Center
 
Microsoft 365 で両立するセキュリティと働き方改革
Microsoft 365 で両立するセキュリティと働き方改革Microsoft 365 で両立するセキュリティと働き方改革
Microsoft 365 で両立するセキュリティと働き方改革
 
“利用者”として使ってみた!Office 365で実現する”自己満足”システム
“利用者”として使ってみた!Office 365で実現する”自己満足”システム“利用者”として使ってみた!Office 365で実現する”自己満足”システム
“利用者”として使ってみた!Office 365で実現する”自己満足”システム
 
NPO に Office365 Nonprofit 版導入してみました。
NPO に Office365 Nonprofit 版導入してみました。NPO に Office365 Nonprofit 版導入してみました。
NPO に Office365 Nonprofit 版導入してみました。
 
スタートアップこそOffice365で業務効率化
スタートアップこそOffice365で業務効率化スタートアップこそOffice365で業務効率化
スタートアップこそOffice365で業務効率化
 
Waston が拓く UX の新しい地平 〜 UX デザイナーが IBM Waston を使ってみた 〜:2017年4月22日 AI eats UX me...
Waston が拓く UX の新しい地平 〜 UX デザイナーが IBM Waston を使ってみた 〜:2017年4月22日 AI eats UX me...Waston が拓く UX の新しい地平 〜 UX デザイナーが IBM Waston を使ってみた 〜:2017年4月22日 AI eats UX me...
Waston が拓く UX の新しい地平 〜 UX デザイナーが IBM Waston を使ってみた 〜:2017年4月22日 AI eats UX me...
 
AWSマイスターシリーズReloaded -Amazon Glacier-
AWSマイスターシリーズReloaded -Amazon Glacier-AWSマイスターシリーズReloaded -Amazon Glacier-
AWSマイスターシリーズReloaded -Amazon Glacier-
 
Watsonに、俺の推しアイドルがかわいいと、わかってほしかった:2017年12月3日 IBM Cloud (Bluemix) 冬の大勉強会
Watsonに、俺の推しアイドルがかわいいと、わかってほしかった:2017年12月3日 IBM Cloud (Bluemix) 冬の大勉強会Watsonに、俺の推しアイドルがかわいいと、わかってほしかった:2017年12月3日 IBM Cloud (Bluemix) 冬の大勉強会
Watsonに、俺の推しアイドルがかわいいと、わかってほしかった:2017年12月3日 IBM Cloud (Bluemix) 冬の大勉強会
 
SoftLayer Bluemix Summit 2015: BluemixでWatsonをつかいたおせ!
SoftLayer Bluemix Summit 2015: BluemixでWatsonをつかいたおせ!SoftLayer Bluemix Summit 2015: BluemixでWatsonをつかいたおせ!
SoftLayer Bluemix Summit 2015: BluemixでWatsonをつかいたおせ!
 

Similar to 一年目がWatsonを調べてみた Discovery編

福岡市内のベンチャー企業が取り組む最新It技術
福岡市内のベンチャー企業が取り組む最新It技術福岡市内のベンチャー企業が取り組む最新It技術
福岡市内のベンチャー企業が取り組む最新It技術Takuya Andou
 
ディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみたディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみた卓也 安東
 
「いい検索」を考える
「いい検索」を考える「いい検索」を考える
「いい検索」を考えるShuryo Uchida
 
20220325 - Oudanピッチ資料
20220325 - Oudanピッチ資料20220325 - Oudanピッチ資料
20220325 - Oudanピッチ資料ShinnosukeAndo
 
Cogbot #30 Ignite 2021 アップデート Cognitive Search 編
Cogbot #30 Ignite 2021 アップデート Cognitive Search 編Cogbot #30 Ignite 2021 アップデート Cognitive Search 編
Cogbot #30 Ignite 2021 アップデート Cognitive Search 編Ayako Omori
 
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜National Institute of Informatics (NII)
 
20140713 ハッカソン基調講演
20140713 ハッカソン基調講演20140713 ハッカソン基調講演
20140713 ハッカソン基調講演Code_for_Sakai
 
データプランナーによるデータ系施策について
データプランナーによるデータ系施策についてデータプランナーによるデータ系施策について
データプランナーによるデータ系施策についてRecruit Lifestyle Co., Ltd.
 
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020Daisuke Masubuchi
 
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例Yahoo!デベロッパーネットワーク
 
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようPPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようDaisuke Masubuchi
 
ディスカバリー・ツールとは?
ディスカバリー・ツールとは?ディスカバリー・ツールとは?
ディスカバリー・ツールとは?Wataru ONO
 

Similar to 一年目がWatsonを調べてみた Discovery編 (20)

福岡市内のベンチャー企業が取り組む最新It技術
福岡市内のベンチャー企業が取り組む最新It技術福岡市内のベンチャー企業が取り組む最新It技術
福岡市内のベンチャー企業が取り組む最新It技術
 
ディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみたディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみた
 
「いい検索」を考える
「いい検索」を考える「いい検索」を考える
「いい検索」を考える
 
情報力を鍛える
情報力を鍛える情報力を鍛える
情報力を鍛える
 
20220325 - Oudanピッチ資料
20220325 - Oudanピッチ資料20220325 - Oudanピッチ資料
20220325 - Oudanピッチ資料
 
Cogbot #30 Ignite 2021 アップデート Cognitive Search 編
Cogbot #30 Ignite 2021 アップデート Cognitive Search 編Cogbot #30 Ignite 2021 アップデート Cognitive Search 編
Cogbot #30 Ignite 2021 アップデート Cognitive Search 編
 
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
 
20140713 ハッカソン基調講演
20140713 ハッカソン基調講演20140713 ハッカソン基調講演
20140713 ハッカソン基調講演
 
データプランナーによるデータ系施策について
データプランナーによるデータ系施策についてデータプランナーによるデータ系施策について
データプランナーによるデータ系施策について
 
35thwebmining_lt
35thwebmining_lt35thwebmining_lt
35thwebmining_lt
 
研究データ流通を支える情報基盤とは
研究データ流通を支える情報基盤とは研究データ流通を支える情報基盤とは
研究データ流通を支える情報基盤とは
 
内省するTensorFlow
内省するTensorFlow内省するTensorFlow
内省するTensorFlow
 
全文検索入門
全文検索入門全文検索入門
全文検索入門
 
農業It 20150312a
農業It 20150312a農業It 20150312a
農業It 20150312a
 
Proxy War
Proxy WarProxy War
Proxy War
 
OSS ソースコードサーチツールの効能、有効活用方法
OSS ソースコードサーチツールの効能、有効活用方法OSS ソースコードサーチツールの効能、有効活用方法
OSS ソースコードサーチツールの効能、有効活用方法
 
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
 
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
 
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようPPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
 
ディスカバリー・ツールとは?
ディスカバリー・ツールとは?ディスカバリー・ツールとは?
ディスカバリー・ツールとは?
 

Recently uploaded

IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdffurutsuka
 

Recently uploaded (9)

IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdf
 

一年目がWatsonを調べてみた Discovery編

Editor's Notes

  1. Bluemix築地のコンセプトである初心者でも発表できる場というところで私にはうってつけ 至らない点も多々あると思いますが、ここ違うよっていうものがあればもし後ほど教えていただければと思います。 それでは
  2. 解釈 Discoveryはシンプルな構成で、より多くの機能を実現
  3. ストレージ・サイズの上限は1TB位
  4. エンリッチ機能は文書を取り込む エンリッチされたメタ情報を検索条件として使えるので、通常の検索エンジンと⽐較してはるかに⾼度な検索が可能 概念 Concepts ⼊⼒テキストが関連付けられている概念を、そのテキストに存在する他の概念とエンティティに基づいて識別します。 エンティティ Entities ⽂中に記載されている⼈物、場所、イベント、その他のエンティティを検索します。 キーワード Keywords ⽂中に繰り返し出てくる重要なキーワードを抽出します。 カテゴリー Categories 対象⽂書を最⼤5レベルの分類基準に従って分類します。カテゴリーの⼀覧は下記リンクにあります。 評判 Sentiment ⽂章全体及び特定のフレーズに対して、その評判をpositive, negative, nutral の3値で分析します。 感情 Emotion ⽂章全体及び特定のフレーズに対して、その感情をjoy, anger, disgust, sadness, fearの5つの観点で分析します。 関係 Relations 2つのエンティティ間の関係を⾒つけ、その関係性を判別します。 意味役割 Semantic Roles 構⽂解析により⼊⼒⽂を「主語(Subject)」「動詞(Action)」「⽬的語(Object)」に分解します。 その他 Metadata HTMLファイルまたはURLを⼊⼒とし、そのHTMLの著者、タイトル、発⾏⽇を分析します。
  5. 検索結果のフィルターや集計を行うことが可能 こちらにもUIがあります それが
  6. VQBという検索UIツールでここで様々なオプションを付けて検索を行う事ができます Search for document で自然文を使うかDQLを使うかの指定を行います。 集約関数やフィルタの設定もここでできます。 2つの検索方法のうちのまずDQLから Discovery query language
  7. DQLでは検索対象をカラムで絞り込んで検索を行います。 UIを使うと自動でDQLを生成してくれるのでそれを使って検索する事ができる 右がsummaryで表示した結果です
  8. こちらは自然文検索の結果をJSONで出力したもので、スコア付きで回答されている事がわかります。 文面だけでなく「意味」を判断するため、人間が話し言葉で打った質問に回答を返してくれます。 どのような条件で検索するとどういう結果がかえってくるかが確認 次にその回答をより適切なものにするための関連性学習について
  9. 質問文をいれるとその回答がでるので回答毎にその回答が正解か正解じゃないかを選択して 所定の品質 最低でも49個の質問について選択しなければならない
  10. Discoveryのインスタンスを作るとデフォルトで表示されています データの保存先
  11. テキストデータではなくファイル名でHITしてしまう場合がある 2000文字程度
  12. まだ未熟ですがこれから成長していきたいと思います。