Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

大數據的關鍵思考(上)重點摘要 原著者:車品覺

  中國大陸大數據實踐的先行者車品覺,曾任職於eBay及阿里巴巴全球兩大電商巨頭,現為阿里巴巴集團數據技術及產品部副總裁、數據委員會會長。

  他在本書中第一手公開十多年的大數據心得,以及阿里巴巴的數據實戰經驗,以清楚的架構分享他如何用數據建立思考模式、用數據找尋機會,用數據產生價值的心法。

  本書不是描述大數據風潮或重要性的趨勢書,而是以實戰為基礎,告訴讀者大數據的具體運作,協助建構當下最需要的大數據思維。

(以上摘自書商簡介)

  • Be the first to comment

大數據的關鍵思考(上)重點摘要 原著者:車品覺

  1. 1. 大數據的關鍵思考(上) 第一部:從數據化營運到營運數據 重點分享 原著者:車品覺
  2. 2. 數據前置: 從「數據解決問題」 到「從數據指引行動」 等孩子唸了三個月書 成績出來了才發現學校有問題 為時已晚
  3. 3. 數據價值來自於團隊的連結 產品 營運數據
  4. 4. 定位問題所在 問句 舉例 你遇到什麼問題? 哪些消費者的體驗改變了? 這是誰的問題? 以誰為中心來設計產品 你是否能解決這個問題? 你的核心競爭力能解決這個問題嗎? 你能理解客戶的需求嗎? 問題現在就得解決嗎? 時機比性能更重要 如果現在就得解決, 那麼可以支撐的數據在哪裡? 數據是否解決這個問題的核心?
  5. 5. 如何解決問題 1. 用戶目前的困難是什麼? 2. 已有的數據可以用於解決這個困難嗎? 3. 假如所有數據都可以被獲取,那麼你需要哪些方面的數據? 4. 獲得數據的成本和風險是什麼? 5. 你的數據解決方案是什麼? 6. 如果方案可行,你如何獲取及累積這些數據?
  6. 6. 用數據還原真實 過去,我們有問題找數據 大數據時代,我們用數據「找機會」 90年代的大數據作法 不單純看比賽數字 而是看錄影帶 過濾干擾變數 還原真實資料!
  7. 7. 數據十誡 1. 好的問題,答案就在裡面 2. 在實踐中提煉數據 3. 讓數據(Data)變成科技(Technology),惠及更多人 4. 讓數據跟著人走 5. 缺乏數據品質,任何數據都是浮雲 6. 以「假設數據是可獲取的」去思考問題 7. 大數據安全,不是監管 8. 利用數據拿到更有用的數據 9. 建立數據的數據,才有進步 10.讓人作人擅長的事,讓機器做機器擅長做的事
  8. 8. 第一章 大數據,只會談,不會做
  9. 9. 為什麼你不該輕易導入大數據? • 大數據從來不是免費午餐 • 儲存、備份、線下獲取… • 誤差、噪音對大數據的影響更隨之放大 • 收集數據的人並不清楚使用數據的人要做什麼 • 轉換率提高1%,是老闆要的嗎? • 投資人/管理者/中階/數據分析師對數據價值看法不同 • 不同類型的數據價值也不同 • 數據來源的不確定性 • 數據模型會依照情境改變而改變
  10. 10. 思考一下 如果搜尋引擎告訴你,台北搜尋「感冒藥」的頻率非常高 可以斷定這個地方出現了流行性感冒?
  11. 11. 更主動的管理與創新 • 從「用數據」到 「養數據」 • 從「數據化營運」到 「營運數據」 • 從「看數據」到 「用數據」 Volume Velocity Variety Value 營運數據
  12. 12. 在大數據的商業環境中,你需要: 數據 商業 思維 方法 三分靠想法 七分靠實踐
  13. 13. 數據分析師的思考習慣(一) BI負責人應該要在5分鐘答出來的問題 好的問題可以解決問題 • 貴公司面對的三大問題是什麼? • 公司未來三個月要解決的問題是什麼? • 過去一個月,你做對了什麼,做錯了什麼?
  14. 14. 第二章 還原使用者真實需求
  15. 15. 數據價值的思考面向 識別 Identify 價值 Value 情境 Situation
  16. 16. 識別:碎片化的個人 Cookie E-mail 手機號碼 信用卡 身份證 聯絡人 知道用戶是誰 決定了企業數據收集行為的意義大小
  17. 17. 為什麼要實現數據收集? 角色不一樣,數據價值也不一樣 企業價值 合理分配資源 客戶價值 顧客體驗提昇 例如:提高購買率 例如:改善搜尋體驗
  18. 18. 銀行: 太好了,2點鐘有20個人在排隊 顧客: 氣死了,我已經等了10分鐘 哪一個KPI重要?服務提供方/服務接受方
  19. 19. 購買情境 • 把所有的數據串起來,就一定能代表事實嗎? • 一家公司需要有多少能力才能還原購買情境? 為什麼台北的用戶搜尋了 一件T恤好多次,卻遲遲不肯訂購?
  20. 20. • IPad的購物量突然爆增?原來是因為假期實施收費亭不收費政策,塞車的人沒事做 • 某一種Device的使用人數很少?會不會是因為Device無法開啟連結? 還原情境 就像偵探解謎
  21. 21. RFM模型 • 最近一次消費(Recency) • 消費頻率(Frequency) • 消費金額(Monetary) • 將以上3個面向分成2個層級,可得出9類客戶 • 客戶分類後衡量其終生價值,最後決定差異化的對待策略 • http://wiki.mbalib.com/zh-tw/RFM%E6%A8%A1%E5%9E%8B
  22. 22. RFM * 情境面向 CLV=終生價值 手機裝置情境 社交情境 地點情境… 情境不同,數據的意義也不一樣
  23. 23. 數據分析師的思考習慣(二) 你是一名數據分析師,今天是星期一早上9點 CEO 向你要3項數據指標, 證明過去一週裡企業營運一切正常 讓他能心理踏實 你會給哪3個數據? 如果你不把自己的分析與當下結合,便無法進步
  24. 24. 第三章 活數據才是大數據
  25. 25. 死數據是無用的,但如何變活? • 把數據用起來! • 形成數據循環 • 進入循環的關鍵就是從 解決問題出發 分析 推薦 回饋 再推 薦
  26. 26. 數據的自循環中,兩個核心關鍵 「活」做數 據收集 連別人的數 據一起收集 「活」看數 據指標 不要侷限現 有框架 應結合用戶 情境
  27. 27. 雷曼兄弟倒閉的前一天… Google宣布退出中的前一天… 最早知道這個情報的企業,是Linkedin
  28. 28. 數據分析師的思考習慣(三) 世界上沒有太多碰巧 今日的數據分析師,需要有點軍師的味道 後端商業數據 前端行為數據 有成 功對 接嗎? 訪問量、瀏覽量、點擊率、站內搜尋…交易量、ROI、顧客終生價值… 你能說出前端行為與 後端的關聯性嗎?
  29. 29. 第四章 行動數據-大數據的顛覆者
  30. 30. 多螢思維 • 多螢時代,數據分析必須多螢化 • PC • 手機 • 平板 • 穿戴式裝置
  31. 31. 行動數據的噪音 • 斷層1:PC的Cookie和行動數據之間的斷層 • 斷層2:操作系統本身的差異,以及同一作業系統版本上的分化 WAP APP 類似電腦原理 在沒有帳戶體系的情況下容易出現斷層 1. 用戶請求伺服器的紀錄 2. 用戶的行為數據
  32. 32. 連結個人電腦與行動數據 完整儲存兩種數據,有利於還原用戶行為 透過帳號體系連結兩種數據
  33. 33. 多螢思維下的電子商務 高效準確的收集 • 建立自動且多面向的系統 • 企業建立自己的用戶識別 方式 培養分析師 的多螢思維 • 先透過精鍊的小團隊摸索
  34. 34. 數據分析師的思考習慣(四) 樣本的偏見 1. 不願意寫問卷的人,他們的意見你永遠不知道 2. 採樣誤差:我身邊朋友很多是天秤座? 3. 朋友的回答可能總有誤差,因為牽涉人情 4. 大數據相信全量數據,而非樣本,是分析,而非抽樣
  35. 35. 第五章 核心數據
  36. 36. 數據的價值 只要是資產,就應該估價 為什麼好吃?蛋貢獻多少?蕃茄貢獻多少? 哪個品種的蕃茄?哪個養殖場的雞蛋? 成熟程度多少?蛋重幾克?
  37. 37. 數據如何分類? • 隱私數據 • 非隱私數據 • 不同平台 • 不同業務主體 • 基礎層 • 中間層 • 應用層 • 可再生 • 不可再生 再生 儲存 隱私 業務 歸屬
  38. 38. 數據的五大價值 識別與串連價值 身份證、信用卡、E-Mail、手機號碼、生日… 帳號、不同頁面的Cookie、車牌號碼 描述價值 成交額、成交用戶數、網站流量、商品介紹頁流量、成交賣家數 建立分析數據的框架:觀察數據分析師的基本要求 時間價值 歷史購買行為 取代產品的推薦(如推薦的茶葉產品),或同類產品的演進(如烘培用品越買越多)、即時 預測價值 單品的預測:哪些商品能推、哪些不能推、電商A的團購活動 數據對經營狀況的預測:活躍用戶數、新增、留存、目標貢獻度 產出數據價值 組合多個數據後產生的新指標 例如誠信=好評率+好評數
  39. 39. 銀行如何相信卡片遺失的致電者是本人?
  40. 40. 用傻瓜的視角觀察問題 用長遠的眼光做出判斷 數據分析師的思考習慣(五) 承認不知道:先若愚、而後大智
  41. 41. 第六章 從用數據到養數據
  42. 42. 先收集再說? • 錯誤的觀點 • 數據收集是為了解決問題 • 數據是有生命週期的 • 性別:終生可用 • 年齡、身高、興趣會改變 • 如果你今天想不出來數據未來可以 做什麼,日後就更不可能想的出來
  43. 43. 收集數據背後的意義 高階希望知道重複購買率,身為數據分析人員知道背後的意義嗎? • 如果要賣公司 • 可以顯示出企業整體營運優劣和用戶品質 • 如果是公司營運觀點 • 每日、每週的變化趨勢更加重要 • 新增客戶三個月內的重複購買率可衡量忠誠度和品質 • 藉此找出改善空間
  44. 44. 如何決定收集哪些數據? 目標越小越具體越好 幫助公司獲利(X) 判斷A策略比B策略好(O)
  45. 45. 根據問題設計「數據框架」 問題:公司懷疑許多老客戶是由Yahoo Games訪問公司官網,而不是 直接訪問官網,那要不要撤去在Yahoo Games的上架? 1. 公司當前的投入產出比(I/O Ratio) • 引進的新舊客戶佔比? • 引進的新舊客戶投入產出比和轉換率為何? • 撤去Yahoo,對流失新舊用戶的影響如何? 2. 與競爭對手的博奕 • 競爭對手會不會取代你原有的架位? 3. 考慮時間因素 • 用現在、過去、未來的眼光審視,看看品質是否更好? • 考慮時間滯延:現在的新客戶,三個月後才能知道價值
  46. 46. 如何使用「數據框架」做決策? 確定問題,從解決問題的角度收集數據 整理好收集的數據,放入一個數據框架 看框架與決策選項的關係(可否幫助選擇) 根據決策行動,檢查行動是否達到目的
  47. 47. 養數據的戰略 需要用 戶提供 的 公司擁 有但沒 有收集 的 不斷透過問 題、互動、 按讚來收集 用戶的偏好 了解數據的 用途、請開 發人員不斷 強化後台
  48. 48. • 兩難壓力下的答案不一定是解決之道 • 不要把自己封閉到狹隘的思想中 • 你必須跳出來問「為什麼是或?」有沒有其它選擇? 數據分析師的思考習慣(六) 遠離「或」:決策不是二選一
  49. 49. 第七章 負面數據的力量
  50. 50. 數據的盲點 物理盲點 應該收集卻不存在 於數據庫的數據 邏輯盲點 有數據卻沒有 被好好的分析利用
  51. 51. 思考 “用戶停留時間” 是一個可以判斷用戶 對商品興趣的KPI?
  52. 52. 小心違反邏輯的漏洞 • 某商品被大量瀏覽,成交率卻偏低? • 成交額偏高,退款率也很高? • 被少算的行動的瀏覽數據導致轉換率過高? • 不要將異常視為偶然的行為
  53. 53. 小偷思維:負能量的數據觀察法 對小偷來說,一間房子七天沒亮燈,就是機會,因為風險很小 負能量思考的要點 • 思考怎麼做才不會失敗 • 思考風險有多大 • 思考我犯了哪些錯誤 • 觀察對手失敗在哪裡 • 有沒有看到應該看到的數據? • 有沒有錯失不應該錯失的數據?
  54. 54. 別忽略負面數據 • 路上突然發生爆炸案,要透過監 視器大數據逮捕犯人,哪些行為 是異常? • 冷靜的離開現場,很可能有問題 • 簡報的時候,怎麼知道哪裡需要 改進? • 什麼時間點頭? • 什麼時間作筆記? • 什麼時間看手機? • 商機存在於看了不買的人身上 • 假設會讓人盲目 • 錯誤的經驗會讓人繼續錯誤 • 經驗經常是盲點
  55. 55. 存 管 用 應該收集多 少才夠? 這麼多如何 管理? 如何使它們實現 更大價值?
  56. 56. • 要觀察數據的常態、時態和變態,才不會被騙 • 何謂觀察:從共通性找出相對性 • 何謂情態:喜、怒、哀、懼、愛、惡、欲 • 何謂時態:情態被邊緣系統激發出來的表現 • 何謂常態:弱(溫柔輕細)、狂(自大好勝)、嘩(好出風頭)、 周旋(牆頭草)、慵懶(漫不經心)、媚(諂媚) • 何謂變態:由常態變為時態而衍生的異常動作或不理智行為 數據分析師的思考習慣(七) 為什麼數據會騙人?

×