如何從0到1做電商用戶畫像建模?

15天0基礎極速入門數據分析,掌握一套數據分析流程和方法,學完就能寫一份數據報告!了解一下>>

用戶畫像,其實就是通過算法聚合成一類實現用戶信息標簽化。而本文就以電商用戶為例,展示了如何從0到1做畫像建模。

一、構建用戶畫像

① 用戶畫像信息:基本屬性,購買能力,行為特征,興趣愛好,心理特征,社交網絡

② 行為建模:文本挖掘,自然語言處理,機器學習,預測算法,聚類算法

③ 數據收集:網絡日志數據,用戶行為數據,網站交易數據

作用:了解用戶的行為習慣,個性化營銷及精準廣告

  • 靜態數據來源:來源于用戶填的個人信息,及算法模型預測的數據
  • 動態信息數據: 用戶行為產生的數據:注冊,瀏覽,點擊,購買,簽收,評價,退貨等

—比較重要的行為:購買商品,瀏覽商品,放入購物車,關注商品等

根據行為可以得出標簽: 潮媽族,糾結商品,最大消費,退貨數量,敗家指數,品牌偏好,用戶活躍度等
確定標簽與根據算法猜測的標簽

  • 確定的標簽:比如用戶購買了或者收藏了某個商品等
  • 猜測的標簽:比如用戶的性別,是男性的概率0.8。

另外還有很多模型:孕婦模型,潛在汽車用戶模型,用戶價值模型

比如:用戶活躍度(活躍,沉睡,流失,未購買) 用戶分群:電腦達人,數碼潮人,家庭用戶,網購達人,奶爸奶媽,單身貴族,閃購用戶,時尚男女等

二、用戶畫像建模

1. 客戶消費訂單表

根據用戶消費的情況來提取的客戶標簽,用以了解用戶的消費情況,消費習慣。

(1)客戶消費訂單表標簽

購買信息:

客戶ID,第一次消費時間,最近一次消費時間,首單距今時間,尾單距今時間,近30/60/90天購買次數/購買金額(不含退拒),最大/最小消費金額,累計消費次數/金額(不含退拒) 累計使用代金券金額,客單價(含退拒),常用收貨地區,常用支付方式,退貨商品數量,退貨商品金額,拒收商品金額/數量,最近一次退貨時間,各地點下單總數/總額,上下午下單總數/總額。

購物車信息:

最近30天購物車商品件數/提交商品件數/購物車成功率/購物車放棄件數

(2)提取標簽的作用

  • 確定用戶什么時候來的,多久沒來了:第一次消費時間,最近一次消費時間,首單距今時間,尾單距今時間。
  • 最近消費能力:近30天購買次數(不含退拒),近30購買金額(不含退拒),近30天購買次數(含退拒),近30天購買金額(含退拒)。
  • 總體的消費情況:最小/大消費金額(可做個性化商品推薦),累計消費次數(不含退拒,可以計算客單價),累計消費金額,累計使用代金券金額(代金券愛好。)
  • 消費屬性:常用收貨地區,常用支付方式。
  • 購物車習慣:最近30天購物車次數,最近30天購物車提交商品件數,最近30天購物車商品件數,最近30天購物車放棄件數,最近30天購物車成功率。
  • 退貨和習慣特征:退貨商品數量,拒收商品數量,退貨商品金額,拒收商品金額,最近一次退貨時間 用戶購物時間及地點習慣:各下單地點總數,各時間段下單總數。

2. 客戶購買類目表

—根據客戶購買類目的情況提取的客戶標簽,用以了解類目的購買人群情況 。

客戶購買表標簽:

客戶ID,一級/二級/三級分類ID/名稱,近30天/90天/180天購買類目次數/金額,累計購買類目次數/金額,累計購買類目次數/金額,近30天/90天/180天購物車某類目次數/金額,累計購買類目次數/金額,累計購物車類目次數/金額,最后一次購買類目時間/距今天數

3. 客戶購買商店表

根據客戶購買商店的情況提取的客戶標簽,用以了解商店及品牌的購買人群(做品牌營銷等) 客戶。

購買商店表標簽:

用戶ID,商店ID/名稱,品牌ID/名稱,最近30天購物車次數/商品件數/提交商品件數/成功率/放棄件數,最后一次購物車時間,最近90天商品排除退拒商品件數/金額,最近90天貨到付款訂單數,最近90天退換件數/金額,最近90天拒收件數/金額.

4. 客戶基本屬性

根據客戶所填的屬性標簽與推算出來的標簽,用以了解用戶的基本屬性(可用以個性營銷,生日營銷,星座營銷等)。

客戶基本屬性標簽:

客戶ID,客戶登錄名,性別,生日,年齡,星座,大區域,省份,城市,城市等級,郵箱,郵箱運營商,加密手機,手機運營商,注冊時間,登錄ip地址,登錄來源,邀請人,會員積分,已使用積分,會員等級名稱,婚姻狀況,學歷,月收入,職業,性別模型,是否孕婦,是否有小孩,孩子性別及年齡概率,是否有車,潛在汽車用戶概率,使用手機品牌/檔次,用戶忠誠度,用戶購物類型,身材,身高。

數據來源:

用戶表,用戶調查表,孕婦模型表,馬甲模型表,用戶價值模型表等 根據算法得出的標簽。

其中模型:

性別模型:用以推算用戶的購買用品的性別傾向(不一定是真實性別)

(1)性別模型

用戶性別:1男,0女,-1未識別 | 1,商品性別得分,2,用戶購買商品性別得分。

孩子性別:0僅有男孩,1僅有女孩,2,男女均勻,3,無法識別 |1,選擇男童女童商品等

性別驗證: 隨機抽樣調查 ,與用戶填寫性惡爆匹配。

(2)用戶購物模型

兩種歸類:

用戶購物類型:

  1. 購物沖動型
  2. 海淘猶豫型
  3. 理性比較型
  4. 目標明確型
  5. 未識別

構建:

  1. 計算用戶在對三級品類購物前流量時間和瀏覽sku數量
  2. kmeans聚類

用戶忠誠度模型:

用戶忠誠度:

  1. 忠誠型用戶
  2. 偶爾型用戶
  3. 投資型用戶
  4. 瀏覽型用戶
  5. 未識別

構建:

  1. 只瀏覽不購買
  2. 購買天數大于一定天數
  3. 購買天數小于一定天數,大部分只有優惠彩購買 等

5. 客戶營銷信息表

將用戶營銷相關的常用標簽放到一張表中,方便使用。

  • 客戶營銷信息表: 客戶ID,營銷手機號,第一個有效訂單來源/地址/手機號,常用的手機號,常用的收貨地址,不同收貨地址的數量,客戶分群,活躍狀態,用戶價值(重要,保持,流失等),糾結商品,糾結小時
  • 主要來源表: 用戶表,訂單表,活動表,購物車表。

其中模型:

(1)客戶活躍狀態模型

客戶一般的活躍狀態:

  1. 注冊未購買(只注冊未購買,多事第三方登錄)
  2. 活躍(可以細分為高頻,中頻,低頻)
  3. 沉睡(近90天無購買,近60天無購買)
  4. 流失 (近90天無購買,曾經購買)

(2)用戶價值模型

體現用戶對網站的價值對提供用戶留存率非常有幫助

使用RFM實現用戶價值模型參考指標:

  • 最近一次消費時間(Recency)
  • 消費頻率(Frequency)
  • 消費金額(Monetary)

RFM 實現用戶價值模型計算方法:

  • 使用指標:租金一次購買時間,近180天購買訂單量,近180天購買金額,分N段進行RFM分數計算
  • 算出Recency_score,Frequency_score,Monetary_score,然后劃分用戶群

? ? 用戶價值分類

6. 客戶活動信息表

根據客戶參與活動的情況提取的客戶標簽,用于了解用戶對活動的參與情況,以進行活動的策劃

客戶活動信息表內容標簽:

客戶ID,用戶促銷明個度,滿減促銷敏感度,打折促銷敏感度,換購促銷敏感度,滿贈促銷敏感度,購買力分段,品牌偏好,品類偏好,顏色偏好,敗家偏好,沖動偏好,累計積分,已用積分,可以積分,累計代金券數量/金額,已用代金券數量/金額,過期代金券數量/金額,可用代金券數量/金額

標簽作用:

確定用戶喜歡那種活動類型:用戶促銷敏感度,滿減促銷敏感度,滿贈敏感度,打折促銷敏感度,換購促銷敏感度,團購促銷敏感度等

促銷敏感度模型:

根據用戶購買的活動類型訂單數與金額數已判斷其屬于哪類人群


用戶有什么偏好:店鋪偏好,品牌偏好,品類偏好,顏色偏好 用戶指數:購買力分段,敗家指數,沖動指數 用戶購買力高中低模型:

—從購物車,客單價來判斷 用戶購買力高中低端模型:

  1. 從購物車來判斷
  2. 從客單價來判斷

指數模型:

敗家指數:

  • 使用購買特征山炮數量來識別(剛出的蘋果產品,奢侈品)
  • 結合用戶的訂單金額

沖動指數 :

  • 使用特征商品(同品類價格較高商品)平均購物車停留時間
  • 結合特征商品(同品類價格較高商品)的購買數量

7. 客戶訪問信息表

根據客戶訪問的情況提取的客戶標簽以了解訪問習慣。

客戶訪問信息標簽:

最近一次/第一次pc端訪問日期/session/cookies/pv/使用瀏覽器/操作系統/,最近一次/ 第一次app端訪問日期/操作系統,最近一次/第一次訪問ip/訪問城市/省份,近7天/15天/30天/60天/90天app端/pc端訪問次數,近30天pc端/app端訪問天數/訪問并購買次數/訪問pv/訪問評價pv/ip數/,app及pc端各時間段訪問的次數。

 

本文由 @Ethan 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于CCO協議。

給作者打賞,鼓勵TA抓緊創作!
評論
歡迎留言討論~!
  1. 數據很全了

    回復
虎扑足球手机虎扑网 量云网配资 产业基金配资 上证指数涨跌代表什么 私募基金配资是什么 宁夏股票配资公司 嘉宝集团股吧 股票配资业务怎么做 闲来广东麻将手机安 广东麻将软件 吉林快3计划软件最 山东11选5玩法 陕西麻将玩法胡牌规则 上海哈灵麻将app 百发理财平台 民生易贷理财平台 快来金融