栏目分类:
子分类:
返回
文库吧用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
文库吧 > IT > 前沿技术 > 大数据 > 数据挖掘与分析

淘宝用户行为分析

淘宝用户行为分析

一背景介绍及数据来源

在互联网的时代下,电商平台提供给网民很多便利,如:提升了购物选择性、更直观的展示出各类商品的优惠折扣以及降低了购买成本等等。网购已经逐渐渗透进我们的生活。淘宝是电商圈里龙头企业,创造过无数奇迹,如“双十一”购物热潮及单日交易额百亿元等历史性的突破。淘宝平台不停的更新迭代,提供了更多的个性化服务。淘宝在2003年创立的,2012年注册会员近5亿,日活跃用户超1.2亿。接下来会通过淘宝2017年11月25日至2017年12月3日的随机用户行为的数据对淘宝进行用户行为分析,找出问题并提出优化方案。 分析工具:Mysql,Navicat,Power bi

数据来源:数据集-阿里云天池 (aliyun.com)

二理解数据

原始数据一共有5个字段

1user_id,用户id,是用来识别用户的编号,不同的编号代表不同的用户。

2item_id 商品id,用来识别商品的编号,不同的编号代表不同的商品。

3category_id 商品类别id,用来识别商品类别的编号,不同的编号代表商品属于不同的类别。

4behavior_id 行为id,用来识别用户的不同行为。

pv-页面游览,就是代表用户点击商品页面,进入游览。

cart-商品加购,就是代表用户将商品加入购物车。

fav-商品收藏,就是代表用户将商品放入收藏。

buy-商品购买,就是代表用户购买商品。

5timestamp-时间戳,代表从1970年1月1号0点0分到发生用户行为的总秒数。

三明确问题及目的

1各环节的转化率是多少,哪个环节的转化率偏低

2各类商品的情况

四分析思路

五数据清洗

1)查找重复值并删除

未发现重复值

2)查找缺失值

未找到缺失值

3)数据格式处理

日期原本为时间戳的形式,不利于后面的数据处理,所以使用FROM_UNIXTIME函数将其转化为常用形式。

添加出日期列,时间列,日期时间列,星期列

4)异常值删除

因为是分析2017年11月25日至2017年12月3日的数据,所以删除其他日期的数据。

删除44个异常值

六模型构建

  • 各个环节转化率是多少

1)对整体数据认识

创建视图,方便后面查看

一共有983名用户,64440个商品,涉及3128个商品类别

2)数据处理

使用AIPL漏斗分析

将behavior_type进行行列转化,创建视图方便后面查看

A-Awareness 认知:pv

I-Interested 兴趣:cart,fav

P-Purchase 购买:buy

L-Loyalty 忠诚:复购

由于整个数据周期较短,所以复购率并没有很大意义,故此忽略,只查看前三个的转化率。

将Power BI 和数据库连接

创建漏斗图

建立度量值收藏加购

得到每个部分的转化率

游览到收藏加购的转化率为9.12%

收藏加购到购买的转化率为23.02%

整体转化率为2.1%

发现游览到收藏加购的转化率比较低,使用假设分析法

(1)计算商品的收藏加购和购买情况

收藏加购过的商品一共有7694种

商品一共64440种

得出商品中一共有12%被收藏加购,在查看这些商品的购买情况

先用sql,在用excel

发现有收藏加购中448个商品被购买,说明收藏加购的商品有5.8%被购买,再看一下商品的整体购买情况

一共有1773种商品被购买,购买率2.8%

发现商品的收藏加购和购买率都比较低,结论成立,对于购买数和收藏加购数都很低的商品建议清仓出售。

(2)观察商品游览和收藏加购,购买数量对比

通过图表发现游览量,购买数量和收藏加购三者未发现关系。再使用Excel进行相关性分析,相关系数都小于0.3,没有什么相关性,说明结论成立,建议优化广告推送机制。

建议推送购买和收藏加购最多的商品

3)将各阶段转化率按时间维度分解

发现购买转化率上下起伏很大,而收藏加购的转化率比较平稳,将购买转化率拿出来单独分析。

将游览量低于平均值得暂时忽略。

对于高于平均转化率的时间段18,14,11,16,17,12,10,13点可以重点投放广告。

  • 将商品按类别分解

使用powerbi统计

购买最多的商品种类是2735466,1464116,4145813,4801426,2885642

收藏加购最多的是4756105,4145813,3607361,982926,4801426

游览最多的是4756105,3607361,4145813,2355072,982926

通过图表发现发现商品种类的游览,收藏加购和购买可能存在相关性。

使用Excel链接powerbi,进行相关性计算

发现三者存在强相关性,说明对于商品种类的人群定位做得比较好,广告推送取得好的效果,可以继续保持。

七总结

1.通过分析发现,游览到收藏加购的转化率为9.12%,收藏加购到购买的转化率为23.02%,整体转化率为2.1%。

2.商品一共64440种,一共有7694种被收藏加购,一共1773种被购买,大量的商品没有产生价值。而且大量商品游览没有产生收藏和购买行为,说明对于商品的推送机制需要改进。

3.18,14,11,16,17,12,10,13点的游览转化为收藏加购比例比较高。

4.商品种类的推送机制比较好,产生了大量的收藏加购和购买行为。

八建议

产品部

1.建议对于购买数量少,收藏加购少的商品进行优化。

市场部

1.建议投放广告时可以在18,14,11,16,17,12,10,13点,转化率较高。

运营部

1.建议将购买数量和收藏加购全都等于0的商品进行清仓处理。

2.建议保留商品种类的推送机制,重点优化具体商品的推送机制。

转载请注明:文章转载自 www.wk8.com.cn
本文地址:https://www.wk8.com.cn/it/279048.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 wk8.com.cn

ICP备案号:晋ICP备2021003244-6号