python 数据逐个验证_案例实战 | Python 实现 AB 测试中常见的分层抽样与假设检验 (附代码和数据集)...-基礎知識庫-匯編語言學習筆記

python 数据逐个验证_案例实战 | Python 实现 AB 测试中常见的分层抽样与假设检验 (附代码和数据集)...

2023-09-13 阅读 30 评论 0

摘要：在这里插入图片描述作者 l 萝卜本文会将原理知识穿插于代码段中，相关代码和数据集可在公众号 “ 数据分析与商业实践 ” 后台回复 " AB测试 " 获取。前言在电商网站 AB 测试非常常见，是将统计学与程序代码结合的经典案例之一。尽管如此，里面还是

在这里插入图片描述

作者 l 萝卜

本文会将原理知识穿插于代码段中，相关代码和数据集可在公众号 “ 数据分析与商业实践 ” 后台回复 " AB测试 " 获取。

前言

在电商网站 AB 测试非常常见，是将统计学与程序代码结合的经典案例之一。尽管如此，里面还是有许多值得学习和注意的地方。

python为什么叫爬虫？A/B 测试用于测试网页的修改效果(浏览量，注册率等)，测试需进行一场实验，实验中控制组为网页旧版本，实验组为网页新版本，实验还需选出一个指标来衡量每组用户的参与度，然后根据实验结果来判断哪个版本效果更好。

通过这些测试，我们可以观察什么样的改动能最大化指标，测试适用的改动类型十分广泛，上到增加元素的大改动，下到颜色小变动都可使用这些测试。

背景

在本次案例研究中，我们将为教育平台 “ 不吹牛分析网 ” 分析 A/B 测试的结果，以下是该公司网站的客户漏斗模型：浏览主页 > 浏览课程概述页面(课程首页) > 注册课程 > 付费并完成课程

图片来自网络

越深入漏斗模型，不吹牛分析网就会流失越多的用户(正常现象)，能进入最后阶段的用户寥寥无几。为了提高参与度，提高每个阶段之间的转化率，萝卜试着做出一些改动，并对改动进行了 A/B 测试，我们将帮萝卜分析相关测试结果，并根据结果建议是否该实现页面改版。

网络爬虫python。因为利用 Python 进行 A/B 测试在每个数据集上的使用大同小异，所以我们这里只展示课程首页的A/B测试过程，其余页面的数据集会一并提供给大家作为练习。

Python 实战

数据读入

在这里插入图片描述

参数说明：

python爬虫菜鸟教程。timestamp：浏览时间

id：用户 id

group：用户所属组别

action：用户行为，view--仅浏览；enroll--浏览并注册

duration：浏览界面时长(浏览越久，可能越感兴趣，就越有可能注册)

点击率分析

python django，点击率 (CTR: click through rate)通常是点击数与浏览数的比例。因为网站页面会使用 cookies，所以我们可以确认单独用户，确保不重复统计同一个用户的点击率。为了进行该实验，我们对点击率作出如下定义：CTR: 单独用户点击数 / 单独用户浏览数，这一需要注意的点可以使用 pandas 中的 nunique() 函数来快捷完成

在这里插入图片描述

同理，实验组的计算方式相同，结果分析如下：

[图片上传失败...(image-de8716-1598879560241)]

根据已有数据，我们通常会猜测会不会是新界面更加能够吸引用户停留并浏览，从而达到用户浏览时间越长，就越有可能注册课程。

浏览时长分析

python 类。可视化分析

这里的我们将使用 seaborn 结合 markdown 公式的方式来实现快捷又强大的数据可视化：

在这里插入图片描述

结果分析

新界面的注册率有所提高，而浏览时长方面均呈现轻微的右偏

python有什么用，实验组的浏览时长平均值比控制组高 15mins 左右，方差差别不大

所以我们可以初步判断新改版的课程首页更吸引用户，后续将进行假设检验来进一步验证我们的猜想。