作者回复: 你好,对于你的第一个问题: 总结的很好! 对于你说的第三个差异来源:时间,如果真的想严谨的考虑,实践中也是有办法的,就是设置一个长时间的Holdback组,假设通过A/B测试我们发现实验组效果好,在之后做决策时,可以给绝大部分的用户(比如99%)实验组的体验(而不是全部100%用户),这时候一直留一个1%的holdback组(控制组的体验),这样的就可以看出随着时间的推移两者的差异如何变化。 对于你的第二个问题:如果将一组内所有用户一天的平均值当作一个样本,会出现几个问题: 1. 样本量会急剧减小,使得中心极限定理那以满足,统计计算难以展开; 2. 以天为单位可能会出现波动性,比如周中和周末的用户行为不同,给A/B测试造成额外的干扰; 3. 实验单位也不再是用户,这样话没有办法来衡量用户反应相关的指标。
作者回复: 这两篇KDD的文章不错: https://exp-platform.com/Documents/2014%20experimentersRulesOfThumb.pdf https://exp-platform.com/Documents/2009-ExPpitfalls.pdf
作者回复: 这里有一些比较好的英文书籍推荐: https://www.alexbirkett.com/ab-testing-books/
作者回复: 你好,下载率这个指标表征的其实是在大样本量下人们下载的概率,对于单个用户来说下载不下载是一个二元事件,那么对于多个用户来说就是二项分布,因为二项分布的定义就是”n个独立的是/非试验中成功的次数的离散概率分布“。
作者回复: 你好,最后一节的实战课程会把代码贴出的,中间的课程会通过案例重点讲解流程和经验。
作者回复: 你好,这里指的是每个用户的数据要超过30个,因为我们要算每个用户每日的平均使用时长。
作者回复: 先说结论:概率类指标在数据量大的情况下也可以使用t检验。 再说原因: 在大样本量的情况下(统计上定义为大于30,现在的大数据时代让我们的数据远远大于这个数值),t检验和z检验几乎是等价的,没有太大区别,所以大数据时代不要太纠结t或者是z。而且根据中心极限定理,这些指标都是近似服从正态分布的。
作者回复: 你好,由下载率的直方图可以看出其为正态分布,并且分布的中心在10%左右,因为正态分布时左右对称的,所以可以得出下载率的平均值为10%.
作者回复: 你好,你对中心极限定理的理解没有错,这个例子中的直方图我是用了1万名用户一个月的使用数据画出的,这里面因为是算用户的日均使用时间,所以你可以把每个用户每天的使用时间当做一个数据点,那么现在我们从这些样本中抽样,每个用户其实有30个数据点(一个月),相当于一次抽样,那么一万个用户就相当于抽样1万次,那这一万个用户(抽样)的均值t,也就是用户的日均使用时间,就符合中心极限定理定理了嘛。
作者回复: 你好,关于你的几个问题:1. ‘每分钟平均有 10 个人会看到广告’是我在这里直接告诉了结论而省去了数据分析(因为这里重点讲AB测试相关内容,我会省去一些不相关的数据分析),你可以认为是应用题的一个给定条件;2. ‘下载率集中分布在 0-30% 之间’这个是看直方图的横坐标得来的。