作者回复: 原文:A/B测试的目的依然是为了数据分析,因此通常被当作大数据平台的一部分。
A/B测试是大数据分析和大数据平台的重要组成部分,但是关于A/B测试系统架构的资料非常少,如果说Hadoop、Spark的资料你可以从网上随便搜,那么完整的A/B测试系统架构的资料可能只有这个专栏才有了。
多说两句,Google发表大数据论文距今15年了,Hadoop开源也十几年了,Spark出现也快10年了,如果我们今天学大数据还是眼里只有Hadoop、Spark,真的太OUT了。大数据生态体系包括Hadoop这样的大数据产品,还包括大数据平台、大数据分析、大数据机器学习,我的专栏是一个关于大数据技术体系的完整知识框架,希望能对你学习大数据起到作用。
作者回复: 是的,可以根据需求设计实验
作者回复: A/B测试可以理解成在原来的打点基础上增加了实验ID和分组ID,数据存储和结构跟原来一样,SQL统计的时候根据ID分别统计,就得到各个实验分组的PV转化率这些指标。
作者回复: pv uv 留存各种数据指标下降了,就是不喜欢
作者回复: 流量划分需要尽量随机,保证实验结果客观,不应该有太多的划分方式。