作者回复: 是,不过两害取其轻也只能如此
作者回复: 哈哈,尽量深入浅出
作者回复: 那就不是随机了,对么
作者回复: 是的,很基本的数据手段
作者回复: 是的!
作者回复: 那样本要分成多份测试吧,要不10个人全算阳性就惨了。
作者回复: 究竟不是所有数据,很可能出现偏差,特别是整体数据分布不确定的情况下。
作者回复: 没太懂你的意思,可以用分布式数据库或者缓存来做这个事情,不用重复造轮子
作者回复: 额。。。游泳池,或者换成大房子?
作者回复: 第一个问题,是的,不过要提前利用领域知识来给出结论,否则就是一个悖论,如果你要知道分布就要统计分析,如果你要统计分析那么就要抽样。 第二个问题,如果在数据源没有处理好的情况下,有这个可能的,一般处理数据都会去重。