编辑回复: 对 和数据集特点有关系,不过数据集大的情况下,不好观察特征。我们可以通过设置最小值支持度和最小置信度来观察关联规则的结果。
一般来说最小支持度常见的取值有0.5,0.1, 0.05。最小置信度常见的取值有1.0, 0.9, 0.8。可以通过尝试一些取值,然后观察关联结果的方式来调整最小值尺度和最小置信度的取值。
作者回复: 哈哈
作者回复: Good Job
作者回复: 有一个工具包 import fptools as fp 你可以试试
作者回复: Good Job 滢
作者回复: import fptools as fp 这个也可以
作者回复: Good Sharing
作者回复: 看来你还是对统计学感兴趣,可以看下《统计数据会说谎》 这本不错,哈哈
作者回复: python 3
作者回复: Good Job
编辑回复: 我的技巧就是不断的尝试,另外XPath是有自己规则的,99%的情况下都是以//开头,因为想要匹配所有的元素,然后找一些关键的特征来进行匹配,比如class='item-root'的节点,或者id='root'都是很好的特征。通过观察id或class,可以自己编写XPath,这样写的XPath会更短。总之,都是要不断的尝试,才能找到自己想要找的内容。寻找XPath的过程就是一个找规律的过程。
编辑回复: 一般来说最小置信度都会大一些,比如1.0, 0.9或者0.8。最小支持度和数据集大小和特点有关,可以尝试一些数值来观察结果,比如0.1, 0.5
作者回复: 对 不同导演的数据集差别很大
作者回复: 哈哈哈 明白了就好