编辑回复: 举例很生动,代码也正确。大家可以看下。
编辑回复: 正确
编辑回复: 同一个类别下的平均值。比如都属于同一个类别里面有10个点,那么新的中心点就是这10个点的中心点,一种简单的方式就是取平均值。比如我在文章里举了足球队的例子,一共有3个指标,每个球队都有这三个指标的特征值,那么新的中心点,就是取这个类别中的这些点 这三个指标特征值的平均值。。
编辑回复: 可以不用转换,之前已经用了:
data = pd.read_csv('data.csv', encoding='gbk')
train_x = data[["2019年国际排名","2018世界杯","2015亚洲杯"]]
得到的train_x是DataFrame数据结构,你也可以通过查看type(train_x),所以不用再转换了。
作者回复: Good Job
作者回复: 哈哈哈 这么说很形象
作者回复: KMeans每次运行结果不一定都相同,有一定随机性
编辑回复: 取特征值的平均值为中心点。
作者回复: 正确,Ronnyz的代码能力不错
编辑回复: 对 可以这么理解,你可以理解是K=3代表是三个类,分别对应Class1, Class2, Class3。我们需要先给这三个类分别指定3个中心点,然后做聚类。最后的聚类标签含义,是我们来标记的。
作者回复: 主要用于分类 和 回归
作者回复: 对 聚类算法有一定的随机性
作者回复: 0 和 2只是label,关键是和谁聚在一起
作者回复: 0, 1, 2只是label,关键是看 聚类出来的 谁和谁聚成了一类。这个数值没有具体含义的
作者回复: Good Sharing