通过数据对用户进行聚类,这个思路的实现方法很难,需要熟悉业务和技术的通才,才能担任,或者互相能够站在更高的维度讨论问题。因为从思路来说,这个思路是由数据逆推用户类别,由于用户标签(姑且先这么叫吧)类别多样,角度不同,标准不同,在进行聚类时通常会进行降低复杂度处理。因此只有当样本数据量足够大时,才能够反映出一定的趋势,结果是不精准的。
而后续的围绕北京市指标做分类,其实也有潜在的分类标签,这些标签存在于思想认知中,并没有在数据中存在。
我把两个方向的分类一个称之为业务侧数据用户分类,一个称为用户侧现实用户分类。
结合实际情况,有侧重的对两个分类结果进行参考借鉴。
技术懂业务,跨界思维很重要。
展开