讲师介绍
王符伟,人工智能团队 Leader,负责技术管理、项目管理与产品研发,拥有 16 年 IT 实战经验。不仅擅长人工智能与大数据分析,而且有深厚的美术功底,对技术插画有着工程与艺术相结合的双项审美能力。善于将晦涩的技术拆解为趣味横生的艺术插画,降低技术理解难度。
问题背景
机器学习会根据数据是否拥有正确答案(标签)分为监督学习和无监督学习两种基本类别。无监督学习即使没有正确答案,也能学习到数据内部很多结构化特征,是一种经常与数据分析共同协作使用的技术。与监督学习相比,无监督学习有着成本低、学习精度高等优点。聚类是无监督学习当中最经典的算法,有层级聚类与非层级聚类等更加细分的算法种类,以此来匹配更加精准的业务场景。
因此,在什么样的情况下,依据数据的哪些特征,选择何种具体的算法就显得尤为重要。与此同时,无监督学习由于没有正确答案,所以如何对学习成果进行评估与解释也成为了一个非常重要的环节。
内容看点
在数据分析流程中实施 K-Means 聚类算法
通过 K-Means++ 增强聚类效果
用 elbow 与剪影分析等方法探索最佳簇数量
精选留言(1)