AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
33455 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

051 | 社区检测算法之“模块最大化 ”

思考题
要点回顾
求解方法
计算方法
目标函数
社区含义
算法核心
定义
小结
模块最大化的基本原理
社区检测
模块最大化算法的基本思想

该思维导图由 AI 生成,仅供参考

一起来回顾下本周的内容。周一我们介绍了用图(Graph)来表达网页与网页之间的关系并计算网页的重要性,就是经典的 PageRank 算法。周三我们介绍了 PageRank 的一个姊妹算法,HITS 算法,并且分析了这两种算法的内在联系,这两类算法都希望给网页赋予一个权重来表达网页的重要性。
今天,我们来看一类完全不一样的网页分析工具,那就是希望把网页所代表的图分割成小块的图,或者叫图聚类,每个小聚类代表一个“社区”。这类分析有时候被称作图上面的“社区检测”(Community Detection),意思就是从一个图上挖掘出潜在的社区结构。

社区检测的简要历史

提到社区检测就不得不提到这么一位学者,他与我们今天要介绍的算法有非常紧密的联系,而且他的研究在 2000 年~2010 年间成了社区检测研究的标杆,影响了后续的大量研究工作。这位学者就是密歇根大学(University of Michigan)的物理学教授马克·纽曼(Mark Newman)。
1991 年,纽曼从牛津大学获得理论物理博士学位。在接下来的 10 年里,他在康奈尔大学和圣塔菲学院(Santa Fe Institute)分别担任博士后研究员和研究教授。2002 年,纽曼来到密歇根大学物理系担任教授,并且一直在这里进行网络科学(Network Science)的基础研究。
2006 年,纽曼在《物理评论》杂志上发表了一个叫“模块最大化”(Modularity Maximization)的社区检测算法。从某种程度上来说,这个算法很快就成了社区检测的标准算法,吸引了研究领域的广泛关注,激发了大量的针对这个算法的分析和研究。对这个算法的最原始论述,请参阅参考文献[1]和[2]。
今天我们就来讲一讲这个“模块最大化”算法的基本原理。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

模块最大化算法是一种用于社区检测的重要算法。该算法的基本思想是将网络分割成紧密连接的社区,以便更好地理解网络结构和关系。该算法的核心是通过最大化模块化目标函数来确定节点的社区分配,从而实现社区的划分。模块化目标函数衡量了节点之间的连接数与期望连接数之间的差异,以此来评估社区的紧密程度。为了解决这一离散优化问题,研究者使用了矩阵表达和特征向量的方法,类似于PageRank和HITS算法。通过对网络进行二分或多次二分,模块最大化算法可以应用于划分多个社区。最后,文章提出了一个思考题,即如何将网页的社区信息应用于学习网页的相关度。这篇文章深入浅出地介绍了模块最大化算法的基本原理和应用,对于对网络科学和社区检测感兴趣的读者具有很高的参考价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

全部留言(1)

  • 最新
  • 精选
  • 韩 * *
    同个社区只输出少量枢纽节点,提高topk结果多样性
    2019-08-03
收起评论
显示
设置
留言
1
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部