数据结构与算法之美
王争
前Google工程师
立即订阅
71638 人已学习
课程目录
已完结 75 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (1讲)
开篇词 | 从今天起,跨过“数据结构与算法”这道坎
免费
入门篇 (4讲)
01 | 为什么要学习数据结构和算法?
02 | 如何抓住重点,系统高效地学习数据结构与算法?
03 | 复杂度分析(上):如何分析、统计算法的执行效率和资源消耗?
04 | 复杂度分析(下):浅析最好、最坏、平均、均摊时间复杂度
基础篇 (38讲)
05 | 数组:为什么很多编程语言中数组都从0开始编号?
06 | 链表(上):如何实现LRU缓存淘汰算法?
07 | 链表(下):如何轻松写出正确的链表代码?
08 | 栈:如何实现浏览器的前进和后退功能?
09 | 队列:队列在线程池等有限资源池中的应用
10 | 递归:如何用三行代码找到“最终推荐人”?
11 | 排序(上):为什么插入排序比冒泡排序更受欢迎?
12 | 排序(下):如何用快排思想在O(n)内查找第K大元素?
13 | 线性排序:如何根据年龄给100万用户数据排序?
14 | 排序优化:如何实现一个通用的、高性能的排序函数?
15 | 二分查找(上):如何用最省内存的方式实现快速查找功能?
16 | 二分查找(下):如何快速定位IP对应的省份地址?
17 | 跳表:为什么Redis一定要用跳表来实现有序集合?
18 | 散列表(上):Word文档中的单词拼写检查功能是如何实现的?
19 | 散列表(中):如何打造一个工业级水平的散列表?
20 | 散列表(下):为什么散列表和链表经常会一起使用?
21 | 哈希算法(上):如何防止数据库中的用户信息被脱库?
22 | 哈希算法(下):哈希算法在分布式系统中有哪些应用?
23 | 二叉树基础(上):什么样的二叉树适合用数组来存储?
24 | 二叉树基础(下):有了如此高效的散列表,为什么还需要二叉树?
25 | 红黑树(上):为什么工程中都用红黑树这种二叉树?
26 | 红黑树(下):掌握这些技巧,你也可以实现一个红黑树
27 | 递归树:如何借助树来求解递归算法的时间复杂度?
28 | 堆和堆排序:为什么说堆排序没有快速排序快?
29 | 堆的应用:如何快速获取到Top 10最热门的搜索关键词?
30 | 图的表示:如何存储微博、微信等社交网络中的好友关系?
31 | 深度和广度优先搜索:如何找出社交网络中的三度好友关系?
32 | 字符串匹配基础(上):如何借助哈希算法实现高效字符串匹配?
33 | 字符串匹配基础(中):如何实现文本编辑器中的查找功能?
34 | 字符串匹配基础(下):如何借助BM算法轻松理解KMP算法?
35 | Trie树:如何实现搜索引擎的搜索关键词提示功能?
36 | AC自动机:如何用多模式串匹配实现敏感词过滤功能?
37 | 贪心算法:如何用贪心算法实现Huffman压缩编码?
38 | 分治算法:谈一谈大规模计算框架MapReduce中的分治思想
39 | 回溯算法:从电影《蝴蝶效应》中学习回溯算法的核心思想
40 | 初识动态规划:如何巧妙解决“双十一”购物时的凑单问题?
41 | 动态规划理论:一篇文章带你彻底搞懂最优子结构、无后效性和重复子问题
42 | 动态规划实战:如何实现搜索引擎中的拼写纠错功能?
高级篇 (9讲)
43 | 拓扑排序:如何确定代码源文件的编译依赖关系?
44 | 最短路径:地图软件是如何计算出最优出行路径的?
45 | 位图:如何实现网页爬虫中的URL去重功能?
46 | 概率统计:如何利用朴素贝叶斯算法过滤垃圾短信?
47 | 向量空间:如何实现一个简单的音乐推荐系统?
48 | B+树:MySQL数据库索引是如何实现的?
49 | 搜索:如何用A*搜索算法实现游戏中的寻路功能?
50 | 索引:如何在海量数据中快速查找某个数据?
51 | 并行算法:如何利用并行处理提高算法的执行效率?
实战篇 (5讲)
52 | 算法实战(一):剖析Redis常用数据类型对应的数据结构
53 | 算法实战(二):剖析搜索引擎背后的经典数据结构和算法
54 | 算法实战(三):剖析高性能队列Disruptor背后的数据结构和算法
55 | 算法实战(四):剖析微服务接口鉴权限流背后的数据结构和算法
56 | 算法实战(五):如何用学过的数据结构和算法实现一个短网址系统?
加餐:不定期福利 (6讲)
不定期福利第一期 | 数据结构与算法学习书单
不定期福利第二期 | 王争:羁绊前行的,不是肆虐的狂风,而是内心的迷茫
不定期福利第三期 | 测一测你的算法阶段学习成果
不定期福利第四期 | 刘超:我是怎么学习《数据结构与算法之美》的?
总结课 | 在实际开发中,如何权衡选择使用哪种数据结构和算法?
《数据结构与算法之美》学习指导手册
加餐:春节7天练 (7讲)
春节7天练 | Day 1:数组和链表
春节7天练 | Day 2:栈、队列和递归
春节7天练 | Day 3:排序和二分查找
春节7天练 | Day 4:散列表和字符串
春节7天练 | Day 5:二叉树和堆
春节7天练 | Day 6:图
春节7天练 | Day 7:贪心、分治、回溯和动态规划
加餐:用户学习故事 (2讲)
用户故事 | Jerry银银:这一年我的脑海里只有算法
用户故事 | zixuan:站在思维的高处,才有足够的视野和能力欣赏“美”
结束语 (3讲)
结束语 | 送君千里,终须一别
第2季回归 | 这一次,我们一起拿下设计模式!
打卡召集令 | 60 天攻克数据结构与算法
免费
数据结构与算法之美
登录|注册

30 | 图的表示:如何存储微博、微信等社交网络中的好友关系?

王争 2018-11-30
微博、微信、LinkedIn 这些社交软件我想你肯定都玩过吧。在微博中,两个人可以互相关注;在微信中,两个人可以互加好友。那你知道,如何存储微博、微信等这些社交网络的好友关系吗?
这就要用到我们今天要讲的这种数据结构:图。实际上,涉及图的算法有很多,也非常复杂,比如图的搜索、最短路径、最小生成树、二分图等等。我们今天聚焦在图存储这一方面,后面会分好几节来依次讲解图相关的算法。

如何理解“图”?

我们前面讲过了树这种非线性表数据结构,今天我们要讲另一种非线性表数据结构,(Graph)。和树比起来,这是一种更加复杂的非线性表结构。
我们知道,树中的元素我们称为节点,图中的元素我们就叫作顶点(vertex)。从我画的图中可以看出来,图中的一个顶点可以与任意其他顶点建立连接关系。我们把这种建立的关系叫作(edge)。
我们生活中就有很多符合图这种结构的例子。比如,开篇问题中讲到的社交网络,就是一个非常典型的图结构。
我们就拿微信举例子吧。我们可以把每个用户看作一个顶点。如果两个用户之间互加好友,那就在两者之间建立一条边。所以,整个微信的好友关系就可以用一张图来表示。其中,每个用户有多少个好友,对应到图中,就叫作顶点的(degree),就是跟顶点相连接的边的条数。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《数据结构与算法之美》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(105)

  • 传说中的成大大
    学了这么久的数据结构和算法,今天突然顿悟,基础的数据结构就是数组和链表, 而后面更加复杂的 树 队列 图 等等 都可以通过数组和链表等方式存储, 出现树 队列 图 等数据结构的原因 就是为了解决 部分问题处理过程中时间复杂度过高的问题, 所以数据结构就是为了算法而生的! 尤其是学习了时间复杂度过后 在工作和学习过程中 就应该分析自己的代码复杂度 以进行优化或者选择更好的数据结构和算法!这样才能写出更好的代码更好的解决问题
    2018-11-30
    7
    331
  • Jerry银银
    地图

    网络

    Gradle这个编译工具,内部组织task的方式用的是有向图

    Android framework层提供了一个CoordinatorLayout,其内部协调子view的联动,也是用的图

    作者回复: 👍

    2018-11-30
    11
    70
  • 黄金的太阳
    请教老师
    解决现实问题的时候当存储图有多种选择,例如:
    1.用邻接表自己存
    2.关系型库
    3.图数据库
    那么这三种方式每一种的适用场景,优缺点分别是什么呢?该如何取舍

    作者回复: 1 内存中用临界表
    2 要持久化存储就用数据库
    2 超大图 并且涉及大量图计算。用专业的图数据库

    2018-12-04
    1
    42
  • 五岳寻仙
    课后思考题:
    1. 微信好友关系存储方式。无向图,也可以使用邻接表的方式存储每个人所对应的好友列表。为了支持快速查找,好友列表可以使用红黑树存储。
    2. 生活工作中应用图的例子。很多,互联网上网页之间通过超链接连接成一张有向图;城市乃至全国交通网络是一张加权图;人与人之间的人际关系够成一张图,著名的六度分割理论据说就是基于这个得到的。

    作者回复: 👍

    2018-11-30
    1
    33
  • 花见笑
    学到现在有一种特别明显的感受就是描述一种需求模型可以有很多种组合数据结构,而这些复杂数据结构都是基础数据结构组合起来的,而这些数据结构去的选择又是基于需求模型对时间和空间这两个维度来的,所以解决问题的关键是我们都需求的理解以及我们对数据结构的熟练运用。
    2018-12-01
    27
  • 汝林外史
    真心感谢王老师,以前看见数据结构和算法都直接略过,感觉很难啃直接就放弃了,不求甚解,经过这段时间得学习发现自己还是可以学的会的,而且也慢慢喜欢看这些数据结构了,老师的功力真的很深厚!
    2018-12-06
    20
  • 鹏程万里
    判断用户 A 是否关注了用户 B; 判断用户 A 是否是用户B的粉丝。这两个操作我怎么觉得是一个意思呢?

    作者回复: 好像是的 第二个应该是 判断a是否被b关注

    2018-12-03
    15
  • 🐱您的好友William🐱
    刚刚还在写Topology Sort,就是leetcode那个给课程先后顺序排列的题。我还知道社交Graph在推荐系统中应用非常广泛(腾讯的人亲口说这是他们很多产品的最大亮点,因为可以做社交)。使用了social trust的推荐系统非常的robust且能够经受大规模水军的攻击,因为水军无法取得用户的trust(graph中无法建立联系),所以水军的行为在推荐系统中会被认为对给用户的影响会非常的小,使得系统的预测基本不变。
    2018-11-30
    15
  • 微418信Im团a队teapot
    微信也是有向图吧……微信单方面删除好友之后另一方仍然会显示在好友列表中的啊(俗称僵尸)

    作者回复: 哈哈,在这个问题上,从你的昵称来看,你最有发言权了。

    2019-02-08
    14
  • ppingfann
    微信社交关系的存储方式

    因为顶点的数量大且关系相对少,所以不适合用邻接矩阵来存储,应该用邻接表来存储。
    微信社交关系的相关操作:1. 判断A、B是否为好友关系 2. A删除B,断开与B的好友关系 3. 展示出A的所有好友,并按名称首字母进行排序

    因为是无向图,所以我们仅需要一个邻接表就行了,然后将链表改造为跳表增加查找速度且在列出好友是会比较方便。最后,若有n台机器可供使用,那么我们可以对n取余来划分这些数据到不同的机器上,毕竟微信的用户量太大,一个机器的内存应该是不够用的。
    2018-11-30
    12
  • 姜戈
    有序动态数组能否讲解一下

    作者回复: 数据有序排列的动态数组

    2018-11-30
    12
  • Jeff.Smile
    早上没事看一篇打个卡,争哥,您早上几点起床啊,感觉您平时回复好早!

    作者回复: 我6点左右起来😂

    2019-09-30
    5
  • qinggeouye
    复杂网络可以说也是基于图,抽象出来的随机网络、小世界网络、无标度网络等都可以用图表示;根据图的组成基本要素:节点和边,现实世界中只要可以将具体的事物抽象出节点,并且节点之间是有联系的,那么应该都可以成为图;比如以城市机场作为节点,城市之间的航班飞行网络;...
    2018-12-23
    5
  • 任雪龙
    终于到图了,感觉有点小激动呢
    2018-11-30
    2
    5
  • Monday
    第1题:使用邻接表存储,并且使用改进升级版(使用跳表或散列表等)
    第2题:1)我司所开发的工作流项目描述的就是有向图。2)小到公交车/地铁网络图,大到国家的铁路分布图。3)韩国偶像局,人物之间的暗恋关系。4)ETL跑批时,各JOB之间的依赖关系。。。等等等等太多了

    作者回复: 👍

    2018-12-04
    3
  • qpm
    微信的用户无向图中,首先为了节约空间,采用的要是邻接表的方式,由于数据量巨大,进一步关于存储的优化和老师文中记述的类似。
    图的数据结构相对其他数据结构而言是更加贴合生活场景的,事物和联系的信息可以映射为节点和边,例如百度在地图中的寻路功能应该是要利用到节点和边权重等方面的信息,期待老师对图的用法做更深入的讲解。
    最后我希望提一个关于邻接表的问题,文中邻接表中,‘节点’指向的是下一个‘节点’的信息,那么‘边’的信息应该如何保存?要是‘节点’指向的是‘边’的信息,‘边’自己又包含另一头‘节点’的下标,这样的存储方式虽然不是很直观,但是也是一种有效的存储方式。老师是否可以就‘邻接表’上‘边’的存储讲解一下?

    作者回复: 实际上 我们并不需要显示的存储边 具体存储方式你可以看下一节课开头的代码

    2018-12-02
    3
  • yongxiang
    问题一:
    微信好友:
    1、微信的好友关系是稀疏矩阵,为了减少空间浪费,使用邻接表;
    2、为了提高查找效率,将邻接表中的链表改为支持快速查找的动态数据结构,这里使用红黑树、跳表都可以,考虑到好友列表是按照字母排序的,可以使用跳表
    问题二:
    图的例子还有:操作系统的资源分配图是有向图,用来分析死锁问题。
    2018-12-01
    3
  • 不靠谱的琴谱
    有向图的矩阵下标2 0和3 2的1和0感觉画反了,还有带权图线上面表示的是5矩阵里面表示的5 3不是很理解

    作者回复: adj行列都是从1开始的。我检查了一下 好像没画错

    2018-11-30
    3
  • Knight²º¹⁸
    图只是逻辑上的一个概念,把实体的关系反映在一张图上,实际储存等操作本质上还是数组+链表,因此优化手段也就是前面所讲到的散列、二叉平衡查找树、跳表等
    2019-05-30
    2
  • 想当上帝的司机
    感觉最后数据库中那张表用起来就能满足需求了,上面说的图的优势是什么呢
    2018-12-24
    2
收起评论
99+
返回
顶部