06 | 链表(上):如何实现LRU缓存淘汰算法?
王争
该思维导图由 AI 生成,仅供参考
今天我们来聊聊“链表(Linked list)”这个数据结构。学习链表有什么用呢?为了回答这个问题,我们先来讨论一个经典的链表应用场景,那就是 LRU 缓存淘汰算法。
缓存是一种提高数据读取性能的技术,在硬件设计、软件开发中都有着非常广泛的应用,比如常见的 CPU 缓存、数据库缓存、浏览器缓存等等。
缓存的大小有限,当缓存被用满时,哪些数据应该被清理出去,哪些数据应该被保留?这就需要缓存淘汰策略来决定。常见的策略有三种:先进先出策略 FIFO(First In,First Out)、最少使用策略 LFU(Least Frequently Used)、最近最少使用策略 LRU(Least Recently Used)。
这些策略你不用死记,我打个比方你很容易就明白了。假如说,你买了很多本技术书,但有一天你发现,这些书太多了,太占书房空间了,你要做个大扫除,扔掉一些书籍。那这个时候,你会选择扔掉哪些书呢?对应一下,你的选择标准是不是和上面的三种策略神似呢?
好了,回到正题,我们今天的开篇问题就是:如何用链表来实现 LRU 缓存淘汰策略呢? 带着这个问题,我们开始今天的内容吧!
五花八门的链表结构
相比数组,链表是一种稍微复杂一点的数据结构。对于初学者来说,掌握起来也要比数组稍难一些。这两个非常基础、非常常用的数据结构,我们常常会放到一块儿来比较。所以我们先来看,这两者有什么区别。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
链表在LRU缓存淘汰算法中的应用是本文的重点。文章通过比喻的方式解释了缓存淘汰策略的概念,并详细介绍了单链表、循环链表和双向链表的特点和应用场景。强调了用空间换时间的设计思想,以及在内存充足时选择空间复杂度较高但时间复杂度较低的算法或数据结构。此外,文章还提到了数组和链表的性能对比,以及基于链表实现LRU缓存淘汰算法的思路和时间复杂度。最后,文章留下了一个问题,即如何判断一个字符串是否是回文字符串,如果字符串是通过单链表来存储的,该如何判断是一个回文串,以及相应的时间空间复杂度。整体而言,本文通俗易懂,适合技术人员快速了解链表在LRU缓存淘汰算法中的应用。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《数据结构与算法之美》,新⼈⾸单¥68
《数据结构与算法之美》,新⼈⾸单¥68
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(824)
- 最新
- 精选
- glbfor.gtw置顶1 快慢指针定位中间节点(这里要区分奇偶情况) 1.1 奇数情况,中点位置不需要矫正 1.2 偶数情况,使用偶数定位中点策略,要确定是返回上中位数或下中位数 1.2.1 如果是返回上中位数,后半部分串头取next 1.2.2 如果是返回下中位数,后半部分串头既是当前节点位置,但前半部分串尾要删除掉当前节点 2 从中间节点对后半部分逆序,或者将前半部分逆序 3 一次循环比较,判断是否为回文 4 恢复现场 题外话,这种操作有点BT啊?实际运用场景中,也真的直接改变引用值吗?至少在多线程情况,要加N多锁(Read Write都要加锁),这个时间成本就不能简单用时间复杂度来衡量了。如果是用copy 机制,不论是倒置前半段还是后半段,至少有一段是需要n/2个节点副本的空间消耗的,那么空间复杂度就是O(n)??啦~跑题了,跑题了~~ 老师,你给我评价被~ 我比较容易钻牛角尖。。
作者回复: 👍 回答的非常好
2018-10-1111133 - sky置顶用快慢指针先找到中点,然后把后半段链表reversed,然后一个指针在头部,一个指针再中点,开始逐个比较,时间复杂度是O(n)
作者回复: 对的!👍
2018-10-09383 - Rain置顶Re Ydyhm: “数组简单易用,在实现上使用的是连续的内存空间,可以借助 CPU 的缓存机制,预读数组中的数据,所以访问效率更高。而链表在内存中并不是连续存储,所以对 CPU 缓存不友好,没办法有效预读。” 这里的CPU缓存机制指的是什么?为什么就数组更好了? ---- 我没有百度也没有Google。之前开发时遇到过,我斗胆说下。 CPU在从内存读取数据的时候,会先把读取到的数据加载到CPU的缓存中。而CPU每次从内存读取数据并不是只读取那个特定要访问的地址,而是读取一个数据块(这个大小我不太确定。。)并保存到CPU缓存中,然后下次访问内存数据的时候就会先从CPU缓存开始查找,如果找到就不需要再从内存中取。这样就实现了比内存访问速度更快的机制,也就是CPU缓存存在的意义:为了弥补内存访问速度过慢与CPU执行速度快之间的差异而引入。 对于数组来说,存储空间是连续的,所以在加载某个下标的时候可以把以后的几个下标元素也加载到CPU缓存这样执行速度会快于存储空间不连续的链表存储。 大牛请指正哈!
作者回复: 同学,太爱你了。写的太好了!就喜欢你这样的,减轻了我很多回复留言的工作量。👍
2018-10-04721627 - andavid置顶思考题: 使用快慢两个指针找到链表中点,慢指针每次前进一步,快指针每次前进两步。在慢指针前进的过程中,同时修改其 next 指针,使得链表前半部分反序。最后比较中点两侧的链表是否相等。 时间复杂度:O(n) 空间复杂度:O(1) https://github.com/andavid/leetcode-java/blob/master/note/234/README.md
作者回复: 思路正确,不过空间复杂度计算的不对,应该是O(1),不是O(n)。我们要看额外的内存消耗,不是看链表本身存储需要多少空间。
2018-10-0332443 - Liam置顶1 快慢指针定位中间节点 2 从中间节点对后半部分逆序 3 前后半部分比较,判断是否为回文 4 后半部分逆序复原 时间复杂度On, 空间复杂度O1 把LRU和回文都实现了一遍~~ 如果是双向链表,时间效率更高,看了下LinkedList,底层也是用双向链表实现
作者回复: 回答的很好!👍
2018-10-037244 - 姜威五、应用 1.如何分别用链表和数组实现LRU缓冲淘汰策略? 1)什么是缓存? 缓存是一种提高数据读取性能的技术,在硬件设计、软件开发中都有着非广泛的应用,比如常见的CPU缓存、数据库缓存、浏览器缓存等等。 2)为什么使用缓存?即缓存的特点 缓存的大小是有限的,当缓存被用满时,哪些数据应该被清理出去,哪些数据应该被保留?就需要用到缓存淘汰策略。 3)什么是缓存淘汰策略? 指的是当缓存被用满时清理数据的优先顺序。 4)有哪些缓存淘汰策略? 常见的3种包括先进先出策略FIFO(First In,First Out)、最少使用策略LFU(Least Frenquently Used)、最近最少使用策略LRU(Least Recently Used)。 5)链表实现LRU缓存淘汰策略 当访问的数据没有存储在缓存的链表中时,直接将数据插入链表表头,时间复杂度为O(1);当访问的数据存在于存储的链表中时,将该数据对应的节点,插入到链表表头,时间复杂度为O(n)。如果缓存被占满,则从链表尾部的数据开始清理,时间复杂度为O(1)。 6)数组实现LRU缓存淘汰策略 方式一:首位置保存最新访问数据,末尾位置优先清理 当访问的数据未存在于缓存的数组中时,直接将数据插入数组第一个元素位置,此时数组所有元素需要向后移动1个位置,时间复杂度为O(n);当访问的数据存在于缓存的数组中时,查找到数据并将其插入数组的第一个位置,此时亦需移动数组元素,时间复杂度为O(n)。缓存用满时,则清理掉末尾的数据,时间复杂度为O(1)。 方式二:首位置优先清理,末尾位置保存最新访问数据 当访问的数据未存在于缓存的数组中时,直接将数据添加进数组作为当前最有一个元素时间复杂度为O(1);当访问的数据存在于缓存的数组中时,查找到数据并将其插入当前数组最后一个元素的位置,此时亦需移动数组元素,时间复杂度为O(n)。缓存用满时,则清理掉数组首位置的元素,且剩余数组元素需整体前移一位,时间复杂度为O(n)。(优化:清理的时候可以考虑一次性清理一定数量,从而降低清理次数,提高性能。) 2.如何通过单链表实现“判断某个字符串是否为水仙花字符串”?(比如 上海自来水来自海上) 1)前提:字符串以单个字符的形式存储在单链表中。 2)遍历链表,判断字符个数是否为奇数,若为偶数,则不是。 3)将链表中的字符倒序存储一份在另一个链表中。 4)同步遍历2个链表,比较对应的字符是否相等,若相等,则是水仙花字串,否则,不是。 六、设计思想 时空替换思想:“用空间换时间” 与 “用时间换空间” 当内存空间充足的时候,如果我们更加追求代码的执行速度,我们就可以选择空间复杂度相对较高,时间复杂度小相对较低的算法和数据结构,缓存就是空间换时间的例子。如果内存比较紧缺,比如代码跑在手机或者单片机上,这时,就要反过来用时间换空间的思路。
作者回复: 👍
2018-10-0322378 - 姜威总结 一、什么是链表? 1.和数组一样,链表也是一种线性表。 2.从内存结构来看,链表的内存结构是不连续的内存空间,是将一组零散的内存块串联起来,从而进行数据存储的数据结构。 3.链表中的每一个内存块被称为节点Node。节点除了存储数据外,还需记录链上下一个节点的地址,即后继指针next。 二、为什么使用链表?即链表的特点 1.插入、删除数据效率高O(1)级别(只需更改指针指向即可),随机访问效率低O(n)级别(需要从链头至链尾进行遍历)。 2.和数组相比,内存空间消耗更大,因为每个存储数据的节点都需要额外的空间存储后继指针。 三、常用链表:单链表、循环链表和双向链表 1.单链表 1)每个节点只包含一个指针,即后继指针。 2)单链表有两个特殊的节点,即首节点和尾节点。为什么特殊?用首节点地址表示整条链表,尾节点的后继指针指向空地址null。 3)性能特点:插入和删除节点的时间复杂度为O(1),查找的时间复杂度为O(n)。 2.循环链表 1)除了尾节点的后继指针指向首节点的地址外均与单链表一致。 2)适用于存储有循环特点的数据,比如约瑟夫问题。 3.双向链表 1)节点除了存储数据外,还有两个指针分别指向前一个节点地址(前驱指针prev)和下一个节点地址(后继指针next)。 2)首节点的前驱指针prev和尾节点的后继指针均指向空地址。 3)性能特点: 和单链表相比,存储相同的数据,需要消耗更多的存储空间。 插入、删除操作比单链表效率更高O(1)级别。以删除操作为例,删除操作分为2种情况:给定数据值删除对应节点和给定节点地址删除节点。对于前一种情况,单链表和双向链表都需要从头到尾进行遍历从而找到对应节点进行删除,时间复杂度为O(n)。对于第二种情况,要进行删除操作必须找到前驱节点,单链表需要从头到尾进行遍历直到p->next = q,时间复杂度为O(n),而双向链表可以直接找到前驱节点,时间复杂度为O(1)。 对于一个有序链表,双向链表的按值查询效率要比单链表高一些。因为我们可以记录上次查找的位置p,每一次查询时,根据要查找的值与p的大小关系,决定是往前还是往后查找,所以平均只需要查找一半的数据。 4.双向循环链表:首节点的前驱指针指向尾节点,尾节点的后继指针指向首节点。 四、选择数组还是链表? 1.插入、删除和随机访问的时间复杂度 数组:插入、删除的时间复杂度是O(n),随机访问的时间复杂度是O(1)。 链表:插入、删除的时间复杂度是O(1),随机访问的时间复杂端是O(n)。 2.数组缺点 1)若申请内存空间很大,比如100M,但若内存空间没有100M的连续空间时,则会申请失败,尽管内存可用空间超过100M。 2)大小固定,若存储空间不足,需进行扩容,一旦扩容就要进行数据复制,而这时非常费时的。 3.链表缺点 1)内存空间消耗更大,因为需要额外的空间存储指针信息。 2)对链表进行频繁的插入和删除操作,会导致频繁的内存申请和释放,容易造成内存碎片,如果是Java语言,还可能会造成频繁的GC(自动垃圾回收器)操作。 4.如何选择? 数组简单易用,在实现上使用连续的内存空间,可以借助CPU的缓冲机制预读数组中的数据,所以访问效率更高,而链表在内存中并不是连续存储,所以对CPU缓存不友好,没办法预读。 如果代码对内存的使用非常苛刻,那数组就更适合。
作者回复: 👍
2018-10-037154 - JStFsLRU:活在当下。比如在公司中,一个新员工做出新业绩,马上会得到重用。 LFU:以史为镜。还是比如在公司中,新员工必须做出比那些功勋卓著的老员工更多更好的业绩才可以受到老板重视,这样的方式比较尊重“前辈”。
作者回复: 哈哈 形象!
2018-10-04358 - 岁月如歌设计lru算法的思路,不管用什么数据结构,都要考虑的几个问题。 1、如何表示最近访问的数据和最早访问的数据 2、如何查找是否缓存了 3、数据有缓存,如何处理 4、数据没有缓存,如何处理 1.缓存未满 2.缓存已满
作者回复: 👍 总结的很好
2018-10-12226 - 5ispy老师好,关于这节的内容有个疑问不太确定。 因为我看有人用java实现了链表有人也可以用c来实现。是不是数组属于编程语言“自带”的,而链表是 人 用编程语言 “实现”的。 比如对于java来说,如果项目中用到了链表,我们可以说是用到了某个类,而这个类就是 链表(实现了链表的功能)。 恳请老师指正!
作者回复: 你理解的没错
2018-10-10320
收起评论