一次倒在LRU上的经历(一)

发布于 2022-7-7 17:02
浏览
0收藏

 

前言
大家好,我是bigsai,好久不见,甚是想念!

最近有个小伙伴跟我诉苦,说他没面到LRU,他说他很久前知道有被问过LRU的但是心想自己应该不会遇到,所以暂时就没准备。

奈何不巧,这还就真的考到了!他此刻的心情,可以用一张图来证明:

一次倒在LRU上的经历(一)-开源基础软件社区

他说他最终踉踉跄跄的写了一个效率不是很高的LRU,面试官看着不是很满意要求写一个O(1)复杂度的LRU……后来果真GG了,后来发现这是力扣146的一道原题。

防止日后再碰到这个坑,今天和大家一起把这个坑踩了,这道题我自身刚开始也是用较为普通的方法,但是好的方法虽然不是很难但是想了真的很久才想到,虽然花了太多时间不太值,总算是自己想出来了,将这个过程给大家分享一下(只从算法的角度,不从操作系统的角度)。

一次倒在LRU上的经历(一)-开源基础软件社区

理解LRU
设计一个LRU,你得知道什么是LRU吧?

LRU,英文全称为Least Recently Used,翻译过来就是最近最久未使用算法,是一种常用的页面置换算法。

说起页面置换算法,这就是跟OS关系比较大的了,我们都知道内存的速度比较快,但是内存的容量是非常有限的,不可能给所有页面装到内存中,所以就需要一个策略将常用的页面预放到内存中。

但是吧,谁也不知道进程下次会访问哪个内存,并不能很有效的知道(我们在当前并没有预测未来的功能),所以有些页面置换算法只是理想化但是没法真实实现的(没错就是最佳置换算法(Optimal)),然后常见必回的算法就是FIFO(先进先出)和LRU(最近最久未使用)。

LRU理解不难,就是维护一个有固定大小的容器,核心就是get()和put()两个操作。

一次倒在LRU上的经历(一)-开源基础软件社区

我们先看一下LRU会有的两个操作:

初始化:LRUCache(int capacity) ,以正整数作为容量 capacity 初始化 LRU 缓存。

查询:get(int key),从自己的设计的数据结构中查找是否有当前key对应的value,如果有那么返回对应值并且要将key更新记录为最近使用,如果没有返回-1。

插入/更新:put(int key,int value),可能是插入一个key-value,也可能是更新一个key-value,如果容器中已经存才这个key-value那么只需要更新对应value值,并且标记成最新。如果容器不存在这个值,那么要考虑容器是否满了,如果满了要先删除最久未使用的那对key-value。

这里的流程可以给大家举个例子,例如

容量大小为2:
[ "put",  "put", "get", "put","get", "put","get","get","get"]
[ [1, 1], [2, 2], [1], [3, 3], [2], [4, 4], [1],  [3], [4]]

这个过程如下:

一次倒在LRU上的经历(一)-开源基础软件社区

大家容易忽略的细节有:

  • put()存在更新的操作,例如put(3,3),put(3,4)会更新key为3的操作。
  • get()可能查询不到,但是查询到也会更新最久未使用的顺序。
  • 如果容器未使用满,那么put可能更新可能插入,但是不会删除;如果容器满了并且put插入,就要考虑删除最久未使用的key-value了。
    对于上面的这么一个规则,我们该如何处理呢?

如果单单用一个List类似的列表,可以顺序存储键值对,在List前面的(0下标为前)我们认为它是比较久的,在List后我们认为它是比较新的。我们考虑下各种操作可能会这样设计:

如果来get操作:

遍历List一个个比对,查看是否有该key的键值对,如果有直接返回对应key的value,如果没有那么返回-1.
如果来put操作:

遍历List,如果有该key的键值对,那么果断删除这个key-value,最后在末尾统一插入该键值对。

如果没有对应的key并且List容器已经到达最满了,那么果断删除第一个位置的key-value。
用List可能需要两个(一个存key一个存value),或者一个存Node节点(key,value为属性)的List,考虑下这个时间复杂度:

put操作:O(n),get操作:O(n) 两个操作都需要枚举列表线性复杂度,效率属实有点拉胯,肯定不行,这样的代码我就不写了。

一次倒在LRU上的经历(一)-开源基础软件社区

哈希初优化

从上面的分析来看,我们已经可以很自信的将LRU写出来了,不过现在要考虑的是一个优化的事情。

如果说我们将程序中引入哈希表,那么肯定会有一些优化的。用哈希表存储key-value,查询是否存在的操作都能优化为O(1),但是删除或者插入或者更新位置的复杂度可能还是O(n),我们一起分析一下:

最久未使用一定是一个有序的序列来储存,要么是顺序表(数组)要么是链表,如果是数组实现的ArrayList存储最久未使用这个序列。

如果是ArrayList进行删除最久未使用(第一个)key-value,新的key被命中变成最新被使用(先删除然后插入末尾)操作都是O(n)。

同理如果是LinkedList的一些操作大部分也是O(n)的,像删除第一个元素这个是因为数据结构原因O(1)。

你发现自己的优化空间其实非常非常小,但是确实还是有进步的,只是被卡住不知道双O(1)的操作究竟怎么优化,这里面我把这个版本代码放出来,大家可以参考一下(如果面试问到实在不会可以这么写)

class LRUCache {

    Map<Integer,Integer>map=new HashMap<>();
    List<Integer>list=new ArrayList<>();
    int maxSize;
    public  LRUCache(int capacity) {
        maxSize=capacity;
    }

    public int get(int key) {
        if(!map.containsKey(key))//不存在返回-1
            return -1;
        int val=map.get(key);
        put(key,val);//要更新位置 变成最新 很重要!
        return val;
    }

    public void put(int key, int value) {
        //如果key存在,直接更新即可
        if (map.containsKey(key)) {
            list.remove((Integer) key);
            list.add(key);
        } else {//如果不存在 要插入到最后,但是如果容量满了需要删除第一个(最久)
            if (!map.containsKey(key)) {
                if (list.size() == maxSize) {
                    map.remove(list.get(0));
                    list.remove(0);
                }
                list.add(key);
            }
        }
        map.put(key, value);
    }
}

 

文章转自公众号:bigsai

标签
已于2022-7-7 17:02:35修改
收藏
回复
举报
回复
添加资源
添加资源将有机会获得更多曝光,你也可以直接关联已上传资源 去关联
    相关推荐