Algorithms – 老廖的个人博客

TopK算法问题

本文总结下TopK相关算法，分为两个部分，一为讨论TopK问题的类型，二为相关的解题思路和C++代码实现。

TopK 问题一般为海量数据问题，可以分为两大类：

这种问题一般分为两种类型，一为内存不够无法一次性加载，二为内存充足可以完全处理数据。

这种问题一般是涉及极其庞大的数据量，内存不可能一次性加载完成。必须采用 分治法。

把 KMP 算法做个详细总结，写成博文。

主要分为四个部分：

讨论几个二分查找的变换问题，主要分为两类：

重点是注意临界条件，小心会死循环。本文假设数组为单调递增。

总结一下缓存置换算法。

最近最不常使用，缓存容量满的时候，置换使用频次最小的那个。

最近最少使用，缓存容量满的时候，置换最长时间没有使用的那个。

LRU-k 有两个队列，一个队列是数据队列，一个队列是缓存队列，只有当数据队列数据的访问次数到达 K次，才将它放入缓存队列。

缓存队列按照 LRU 的方法置换数据。

给定一个排列，如 "aazz" ,求按照字典排列方式的下一个字符，这里是："azaz".

以 "aazz" 为例，字典序的算法步骤如下：

本例中为 'a', left = 1;

本例中为 'z', right = 3;

本例变成：'azaz';

结束条件: 如果第一步中，找不到左邻小于右邻的字符，则说明已经是字典序的最后一个排列了。