月度归档: 2019 年 9 月

TopK算法问题

本文总结下TopK相关算法,分为两个部分,一为讨论TopK问题的类型,二为相关的解题思路和C++代码实现。

TopK 问题一般为海量数据问题,可以分为两大类:

  • 找最大/最小的 K 个数

  这种问题一般分为两种类型,一为内存不够无法一次性加载,二为内存充足可以完全处理数据。

  • 找重复次数最大的 K 个数

  这种问题一般是涉及极其庞大的数据量,内存不可能一次性加载完成。必须采用 分治法

(更多…)

KMP算法

把 KMP 算法做个详细总结,写成博文。

主要分为四个部分:

  • KMP 中的前缀后缀

  • 构建 Next数组

  • KMP算法匹配过程

  • 源码示例.

(更多…)