https://segmentfault.com/a/1190000008575379
## 简介
KMP 算法是一种改进的字符串匹配算法,KMP 算法是由 D.E.Knuth,J.H.Morris 和 V.R.Pratt 三人提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称 KMP 算法)。KMP 算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个 next() 函数实现,函数本身包含了模式串的局部匹配信息。
## 暴力匹配
有一个文本串 S 和一个模式串 P,现在要查找 P 在 S 中的位置。如果用暴力匹配的思路,
并假设现在文本串 S 匹配到 i 位置,模式串 P 匹配到 j 位置,则有:
1. 如果当前字符匹配成功(即 S[i] == P[j]),则 i++,j ++,继续匹配下一个字符。
2. 如果失配(即 S[i] != P[j]),重置 i = i - (j - 1),j = 0。相当于每次匹配失败时,
i 回退,j 被置为 0。
```cpp
int violenceSearch(const std::string& str, const std::string& match)
{
int strLen = str.size();
int matchLen = match.size();
if (strLen < matchLen)
return -1;
int i = 0;
int j = 0;
while (i < strLen && j < matchLen)
{
if (str[i] == match[j])
{
i++;
j++;
}
else
{
i = i - j + 1;
j = 0;
}
}
return j == matchLen ? i - j : -1;
}
```
## kmp匹配
模式串`ABCABD`计算出部分匹配表,匹配表如下:
| 字符 | A | B | C | A | B | D |
| --- | --- | --- | --- | --- | --- | --- |
| 匹配值 | 0 | 0 | 0 | 1 | 2 | 0 |
```cpp
/**
* 部分匹配值就是前缀和后缀的最长共有元素的长度。假设一个字符串 "hello",它的前缀有 h、he、hel、hell,
* 它的后缀有 ello、llo、lo、o。
*
* 假设模式字符串为:ABCAB
*
* A 没有前缀和后缀,公有元素长度为 0
* AB 的前缀有 A,后缀有 B,公有元素长度为 0
* ABC 的前缀有 A、AB,后缀有 BC、C,公有元素长度为 0
* ABCA 的前缀有 A、AB、ABC,后缀有 BCA、CA、A,公有元素长度为 1
* ABCAB 的前缀有 A、AB、ABC、ABCA,后缀有 BCAB、CAB、AB、B,公有元素长度为 2
* ABCABD 的前缀有 A、AB、ABC、ABCA、ABCAB,后缀有 BCABD、CABD、ABD、BD、D,公有元素长度为 0
* 所以 ABCABD 中每个字符对于的匹配值分别为 0、0、0、1、2、0。
*/
std::vector<int> getNext(const std::string &match)
{
int k = 0;
int len = match.size();
std::vector<int> next(len, 0);
for (int i = 1; i < len; ++i)
{
if (k > 0 && match[k] != match[i])
k = next[k - 1];
if (match[k] == match[i])
k++;
next[i] = k;
}
return next;
}
int kmp(const std::string &str, const std::string &match)
{
std::vector<int> next = getNext(match);
int k = 0;
for (int i = 0; i < str.size(); ++i)
{
if (k > 0 && match[k] != str[i])
k = next[k];
if (match[k] == str[i])
k++;
if (k == match.size())
return i - k + 1;
}
return -1;
}
```
- 空白目录
- 算法
- 排序
- 冒泡排序
- 选择排序
- 插入排序
- 归并排序
- 快速排序
- 计数排序
- 桶排序
- 基数排序
- 希尔排序
- 堆排序
- 二分查找
- 最小堆
- 最小索引堆
- 平衡二叉树(AVL tree)
- bitmap位图
- 布隆过滤器
- hashmap
- topK
- 跳表
- LRU Cache
- kmp
- 最小堆和堆排序
- 最短路径
- C++
- 运行时类型判断RTTI
- C++反射
- 手动实现智能指针
- 序列化实现
- rpc实现
- std::forward
- 函数指针的妙用
- C/C++
- std::function
- 同步队列
- 线程池实现
- std::promise
- 深入理解虚函数
- extern "C" 关键字讲解
- 大端小端的区别
- 简历
- 简历1
- redis
- 数据结构和对象
- sds
- list
- zskiplist
- 腾讯云redis面试题总结
- redis集群部署
- LeetCode
- 目标
- go基础
- 算法快速入门
- 数据结构篇
- 二叉树
- 链表
- 栈和队列
- 二进制
- 基础算法篇
- 二分搜索
- 排序算法
- 动态规划
- 算法思维
- 递归思维
- 滑动窗口思想
- 二叉搜索树
- 回溯法
- 其他
- 剑指offer
- 笔记
- git代理加速
- Linux
- vim大法
- vscode远程不能跳转
- cmake
- 设计模式
- 单例模式
- 简单工厂模式
- 外观模式
- 适配器模式
- 工厂方法模式
- 抽象工厂模式
- 生成器模式
- 原型模式
- 中介者模式
- 观察者模式
- 访问者模式
- 命令模式
- 网络编程
- epoll reactor模式
- linux timerfd系列函数总结
- IO
- mapreduce
- 反射器
- leo通信库
- Mutex
- Condition
- thread
- raft
- 协程
- hook
- 定时器
- 别人的面试经验
- 面试题
- vector崩溃问题
- JAVA
- Linux java环境配置
- ucore
- lab1
- FreeNOS
- leveldb
- 刷题笔记
- 回文串
- 前缀树
- 字符串查找
- 查找两个字符串a,b中的最长公共子串
- 动态规划
- golang
- 顺序循环打印实现
- 数据结构
- rpc运用
- python
- 单例
- 深拷贝浅拷贝
- 链表
- python基础题
- mysql
- 事务
- Linux
- 共享内存
- 刷题记录
- 贪心算法
- 动态规划
- 面试
- 腾讯C++面试
- 微众面试JD
- 迅雷网络面试
- 学习网址
- rabbitMq
