## 课后小视频之字符串查找之 Rabin Karp 算法 算法视频QQ\_1603159172
这种算法的本质是用hash function把字符串之间的比较由O(m)长的时间变为O(1)
### hash function
哈希表就是个大数组, hash function是个把字符串, float, double, int都转换到数组一个位置的mapping.
#### ABCDE
\= (a \* 31^4 + b \* 31^3 + c \* 31^2 + d \* 31 + e) % 10^6
其中31是个经验值, hash size 10^6, 越大越不容易重, 越小越容易冲突, 所以选一个不越界的大的值
如果用int的话, 保证 31 \* 10^6不越界.
如果用10^8的话, 就需要long int 了
key到value唯一, 反之不成立. abc 只等于123, cde也只等与123, 但是123对应两个string
```cpp
#include <iostream>
#include <string>
using namespace std;
bool matchStr(const string& str, const string& match) {
/**
* abcd
* (a*31^3 + b*31^2 + c*31^1 + d) % 10^6
*/
int Base = 1000000;
int len = match.size();
int code = 0;
int power = 1;
for (auto c : match) {
code = (code * 31 + c) % Base;
power = (power * 31) % Base;
}
int hash = 0;
for (int i = 0; i < str.size(); i++) {
hash = (hash * 31 + str[i]) % Base;
if (i < len - 1)
continue;
if (i >= len) {
hash = hash - str[i - len] * power;
if (hash < 0) hash += Base; // str[i - len] * power > Base, +Base是上面 %Base 取余减多的
}
if (hash == code) {
if (match.compare(str.substr(i - len + 1, len)) == 0) {
return true;
}
}
}
return false;
}
int main() {
string match, str;
while (cin >> match >> str) {
bool isMatch = matchStr(str, match);
if (isMatch) {
cout << "true" << endl;
} else {
cout << "false" << endl;
}
}
return 0;
}
```
#include <iostream>
#include <vector>
using namespace std;
struct Maxheap {
int capacity_;
int count_;
vector<int> data;
Maxheap(int capacity) : capacity_(capacity), count_(0) {
data = vector<int>(capacity_);
}
void push(int val) {
if (count_ < capacity_) {
data[count_] = val;
shift_up(count_++);
} else {
if (val < data[0]) {
data[0] = val;
shift_down(0);
}
}
}
private:
void shift_up(int k) {
while ( (k - 1) / 2) {
int parent = (k - 1) / 2;
if (data[parent] >= data[k])
break;
swap(data[parent], data[k]);
k = parent;
}
}
void shift_down(int k) {
while ((k + 1) * 2 < count_) {
int max = k;
int left = (k + 1) * 2;
if (data[left] > data[max]) {
max = left;
}
if (left + 1 < count_ && data[left + 1] > data[max]) {
max = left + 1;
}
if (max == k) {
break;
}
swap(data[k], data[max]);
k = max;
}
}
};
int main() {
int N, K;
while (cin >> N >> K) {
Maxheap heap(K);
int n;
for (int i = 0; i < N; i++) {
cin >> n;
heap.push(n);
}
for (auto& x : heap.data) {
cout << x << " ";
}
cout << endl;
}
return 0;
}
- 空白目录
- 算法
- 排序
- 冒泡排序
- 选择排序
- 插入排序
- 归并排序
- 快速排序
- 计数排序
- 桶排序
- 基数排序
- 希尔排序
- 堆排序
- 二分查找
- 最小堆
- 最小索引堆
- 平衡二叉树(AVL tree)
- bitmap位图
- 布隆过滤器
- hashmap
- topK
- 跳表
- LRU Cache
- kmp
- 最小堆和堆排序
- 最短路径
- C++
- 运行时类型判断RTTI
- C++反射
- 手动实现智能指针
- 序列化实现
- rpc实现
- std::forward
- 函数指针的妙用
- C/C++
- std::function
- 同步队列
- 线程池实现
- std::promise
- 深入理解虚函数
- extern "C" 关键字讲解
- 大端小端的区别
- 简历
- 简历1
- redis
- 数据结构和对象
- sds
- list
- zskiplist
- 腾讯云redis面试题总结
- redis集群部署
- LeetCode
- 目标
- go基础
- 算法快速入门
- 数据结构篇
- 二叉树
- 链表
- 栈和队列
- 二进制
- 基础算法篇
- 二分搜索
- 排序算法
- 动态规划
- 算法思维
- 递归思维
- 滑动窗口思想
- 二叉搜索树
- 回溯法
- 其他
- 剑指offer
- 笔记
- git代理加速
- Linux
- vim大法
- vscode远程不能跳转
- cmake
- 设计模式
- 单例模式
- 简单工厂模式
- 外观模式
- 适配器模式
- 工厂方法模式
- 抽象工厂模式
- 生成器模式
- 原型模式
- 中介者模式
- 观察者模式
- 访问者模式
- 命令模式
- 网络编程
- epoll reactor模式
- linux timerfd系列函数总结
- IO
- mapreduce
- 反射器
- leo通信库
- Mutex
- Condition
- thread
- raft
- 协程
- hook
- 定时器
- 别人的面试经验
- 面试题
- vector崩溃问题
- JAVA
- Linux java环境配置
- ucore
- lab1
- FreeNOS
- leveldb
- 刷题笔记
- 回文串
- 前缀树
- 字符串查找
- 查找两个字符串a,b中的最长公共子串
- 动态规划
- golang
- 顺序循环打印实现
- 数据结构
- rpc运用
- python
- 单例
- 深拷贝浅拷贝
- 链表
- python基础题
- mysql
- 事务
- Linux
- 共享内存
- 刷题记录
- 贪心算法
- 动态规划
- 面试
- 腾讯C++面试
- 微众面试JD
- 迅雷网络面试
- 学习网址
- rabbitMq
