其实就是字符串前缀哈希。求的是前缀和。
注意h[]数组中存放的不是字符串还是字符串的hash值。
任意字符不可以映射成0,否则会出现不同的字符串都映射成0的情况,比如A,AA,AAA皆为0
可以将h[]中的每一个字符串看做一个p进制数,上图=后就是将他转化为10进制数。
字符串哈希就是假设不出现冲突,当P = 131或者1331,Q取2的64次方就能保证99.99%不会出现冲突。
我们知道long long类型数据范围最大是2的64次方,那我们取unsigned long long溢出就等于mod2的64次方。
//字符串哈希,可以解决kmp解决不了的问题
#include<iostream>
using namespace std;
using ull = unsigned long long;//原本需要mod上2的64次方,但是无符号类型溢出等价于mod
const int N = 1e5 + 9, P = 131;//p一般取131或者13331
char str[N];
int n, m;
ull p[N], h[N];//p用来存储p的多少次方
ull get(int l, int r)
{
//区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样,只差两位,
//乘上P的二次方把 ABC 变为 ABC00,再用 ABCDE - ABC00 得到 DE 的哈希值。
//也就是将ABC左移两位
return h[r] - h[l - 1] * p[r - l + 1];//公式
}
int main()
{
ios::sync_with_stdio(0), cin.tie(0), cout.tie(0);
cin >> n >> m >> str + 1;
//初始化
p[0] = 1;
for (int i = 1; i <= n; ++i)
{
p[i] = p[i - 1] * P;//p的多少次方
h[i] = h[i - 1] * P + str[i];//字符哈希的前缀和
}
while (m--)
{
int l1, r1, l2, r2; cin >> l1 >> r1 >> l2 >> r2;
if (get(l1, r1) == get(l2, r2)) cout << "Yes" << '\n';
else cout << "No" << '\n';
}
return 0;
}
ull get(int l, int r)
{
//区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样,只差两位,
//乘上P的二次方把 ABC 变为 ABC00,再用 ABCDE - ABC00 得到 DE 的哈希值。
//也就是将ABC左移两位
return h[r] - h[l - 1] * p[r - l + 1];//公式
}
上述代码就是核心代码。
移动完之后就可以得到l到r区间的映射的哈希值了。