新用户注册入口 老用户登录入口

[转载]Reincarnation HDU - 4622

文章作者:转载 更新时间:2023-12-12 08:51:04 阅读数量:128
文章标签:字符串查询不同字串数量子串预处理时间复杂度
本文摘要:该文介绍了一道编程题解,针对给定字符串的子串,计算其不同字串数量。通过构建Suffix Automaton后缀自动机(SAM),高效解决高达10000次的查询问题。首先预处理所有子串的不同字串个数并存储在二维数组中,将原本O(nq)的时间复杂度优化为O(n^2 + q),其中n代表字符串长度,q表示询问次数。在实际操作中,针对每个[l,r]区间的子串查询请求,直接从预处理后的数组中快速获取答案。此方法利用了SAM结构特性,有效应对大量查询场景下的文本处理需求。
转载文章

本篇文章为转载内容。原文链接:https://blog.csdn.net/weixin_30872499/article/details/96073657。

该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。

作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。

如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。

\(\color{#0066ff}{ 题目描述 }\)

给定一个字符串,多次询问某一字串的f值

f(s)代表s的不同字串数量

\(\color{#0066ff}{输入格式}\)

第一行T,代表数据组数\(T\leq 5\)

每组数据第一行一个字符串\(1\leq len \leq 2000\)

然后一个数字m(\(1\leq m \leq 10000\)),表示有m个询问

接下来m行,每行两个整数l,r,表示询问[l,r]的字串的答案

\(\color{#0066ff}{输出格式}\)

对于每个询问,输出一行表示答案

\(\color{#0066ff}{输入样例}\)

2
bbaba
5
3 4
2 2
2 5
2 4
1 4
baaba
5
3 3
3 4
1 4
3 5
5 5

\(\color{#0066ff}{输出样例}\)

3
1
7
5
8
1
3
8
5
1

\(\color{#0066ff}{数据范围与提示}\)

本题不卡hash, 但是正解不是hash

\(\color{#0066ff}{ 题解 }\)

考虑没有询问的时候,对于查询不同字串个数,见一个SAM就没事了

本题询问有10000个,考虑优化

因为长度是2000的,\(O(n^2)\)显然可以

所以我们开一个二维数组暴力预处理出所有的ans, 然后\(O(1)\)查询

\(O(nq) \to O(n^2 + q)\)

#include<bits/stdc++.h>
using namespace std;
#define LL long long
LL in() {char ch; int x = 0, f = 1;while(!isdigit(ch = getchar()))(ch == '-') && (f = -f);for(x = ch ^ 48; isdigit(ch = getchar()); x = (x << 1) + (x << 3) + (ch ^ 48));return x * f;
}
const int maxn = 5555;
struct SAM {
protected:struct node {node *ch[26], *fa;int len, siz;node(int len = 0, int siz = 0): fa(NULL), len(len), siz(siz) {memset(ch, 0, sizeof ch);} };node *root, *tail, *lst;node pool[maxn];
public:node *extend(int c) {node *o = new(tail++) node(lst->len + 1, 1), *v = lst;for(; v && !v->ch[c]; v = v->fa) v->ch[c] = o;if(!v) o->fa = root;else if(v->len + 1 == v->ch[c]->len) o->fa = v->ch[c];else {node *n = new(tail++) node(v->len + 1), *d = v->ch[c];std::copy(d->ch, d->ch + 26, n->ch);n->fa = d->fa, d->fa = o->fa = n;for(; v && v->ch[c] == d; v = v->fa) v->ch[c] = n;}return lst = o;}void clr() {tail = pool;root = lst = new(tail++) node();}SAM() { clr(); }
}sam;
LL ans[2050][2050];
char s[maxn];
int main() {for(int T = in(); T --> 0;) {scanf("%s", s + 1);int len = strlen(s + 1);for(int i = 1; i <= len; i++) {for(int j = i; j <= len; j++) {auto o = sam.extend(s[j] - 'a');ans[i][j] = ans[i][j - 1] + o->len - o->fa->len;}sam.clr();}for(int m = in(); m --> 0;) {int l = in(), r = in();printf("%lld\n", ans[l][r]);} }return 0;
}

转载于:https://www.cnblogs.com/olinr/p/10253544.html

本篇文章为转载内容。原文链接:https://blog.csdn.net/weixin_30872499/article/details/96073657。

该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。

作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。

如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。

相关阅读
文章标题:[转载][洛谷P1082]同余方程

更新时间:2023-02-18
[转载][洛谷P1082]同余方程
文章标题:[转载]webpack优化之HappyPack实战

更新时间:2023-08-07
[转载]webpack优化之HappyPack实战
文章标题:[转载]oracle 同时更新多表,在Oracle数据库中同时更新两张表的简单方法

更新时间:2023-09-10
[转载]oracle 同时更新多表,在Oracle数据库中同时更新两张表的简单方法
文章标题:[转载][Unity] 包括场景互动与射击要素的俯视角闯关游戏Demo

更新时间:2024-03-11
[转载][Unity] 包括场景互动与射击要素的俯视角闯关游戏Demo
文章标题:[转载]程序员也分三六九等?等级差异,一个看不起一个!

更新时间:2024-05-10
[转载]程序员也分三六九等?等级差异,一个看不起一个!
文章标题:[转载]海贼王 动漫 全集目录 分章节 精彩打斗剧集

更新时间:2024-01-12
[转载]海贼王 动漫 全集目录 分章节 精彩打斗剧集
名词解释
作为当前文章的名词解释,仅对当前文章有效。
后缀自动机(Suffix Automaton)在计算机科学中,后缀自动机是一种用于处理字符串的高效数据结构。它能够表示一个字符串的所有后缀,并通过构建有向无环图(DAG)来记录字符串中所有相同前缀的后缀之间的关系。在本文章的具体语境下,后缀自动机被用来统计给定字符串子串的不同字串数量,通过维护状态转移关系,在预处理阶段计算并存储不同子串的数量,从而实现对大规模查询的快速响应。
二维数组预处理(Two-dimensional Array Preprocessing)这是一种编程中的优化策略,即预先计算出所有可能的查询结果并存入一个二维数组中,以便后续直接查表获取答案,避免重复计算。在此文中,作者利用二维数组ans[i][j]来存储字符串从位置i到位置j的子串的不同字串数量,这样在面对大量询问时,可以直接通过访问数组得到结果,极大地提高了查询效率。
查询次数(Query Times)在算法和数据结构领域,查询次数通常指针对特定数据结构执行查找、检索等操作的次数。本文提及的查询次数为m,表示用户对于给定字符串提出了m个子串查询请求,要求求出每个子串内不重复字串的数量。为了应对高达10000次的查询挑战,文章提出的解决方案通过预处理将时间复杂度降低至O(n^2 + q),从而确保即使在高查询频率下也能迅速给出正确答案。
延伸阅读
作为当前文章的延伸阅读,仅对当前文章有效。
在深入理解了利用后缀自动机(Suffix Automaton)解决字符串子串不同字串数量查询问题的基础上,我们可以进一步探索这一数据结构和技术在实际应用中的最新进展和案例。近日,在自然语言处理领域的一项研究中,科学家们巧妙地运用了改进版的后缀自动机算法,成功优化了大规模文本数据库的检索效率。
例如,Google研究人员于2023年发表的一篇论文详细介绍了他们如何借助后缀数组与后缀自动机的结合来提升搜索引擎对复杂、模糊查询语句的理解能力,从而更快找到相关文档并提高搜索结果的质量。通过预计算和存储文本索引,不仅使得大规模文本数据的实时查询成为可能,还大大降低了服务器端的计算压力。
此外,在生物信息学领域,DNA序列分析中也广泛采用了基于后缀自动机的方法。科研团队通过构建基因序列的后缀自动机模型,高效解决了比对、查找特定模式以及统计重复序列等问题,这对于疾病基因识别、遗传变异研究等具有重大意义。
综上所述,后缀自动机作为高效处理字符串问题的重要工具,在不断发展的计算机科学前沿,特别是在大数据处理、搜索引擎优化及生物信息学等领域展现出强大的生命力和广阔的应用前景,值得我们持续关注和深入研究。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
grep pattern file.txt - 在文件中搜索模式。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
RabbitMQ实战中因API版本问题导致消息丢失的排查与修复 03-12 jQuery元素滚动动画库插件-ScrollMagic 02-09 属性级联同步与实体管理:Hibernate实战案例详解 01-27 jQuery超酷3D包装盒封面旋转特效 05-16 ElSteps组件动态改变当前步骤时样式更新滞后问题的Vue.js解决方案 02-22 java中处理异常的方式和语句 01-13 AI助手的工作原理与限制:无法按特定要求撰写的原因及信息处理分析 12-27 代码写的html网红钟表 12-18 简约大气文艺工作者作品展示网站模板 09-21 本次刷新还10个文章未展示,点击 更多查看。
ClickHouse系统重启情境下的数据丢失风险与应对:写入一致性、同步模式及备份恢复策略实践 08-27 jQuery带放大镜的迷你幻灯片插件 08-16 简约手机UI设计公司网站模板下载 04-30 绿色经典响应式主机服务器托管网站模板 04-25 PostgreSQL中应对密码过期警告:安全更改密码的步骤与注意事项 04-17 docker改tag(docker改配置文件) 03-17 [转载]蓝桥 利息计算(Java) 03-11 jquery文字动画特效插件animatext 01-22 大气简洁手机电子产品展示柜台前端模板 01-22 [转载]ubuntu用户和权限介绍 01-10 可爱毛绒玩具网上商城响应式网站模板 01-05
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"