新用户注册入口 老用户登录入口

[转载]【BZOJ3238】差异,后缀数组+单调栈维护height

文章作者:转载 更新时间:2023-03-01 16:36:48 阅读数量:178
文章标签:快速求和单调栈性质排名字符串处理
本文摘要:本文介绍了如何利用后缀数组和单调栈解决求解字符串后缀间最长公共前缀累加和的问题。作者指出,对于排名为i和j的两个后缀,它们的最长公共前缀长度等于height[i+1..j]中的最小值,并利用此性质快速计算f[i]=∑lcp(i,j)。在算法实现中,通过维护单调栈并结合高度数组(height)的单调性,有效减少了计算复杂度。最终输出的答案是经过特定公式转化后的结果。其中涉及到的关键概念包括:最长公共前缀(LCP)、累积贡献(f[i])、后缀数组、单调栈、高度数组以及字符串处理等技术。
转载文章

本篇文章为转载内容。原文链接:https://blog.csdn.net/xym_CSDN/article/details/51485164。

该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。

作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。

如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。

Time:2016.05.23
Author:xiaoyimi
转载注明出处谢谢


传送门
思路:
题意已经说的很明白了。
关键在于如何快速求得各lcp的和
有一个重要的性质

排名为i和j(i<j)的最长前缀长度=min(height[i+1..j])

对于排名为i的后缀,想要求得f[i]=lcp(i,j) (i<j)我们只用维护好(i,j]区间的height最小值就好,而且如果遇到某个j,height[j]比height[i]小,那么j及其后的后缀对答案的贡献就是f[j]了,j之前的后缀一共是j-i个,对答案的贡献就是height[i]*(j-i);反之如果height[j]>=height[i],那么height[j]以后对答案没有任何贡献(因为有比它小的height[i]存在),直接排除它,也就是说对于height的使用是存在单调性的,使用单调栈就好(一开始我还不怎么会单调栈,蛋疼了好久)
注意:
1.起初对栈底放入len+1,使得栈不为空,从而计算各个值
2.对于原式中lcp以外的东西,我们可以把它化成(n是字符串长度)
(n(n+1)(2n+1)6n(n+1)2)32
代码:

#include<bits/stdc++.h>
#define M 500004
#define LL long long 
using namespace std;
char s[M];
int w[M],cnt[M],sa[M],rank[M],tmp[M],id[M],height[M];
LL ans,f[M];
stack<int>S;
void SA(int len,int up)
{int *rk=rank,p=0,*t=tmp,d=1;for (int i=0;i<len;i++) cnt[rk[i]=w[i]]++;for (int i=1;i<up;i++) cnt[i]+=cnt[i-1];for (int i=len-1;i>=0;i--) sa[--cnt[rk[i]]]=i;for (;;){for (int i=len-d;i<len;i++) id[p++]=i;for (int i=0;i<len;i++)if (sa[i]>=d) id[p++]=sa[i]-d;for (int i=0;i<up;i++) cnt[i]=0;for (int i=0;i<len;i++) cnt[t[i]=rk[id[i]]]++;for (int i=1;i<up;i++) cnt[i]+=cnt[i-1];for (int i=len-1;i>=0;i--) sa[--cnt[t[i]]]=id[i];swap(t,rk);p=1;rk[sa[0]]=0;for (int i=0;i<len-1;i++)if (sa[i]+d<len&&sa[i+1]+d<len&&t[sa[i]]==t[sa[i+1]]&&t[sa[i]+d]==t[sa[i+1]+d])rk[sa[i+1]]=p-1;elserk[sa[i+1]]=p++;if (p==len) break;d<<=1;up=p;p=0;}
}
void Height(int len)
{for (int i=1;i<=len;i++) rank[sa[i]]=i;int k=0,x;for (int i=0;i<len;i++){k=max(k-1,0);x=sa[rank[i]-1];while (w[i+k]==w[x+k]) k++;height[rank[i]]=k;}
} 
main()
{scanf("%s",s);int len=strlen(s);ans=((LL)len*(len+1)*(len*2+1)/6-(LL)len*(len+1)/2)*3/2;for (int i=0;i<len;i++) w[i]=s[i]-'a'+1;SA(len+1,28);Height(len);S.push(len+1);for (int i=len;i>=1;i--){while(height[S.top()]>height[i]) S.pop();f[i]=(LL)height[i]*(S.top()-i)+f[S.top()];ans-=f[i]<<1;S.push(i);}printf("%lld",ans);
}

本篇文章为转载内容。原文链接:https://blog.csdn.net/xym_CSDN/article/details/51485164。

该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。

作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。

如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。

相关阅读
文章标题:[转载][洛谷P1082]同余方程

更新时间:2023-02-18
[转载][洛谷P1082]同余方程
文章标题:[转载]webpack优化之HappyPack实战

更新时间:2023-08-07
[转载]webpack优化之HappyPack实战
文章标题:[转载]oracle 同时更新多表,在Oracle数据库中同时更新两张表的简单方法

更新时间:2023-09-10
[转载]oracle 同时更新多表,在Oracle数据库中同时更新两张表的简单方法
文章标题:[转载][Unity] 包括场景互动与射击要素的俯视角闯关游戏Demo

更新时间:2024-03-11
[转载][Unity] 包括场景互动与射击要素的俯视角闯关游戏Demo
文章标题:[转载]程序员也分三六九等?等级差异,一个看不起一个!

更新时间:2024-05-10
[转载]程序员也分三六九等?等级差异,一个看不起一个!
文章标题:[转载]海贼王 动漫 全集目录 分章节 精彩打斗剧集

更新时间:2024-01-12
[转载]海贼王 动漫 全集目录 分章节 精彩打斗剧集
名词解释
作为当前文章的名词解释,仅对当前文章有效。
后缀数组(Suffix Array)在计算机科学中,特别是在字符串处理和文本搜索领域,后缀数组是一种特殊的数据结构,它将一个字符串的所有非空后缀按照字典序排序并存储其起始索引。在本文的上下文中,作者通过构造后缀数组来快速计算字符串后缀之间的最长公共前缀,并利用此信息解决特定问题。
单调栈(Monotonic Stack)单调栈是一种特殊的栈数据结构,在算法设计中用于优化动态规划或其他需要维护有序序列性质的问题。在本文提供的代码实现中,单调栈用于维护height数组的部分区间最小值,根据栈内元素的单调性简化计算过程,从而高效求解最长公共前缀累加和。
最长公共前缀(Longest Common Prefix, LCP)在字符串比较和文本处理中,最长公共前缀是指两个或多个字符串共有的、尽可能长的起始子串。文章指出,对于排名i和j的两个后缀而言,它们的最长公共前缀长度可以通过height数组的某个特性快速得出,进而利用这一性质计算所有后缀对之间的LCP值之和。
高度数组(Height Array)在与后缀数组相关的算法中,高度数组是一个辅助数组,它的每个元素表示对应后缀在后缀数组中相邻两元素的最大公共前缀长度。本文中的高度数组被用来反映字符串不同后缀之间的相似性程度,是计算LCP值以及优化算法性能的关键数据结构。
延伸阅读
作为当前文章的延伸阅读,仅对当前文章有效。
在探讨了利用单调栈与后缀数组求解字符串最长公共前缀累加和这一问题之后,我们发现此类算法在文本处理、数据压缩以及生物信息学等领域具有广泛的应用价值。近期,在自然语言处理领域,Google于2023年发布的一项研究中,研究人员就巧妙运用了相似的动态规划策略优化了文档相似度计算模型,显著提升了搜索结果的相关性。
此外,针对大数据环境下对海量文本内容进行快速索引的需求,学术界也在不断探索基于LCP性质的新型索引结构。例如,一篇发表于《ACM Transactions on Information Systems》的论文中,作者提出了一种改进的后缀树变种,结合了LCP数组的信息以提高大规模文本检索的效率,这一研究成果为搜索引擎和其他依赖于文本匹配技术的产品提供了有力的技术支持。
而在生物信息学方面,DNA序列比对是基因组分析中的基础操作,其中也涉及到了类似最长公共前缀的问题。科学家们正在通过深入研究和发展高效的LCP算法,来解决基因组组装、物种进化关系推断等复杂问题,这些最新的科研进展对于理解生命的奥秘和推动精准医疗的发展至关重要。
总之,从理论到实践,从计算机科学到生命科学,对最长公共前缀性质及其高效计算方法的研究不仅丰富了算法设计的宝库,更在诸多现实场景下产生了深远影响,彰显出其跨学科的普适性和时代意义。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
passwd user - 更改用户密码。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
响应式抖音课程培训学院类企业前端模板下载 01-21 jQuery点击显示隐藏更多文字内容插件 01-15 黑色设计师简历响应式网页模板下载 01-14 [转载]Tomcat启动时卡在“ Deploying web application directory ”很久的解决方法 12-19 Saiku LDAP集成登录失效问题:排查配置错误、身份验证及解决方案实操 12-01 Spring Cloud微服务架构中注册中心的必要性与服务间通信实践:服务发现、API契约与高可用性考量 11-23 MahoutIllegalArgumentException在Apache Mahout中的应用场景:矩阵维度不匹配与向量索引异常解析及参数有效性的API调用实践 10-16 [转载]Docker 相关配置文件路径 09-08 蓝色精品美容整形机构网站模板 08-29 本次刷新还10个文章未展示,点击 更多查看。
Gradle在持续集成中的关键作用:自动化构建、依赖管理与多项目构建实践及CI服务器集成 07-06 化妆品购物商城通用网站模板下载 06-27 响应式建筑装饰设计类企业前端CMS模板下载 04-14 微服务架构下用户认证鉴权:网关层统一处理与服务内部处理的比较及选择考量 04-09 响应式会议活动主题着陆页网站模板 03-24 Tomcat内存泄漏问题在Web应用程序中的解决方案:Servlet上下文管理、全局变量引用与弱引用实践及监控工具应用 03-15 Kafka消费者消费偏移量设置:auto.offset.reset策略与手动控制方法详解 02-10 [转载]JavaScript中的时间与日期、正则表达式和Function类型 01-24 大气简洁手机电子产品展示柜台前端模板 01-22 项目案例展示设计公司企业网站模板 01-18 Bootstrap博客后台管理系统网站模板 01-08
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"