前端技术
HTML
CSS
Javascript
前端框架和UI库
VUE
ReactJS
AngularJS
JQuery
NodeJS
JSON
Element-UI
Bootstrap
Material UI
服务端和客户端
Java
Python
PHP
Golang
Scala
Kotlin
Groovy
Ruby
Lua
.net
c#
c++
后端WEB和工程框架
SpringBoot
SpringCloud
Struts2
MyBatis
Hibernate
Tornado
Beego
Go-Spring
Go Gin
Go Iris
Dubbo
HessianRPC
Maven
Gradle
数据库
MySQL
Oracle
Mongo
中间件与web容器
Redis
MemCache
Etcd
Cassandra
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Nacos
Consul
Tomcat
Nginx
Netty
大数据技术
Hive
Impala
ClickHouse
DorisDB
Greenplum
PostgreSQL
HBase
Kylin
Hadoop
Apache Pig
ZooKeeper
SeaTunnel
Sqoop
Datax
Flink
Spark
Mahout
数据搜索与日志
ElasticSearch
Apache Lucene
Apache Solr
Kibana
Logstash
数据可视化与OLAP
Apache Atlas
Superset
Saiku
Tesseract
系统与容器
Linux
Shell
Docker
Kubernetes
[Trie树 前缀树 ]的搜索结果
这里是文章列表。热门标签的颜色随机变换,标签颜色没有特殊含义。
点击某个标签可搜索标签相关的文章。
点击某个标签可搜索标签相关的文章。
转载文章
.../数据库或倒排索引/trie树。空间复杂度方面,分而治之/hash映射。 海量数据处理的基本方法总结起来分为以下几种: 分而治之/hash映射 + hash统计 + 堆/快速/归并排序; 双层桶划分; Bloom filter/Bitmap; Trie树/数据库/倒排索引; 外排序; 分布式处理之Hadoop/Mapreduce。 前提基础知识: 1 byte= 8 bit。 int整形一般为4 bytes 共32位bit。 2^32=4G。 1G=2^30=10.7亿。 1 分而治之+hash映射+快速/归并/堆排序 问题1 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 分析:50亿64=320G大小空间。 算法思想1:hash 分解+ 分而治之 + 归并 遍历文件a,对每个url根据某种hash规则求取hash(url)/1024,然后根据所取得的值将url分别存储到1024个小文件(a0~a1023)中。这样每个小文件的大约为300M。如果hash结果很集中使得某个文件ai过大,可以在对ai进行二级hash(ai0~ai1024)。 这样url就被hash到1024个不同级别的目录中。然后可以分别比较文件,a0VSb0……a1023VSb1023。求每对小文件中相同的url时,可以把其中一个小文件的url存储到hash_map中。然后遍历另一个小文件的每个url,看其是否在刚才构建的hash_map中,如果是,那么就是共同的url,存到文件里面就可以了。 把1024个级别目录下相同的url合并起来。 问题2 有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序。 解决思想1:hash分解+ 分而治之 +归并 顺序读取10个文件a0~a9,按照hash(query)%10的结果将query写入到另外10个文件(记为 b0~b9)中。这样新生成的文件每个的大小大约也1G(假设hash函数是随机的)。 找一台内存2G左右的机器,依次对用hash_map(query, query_count)来统计每个query出现的次数。利用快速/堆/归并排序按照出现次数进行排序。将排序好的query和对应的query_cout输出到文件中。这样得到了10个排好序的文件c0~c9。 对这10个文件c0~c9进行归并排序(内排序与外排序相结合)。每次取c0~c9文件的m个数据放到内存中,进行10m个数据的归并,即使把归并好的数据存到d结果文件中。如果ci对应的m个数据全归并完了,再从ci余下的数据中取m个数据重新加载到内存中。直到所有ci文件的所有数据全部归并完成。 解决思想2: Trie树 如果query的总量是有限的,只是重复的次数比较多而已,可能对于所有的query,一次性就可以加入到内存了。在这种假设前提下,我们就可以采用trie树/hash_map等直接来统计每个query出现的次数,然后按出现次数做快速/堆/归并排序就可以了。 问题3: 有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。 类似问题:怎么在海量数据中找出重复次数最多的一个? 解决思想: hash分解+ 分而治之+归并 顺序读文件中,对于每个词x,按照hash(x)/(10244)存到4096个小文件中。这样每个文件大概是250k左右。如果其中的有的文件超过了1M大小,还可以按照hash继续往下分,直到分解得到的小文件的大小都不超过1M。 对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树/hash_map等),并取出出现频率最大的100个词(可以用含100个结点的最小堆),并把100词及相应的频率存入文件。这样又得到了4096个文件。 下一步就是把这4096个文件进行归并的过程了。(类似与归并排序) 问题4 海量日志数据,提取出某日访问百度次数最多的那个IP 解决思想: hash分解+ 分而治之 + 归并 把这一天访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有2^32个IP。同样可以采用hash映射的方法,比如模1024,把整个大文件映射为1024个小文件。 再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及相应的频率。 然后再在这1024组最大的IP中,找出那个频率最大的IP,即为所求。 问题5 海量数据分布在100台电脑中,想个办法高效统计出这批数据的TOP10。 解决思想: 分而治之 + 归并。 注意TOP10是取最大值或最小值。如果取频率TOP10,就应该先hash分解。 在每台电脑上求出TOP10,采用包含10个元素的堆完成(TOP10小,用最大堆,TOP10大,用最小堆)。比如求TOP10大,我们首先取前10个元素调整成最小堆,如果发现,然后扫描后面的数据,并与堆顶元素比较,如果比堆顶元素大,那么用该元素替换堆顶,然后再调整为最小堆。最后堆中的元素就是TOP10大。 求出每台电脑上的TOP10后,然后把这100台电脑上的TOP10组合起来,共1000个数据,再利用上面类似的方法求出TOP10就可以了。 问题6 在2.5亿个整数中找出不重复的整数,内存不足以容纳这2.5亿个整数。 解决思路1 : hash 分解+ 分而治之 + 归并 2.5亿个int数据hash到1024个小文件中a0~a1023,如果某个小文件大小还大于内存,进行多级hash。每个小文件读进内存,找出只出现一次的数据,输出到b0~b1023。最后数据合并即可。 解决思路2 : 2-Bitmap 如果内存够1GB的话,采用2-Bitmap(每个数分配2bit,00表示不存在,01表示出现一次,10表示多次,11无意义)进行,共需内存2^322bit=1GB内存。然后扫描这2.5亿个整数,查看Bitmap中相对应位,如果是00变01,01变10,10保持不变。所描完事后,查看bitmap,把对应位是01的整数输出即可。 注意,如果是找出重复的数据,可以用1-bitmap。第一次bit位由0变1,第二次查询到相应bit位为1说明是重复数据,输出即可。 问题7 一共有N个机器,每个机器上有N个数。每个机器最多存O(N)个数并对它们操作。如何找到N^2个数中的中数? 解决思想1 : hash分解 + 排序 按照升序顺序把这些数字,hash划分为N个范围段。假设数据范围是2^32 的unsigned int 类型。理论上第一台机器应该存的范围为0~(2^32)/N,第i台机器存的范围是(2^32)(i-1)/N~(2^32)i/N。hash过程可以扫描每个机器上的N个数,把属于第一个区段的数放到第一个机器上,属于第二个区段的数放到第二个机器上,…,属于第N个区段的数放到第N个机器上。注意这个过程每个机器上存储的数应该是O(N)的。 然后我们依次统计每个机器上数的个数,一次累加,直到找到第k个机器,在该机器上累加的数大于或等于(N^2)/2,而在第k-1个机器上的累加数小于(N^2)/2,并把这个数记为x。那么我们要找的中位数在第k个机器中,排在第(N^2)/2-x位。然后我们对第k个机器的数排序,并找出第(N^2)/2-x个数,即为所求的中位数的复杂度是O(N^2)的。 解决思想2: 分而治之 + 归并 先对每台机器上的数进行排序。排好序后,我们采用归并排序的思想,将这N个机器上的数归并起来得到最终的排序。找到第(N^2)/2个便是所求。复杂度是O(N^2 lgN^2)的。 2 Trie树+红黑树+hash_map 这里Trie树木、红黑树或者hash_map可以认为是第一部分中分而治之算法的具体实现方法之一。 问题1 上千万或上亿数据(有重复),统计其中出现次数最多的钱N个数据。 解决思路: 红黑树 + 堆排序 如果是上千万或上亿的int数据,现在的机器4G内存可以能存下。所以考虑采用hash_map/搜索二叉树/红黑树等来进行统计重复次数。 然后取出前N个出现次数最多的数据,可以用包含N个元素的最小堆找出频率最大的N个数据。 问题2 1000万字符串,其中有些是重复的,需要把重复的全部去掉,保留没有重复的字符串。请怎么设计和实现? 解决思路:trie树。 这题用trie树比较合适,hash_map也应该能行。 问题3 一个文本文件,大约有一万行,每行一个词,要求统计出其中最频繁出现的前10个词,请给出思想,给出时间复杂度分析。 解决思路: trie树 + 堆排序 这题是考虑时间效率。 1. 用trie树统计每个词出现的次数,时间复杂度是O(nlen)(len表示单词的平准长度)。 2. 然后找出出现最频繁的前10个词,可以用堆来实现,前面的题中已经讲到了,时间复杂度是O(nlg10)。 总的时间复杂度,是O(nle)与O(nlg10)中较大的哪一个。 问题4 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录,这些查询串的重复读比较高,虽然总数是1千万,但是如果去除重复和,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就越热门。请你统计最热门的10个查询串,要求使用的内存不能超过1G。 解决思想 : trie树 + 堆排序 采用trie树,关键字域存该查询串出现的次数,没有出现为0。最后用10个元素的最小推来对出现频率进行排序。 3 BitMap或者Bloom Filter 3.1 BitMap BitMap说白了很easy,就是通过bit位为1或0来标识某个状态存不存在。可进行数据的快速查找,判重,删除,一般来说适合的处理数据范围小于82^32。否则内存超过4G,内存资源消耗有点多。 问题1 已知某个文件内包含一些电话号码,每个号码为8位数字,统计不同号码的个数。 解决思路: bitmap 8位最多99 999 999,需要100M个bit位,不到12M的内存空间。我们把0-99 999 999的每个数字映射到一个Bit位上,所以只需要99M个Bit==12MBytes,这样,就用了小小的12M左右的内存表示了所有的8位数的电话 问题2 2.5亿个整数中找出不重复的整数的个数,内存空间不足以容纳这2.5亿个整数。 解决思路:2bit map 或者两个bitmap。 将bit-map扩展一下,用2bit表示一个数即可,00表示未出现,01表示出现一次,10表示出现2次及以上,11可以暂时不用。 在遍历这些数的时候,如果对应位置的值是00,则将其置为01;如果是01,将其置为10;如果是10,则保持不变。需要内存大小是2^32/82=1G内存。 或者我们不用2bit来进行表示,我们用两个bit-map即可模拟实现这个2bit-map,都是一样的道理。 3.2 Bloom filter Bloom filter可以看做是对bit-map的扩展。 参考july大神csdn文章 Bloom Filter 详解 4 Hadoop+MapReduce 参考引用july大神 csdn文章 MapReduce的初步理解 Hadoop框架与MapReduce模式 转载请注明本文地址: 大数据——海量数据处理的基本方法总结 本篇文章为转载内容。原文链接:https://blog.csdn.net/hong2511/article/details/80842704。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2024-03-01 12:40:17
541
转载
转载文章
...内置图标的CSS类名前缀。在文章所描述的场景下,为了将阿里矢量图标库中的图标与layui的样式保持一致,并能像内置图标一样方便地在项目中使用,需要将阿里矢量图标的类名修改为“layui-icon”。 iconfont.css , iconfont.css是一个包含自定义矢量图标样式信息的CSS文件。在阿里矢量图标库中,用户下载的代码包通常会包含一个iconfont.css文件,其中定义了每个图标对应的Unicode编码及样式属性。在本文中,开发者需要通过编辑这个文件,并将其内容合并到layui.css中,以便于在layui项目中引入和应用阿里矢量图标。
2023-01-15 13:55:36
531
转载
转载文章
...名时,常需要去除特定前缀或后缀,新方法提供了更为便捷的操作手段。 另外,对于大型应用中的字符串性能优化问题,推荐阅读关于Python内部字符串池(String Interning)机制的文章。Python为了提高内存效率,会自动将一些重复出现的字符串引用到同一内存地址,这与我们之前讨论过的is关键字用于字符串比较时的行为有关。深入理解这一机制,可以帮助开发者避免不必要的内存消耗,并优化程序性能。 此外,近期一篇关于安全编码的文章指出,在进行用户输入验证时,应当避免仅依赖in操作符来判断字符串是否包含敏感词汇,因为这种方式无法防止大小写混淆、边界空格等问题。提倡使用正则表达式或其他专用的安全过滤库,确保字符串匹配严格且全面,以提升应用安全性。 综上所述,掌握Python字符串相等性判断仅仅是字符串处理的基础,实际开发中还需要关注最新的语言特性、内存管理机制以及安全编码规范,才能编写出既高效又健壮的代码。
2023-06-27 09:21:09
78
转载
VUE
...所有资源的公共URL前缀。当项目部署到服务器上时,如果静态资源的URL与开发环境不同,可以通过修改vue.config.js文件中的publicPath属性来指定资源的根路径,以确保图片和其他静态资源能够被正确地从服务器获取并展示在页面上。 require , 在JavaScript中,require是一个CommonJS规范的导入函数,常用于Node.js环境中加载模块。在Vue项目中,由于使用了Webpack,因此也可以借助require函数动态导入图片或其他资源,使其能被Webpack正确识别和处理,并转化为模块化的引用方式,这样在模板中可以通过变量来调用图片资源,避免因路径问题导致图片无法加载的情况发生。
2023-03-20 19:48:02
142
键盘勇士
CSS
...以通过加上一些浏览器前缀来兼容各类的浏览器: filter: blur(5px); -webkit-filter: blur(5px);/ Safari和Chrome浏览器需要加上该前缀 / 总结:模糊范围是最新CSS中用来调整滤镜效果模糊强度的一个属性,可以用于图片、文字、边框等组件。在运用的时候需要注意兼容性问题,可以通过为不同浏览器加上前缀来解决。
2023-01-02 20:52:05
510
逻辑鬼才
HTML
...,无需依赖浏览器特有前缀(如-webkit-)。通过这个API,开发者可以设置滚动条的宽度、颜色、圆角、阴影等属性,提高滚动条样式的跨浏览器兼容性和易定制性,进一步提升网页的用户体验设计水平。
2023-01-11 20:54:07
522
素颜如水-t
VUE
...是特殊的属性,以v-前缀标识,它们提供了对DOM元素行为的扩展能力。指令能够监听并改变元素的行为或者影响其渲染效果。例如,v-if用于条件性地渲染元素,v-for则用于循环遍历数组或对象并重复渲染元素。通过指令,开发者无需直接操作DOM,而是关注于业务逻辑和数据变化,Vue.js会依据指令背后的规则处理好相应的DOM更新工作。
2023-12-22 14:31:59
63
逻辑鬼才
MySQL
...使用\ sudo\ 前缀是为了获取足够的权限来安装MySQL服务器和进行相关配置修改。 systemctl , systemctl是Systemd系统和服务管理器的一部分,它提供了一种统一的方式来控制Linux系统服务的启动、停止、重启以及查看状态等操作。在文中,通过\ sudo systemctl status mysql\ 命令可以检查MySQL服务器是否成功启动并运行,而\ sudo systemctl restart mysql\ 则是用来重启MySQL服务,使之前对配置文件所做的更改生效。 mysql_secure_installation , 这是一个MySQL官方提供的安全脚本,用于加强新安装的MySQL服务器的安全性。执行此脚本时,系统会提示用户设置root密码(如果尚未设置)、删除匿名用户、禁止root账户远程登录、移除测试数据库以及其他一些安全相关的配置选项,确保MySQL服务器在初次安装后即具备一定的安全性基础。 bind-address , 在MySQL服务器配置文件中,bind-address是指定MySQL服务监听连接请求的IP地址的参数。默认情况下,MySQL可能仅监听本地回环地址(localhost),将其更改为“0.0.0.0”意味着MySQL将接受来自任何IP地址的连接请求,从而实现远程访问MySQL数据库的功能。
2023-10-24 11:08:12
58
逻辑鬼才
CSS
...式或添加浏览器兼容性前缀等。在这个语境下,PostCSS 的 plugin-layer-vars 插件被用来帮助开发者自动检测和修复与 CSS @layer 特性使用相关的问题,提升开发效率。 选择器(selector) , 在 CSS 中,选择器是用于指定要应用样式的 HTML 元素的关键字或表达式。当提到“Expected selector before @layer”这个错误时,它意味着在 @layer 声明之后应立即跟一个有效的 CSS 选择器以及相应的样式规则。例如,在声明了 @layer base; 后,应当紧跟着如 body ... 这样的选择器及其样式定义。
2023-08-23 12:28:06
496
岁月如歌_t
VUE
...法的核心部分,以v-前缀标识,如v-if、v-for和v-html等。它们提供了一种声明式的方式来实现DOM操作、数据绑定以及响应式更新等功能。例如,v-html指令能够根据JavaScript表达式的值动态渲染HTML内容到页面上,类似于Angular.js中的ng-bind-html指令。
2023-08-10 19:26:32
332
算法侠
AngularJS
...和指令定义唯一的名称前缀。 3. 适当的分层 我们应该根据功能和复杂性将组件划分为不同的层次,这样可以使代码结构更清晰。 4. 注释和文档 为了帮助其他开发者理解和使用我们的组件,我们应该为它们添加详细的注释和文档。 五、结论 在 AngularJS 中,组件化开发是一种强大的工具,可以帮助我们构建复杂的单页面应用程序。要是我们按照上面提到的那些顶级技巧来操作,就能妥妥地发挥这种本领,写出既高质量又方便维护的代码。 六、参考文献 [1] AngularJS documentation: https://docs.angularjs.org/ [2] Pluralsight course: Angular Fundamentals: https://www.pluralsight.com/courses/angular-fundamentals
2023-01-15 10:15:11
389
月下独酌-t
转载文章
...记录字符串中所有相同前缀的后缀之间的关系。在本文章的具体语境下,后缀自动机被用来统计给定字符串子串的不同字串数量,通过维护状态转移关系,在预处理阶段计算并存储不同子串的数量,从而实现对大规模查询的快速响应。 二维数组预处理(Two-dimensional Array Preprocessing) , 这是一种编程中的优化策略,即预先计算出所有可能的查询结果并存入一个二维数组中,以便后续直接查表获取答案,避免重复计算。在此文中,作者利用二维数组ans i j 来存储字符串从位置i到位置j的子串的不同字串数量,这样在面对大量询问时,可以直接通过访问数组得到结果,极大地提高了查询效率。 查询次数(Query Times) , 在算法和数据结构领域,查询次数通常指针对特定数据结构执行查找、检索等操作的次数。本文提及的查询次数为m,表示用户对于给定字符串提出了m个子串查询请求,要求求出每个子串内不重复字串的数量。为了应对高达10000次的查询挑战,文章提出的解决方案通过预处理将时间复杂度降低至O(n^2 + q),从而确保即使在高查询频率下也能迅速给出正确答案。
2023-12-12 08:51:04
129
转载
Netty
...取或者设置IPv6的前缀长度等。 3. Netty与IPv4的兼容性问题? 虽然Netty支持IPv6,但是在实际应用中,我们还需要考虑IPv4与IPv6的兼容性问题。这是因为现在大部分网络还在用着IPv4这个老伙计,如果我们只认IPv6这新玩意儿的话,那连接那些老网络就成问题啦。 那么,我们应该如何解决这个问题呢?一种常见的解决方案是使用双栈模式,即在同一台机器上同时运行IPv4和IPv6的网络栈。这样一来,当我们想接入IPv4的网络时,就该派上IPv4的网络工具箱了;而当我们想要连上IPv6的网络时,就得切换到IPv6的网络工具箱来大显身手。 这种双栈模式在Netty中可以通过配置来实现。具体来说,你需要在启动Netty服务器时,通过ServerBootstrap.bind()方法的第二个参数,指定使用的套接字类型: java ServerBootstrap b = new ServerBootstrap(); b.group(bossGroup, workerGroup) .channel(NioServerSocketChannel.class) .childHandler(new ChannelInitializer() { @Override public void initChannel(SocketChannel ch) throws Exception { // ... } }); InetSocketAddress addr = new InetSocketAddress("localhost", 8080); b.bind(addr).sync(); 在这个例子中,NioServerSocketChannel.class表示使用的服务器通道类型。如果你想让Netty同时兼容IPv4和IPv6,那就试试把类型换成NioDatagramChannel.class吧,这样一来,它就能在两种协议间自由切换,畅通无阻了。 4. 结论 总的来说,Netty在支持IPv6方面做得非常好,它提供了丰富的API来处理IPv6的各种操作。同时,通过双栈模式,Netty也可以很好地与IPv4进行兼容。总的来说,如果你现在正在捣鼓一个必须兼容IPv6的应用程序,那我得说,选用Netty绝对是个相当赞的决定。 注意:以上内容纯属虚构,只是为了展示编写技术文章的方法和技巧,真实的技术信息可能与此有所不同。
2023-01-06 15:35:06
512
飞鸟与鱼-t
转载文章
...和j(i<j)的最长前缀长度=min(height[i+1..j]) 对于排名为i的后缀,想要求得f[i]=∑lcp(i,j) (i<j)我们只用维护好(i,j]区间的height最小值就好,而且如果遇到某个j,height[j]比height[i]小,那么j及其后的后缀对答案的贡献就是f[j]了,j之前的后缀一共是j-i个,对答案的贡献就是height[i](j-i);反之如果height[j]>=height[i],那么height[j]以后对答案没有任何贡献(因为有比它小的height[i]存在),直接排除它,也就是说对于height的使用是存在单调性的,使用单调栈就好(一开始我还不怎么会单调栈,蛋疼了好久) 注意: 1.起初对栈底放入len+1,使得栈不为空,从而计算各个值 2.对于原式中lcp以外的东西,我们可以把它化成(n是字符串长度) (n(n+1)(2n+1)6−n(n+1)2)∗32 代码: include<bits/stdc++.h>define M 500004define LL long long using namespace std;char s[M];int w[M],cnt[M],sa[M],rank[M],tmp[M],id[M],height[M];LL ans,f[M];stack<int>S;void SA(int len,int up){int rk=rank,p=0,t=tmp,d=1;for (int i=0;i<len;i++) cnt[rk[i]=w[i]]++;for (int i=1;i<up;i++) cnt[i]+=cnt[i-1];for (int i=len-1;i>=0;i--) sa[--cnt[rk[i]]]=i;for (;;){for (int i=len-d;i<len;i++) id[p++]=i;for (int i=0;i<len;i++)if (sa[i]>=d) id[p++]=sa[i]-d;for (int i=0;i<up;i++) cnt[i]=0;for (int i=0;i<len;i++) cnt[t[i]=rk[id[i]]]++;for (int i=1;i<up;i++) cnt[i]+=cnt[i-1];for (int i=len-1;i>=0;i--) sa[--cnt[t[i]]]=id[i];swap(t,rk);p=1;rk[sa[0]]=0;for (int i=0;i<len-1;i++)if (sa[i]+d<len&&sa[i+1]+d<len&&t[sa[i]]==t[sa[i+1]]&&t[sa[i]+d]==t[sa[i+1]+d])rk[sa[i+1]]=p-1;elserk[sa[i+1]]=p++;if (p==len) break;d<<=1;up=p;p=0;} }void Height(int len){for (int i=1;i<=len;i++) rank[sa[i]]=i;int k=0,x;for (int i=0;i<len;i++){k=max(k-1,0);x=sa[rank[i]-1];while (w[i+k]==w[x+k]) k++;height[rank[i]]=k;} } main(){scanf("%s",s);int len=strlen(s);ans=((LL)len(len+1)(len2+1)/6-(LL)len(len+1)/2)3/2;for (int i=0;i<len;i++) w[i]=s[i]-'a'+1;SA(len+1,28);Height(len);S.push(len+1);for (int i=len;i>=1;i--){while(height[S.top()]>height[i]) S.pop();f[i]=(LL)height[i](S.top()-i)+f[S.top()];ans-=f[i]<<1;S.push(i);}printf("%lld",ans);} 本篇文章为转载内容。原文链接:https://blog.csdn.net/xym_CSDN/article/details/51485164。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-03-01 16:36:48
179
转载
转载文章
前缀积 , 在计算机科学和数学中,前缀积是指一个数字序列中从第一个元素到当前元素的所有元素的乘积。在文章给出的问题“如此编码”中,前缀积被用于计算给定数字序列的特定数值特性。例如,对于序列 a= a1, a2, ..., an ,其前缀积数组 c_ 可以表示为。 01背包问题 , 01背包问题是一种经典的动态规划问题,在计算机科学与运筹学领域广泛应用。该问题描述的是有n件物品,每件物品有一个体积vi和一个价值wi,现在有一个容量为V的背包,要求在不超过背包容量的前提下,使得装入背包物品的总价值最大。在文章中的“何以包邮?”问题中,将书籍的价格视为物品的价值和体积,并通过解决01背包问题来找到满足包邮条件且总价最小的书籍组合。 动态规划算法 , 动态规划是一种在计算机科学和数学优化中用于求解最优化问题的方法,通过把原问题分解为相互重叠子问题的方式来构造最优解。它主要用于求解具有重叠子问题和最优子结构特征的问题。在本文提及的两个编程问题中,都运用了动态规划思想。对于“如此编码”,动态规划并非直接应用,但在计算前缀积时隐含了状态转移的思想;而在“何以包邮?”问题中,则是明确地使用了动态规划算法求解01背包问题,从而得出在满足包邮条件下花费最小的购书方案。
2023-02-17 21:41:19
342
转载
Java
...效果,压根没必要用到前缀递增或后缀递增的操作。 四、结论 总的来说,前加加和后加加是Java编程中非常重要的一部分,它们不仅提供了丰富的功能,而且也为我们的程序设计带来了更大的灵活性和便利性。不过呢,咱们也得留心眼儿,在使用这些运算符的时候可得多加小心,确保咱的程序既不出错又靠得住。同时呢,咱也得尝试各种各样的招数来解决实际问题,别老拘泥于一种方法或者技巧嘛,让思路活泛起来,多维度解决问题才更有趣儿!
2023-03-21 12:55:07
376
昨夜星辰昨夜风-t
AngularJS
...它可以按照指定的路径前缀和后缀自动加载JSON或其他格式的语言资源文件,以便在应用运行时根据需要获取并应用不同的语言包。 视图层(View Layer) , 在MVC(模型-视图-控制器)架构中,视图层负责展示数据及用户交互界面。在AngularJS中,视图通常是由HTML模板和AngularJS指令组成的,文中提到的translate过滤器就是在视图层中应用国际化的一种方式,它能够将从语言资源文件中读取到的翻译结果动态插入到HTML模板对应的元素中。
2023-06-23 10:38:49
376
晚秋落叶
Golang
...为静态资源的访问路径前缀,而实际的静态文件则存储在项目根目录下的"public"目录中。 4. 深入思考与探讨 处理路由配置和静态文件目录的问题,不仅关乎技术实现,更体现了我们在设计Web架构时的灵活性和预见性。比如说,如果把路由设计得恰到好处,就仿佛给咱们的API铺上了一条宽敞明亮的大道,让咱能轻松梳理、便捷维护。再者,把静态文件资料收拾得井井有条,就像给应用装上了火箭助推器,嗖一下提升运行速度,还能帮服务器大大减压,让它喘口气儿。 当我们在编写Golang Web应用时,务必保持对细节的关注,充分理解并熟练运用各种工具库,这样才能在满足功能需求的同时,打造出既优雅又高效的程序。同时呢,咱们也得不断尝鲜、积极探索新的解决方案。毕竟,技术这家伙可是一直在突飞猛进,指不定啥时候就冒出来个更优秀的法子,让我们的配置策略更加优化、更上一层楼。 总结来说,Golang以其强大而又易用的特性,为我们搭建Web应用提供了一条顺畅的道路。要是咱们能把路由配置得恰到好处,再把静态资源打理得井井有条,那咱们的应用就能更上一层楼,无论多复杂、多变化的业务场景,都能应对自如,让应用表现得更加出色。让我们在实践中不断学习、不断进步,享受Golang带来的开发乐趣吧!
2023-01-10 18:53:06
507
繁华落尽
转载文章
...改文件名称,变为统一前缀名称并且自增索引,修改后效果 修改后 最简单的人力操作就是逐个文件重命名,但本着DRY(Don't repeat yourself)原则,还是写一个node脚本搞定。 研究 node中要进行文件操作需要了解一下fs模块 在fs模块中有同步和异步两种方式 读取文件 //异步 fs.readFile('test.txt', 'utf-8' (err, data) => { if (err) { throw err; } console.log(data); }); //同步 let data = fs.readFileSync('test.txt'); console.log(data); 异步读取文件参数:文件路径,编码方式,回调函数 写入文件 fs.writeFile('test2.txt', 'this is text', { 'flag': 'w' }, err => { if (err) { throw err; } console.log('saved'); }); 写入文件参数:目标文件,写入内容,写入形式,回调函数 flag写入方式: r:读取文件 w:写文件 a:追加 创建目录 fs.mkdir('dir', (err) => { if (err) { throw err; } console.log('make dir success'); }); dir为新建目录名称 读取目录 fs.readdir('dir',(err, files) => { if (err) { throw err; } console.log(files); }); dir为读取目录名称,files为目录下的文件或目录名称数组 获取文件信息 fs.stat('test.txt', (err, stats)=> { console.log(stats.isFile()); //true }) 获取文件信息后stats方法: 方法 说明 stats.isFile() 是否为文件 stats.isDirectory() 是否为目录 stats.isBlockDevice() 是否为块设备 stats.isCharacterDevice() 是否为字符设备 stats.isSymbolicLink() 是否为软链接 stats.isFIFO() 是否为UNIX FIFO命令管道 stats.isSocket() 是否为Socket 创建读取流 let stream = fs.createReadStream('test.txt'); 创建写入流 let stream = fs.createWriteStreamr('test_copy.txt'); 开发 开发思路: 读取源目录 判读存放目录是否存在,不存在时新建目录 复制文件 判断复制内容是否为文件 创建读取流 创建写入流 链接管道,写入文件内容 let fs = require('fs'), src = 'src', dist = 'dist', args = process.argv.slice(2), filename = 'image', index = 0; //show help if (args.length === 0 || args[0].match('--help')) { console.log('--help\n \t-src 文件源\n \t-dist 文件目标\n \t-n 文件名\n \t-i 文件名索引\n'); return false; } args.forEach((item, i) => { if (item.match('-src')) { src = args[i + 1]; } else if (item.match('-dist')) { dist = args[i + 1]; } else if (item.match('-n')) { filename = args[i + 1]; } else if (item.match('-i')) { index = args[i + 1]; } }); fs.readdir(src, (err, files) => { if (err) { console.log(err); } else { fs.exists(dist, exist => { if (exist) { copyFile(files, src, dist, filename, index); } else { fs.mkdir(dist, () => { copyFile(files, src, dist, filename, index); }) } }); } }); function copyFile(files, src, dist, filename, index) { files.forEach(n => { let readStream, writeStream, arr = n.split('.'), oldPath = src + '/' + n, newPath = dist + '/' + filename + index + '.' + arr[arr.length - 1]; fs.stat(oldPath, (err, stats) => { if (err) { console.log(err); } else if (stats.isFile()) { readStream = fs.createReadStream(oldPath); writeStream = fs.createWriteStream(newPath); readStream.pipe(writeStream); } }); index++; }) } 效果 总结 node提供了很多模块可以帮助我们完成不同需求的功能开发,使javascript不仅仅局限与浏览器中,尝试自己编写一些脚本有助于对这些模块的理解,同时也能提高办公效率。 本篇文章为转载内容。原文链接:https://blog.csdn.net/weixin_33205138/article/details/112036462。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-12-30 19:15:04
67
转载
转载文章
...序数组区间查询”和“前缀和优化”等概念紧密相关。最近,在ACM国际大学生程序设计竞赛(ACM-ICPC)以及LeetCode等在线编程挑战平台中,频繁出现类似问题变种,强调对数据结构和算法有深刻理解和灵活运用。 进一步深入研究,此类问题可扩展到多维空间或更复杂的约束条件下,如二维矩阵中寻找满足递增顺序的子矩阵个数,或者在网络流、图论等领域中寻找满足特定条件的路径集合等。今年早些时候,一篇发表在《ACM Transactions on Algorithms》的研究论文就探讨了一类复杂度更高的动态三元组匹配问题,并提出了一种新颖的时间复杂度为O(n log n)的解决方案,为这类问题的求解提供了新的思路。 此外,在实际应用层面,递增序列问题也常出现在大数据分析、搜索引擎索引构建以及机器学习特征选择等方面。例如,在推荐系统中,用户行为序列的模式挖掘往往需要统计用户对商品评分的递增关系,从而推断用户的兴趣迁移趋势。而在数据库领域,索引优化技术会利用相似的逻辑来提高查询效率。 总之,递增三元组问题作为一个典型的编程题目,其背后所蕴含的数据处理思想和技术手段具有广泛的适用性和深度,值得我们在理论学习和实践操作中持续探索和深化理解。
2023-10-25 23:06:26
333
转载
PostgreSQL
...- 时间戳和进程ID前缀可能会使日志行变得冗长 log_directory = '/var/log/postgresql' -- 如果不加以定期清理,日志文件可能会撑满整个分区 4. 探讨与建议 面对PostgreSQL的系统配置问题,我们需要深入了解每个参数的含义以及它们在不同场景下的最佳实践。优化配置是一个持续的过程,需要结合业务特性和硬件资源来进行细致调优。 - 理解需求:首先,应了解业务特点,包括数据量大小、查询复杂度、并发访问量等因素。 - 监控分析:借助pg_stat_activity、pg_stat_bgwriter等视图监控数据库运行状态,结合如pgBadger、pg_top等工具分析性能瓶颈。 - 逐步调整:每次只更改一个参数,观察并评估效果,切忌盲目跟从网络上的推荐配置。 总结来说,PostgreSQL的强大性能背后,合理的配置是关键。要让咱们的数据库系统跑得溜又稳,像老黄牛一样可靠,给业务发展扎扎实实当好坚强后盾,那就必须把这些参数整得门儿清,调校得恰到好处才行。
2023-12-18 14:08:56
236
林中小径
转载文章
...分配了一个由 hd 前缀组成的文件;而对于各种 SCSI 设备,则分配了一个由 sd 前缀组成的文件。 例如,第一个 IDE 设备,Linux 就定义为 hda;第二个 IDE 设备就定义为 hdb;下面以此类推。而 SCSI 设备就应该是 sda、sdb、sdc 等。 分区数量 要进行分区就必须针对每一个硬件设备进行操作,这就有可能是一块IDE硬盘或是一块SCSI硬盘。对于每一个硬盘(IDE 或 SCSI)设备,Linux 分配了一个 1 到 16 的序列号码,这就代表了这块硬盘上面的分区号码。 例如,第一个 IDE 硬盘的第一个分区,在 Linux 下面映射的就是 hda1,第二个分区就称作是 hda2。对于 SCSI 硬盘则是 sda1、sdb1 等。 本篇文章为转载内容。原文链接:https://blog.csdn.net/weixin_39713578/article/details/111950574。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-04-26 12:47:34
116
转载
站内搜索
用于搜索本网站内部文章,支持栏目切换。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
renice -n [+|-priority] pid
- 更改进程运行时的优先级。
推荐内容
推荐本栏目内的其它文章,看看还有哪些文章让你感兴趣。
2023-04-28
2023-08-09
2023-06-18
2023-04-14
2023-02-18
2023-04-17
2024-01-11
2023-10-03
2023-09-09
2023-06-13
2023-08-07
2023-03-11
历史内容
快速导航到对应月份的历史文章列表。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"