前端技术
HTML
CSS
Javascript
前端框架和UI库
VUE
ReactJS
AngularJS
JQuery
NodeJS
JSON
Element-UI
Bootstrap
Material UI
服务端和客户端
Java
Python
PHP
Golang
Scala
Kotlin
Groovy
Ruby
Lua
.net
c#
c++
后端WEB和工程框架
SpringBoot
SpringCloud
Struts2
MyBatis
Hibernate
Tornado
Beego
Go-Spring
Go Gin
Go Iris
Dubbo
HessianRPC
Maven
Gradle
数据库
MySQL
Oracle
Mongo
中间件与web容器
Redis
MemCache
Etcd
Cassandra
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Nacos
Consul
Tomcat
Nginx
Netty
大数据技术
Hive
Impala
ClickHouse
DorisDB
Greenplum
PostgreSQL
HBase
Kylin
Hadoop
Apache Pig
ZooKeeper
SeaTunnel
Sqoop
Datax
Flink
Spark
Mahout
数据搜索与日志
ElasticSearch
Apache Lucene
Apache Solr
Kibana
Logstash
数据可视化与OLAP
Apache Atlas
Superset
Saiku
Tesseract
系统与容器
Linux
Shell
Docker
Kubernetes
[查询缓存大小配置最佳实践]的搜索结果
这里是文章列表。热门标签的颜色随机变换,标签颜色没有特殊含义。
点击某个标签可搜索标签相关的文章。
点击某个标签可搜索标签相关的文章。
Kibana
...icsearch发出查询请求,然后把那些符合你条件的数据给挖出来,以一种可视化的方式展示给你看,就像变魔术一样。如果这个过程耗时较长或者返回为空,通常涉及到以下几个可能因素: - 查询语句过于复杂或宽泛 - Elasticsearch集群性能瓶颈 - 网络延迟或带宽限制 - Kibana自身的配置问题 3. 深入排查原因(举例说明) 示例1:查询语句分析 json GET /my_index/_search { "query": { "match_all": {} }, "size": 5000 } 上述代码是一个简单的match_all查询,试图从my_index中获取5000条记录。如果您的索引数据量巨大,这样的查询将会消耗大量资源,导致Discover页面加载缓慢。此时,可以尝试优化查询条件,比如添加时间范围过滤、字段筛选等。 示例2:检查Elasticsearch性能指标 借助Elasticsearch的监控API,我们可以获取节点、索引及查询的性能指标: bash curl -X GET 'localhost:9200/_nodes/stats/indices,query_cache?human&pretty' 通过观察查询缓存命中率、分片分配状态以及CPU、内存使用情况,可以帮助我们判断是否因ES集群性能瓶颈导致Discover加载慢。 4. 解决策略与实践 策略1:优化查询条件与DSL 确保在Discover页面使用的查询语句高效且有针对性。例如,使用range查询限定时间范围,使用term或match精确匹配特定字段,或利用bool查询进行复杂的组合条件过滤。 策略2:调整Elasticsearch集群配置 - 增加硬件资源,如提升CPU核数、增加内存大小。 - 调整索引设置,如合理设置分片数量和副本数量,优化refresh interval以平衡写入性能与实时性需求。 - 启用并适当调整查询缓存大小。 策略3:优化Kibana配置 在Kibana.yml配置文件中,可以对discover页面的默认查询参数进行调整,如设置默认时间范围、最大返回文档数等,以降低一次性加载数据量。 5. 结论与探讨 解决Kibana Discover页面加载数据慢或空白的问题,需要结合实际情况,从查询语句优化、Elasticsearch集群调优以及Kibana自身配置多方面着手。在实际操作的过程中,我们得像个福尔摩斯那样,一探究竟,把问题的根源挖个底朝天。然后,咱们得冷静分析,理性思考,不断尝试各种可能的优化方案,这样才能够让咱们的数据分析之路走得更加顺风顺水,畅通无阻。记住,每一次的成功优化都是对我们技术理解与应用能力的一次锤炼和提升!
2023-08-21 15:24:10
298
醉卧沙场
MySQL
慢查询日志 , 在MySQL数据库中,慢查询日志是一种专门记录执行时间超过特定阈值的SQL查询的日志文件。通过开启并配置慢查询日志,数据库管理员可以追踪和分析那些执行效率低下的查询语句,进而优化查询性能,提升整个系统的运行效率。结合文章中的应用场景,当在线MySQL数据库出现性能下降或查询速度变慢时,启用慢查询日志功能有助于找出问题所在。 索引状态 , 在数据库管理系统中,索引状态指的是数据库表中索引的使用情况、效率以及维护相关信息的状态指标。对于MySQL数据库而言,通过show status like %key_buffer% 命令可以查看与索引缓存(如key buffer)相关的状态信息,而show index from tablename;命令则用于展示特定表的索引定义及其详细属性。了解索引状态有助于判断索引是否有效利用、是否存在设计不合理或者需要更新维护等问题,从而对表结构进行优化以提高查询速度。 MySQL系统变量 , MySQL系统变量是MySQL服务器在运行过程中用来控制其行为和性能的各种参数设置。这些变量可以在全局级别或会话级别设置,并影响到诸如缓冲区大小、连接管理、查询优化器的行为等多个方面。例如,在文中提到的set global slow_query_log=1;命令用于全局范围内开启慢查询日志功能,而set global long_query_time=2;则是设置长查询的时间阈值为2秒。通过show variables like %query% ;可以查看所有与查询操作相关的系统变量,帮助数据库管理员根据实际情况调整这些参数,以达到优化MySQL数据库性能的目的。
2023-04-11 19:17:38
93
电脑达人
Hibernate
...我们进一步认识到正确配置和使用ORM框架对于现代应用程序开发的重要性。近期,随着Java生态持续发展,Spring Boot 2.5版本对JPA(Java Persistence API)及与其紧密集成的Hibernate提供了更多优化支持。例如,开发者现在可以利用新版特性改进实体类映射管理,并借助更精细化的缓存策略提升数据访问性能。 同时,为了更好地应对实体映射相关的问题,社区中涌现出许多实用工具和技术文章。其中,《深入剖析Spring Data JPA与Hibernate最佳实践》一文就详细解读了如何避免常见的实体映射错误,通过实例演示了如何结合最新框架特性进行有效调试和优化。此外,一篇名为《Hibernate性能调优实战》的技术博客则深度探讨了Hibernate缓存机制,以及如何根据实际场景调整缓存策略以降低未知实体异常的风险。 总之,紧跟技术前沿并结合实践经验,是有效解决类似“Unknown entity”异常的关键。开发者应不断学习和完善自身对ORM框架的理解,从而确保在项目开发过程中能高效、稳定地操作数据库,提高应用的整体性能表现。
2023-10-12 18:35:41
463
红尘漫步-t
Apache Solr
...际上,除了文中提到的查询缓存调整、索引文件大小控制以及增加物理内存等基础解决方案外,最新版本的Solr提供了更为精细和智能的内存管理机制。 例如,在Solr 8.x版本中引入了全新的内存分析工具,可以实时监控并可视化Java堆内存的使用情况,帮助用户更准确地定位内存瓶颈,并根据实际业务负载进行动态调整。此外,针对大规模分布式部署环境,Solr还支持在各个节点之间均衡内存资源,避免局部节点内存溢出的问题。 同时,社区及各大云服务商也持续推出针对Solr性能优化的实践指导和案例分享。例如,阿里云在其官方博客上就曾发布过一篇深度解析文章,详细介绍了如何结合Zookeeper配置、分片策略以及冷热数据分离等手段,实现Solr集群的高效内存利用和整体性能提升。 因此,对于正在或计划使用Apache Solr构建复杂搜索服务的用户来说,关注相关领域的最新研究进展和技术实践,将有助于更好地应对“java.lang.OutOfMemoryError: Java heap space”这类内存问题,从而确保系统的稳定性和用户体验。
2023-04-07 18:47:53
453
凌波微步-t
SpringCloud
...ngCloud的各种配置秘籍和实战技术,还会配上活灵活现的代码实例,实实在在地帮大伙儿把这个难题给整明白、解决掉。 2. 问题解析 超时的原因与影响 当我们的微服务应用出现"超时"情况时,通常涉及以下几个层面: - 网络延迟:服务间调用时,由于网络环境不稳定或拥塞,请求可能无法在设定的时间内到达目标服务。 - 服务处理耗时过长:被调用的服务端逻辑复杂、资源消耗大,导致无法在预设的响应时间内完成处理并返回结果。 - 线程池不足:服务端处理请求的线程池大小设置不当,导致请求堆积,无法及时处理。 3. SpringCloud中的超时配置及优化策略 (1) Hystrix超时设置 Hystrix是SpringCloud中用于实现服务容错和隔离的重要组件。我们可以通过调整hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds属性来设定命令执行的超时时间: java // application.yml hystrix: command: default: execution: isolation: thread: timeoutInMilliseconds: 5000 设置超时时间为5秒 (2) Ribbon客户端超时配置 Ribbon是SpringCloud中的客户端负载均衡器,它允许我们为HTTP请求设置连接超时(ConnectTimeout)和读取超时(ReadTimeout): java @Configuration public class RibbonConfiguration { @Bean publicribbon: ReadTimeout: 2000 设置读取超时时间为2秒 ConnectTimeout: 1000 设置连接超时时间为1秒 } } (3) 服务端性能优化 对于服务处理耗时过长的问题,我们需要对服务进行性能优化,如数据库查询优化、缓存使用、异步处理等。例如,我们可以利用@Async注解实现异步方法调用: java @Service public class SomeService { @Async public Future timeConsumingTask() { // 这是一个耗时的操作... return new AsyncResult<>("Task result"); } } 4. 系统设计层面的思考与探讨 除了上述具体配置和优化措施外,我们也需要从系统设计角度去预防和应对超时问题。比如,咱们可以像安排乐高积木一样,把各个服务间的调用关系巧妙地搭建起来,别让它变得太绕太复杂。同时呢,咱也要像精打细算的管家,充分揣摩每个服务的“饭量”(QPS和TPS)大小,然后据此给线程池调整合适的“碗筷”数量,再定个合理的“用餐时间”(超时阈值)。再者,就像在电路中装上保险丝、开关控制电流那样,我们可以运用熔断、降级、限流这些小妙招,确保整个系统的平稳运行,随时都能稳定可靠地为大家服务。 5. 结语 总之,面对SpringCloud应用中的“超时”问题,我们应根据实际情况,采取针对性的技术手段和策略,从配置、优化和服务设计等多个维度去解决问题。这个过程啊,可以说是挑战满满,但这也恰恰是技术最吸引人的地方——就是要不断去摸索、持续改进,才能打造出一套既高效又稳定的微服务体系。就像是盖房子一样,只有不断研究和优化设计,才能最终建成一座稳固又实用的大厦。而这一切的努力,最终都会化作用户满意的微笑和体验。
2023-04-25 12:09:08
39
桃李春风一杯酒
Greenplum
...Greenplum的缓存优化策略。在数据处理这块儿,相信咱都明白一个道理,甭管是关系型数据库还是大数据平台,缓存这家伙可是个不可或缺的关键角色。那么,咱们究竟怎样才能通过一些实打实的缓存优化策略,让Greenplum的整体性能蹭蹭上涨呢?不如现在就一起踏上这场揭秘之旅吧! 二、Greenplum缓存的基本概念 首先,我们需要了解Greenplum中的缓存是如何工作的。在Greenplum中,缓存分为两种类型:系统缓存和查询缓存。系统缓存就像是一个超能的小仓库,它专门用来存放咱们绿宝石的各种重要小秘密,这些小秘密包括了表格的结构设计图、查找路径的索引标签等等。而查询缓存则是为了加速重复查询,存储的是SQL语句及其执行计划。 三、缓存的配置和管理 接下来,我们来看看如何配置和管理Greenplum的缓存。首先,我们可以调整Greenplum的内存分配比例来影响缓存的大小。例如,我们可以使用以下命令来设置系统缓存的大小为总内存的25%: sql ALTER SYSTEM SET gp_cached_stmts = 'on'; ALTER SYSTEM SET gp_cache_size = 25; 其次,我们可以通过gp_max_statement_mem参数来限制单条SQL语句的最大内存使用量。这有助于防止大查询耗尽系统资源,影响其他并发查询的执行。 四、缓存的优化策略 最后,我们将讨论一些实际的缓存优化策略。首先,我们应该尽可能地减少对缓存的依赖。你知道吗,那个缓存空间它可不是无限大的,就像我们的手机内存一样,也是有容量限制的。要是咱们老是用大量的数据去频繁查询,就相当于不断往这个小仓库里塞东西,结果呢,可能会把这个缓存占得满满当当的,这样一来,整个系统的运行速度和效率可就要大打折扣了,就跟人吃饱了撑着跑不动是一个道理哈。 其次,我们可以使用视图或者函数来避免多次查询相同的数据。这样可以减少对缓存的需求,并且使查询更加简洁和易读。 再者,我们可以定期清理过期的缓存记录。Greenplum提供了VACUUM命令来进行缓存的清理。例如,我们可以使用以下命令来清理所有过期的缓存记录: sql VACUUM ANALYZE; 五、总结 总的来说,通过合理的配置和管理,以及适当的优化策略,我们可以有效地利用Greenplum的缓存,提高其整体性能。不过呢,咱也得明白这么个理儿,缓存这家伙虽然神通广大,但也不是啥都能搞定的。有时候啊,咱们要是过分依赖它,说不定还会惹出些小麻烦来。所以,在实际动手干的时候,咱们得瞅准具体的情况和需求,像变戏法一样灵活运用各种招数,摸排出最适合自己的那套方案来。真心希望这篇文章能帮到你,要是你有任何疑问、想法或者建议,尽管随时找我唠嗑哈!谢谢大家!
2023-12-21 09:27:50
405
半夏微凉-t
Apache Solr
...据更新后几乎立即进行查询,无需等待索引刷新。这一特性在新闻资讯、电商产品搜索等场景下尤为实用。比如,当一篇崭新的博客文章刚刚出炉,或者一个新产品热乎乎地上架时,用户就能在短短几秒钟内,通过输入关键词,像变魔术一样找到它们。 java // 假设我们有一个Solr客户端实例solrClient SolrInputDocument doc = new SolrInputDocument(); doc.addField("id", "unique_id"); doc.addField("title", "Real-Time Search with Apache Solr"); doc.addField("content", "This article explores the real-time search capabilities..."); UpdateResponse response = solrClient.add(doc); solrClient.commit(); // 提交更改,实现实时搜索 上述代码展示了如何向Solr添加一个新的文档并立即生效,实现了实时搜索的基本流程。 3. Solr实时搜索背后的原理 Solr的实时搜索主要依赖于Near Real-Time (NRT)搜索机制,即在文档被索引后,虽然不会立即写入硬盘,但会立刻更新内存中的索引结构,使得新数据可以迅速被搜索到。这个过程中,Solr巧妙地平衡了索引速度和搜索响应时间。 4. 实时搜索功能的优化与改进 尽管Solr的实时搜索功能强大,但在大规模数据处理中,仍需关注性能调优问题。以下是一些可能的改进措施: (1)合理配置UpdateLog Solr的NRT搜索使用UpdateLog来跟踪未提交的更新。你晓得不,咱们可以通过在solrconfig.xml这个配置文件里头动动手脚,调整一下那个updateLog参数,这样一来,就能灵活把控日志的大小和滚动规则了。这样做主要是为了应对各种不同的实时性需求,同时也能考虑到系统资源的实际限制,让整个系统运作起来更顺畅、更接地气儿。 xml ${solr.ulog.dir:} 5000 ... (2)利用软硬件优化 使用更快的存储设备(如SSD),增加内存容量,或者采用分布式部署方式,都可以显著提升Solr的实时搜索性能。 (3)智能缓存策略 Solr提供了丰富的查询缓存机制,如过滤器缓存、文档值缓存等,合理设置这些缓存策略,能有效减少对底层索引的访问频率,提高实时搜索性能。 (4)并发控制与批量提交 对于大量频繁的小规模更新,可以考虑适当合并更新请求,进行批量提交,既能减轻服务器压力,又能降低因频繁提交导致的I/O开销。 结语:Apache Solr的实时搜索功能为用户提供了一种高效、便捷的数据检索手段。然而,要想最大化发挥其效能,还需根据实际业务场景灵活运用各项优化策略。在这个过程中,技术人的思考、探索与实践,如同绘制一幅精准而生动的信息地图,让海量数据的价值得以快速呈现。
2023-07-27 17:26:06
451
雪落无痕
PostgreSQL
...stgreSQL系统配置错误:导致性能下降与故障发生的深层解析 1. 引言 PostgreSQL,作为一款功能强大、开源的关系型数据库管理系统,在全球范围内广受赞誉。不过呢,就像老话说的,“好马得配好鞍”,哪怕PostgreSQL这匹“骏马”有着超凡的性能和稳如磐石的稳定性,可一旦咱们给它配上不合适的“鞍子”,也就是配置出岔子或者系统闹点儿小情绪,那很可能就拖了它的后腿,影响性能,严重点儿还可能引发各种意想不到的问题。这篇文章咱们要接地气地聊聊,配置出岔子可能会带来的那些糟心影响,并且我还会手把手地带你瞧瞧实例代码,教你如何把配置调校得恰到好处,让这些问题通通远离咱们。 2. 配置失误对性能的影响 2.1 shared_buffers设置不合理 shared_buffers是PostgreSQL用于缓存数据的重要参数,其大小直接影响到数据库的查询性能。要是你把这数值设得过小,就等于是在让磁盘I/O忙个不停,频繁操作起来,就像个永不停歇的陀螺,会拖累整体性能,让系统跑得像只乌龟。反过来,如果你一不留神把数值调得过大,那就像是在内存里开辟了一大片空地却闲置不用,这就白白浪费了宝贵的内存资源,还会把其他系统进程挤得没地方住,人家也会闹情绪的。 postgresql -- 在postgresql.conf中调整shared_buffers值 shared_buffers = 4GB -- 假设服务器有足够内存支持此设置 2.2 work_mem不足 work_mem定义了每个SQL查询可以使用的内存量,对于复杂的排序、哈希操作等至关重要。过低的work_mem设定可能导致大量临时文件生成,进一步降低性能。 postgresql -- 调整work_mem大小 work_mem = 64MB -- 根据实际业务负载进行合理调整 3. 配置失误导致的故障案例 3.1 max_connections设置过高 max_connections参数限制了PostgreSQL同时接受的最大连接数。如果设置得过高,却没考虑服务器的实际承受能力,就像让一个普通人硬扛大铁锤,早晚得累垮。这样一来,系统资源就会被消耗殆尽,好比车票都被抢光了,新的连接请求就无法挤上这趟“网络列车”。最终,整个系统可能就要“罢工”瘫痪啦。 postgresql -- 不合理的高连接数设置示例 max_connections = 500 -- 若服务器硬件条件不足以支撑如此多的并发连接,则可能引发故障 3.2 日志设置不当造成磁盘空间耗尽 log_line_prefix、log_directory等日志相关参数设置不当,可能导致日志文件迅速增长,占用过多磁盘空间,进而引发数据库服务停止。 postgresql -- 错误的日志设置示例 log_line_prefix = '%t [%p]: ' -- 时间戳和进程ID前缀可能会使日志行变得冗长 log_directory = '/var/log/postgresql' -- 如果不加以定期清理,日志文件可能会撑满整个分区 4. 探讨与建议 面对PostgreSQL的系统配置问题,我们需要深入了解每个参数的含义以及它们在不同场景下的最佳实践。优化配置是一个持续的过程,需要结合业务特性和硬件资源来进行细致调优。 - 理解需求:首先,应了解业务特点,包括数据量大小、查询复杂度、并发访问量等因素。 - 监控分析:借助pg_stat_activity、pg_stat_bgwriter等视图监控数据库运行状态,结合如pgBadger、pg_top等工具分析性能瓶颈。 - 逐步调整:每次只更改一个参数,观察并评估效果,切忌盲目跟从网络上的推荐配置。 总结来说,PostgreSQL的强大性能背后,合理的配置是关键。要让咱们的数据库系统跑得溜又稳,像老黄牛一样可靠,给业务发展扎扎实实当好坚强后盾,那就必须把这些参数整得门儿清,调校得恰到好处才行。
2023-12-18 14:08:56
236
林中小径
HBase
...越的大数据存储和实时查询能力而备受青睐。然而,在面对人山人海的数据量和每秒上万次的访问压力时,怎样才能让HBase这个大块头更聪明地使用I/O和CPU资源,从而跑得更快、更强,无疑变成了一项既关键又颇具挑战性的任务。本文将通过实例剖析与实战演示的方式,引导你一步步探寻优化策略。 1. HBase I/O优化策略 1.1 数据块大小调整 HBase中的Region是其基本的数据存储单元,Region内部又由多个HFile组成,而每个HFile又被划分为多个数据块(Block Size)。默认情况下,HBase的数据块大小为64KB。如果数据块太小,就像是把东西分割成太多的小包装,这样一来,每次找东西的时候,就像翻箱倒柜地找小物件,不仅麻烦还增加了I/O操作的次数,就像频繁地开开关关抽屉一样。反过来,如果数据块太大,就好比你一次性拎一大包东西,虽然省去了来回拿的功夫,但可能会导致内存这个“仓库”空间利用得不够充分,有点儿大材小用的感觉。根据实际业务需求及硬件配置,适当调整数据块大小至关重要: java Configuration conf = HBaseConfiguration.create(); conf.setInt("hbase.hregion.blocksize", 128 1024); // 将数据块大小设置为128KB 1.2 利用Bloom Filter降低读取开销 Bloom Filter是一种空间效率极高的概率型数据结构,用于判断某个元素是否在一个集合中。在HBase中,启用Bloom Filter可以显著减少无效的磁盘I/O。以下是如何在表级别启用Bloom Filter的示例: java HTableDescriptor tableDesc = new HTableDescriptor(TableName.valueOf("myTable")); tableDesc.addFamily(new HColumnDescriptor("cf").set BloomFilterType(BloomType.ROW)); admin.createTable(tableDesc); 2. HBase CPU优化策略 2.1 合理设置MemStore和BlockCache MemStore和BlockCache是HBase优化CPU使用的重要手段。MemStore用来缓存未写入磁盘的新写入数据,BlockCache则缓存最近访问过的数据块。合理分配两者内存占比有助于提高系统性能: java conf.setFloat("hbase.regionserver.global.memstore.size", 0.4f); // MemStore占用40%的堆内存 conf.setFloat("hfile.block.cache.size", 0.6f); // BlockCache占用60%的堆内存 2.2 精细化Region划分与预分区 Region数量和大小直接影响到HBase的并行处理能力和CPU资源分配。通过对表进行预分区或适时分裂Region,可以避免热点问题,均衡负载,从而提高CPU使用效率: java byte[][] splits = new byte[][] {Bytes.toBytes("A"), Bytes.toBytes("M"), Bytes.toBytes("Z")}; admin.createTable(tableDesc, splits); // 预先对表进行3个区域的划分 3. 探讨与思考 优化HBase的I/O和CPU使用率是一个持续的过程,需要结合业务特性和实际运行状况进行细致分析和调优。明白了这个策略之后,咱们就得学着在实际操作中不断尝试和探索。就像调参数时,千万得瞪大眼睛盯着系统的响应速度、处理能力还有资源使用效率这些指标的变化,这些可都是我们判断优化效果好坏的重要参考依据。 总之,针对HBase的I/O和CPU优化不仅关乎技术层面的深入理解和灵活运用,更在于对整个系统运行状态的敏锐洞察和精准调控。每一次实践都是对我们对技术认知的深化,也是我们在大数据领域探索过程中不可或缺的一部分。
2023-08-05 10:12:37
506
月下独酌
转载文章
...数据;同时启用并合理配置MySQL的错误日志、通用查询日志和慢查询日志,可有效监控潜在的安全威胁和性能瓶颈。 此外,针对Linux系统下MySQL的资源管理与高可用性设置,可以参考《MySQL High Availability》一书,作者Jay Janssen和Baron Schwartz从实战角度详细解读了如何运用复制、集群及容灾技术实现MySQL服务的高可用和故障切换。 综上所述,MySQL的持续学习和最佳实践探索是每一位数据库管理员的重要任务,时刻关注官方更新动态、加强安全意识,并深入了解高级配置技巧,才能让Linux环境下运行的MySQL发挥出最大效能,为企业业务稳定高效运转提供坚实基础。
2023-05-24 19:00:46
119
转载
Impala
...ala作为高效SQL查询引擎的重要性日益凸显。近期,Cloudera公司发布了Impala的最新版本,引入了一系列新功能和性能优化升级。例如,新版本增强了对Parquet文件格式的支持,使得列式存储的优势在更多场景下得以充分发挥,进一步提升了数据读取速度和查询效率。 同时,针对当前实时分析与交互式查询的需求增加,Impala也在持续优化其内存管理和资源调度算法,确保在处理海量数据时仍能保持低延迟响应。不仅如此,新版Impala还加强了与Apache Kudu的集成,为用户提供了一种更为灵活的数据更新方案,满足混合读写工作负载的需求。 值得注意的是,在实际应用中,如何结合硬件配置、数据规模以及业务场景进行深度调优,仍然是最大化发挥Impala潜力的关键。因此,业界专家建议用户密切关注Impala社区的发展动态,并结合官方文档与最佳实践,不断探索和优化自身的查询策略及系统配置,以适应日新月异的大数据环境挑战。
2023-03-25 22:18:41
486
凌波微步-t
Superset
...境尤其重要。 SQL查询优化策略 , 是指一系列技术和方法,旨在提高SQL查询的执行效率,减少查询时间,优化资源使用。这包括但不限于使用索引、避免全表扫描、优化查询结构、批量处理等策略,以确保数据查询在处理大量数据时保持高效。 缓存优化指南 , 是针对缓存机制的一系列策略和实践,旨在提高数据访问速度和减少延迟。缓存通过存储经常访问的数据副本,使得数据可以在本地快速获取,而不是每次都从原始数据源加载。有效的缓存策略需要考虑缓存的大小、过期策略、数据一致性维护等多方面因素。 自动化脚本构建 , 指的是使用编程语言(如Python、Shell脚本等)编写自动执行任务的脚本。在数据管理和分析场景中,自动化脚本可以用于执行定期的数据验证、数据更新、错误检测和修复等任务,提高工作效率和减少人为错误。 分页查询最佳实践 , 是指在处理大型数据集时,使用分页查询技术的一种优化策略。分页查询允许系统一次只加载一部分数据,从而减少内存使用和加载时间,提高查询性能。这种策略在数据量大、需要频繁查询的场景下特别有用。 云计算和边缘计算技术 , 云计算指的是通过互联网提供可扩展的计算资源和服务,用户无需直接管理硬件基础设施。边缘计算则是在数据产生源附近处理数据,减少数据传输延迟,提高响应速度和效率。两者都对实时数据分析和处理有重要作用,能够帮助企业更快速、更有效地利用数据。 智能化水平 , 指的是通过自动化、机器学习、人工智能等技术提高系统或过程的自主性和效率的能力。在数据管理和分析领域,智能化水平的提升可以帮助企业自动化重复性工作、预测趋势、优化决策,从而提高整体运营效率和竞争力。
2024-08-21 16:16:57
110
青春印记
MemCache
...于Web应用程序中的缓存处理,以提高网站性能。然而,在实际应用过程中,我们可能会遇到Memcached进程占用CPU过高的问题。这不仅会影响系统的运行效率,还可能引发一系列问题。这篇文章会手把手教你一步步弄明白,为啥Memcached这个小家伙有时候会使劲霸占CPU资源,然后咱再一起商量商量怎么把它给“治”好,让它恢复正常运作。 二、Memcached进程占用CPU高的原因分析 1. Memcached配置不当 当Memcached配置不当时,会导致其频繁进行数据操作,从而增加CPU负担。比如说,要是你给数据设置的过期时间太长了,让Memcached这个家伙没法及时把没用的数据清理掉,那可能会造成CPU这老兄压力山大,消耗过多的资源。 示例代码如下: python import memcache mc = memcache.Client(['localhost:11211']) mc.set('key', 'value', 120) 上述代码中,设置的数据过期时间为120秒,即两分钟。这就意味着,即使数据已经没啥用了,Memcached这家伙还是会死拽着这些数据不放,在接下来的两分钟里持续占据着CPU资源不肯放手。 2. Memcached与大量客户端交互 当Memcached与大量客户端频繁交互时,会加重其CPU负担。这是因为每次交互都需要进行复杂的计算和数据处理操作。比如,想象一下你运营的Web应用火爆到不行,用户请求多得不得了,每个请求都得去Memcached那儿抓取数据。这时候,Memcached这个家伙可就压力山大了,CPU资源被消耗得嗷嗷叫啊! 示例代码如下: python import requests for i in range(1000): response = requests.get('http://localhost/memcached/data') print(response.text) 上述代码中,循环执行了1000次HTTP GET请求,每次请求都会从Memcached获取数据。这会导致Memcached的CPU资源消耗过大。 三、排查Memcached进程占用CPU高的方法 1. 使用top命令查看CPU使用情况 在排查Memcached进程占用CPU过高的问题时,我们可以首先使用top命令查看系统中哪些进程正在占用大量的CPU资源。例如,以下输出表示PID为31063的Memcached进程正在占用大量的CPU资源: javascript top - 13:34:47 up 1 day, 6:13, 2 users, load average: 0.24, 0.36, 0.41 Tasks: 174 total, 1 running, 173 sleeping, 0 stopped, 0 zombie %Cpu(s): 0.2 us, 0.3 sy, 0.0 ni, 99.5 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st KiB Mem : 16378080 total, 16163528 free, 182704 used, 122848 buff/cache KiB Swap: 0 total, 0 free, 0 used. 2120360 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 3106 root 20 0 1058688 135484 4664 S 45.9 8.3 1:23.79 python memcached_client.py 我们可以看到,PID为31063的Python程序正在占用大量的CPU资源。接着,我们可以使用ps命令进一步了解这个进程的情况: bash ps -p 3106 2. 查看Memcached配置文件 在确认Memcached进程是否异常后,我们需要查看其配置文件,以确定是否存在配置错误导致的高CPU资源消耗。例如,以下是一个默认的Memcached配置文件(/etc/memcached.conf)的一部分: php-template Default MaxItems per key (65536). default_maxbytes 67108864 四、解决Memcached进程占用CPU高的方案 1. 调整Memcached配置 根据Memcached配置不当的原因,我们可以调整相关参数来降低CPU资源消耗。例如,可以减少过期时间、增大最大数据大小等。以下是修改过的配置文件的一部分: php-template Default MaxItems per key (131072). default_maxbytes 134217728 Increase expiration time to reduce CPU usage. default_time_to_live 14400 2. 控制与Memcached的交互频率 对于因大量客户端交互导致的高CPU资源消耗问题,我们可以采取一些措施来限制与Memcached的交互频率。例如,可以在服务器端添加限流机制,防止短时间内产生大量请求。或者,优化客户端代码,减少不必要的网络通信。 3. 提升硬件设备性能 最后,如果其他措施都无法解决问题,我们也可以考虑提升硬件设备性能,如增加CPU核心数量、扩大内存容量等。但这通常不是最佳解决方案,因为这可能会带来更高的成本。 五、结论 总的来说,Memcached进程占用CPU过高是一个常见的问题,其产生的原因是多种多样的。要真正把这个问题给揪出来,咱们得把系统工具和实际操作的经验都使上劲儿,得像钻井工人一样深入挖掘Memcached这家伙的工作内幕和使用门道。只有这样,才能真正找到问题的关键所在,并提出有效的解决方案。 感谢阅读这篇文章,希望对你有所帮助!
2024-01-19 18:02:16
95
醉卧沙场-t
Apache Solr
...1. 引言 Solr查询性能的困惑 嗨,朋友们!今天我要跟大家聊聊一个让我头疼了好一阵子的问题——Apache Solr的查询性能不稳定。这事真让我头疼,谁不希望自己的搜索系统又快又准呢?我在一个项目里用了Solr,本来以为它能大显神通,没想到查询速度时快时慢,有时简直让人想砸键盘!我刚开始还以为是自己出了什么岔子,不过后来才发现原来不只是我一个人碰到了这个问题。我就想,干脆好好查一查,看看是不是啥外部因素或者设置问题搞的鬼。 2. 初步排查 Solr配置检查 2.1 索引优化 首先,我想到的是索引是否进行了优化。Solr的索引优化对于查询性能至关重要。如果索引过大且碎片较多,那么查询速度自然会受到影响。我查看了Solr的日志文件,发现确实存在一些索引碎片。为了优化索引,我执行了以下命令: bash curl http://localhost:8983/solr/mycollection/update?optimize=true&maxSegments=1 这个命令会将所有索引合并成一个段,并释放未使用的空间。运行后,查询速度确实有所提升,但这只是暂时的解决方案。 2.2 缓存设置 接着,我又检查了Solr的缓存设置。Solr提供了多种缓存机制,如Query Result Cache、Document Cache等,这些缓存可以显著提高查询性能。我调整了配置文件solrconfig.xml中的相关参数: xml size="512" initialSize="128" autowarmCount="64" eternal="true" ttiMillis="0" ttlMillis="0"/> 通过调整缓存大小和预热数量,我发现查询响应时间有所改善,但还是不够稳定。 3. 深入分析 外部依赖的影响 3.1 网络延迟 在排除了内部配置问题后,我开始怀疑是否有外部因素在作祟。经过一番排查,我发现网络延迟可能是罪魁祸首之一。Solr在处理查询时,得从好几个地方找信息,如果网速慢得像乌龟爬,那查询速度肯定也会变慢。我用ping命令测了一下和数据库服务器的连接,发现确实有点儿延时,挺磨人的。为了解决这个问题,我在想是不是可以在Solr服务器和数据库服务器中间加一台缓存服务器。这样就能少直接去查数据库了,效率应该能提高不少。 3.2 第三方API调用 除了网络延迟外,第三方API调用也可能是导致性能不稳定的另一个原因。Solr在处理某些查询时,可能需要调用外部服务来获取额外的数据。如果这些服务响应缓慢,整个查询过程也会变慢。我翻了一下Solr的日志,发现有些查询卡在那儿等外部服务回应,结果等超时了。为了搞定这个问题,我在Solr里加了个异步召唤的功能,这样Solr就能一边等着外部服务响应,一边还能接着处理别的查询请求了。具体代码如下: java public void handleExternalRequest() { CompletableFuture.supplyAsync(() -> { // 调用外部服务获取数据 return fetchDataFromExternalService(); }).thenAccept(result -> { // 处理返回的数据 processResult(result); }); } 4. 实践经验分享 配置波动与性能优化 4.1 动态配置管理 在实践中,我发现Solr的配置文件经常需要根据实际需求进行调整。然而,频繁地修改配置文件可能导致系统性能不稳定。为了更好地管理配置文件的变化,我建议使用动态配置管理工具,如Zookeeper。Zookeeper可帮我们在不耽误Solr正常运转的前提下更新配置,这样就不用担心因为调整设置而影响性能了。 4.2 监控与报警 最后,我强烈建议建立一套完善的监控和报警机制。通过实时盯着Solr的各种表现(比如查询速度咋样、CPU用得多不多等),我们就能赶紧发现状况,然后迅速出手解决。另外,咱们得设定好警报线,就像给系统设个底线。一旦性能掉到这线下,它就会自动给我们发警告。这样我们就能赶紧找出毛病,及时修好,不让小问题拖成大麻烦。例如,可以使用Prometheus和Grafana来搭建监控系统,代码示例如下: yaml Prometheus配置 global: scrape_interval: 15s scrape_configs: - job_name: 'solr' static_configs: - targets: ['localhost:8983'] json // Grafana仪表盘JSON配置 { "dashboard": { "panels": [ { "type": "graph", "title": "Solr查询响应时间", "targets": [ { "expr": "solr_query_response_time_seconds", "legendFormat": "{ {instance} }" } ] } ] } } 5. 结语 共勉与展望 总的来说,Solr查询性能不稳定是一个复杂的问题,可能涉及多方面的因素。咱们得从内部设置、外部依赖还有监控报警这些方面一起考虑,才能找出个靠谱的解决办法。在这个过程中,我也学到了很多,希望大家能够从中受益。未来,我将继续探索更多关于Solr优化的方法,希望能与大家共同进步! 希望这篇文章对你有所帮助,如果你有任何疑问或想法,欢迎随时交流讨论。
2025-02-08 16:04:27
36
蝶舞花间
HBase
...),甚至调整数据量的大小。然后,咱们就可以通过观察HBase在这些极限条件下的表现,看看它是否能够坚挺如初,表现出色。 (2)监控分析 利用HBase自带的监控接口或第三方工具(如Grafana+Prometheus)实时收集并分析集群的各项指标,如RegionServer负载均衡状况、内存使用率、磁盘I/O、RPC延迟等,以发现可能存在的性能瓶颈。 4. HBase性能调优策略 (1)配置优化 - 网络参数:调整hbase.client.write.buffer大小以适应网络带宽和延迟。 - 内存分配:合理分配BlockCache和MemStore的空间,以平衡读写性能。 - Region大小:根据数据访问模式动态调整Region大小,防止热点问题。 (2)架构优化 - 增加RegionServer节点,提高并发处理能力。 - 采用预分裂策略避免Region快速膨胀导致的性能下降。 (3)数据模型优化 - 合理设计RowKey,实现热点分散,提升查询效率。 - 根据查询需求选择合适的列族压缩算法,降低存储空间占用。 5. 实践案例与思考过程 在一次实践中,我们发现某业务场景下HBase读取速度明显下滑。经过YCSB压测后,定位到RegionServer的BlockCache已满,导致频繁的磁盘IO。于是我们决定给BlockCache扩容,让它变得更大些,同时呢,为了让热点现象不再那么频繁出现,我们对RowKey的结构进行了大刀阔斧的改造。这一系列操作下来,最终咱们成功让系统的性能蹭蹭地往上提升啦!在这个过程中,我们可是实实在在地感受到了,摸清业务特性、一针见血找准问题所在,还有灵活运用各种调优手段的重要性,这简直就像是打游戏升级一样,缺一不可啊! 6. 结语 性能测试与调优是HBase运维中的必修课,它需要我们既具备扎实的技术理论知识,又要有敏锐的洞察力和丰富的实践经验。经过对HBase从头到脚、一丝不苟的性能大考验,再瞅瞅咱的真实业务场景,咱们能针对性地使出一些绝招进行调优。这样一来,HBase就能更溜地服务于我们的业务需求,在大数据的世界里火力全开,展现它那无比强大的能量。
2023-03-14 18:33:25
580
半夏微凉
Cassandra
...Cassandra的缓存清洗策略 1. 为什么我们需要关注缓存清洗? 嘿,大家好!今天咱们聊聊Cassandra的缓存清洗策略。提到Cassandra,那可是分布式数据库里的大明星啊!它特别在行的就是对付海量数据和超高并发的请求,简直是这方面的扛把子!不过,Cassandra也有它的烦恼——那就是缓存问题。 在Cassandra中,缓存是提高读性能的重要手段。无论是Key Cache还是Row Cache,它们都能显著提升查询速度。但是,缓存并不是万能的,它也有容量限制。一旦缓存满了,就得进行清理,否则新的数据就没地方存放了。这就引出了我们今天的主题——缓存清洗策略。 缓存清洗策略的核心在于平衡内存使用与性能需求。如果清洗策略不当,可能会导致频繁的缓存失效,从而影响应用性能。所以,咱们得好好研究一下,如何让缓存既高效又稳定。 --- 2. Key Cache 缓存主键索引 先来说说Key Cache。它是用来缓存表的主键索引的。每次Cassandra要查东西的时候,它都会先翻翻Key Cache这个小本本,看看主键索引在不在里面。要是找到了,就顺着线索去磁盘上把数据给捞出来。这样可以大幅减少磁盘I/O操作。 2.1 缓存清洗策略:LRU vs. LRU + TTL Cassandra默认使用的是LRU(Least Recently Used)算法来管理Key Cache。LRU的意思是最少最近使用的缓存会被优先淘汰。简单来说,就是谁最近没被访问过,谁就倒霉。 不过,Cassandra还提供了一种更灵活的策略——结合TTL(Time To Live)。通过设置TTL,我们可以指定缓存项的有效期。就算是刚刚才用到的缓存,如果超过了规定的时间,照样会被踢走。 示例代码: java // 设置Key Cache大小为100MB,并启用TTL功能 Cluster cluster = Cluster.builder() .addContactPoint("127.0.0.1") .withQueryOptions(new QueryOptions().setConsistencyLevel(ConsistencyLevel.ONE)) .withPoolingOptions(new PoolingOptions().setMaxSimultaneousRequestsPerConnectionLocal(128)) .withCodecRegistry(DefaultCodecRegistry.DEFAULT) .withConfigLoader(new ConfigLoader() { @Override public Config loadConfig() { return ConfigFactory.parseString( "cassandra.key_cache_size_in_mb: 100\n" + "cassandra.key_cache_save_period: 14400\n" + "cassandra.key_cache_tti_seconds: 3600" ); } }) .build(); 在这个例子中,我们设置了Key Cache的大小为100MB,并启用了TTL功能,TTL时间为3600秒(即1小时)。这就相当于说,哪怕某个东西刚被人用过没多久,但只要超过了1个小时,就会被系统踢走,不管三七二十一,直接清掉! --- 3. Row Cache 缓存整行数据 接下来聊聊Row Cache。Row Cache就像是个专门存整行数据的小金库,特别适合那种经常被人翻出来看,但几乎没人动它的东西。相比Key Cache,Row Cache的命中率更高,但占用的内存也更多。 3.1 缓存清洗策略:手动控制 Row Cache的清洗策略相对简单,主要依赖于手动配置。你可以通过调整row_cache_size_in_mb参数来控制Row Cache的大小。如果Row Cache满了,Cassandra会根据LRU算法淘汰最老的缓存项。 思考过程: 说实话,Row Cache的使用场景比较有限。Row Cache虽然能加快访问速度,但它特别“占地儿”,把内存占得满满当当的。更麻烦的是,它还爱“喜新厌旧”——一旦被踢出去,下次再想用的时候就得老老实实重新把数据装回来,挺折腾的。这不仅增加了延迟,还可能导致系统抖动。所以,在实际项目中,我建议谨慎使用Row Cache。 示例代码: yaml 配置Row Cache大小为50MB cassandra.row_cache_size_in_mb: 50 这段配置非常直观,直接设置了Row Cache的大小为50MB。要是你的电脑内存还挺空闲的,而且有些数据你经常要用到的话,那就可以试试打开 Row Cache 这个功能,这样能让你查东西的时候更快一点! --- 4. 缓存清洗的挑战与优化 最后,我想谈谈缓存清洗面临的挑战以及一些优化思路。 4.1 挑战:缓存一致性与性能平衡 缓存清洗的一个重要挑战是如何保持一致性。例如,当某个数据被更新时,缓存中的旧版本应该及时失效。然而,频繁的缓存失效会导致性能下降。所以啊,咱们得找那么个折中的办法,既能保证缓存里的数据跟实际的是一模一样的,又不用老是去清理它,省得麻烦。 我的理解: 其实,这个问题的本质是权衡。咱得好好琢磨这缓存的事儿啊!一方面呢,可不能让它变成脏数据的老窝,不然麻烦就大了;另一方面嘛,又希望能把缓存稳住,别老是频繁地刷新清洗,太折腾了。我觉得,可以通过动态调整TTL值来解决这个问题。比如说,那些经常要更新的数据,咱们就给它设个短一点的TTL(就是“生存时间”啦),这样过段时间就自动清理掉,省得占地方。但要是那些很少更新的数据呢,就可以设个长点的TTL,让它在那儿多待会儿,不用频繁操心。 4.2 优化:监控与调参 另一个重要的优化方向是监控和调参。Cassandra自带一堆超实用的监控数据,像缓存命中率这种关键指标,还有缓存命中的具体时间啥的,都能一清二楚地给你展示出来!通过这些指标,我们可以实时了解缓存的状态,并据此调整参数。 实际经验: 记得有一次,我们的Key Cache命中率突然下降,经过排查发现是因为缓存大小设置得太小了。嘿,咱们就实话实说吧!之前Key Cache的容量才50MB,小得可怜,后来一狠心把它调大到200MB,结果怎么样?效果立竿见影啊,命中率直接飙升了20%以上,简直像是给系统开挂了一样!所以,定期监控和动态调整参数是非常必要的。 --- 5. 结语 好了,到这里,关于Cassandra的缓存清洗策略就聊完了。总的来说,缓存清洗是个复杂但有趣的话题。它考验着我们的技术水平,也锻炼着我们的耐心和细心。 希望大家在实际工作中,能够根据自己的业务特点,合理选择缓存策略。记住,没有一成不变的最佳实践,只有最适合你的解决方案。 好了,今天就到这里吧!如果你还有其他问题,欢迎随时来找我讨论。咱们下次再见啦!👋
2025-05-11 16:02:40
61
心灵驿站
Redis
...用中的最新应用趋势与最佳实践 随着云计算、大数据和物联网等技术的快速发展,现代Web应用面临着前所未有的挑战和机遇。在这样的背景下,Redis作为高性能、灵活的内存数据结构存储系统,其在Web应用中的应用趋势与最佳实践也日益受到关注。本文将探讨Redis在现代Web应用中的最新应用趋势,以及如何通过最佳实践提高应用性能和用户体验。 1. 低延迟与高并发场景优化 在高流量、高并发的Web应用中,低延迟和高吞吐量是至关重要的。Redis通过其内存优先的数据存储机制,显著降低了数据访问延迟,使得Web应用能够迅速响应用户请求。例如,在电商网站的秒杀活动期间,Redis可以用来存储临时的购物车信息,减少数据库的访问压力,从而确保交易的流畅性和稳定性。 2. 分布式系统中的协调与一致性 随着微服务架构的普及,分布式系统成为现代Web应用的主流形态。Redis通过其丰富的数据结构和事务支持,能够有效地在分布式环境中实现数据的一致性和协调。例如,使用Redis的发布/订阅模式实现服务间的异步通信,或者通过Redis的原子操作保证多节点之间的数据一致性,这些都是分布式系统设计中常见的最佳实践。 3. 缓存与数据加速 Redis的强大缓存能力在提升Web应用性能方面发挥着重要作用。通过将热点数据存储在内存中,Redis能够显著减少数据库查询次数,加快页面加载速度,提升用户体验。此外,Redis的持久化机制(如RDB和AOF)确保了缓存数据的安全性,即使在服务器崩溃后也能快速恢复。 4. 机器学习与数据分析 随着人工智能技术的发展,Redis在支持机器学习模型的训练和部署上展现出潜力。通过Redis的高效数据结构,可以快速存储和检索大量的特征向量,加速模型的训练过程。同时,Redis的实时分析能力使其成为实时数据分析场景的理想选择,如在线广告投放、个性化推荐等。 5. 安全与合规性考虑 在应用Redis的过程中,还需要注意安全性和合规性的问题。例如,确保敏感数据的加密存储、限制对Redis实例的访问权限、定期备份数据以防止数据丢失等。遵循行业标准和法律法规,如GDPR或CCPA,对于保护用户隐私至关重要。 总之,Redis凭借其高效、灵活的特点,在现代Web应用中扮演着越来越重要的角色。通过深入理解其在不同场景下的应用趋势和最佳实践,开发者可以更好地利用Redis提升应用性能、优化用户体验,并满足业务需求的多样化挑战。随着技术的不断演进,Redis的应用领域和最佳实践也将持续扩展,成为推动Web应用创新和发展的重要力量。
2024-08-20 16:11:43
98
百转千回
Impala
... Impala的查询性能与硬件配置:深度解析与实践探索 引言 在大数据时代,高效的数据分析成为企业决策的重要支撑。Apache Impala,这个家伙可真不简单!它就像个超级英雄,专门负责搞定那些海量数据的大任务。别看数据量大得能装满好几座山(PB级别),Impala一上阵,立马就能飞快地帮我们查询到需要的信息,而且还是那种边聊天边玩手机也能随时翻阅数据的那种速度,简直不要太爽!所以,如果你想找一个既能快速响应又能处理大数据的小伙伴,Impala绝对是你的菜!嘿,你知道吗?Impala的厉害之处在于它有个超酷的设计理念!那就是不让那些中间的数据白白地躺在那儿不动,而是尽可能地让所有的任务一起并肩作战。这样一来,不管你的数据有多大,Impala都能像小菜一碟一样,高效地完成查询,让你的数据分析快人一步!是不是超级牛逼啊?然而,要充分发挥Impala的潜力,硬件配置的选择与优化至关重要。嘿,兄弟!这篇大作就是要好好扒一扒 Impala 这个家伙的查询速度和咱们硬件设备之间的那点事儿。咱们要拿真实的代码例子来说明,怎么才能把这事儿给整得既高效又顺溜。咱们得聊聊,怎么根据你的硬件配置,调整 Impala 的设置,让它跑起来更快,效率更高。别担心,咱们不会用一堆干巴巴的术语让你头疼,而是用一些接地气的语言,让你一看就懂,一学就会的那种。准备好了吗?咱们这就开始,探索这个神秘的关系,找出最佳的优化策略,让你的查询快如闪电,流畅如丝! 1. Impala查询性能的关键因素 Impala的性能受到多种因素的影响,包括但不限于硬件资源、数据库架构、查询优化策略等。硬件配置作为基础,直接影响着查询的响应时间和效率。 - 内存:Impala需要足够的内存来缓存查询计划和执行状态,同时存储中间结果。内存的大小直接影响到并行度和缓存效果,进而影响查询性能。 - CPU:CPU的计算能力决定了查询执行的速度,尤其是在多线程环境下。合理的CPU分配可以显著提升查询速度。 - 网络:数据存储和计算之间的网络延迟也会影响查询性能,尤其是在分布式环境中。优化网络配置可以减少数据传输时间。 2. 实例代码 配置与优化 接下来,我们通过一段简单的代码实例,展示如何通过配置和优化来提升Impala的查询性能。 示例代码:查询性能调优配置 python 假设我们正在使用Cloudera Manager进行配置管理 调整Impala节点的内存配置 cloudera_manager.set_impala_config('memory', { 'query_mem_limit': '2GB', 根据实际需求调整查询内存限制 'coordinator_memory_limit': '16GB', 协调器的最大内存限制 'executor_memory_limit': '16GB' 执行器的最大内存限制 }) 调整CPU配额 cloudera_manager.set_impala_config('cpu', { 'max_threads_per_node': 8, 每个节点允许的最大线程数 'max_threads_per_core': 2 每个核心允许的最大线程数 }) 开启并行查询功能 cloudera_manager.set_impala_config('parallelism', { 'default_parallelism': 'auto' 自动选择最佳并行度 }) 运行查询前,确保表数据更新已同步到Impala cloudera_manager.refresh_table('your_table_name') cloudera_manager.compute_stats('your_table_name') print("配置已更新,查询性能调优已完成。") 这段代码展示了如何通过Cloudera Manager调整Impala节点的内存限制、CPU配额以及开启自动并行查询功能。通过这样的配置,我们可以针对特定的查询场景和数据集进行优化,提高查询性能。 3. 性能监控与诊断 为了确保硬件配置达到最佳状态,持续的性能监控和诊断至关重要。利用Impala自带的诊断工具,如Explain Plan和Profile,可以帮助我们深入了解查询执行的详细信息,包括但不限于执行计划、CPU和内存使用情况、I/O操作等。 Examine Plan 示例 bash 使用Explain Plan分析查询执行计划 impala-shell> EXPLAIN SELECT FROM your_table WHERE column = 'value'; 输出的结果将展示查询的执行计划,帮助识别瓶颈所在,为后续的优化提供依据。 4. 结语 Impala的查询性能与硬件配置息息相关,合理的配置不仅能提升查询效率,还能优化资源利用,降低运行成本。通过本文的探讨和示例代码的展示,希望能够激发读者对Impala性能优化的兴趣,并鼓励大家在实践中不断探索和尝试,以实现大数据分析的最佳效能。嘿,兄弟!你得明白,真正的硬仗可不只在找答案,而是在于找到那个对特定工作环境最合适的平衡点。这事儿啊,一半靠的是技巧,另一半还得靠点智慧。就像调鸡尾酒一样,你得知道加多少冰,放什么酒,才能调出那个完美的味道。所以,别急着去死记硬背那些公式和规则,多琢磨琢磨,多试试错,慢慢你会发现,找到那个平衡点,其实挺像在创作一首诗,又像是在解一道谜题。
2024-08-19 16:08:50
71
晚秋落叶
转载文章
...oreData的默认配置项。 调整 fullfsync = 1 , 保证写入文件顺序和提交顺序一致,拒绝设备重排顺序以优化性能。此项会降低性能。对比得出写入性能大概降低至默认值的25%左右。 优化效果: 根据微信的实践,调整配置项后,损坏率可以降低一半,但并不能完全避免损坏,所以我们还是需要补救措施。 补救措施: 通过查阅 SQLite 的相关资料,发现修复损坏数据库的两种思路和四种方案。 思路一:数据导出 .dump修复 从 master 表中读出一个个表的信息,根据根节点地址和创表语句来 select 出表里的数据,能 select 多少是多少,然后插入到一个新 DB 中。 每个SQLite DB都有一个sqlite_master表,里面保存着全部table和index的信息(table本身的信息,不包括里面的数据哦),遍历它就可以得到所有表的名称和 CREATE TABLE ...的SQL语句,输出CREATE TABLE语句,接着使用SELECT FROM ... 通过表名遍历整个表,每读出一行就输出一个INSERT语句,遍历完后就把整个DB dump出来了。 这样的操作,和普通查表是一样的,遇到损坏一样会返回SQLITE_CORRUPT,我们忽略掉损坏错误, 继续遍历下个表,最终可以把所有没损坏的表以及损坏了的表的前半部分读取出来。将 dump 出来的SQL语句逐行执行,最终可以得到一个等效的新DB。 思路二:数据备份 拷贝: 不能再直白的方式。由于SQLite DB本身是文件(主DB + journal 或 WAL), 直接把文件复制就能达到备份的目的。 .dump备份: 上一个恢复方案用到的命令的本来目的。在DB完好的时候执行.dump, 把 DB所有内容输出为 SQL语句,达到备份目的,恢复的时候执行SQL即可。 Backup API: SQLite自身提供的一套备份机制,按 Page 为单位复制到新 DB, 支持热备份。 综合思路:备份master表+数据导出 WCDB框架: 数据库完整时备份master表,数据库损坏时通过使用已备份的master表读取损坏数据库来恢复数据。成功率大概是70%。缺点在于我们目前项目使用的是CoreData框架,迁移成本非常的高。没有办法使用。 补救措施选型原则: 这么多的方案孰优孰劣?作为一个移动APP,我们追求的就是用户体验,根据资料推断只有万分之一不到的用户会发生DB损坏,不能为了极个别牺牲全体用户的体验。不影响用户体验的方法就是好方案。主要考量指标如下: 一:恢复成功率 由于牵涉到用户核心数据,“姑且一试”的方案是不够的,虽说 100% 成功率不太现实,但 90% 甚至 99% 以上的成功率才是我们想要的。 二:备份大小: 原本用户就可能有2GB 大的 DB,如果备份数据本身也有2GB 大小,用户想必不会接受。 三:备份性能: 性能则主要影响体验和备份成功率,作为用户不感知的功能,占用太多系统资源造成卡顿 是不行的,备份耗时越久,被系统杀死等意外事件发生的概率也越高。 数据导出方案考量: 恢复成功率大概是30%。不需要事先备份,故备份大小和备份性能都是最优的。 备份方案考量: 备份方案的理论恢复成功率都为100%,需要考量的即为备份大小和性能。 拷贝:备份大小等于原文件大小。备份性能最好,直接拷贝文件,不需要运算。 Backup API: 备份大小等于原文件大小。备份性能最差,原因是热备份,需要用到锁机制。 .dump:因为重新进行了排序,备份大小小于原文件。备份性能居中,需要遍历数据库生成语句。 可以看出,比较折中的选择是 Dump ,备份大小具有明显优势,备份性能尚可,恢复性能较差但由于需要恢复的场景较少,算是可以接受的短板。 深入钻研 即使优化后的方案,对于大DB备份也是耗时耗电,对于移动APP来说,可能未必有这样的机会做这样重度的操作,或者频繁备份会导致卡顿和浪费使用空间。 备份思路的高成本迫使我们从另外的方案考虑,于是我们再次把注意力放在之前的Dump方案。 Dump 方案本质上是尝试从坏DB里读出信息,这个尝试一般来说会出现两种结果: DB的基本格式仍然健在,但个别数据损坏,读到损坏的地方SQLite返回SQLITE_CORRUPT错误, 但已读到的数据得以恢复。 基本格式丢失(文件头或sqlite_master损坏),获取有哪些表的时候就返回SQLITE_CORRUPT, 根本没法恢复。 第一种可以算是预期行为,毕竟没有损坏的数据能部分恢复。从成功率来看,不少用户遇到的是第二种情况,这种有没挽救的余地呢? 要回答这个问题,先得搞清楚sqlite_master是什么。它是一个每个SQLite DB都有的特殊的表, 无论是查看官方文档Database File Format,还是执行SQL语句 SELECT FROM sqlite_master;,都可得知这个系统表保存以下信息: 表名、类型(table/index)、 创建此表/索引的SQL语句,以及表的RootPage。sqlite_master的表名、表结构都是固定的, 由文件格式定义,RootPage 固定为 page 1。 正常情况下,SQLite 引擎打开DB后首次使用,需要先遍历sqlite_master,并将里面保存的SQL语句再解析一遍, 保存在内存中供后续编译SQL语句时使用。假如sqlite_master损坏了无法解析,“Dump恢复”这种走正常SQLite 流程的方法,自然会卡在第一步了。为了让sqlite_master受损的DB也能打开,需要想办法绕过SQLite引擎的逻辑。 由于SQLite引擎初始化逻辑比较复杂,为了避免副作用,没有采用hack的方式复用其逻辑,而是决定仿造一个只可以 读取数据的最小化系统。 虽然仿造最小化系统可以跳过很多正确性校验,但sqlite_master里保存的信息对恢复来说也是十分重要的, 特别是RootPage,因为它是表对应的B-tree结构的根节点所在地,没有了它我们甚至不知道从哪里开始解析对应的表。 sqlite_master信息量比较小,而且只有改变了表结构的时候(例如执行了CREATE TABLE、ALTER TABLE 等语句)才会改变,因此对它进行备份成本是非常低的,一般手机典型只需要几毫秒到数十毫秒即可完成,一致性也容易保证, 只需要执行了上述语句的时候重新备份一次即可。有了备份,我们的逻辑可以在读取DB自带的sqlite_master失败的时候 使用备份的信息来代替。 到此,初始化必须的数据就保证了,可以仿造读取逻辑了。我们常规使用的读取DB的方法(包括dump方式恢复), 都是通过执行SQL语句实现的,这牵涉到SQLite系统最复杂的子系统——SQL执行引擎。我们的恢复任务只需要遍历B-tree所有节点, 读出数据即可完成,不需要复杂的查询逻辑,因此最复杂的SQL引擎可以省略。同时,因为我们的系统是只读的, 写入恢复数据到新 DB 只要直接调用 SQLite 接口即可,因而可以省略同样比较复杂的B-tree平衡、Journal和同步等逻辑。 最后恢复用的最小系统只需要: VFS读取部分的接口(Open/Read/Close),或者直接用stdio的fopen/fread、Posix的open/read也可以 B-tree解析逻辑 Database File Format 详细描述了SQLite文件格式, 参照之实现B-tree解析可读取 SQLite DB。 实现了上面的逻辑,就能读出DB的数据进行恢复了,但还有一个小插曲。我们知道,使用SQLite查询一个表, 每一行的列数都是一致的,这是Schema层面保证的。但是在Schema的下面一层——B-tree层,没有这个保证。 B-tree的每一行(或者说每个entry、每个record)可以有不同的列数,一般来说,SQLite插入一行时, B-tree里面的列数和实际表的列数是一致的。但是当对一个表进行了ALTER TABLE ADD COLUMN操作, 整个表都增加了一列,但已经存在的B-tree行实际上没有做改动,还是维持原来的列数。 当SQLite查询到ALTER TABLE前的行,缺少的列会自动用默认值补全。恢复的时候,也需要做同样的判断和支持, 否则会出现缺列而无法插入到新的DB。 解析B-tree方案上线后,成功率约为78%。这个成功率计算方法为恢复成功的 Page 数除以总 Page 数。 由于是我们自己的系统,可以得知总 Page 数,使用恢复 Page 数比例的计算方法比人数更能反映真实情况。 B-tree解析好处是准备成本较低,不需要经常更新备份,对大部分表比较少的应用备份开销也小到几乎可以忽略, 成功恢复后能还原损坏时最新的数据,不受备份时限影响。 坏处是,和Dump一样,如果损坏到表的中间部分,比如非叶子节点,将导致后续数据无法读出。 落地实践: 剥离封装RepairKit: 从WCDB框架中,剥离修复组件,并且封装其C++的原始API为OC管理类。 备份 master 表的时机: 我们发现 SQLite 里面 B+树 算法的实现是 向下分裂 的,也就是说当一个叶子页满了需要分裂时,原来的叶子页会成为内部节点,然后新申请两个页作为他的叶子页。这就保证了根节点一旦下来,是再也不会变动的。master 表只会在新创建表或者删除一个表时才会发生变化,而CoreData的机制表明每一次数据库的变动都要改动版本标识,那么我通过缓存和查询版本标识的变动来确定何时进行备份,避免频繁备份。 备份文件有效性: 既然 DB 可以损坏,那么这个备份文件也会损坏,怎么办呢?我用了双备份,每一个版本备份两个文件,如果一个备份恢复失败,就会启动另一个备份文件恢复。 介入恢复时机: 当CoreData初始化SQLite前,校验SQLite的Head完整性,如果不完整,进行介入修复。 经过我深入研究证明了这已经是最佳做法。 本篇文章为转载内容。原文链接:https://blog.csdn.net/a66666225/article/details/81637368。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-11-23 18:22:40
127
转载
转载文章
...MySQL服务器实例配置文件的基本内容和使用方法后,延伸阅读可关注以下几方面以获取更深入的理解与实际操作指导: 1. 最新MySQL版本特性解读:随着MySQL 8.x系列的发布,新版本引入了许多改进和新特性,如增强的安全性(如caching_sha2_password身份验证插件)、窗口函数、JSON字段支持等。阅读官方文档或技术博客可以掌握这些更新对服务器配置的影响以及如何在my.cnf中启用它们。 2. 数据库性能调优实践:针对特定应用场景调整MySQL服务器配置参数至关重要。例如,通过优化innodb_buffer_pool_size以提升InnoDB存储引擎的性能,或者调整query_cache_size以缓存查询结果。实时案例分析和专家建议可以帮助您更好地理解如何根据服务器硬件资源和工作负载特征进行有效调优。 3. 日志管理与故障排查:MySQL服务器的日志记录功能对于问题诊断和审计有着重要作用。学习如何通过配置慢查询日志、错误日志以及二进制日志实现对系统运行状况的有效监控,并借助相关工具分析日志数据来发现并解决潜在问题。 4. 高可用性和复制策略:在生产环境中,MySQL往往需要部署为集群或采用主从复制模式以确保服务的高可用性。深入研究server-id、binlog_format等相关配置项如何影响复制行为,并结合GTID(全局事务标识符)等高级复制特性进行实战演练。 5. 操作系统级优化配合MySQL:除了直接修改MySQL配置文件外,系统级别的优化也相当重要,包括合理分配内存、磁盘I/O调度策略、网络参数调整等,这些都会间接影响到MySQL服务器的性能表现。及时跟踪Linux或Windows操作系统的最佳实践指南,以实现软硬件层面的协同优化。 综上所述,MySQL服务器配置文件只是数据库运维中的一个环节,后续的学习应结合当前的技术发展动态、行业最佳实践以及自身业务需求,不断深化对MySQL以及其他相关技术栈的理解与应用能力。
2023-10-08 09:56:02
129
转载
转载文章
...用 课程计划媒资信息查询接口,获取该课程计划的视频播放的 m3u8 url地址,并返回给前端,前端使用该 url 进行视频的在线播放。 在线学习完整的测试流程:媒资信息的上传、选择、发布到前端门户、搜索门户测试,在线学习的播放视频。 目录 内容会比较多,小伙伴门可以根据目录进行按需查阅。 文章目录 😎 知识点概览 目录 一、学习页面:查询课程计划 0x01 需求分析 0x02 Api接口 0x03 服务端开发 Controller Service 测试 0x04 前端开发 配置NGINX虚拟主机 前端 API 方法 前端 API 方法调用 测试 二、学习页面:获取视频播放地址 0x01 需求分析 0x02 课程发布:储存媒资信息 需求分析 数据模型 Dao Service 测试 0x03 Logstash:扫描课程计划媒资 创建索引 创建模板文件 配置 mysql.conf 启动 logstash.bat Logstash多实例运行 0x04 搜素服务:查询课程媒资接口 需求分析 Api接口定义 Service Controller 测试 三、在线学习:接口开发 0x01 需求分析 0x02 搭建开发环境 0x03 Api接口 0x04 服务端开发 需求分析 搜索服务注册Eureka 搜索服务客户端 自定义错误代码 Service Controller 测试 0x05 前端开发 需求分析 api方法 配置代理 视频播放页面 简单的测试 完整的测试 1、上传文件 一些问题 ~~方案1:删除本地分块文件重新尝试上传~~ 方案2:检查前端提交的MD5值是否正确 2、为课程计划选择媒资信息 3、前端门户测试 四、待完善的一些功能 😁 认识作者 一、学习页面:查询课程计划 0x01 需求分析 到目前为止,我们已可以编辑课程计划信息并上传课程视频,下一步我们要实现在线学习页面动态读取章节对应的视频并进行播放。在线学习页面所需要的信息有两类: 课程计划信息 课程学习信息(视频地址、学习进度等) 如下图: 在线学习集成媒资管理的需求如下: 1、在线学习页面显示课程计划 2、点击课程计划播放该课程计划对应的视频 本章节实现学习页面动态显示课程计划,进入不同课程的学习页面右侧动态显示当前课程的课程计划。 0x02 Api接口 课程计划信息从哪里获取? 在课程发布完成后会自动发布到一个 course_pub 的表中,logstash 会自动将课程发布后的信息自动采集到 ES 索引库中,这些信息也包含课程计划信息。 所以考虑性能要求,课程发布后对课程的查询统一从 ES 索引库中查询。 前端通过请求 搜索服务 获取课程信息,需要单独在 搜索服务 中定义课程信息查询接口。 本接口接收课程id,查询课程所有信息返回给前端。 我们在搜素服务 API 下添加以下方法 @ApiOperation("根据id搜索课程发布信息")public Map<String,CoursePub> getdetail(String id); 返回的课程信息为 json 结构:key 为课程id,value 为课程内容。 0x03 服务端开发 在搜索服务中开发查询课程信息接口。 Controller 在搜素服务下添加以下方法 / 根据id搜索课程发布信息 @param id 课程id @return JSON数据/@Override@GetMapping("/getdetail/{id}")public Map<String, CoursePub> getdetail(@PathVariable("id")String id) {return esCourseService.getdetail(id);} Service / 根据id搜索课程发布信息 @param id 课程id @return JSON数据/public Map<String, CoursePub> getdetail(String id) {//设置索引SearchRequest searchRequest = new SearchRequest(es_index);//设置类型searchRequest.types(es_type);//创建搜索源对象SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();//设置查询条件,根据id进行查询searchSourceBuilder.query(QueryBuilders.termQuery("id",id));//这里不使用source的原字段过滤,查询所有字段// searchSourceBuilder.fetchSource(new String[]{"name", "grade", "charge","pic"}, newString[]{});//设置搜索源对象searchRequest.source(searchSourceBuilder);//执行搜索SearchResponse searchResponse = null;try {searchResponse = restHighLevelClient.search(searchRequest);} catch (IOException e) {e.printStackTrace();}//获取搜索结果SearchHits hits = searchResponse.getHits();SearchHit[] searchHits = hits.getHits(); //获取最优结果Map<String,CoursePub> map = new HashMap<>();for (SearchHit hit: searchHits) {//从搜索结果中取值并添加到coursePub对象Map<String, Object> sourceAsMap = hit.getSourceAsMap();String courseId = (String) sourceAsMap.get("id");String name = (String) sourceAsMap.get("name");String grade = (String) sourceAsMap.get("grade");String charge = (String) sourceAsMap.get("charge");String pic = (String) sourceAsMap.get("pic");String description = (String) sourceAsMap.get("description");String teachplan = (String) sourceAsMap.get("teachplan");CoursePub coursePub = new CoursePub();coursePub.setId(courseId);coursePub.setName(name);coursePub.setPic(pic);coursePub.setGrade(grade);coursePub.setTeachplan(teachplan);coursePub.setDescription(description);//设置map对象map.put(courseId,coursePub);}return map;} 测试 使用 swagger-ui 或 postman 测试查询课程信息接口。 0x04 前端开发 配置NGINX虚拟主机 学习中心的二级域名为 ucenter.xuecheng.com ,我们在 nginx 中配置 ucenter 虚拟主机。 学成网用户中心server {listen 80;server_name ucenter.xuecheng.com;个人中心location / {proxy_pass http://ucenter_server_pool;} } 前端ucenterupstream ucenter_server_pool{server 127.0.0.1:7081 weight=10;server 127.0.0.1:13000 weight=10;} 在学习中心要调用搜索的 API,使用 Nginx 解决代理,如下图: 在 ucenter 虚拟主机下配置搜索 Api 代理路径 后台搜索(公开api)upstream search_server_pool{server 127.0.0.1:40100 weight=10;} 学成网用户中心server {listen 80;server_name ucenter.xuecheng.com;个人中心location / {proxy_pass http://ucenter_server_pool;}后端搜索服务location /openapi/search/ {proxy_pass http://search_server_pool/search/;} } 前端 API 方法 在学习中心 xc-ui-pc-leanring 对课程信息的查询属于基础常用功能,所以我们将课程查询的 api 方法定义在base 模块下,如下图: 在system.js 中定义课程查询方法: import http from './public'export const course_view = id => {return http.requestGet('/openapi/search/course/getdetail/'+id);} 前端 API 方法调用 在 learning_video.vue 页面中调用课程信息查询接口得到课程计划,将课程计划json 串转成对象。 xc-ui-pc-leanring/src/module/course/page/learning_video.vue 1、定义视图 课程计划 <!--课程计划部分代码--><div class="navCont"><div class="course-weeklist"><div class="nav nav-stacked" v-for="(teachplan_first, index) in teachplanList"><div class="tit nav-justified text-center"><i class="pull-left glyphicon glyphicon-th-list"></i>{ {teachplan_first.pname} }<i class="pull-right"></i></div><li v-if="teachplan_first.children!=null" v-for="(teachplan_second, index) in teachplan_first.children"><i class="glyphicon glyphicon-check"></i><a :href="url" @click="study(teachplan_second.id)">{ {teachplan_second.pname} }</a></li><!-- <div class="tit nav-justified text-center"><i class="pull-left glyphicon glyphicon-th-list"></i>第一章<i class="pull-right"></i></div><li ><i class="glyphicon glyphicon-check"></i><a :href="url" >第一节</a></li>--><!--<li><i class="glyphicon glyphicon-unchecked"></i>为什么分为A、B、C部分</li>--></div></div></div> 课程名称 <div class="top text-center">{ {coursename} }</div> 定义数据对象 data() {return {url:'',//当前urlcourseId:'',//课程idchapter:'',//章节Idcoursename:'',//课程名称coursepic:'',//课程图片teachplanList:[],//课程计划playerOptions: {//播放参数autoplay: false,controls: true,sources: [{type: "application/x-mpegURL",src: ''}]},} } 在 created 钩子方法中获取课程信息 created(){//当前请求的urlthis.url = window.location//课程idthis.courseId = this.$route.params.courseId//章节idthis.chapter = this.$route.params.chapter//查询课程信息systemApi.course_view(this.courseId).then((view_course)=>{if(!view_course || !view_course[this.courseId]){this.$message.error("获取课程信息失败,请重新进入此页面!")return ;} let courseInfo = view_course[this.courseId]console.log(courseInfo)this.coursename = courseInfo.nameif(courseInfo.teachplan){let teachplan = JSON.parse(courseInfo.teachplan);this.teachplanList = teachplan.children;} })}, 测试 在浏览器请求:http://ucenter.xuecheng.com//learning/4028e581617f945f01617f9dabc40000/0 4028e581617f945f01617f9dabc40000:第一个参数为课程 id,测试时从 ES索引库找一个课程 id 0:第二个参数为课程计划 id,此参数用于点击课程计划播放视频。 如果出现跨域问题,但是确定已经配置了跨域,请尝试结束所以 nginx.exe 的进程 和 清空浏览器缓存。 如果还没有解决?重启电脑试试。 二、学习页面:获取视频播放地址 0x01 需求分析 用户进入在线学习页面,点击课程计划将播放该课程计划对应的教学视频。 业务流程如下: 业务流程说明: 1、用户进入在线学习页面,页面请求搜索服务获取课程信息(包括课程计划信息)并且在页面展示。 2、在线学习请求学习服务获取视频播放地址。 3、学习服务校验当前用户是否有权限学习,如果没有权限学习则提示用户。 4、学习服务校验通过,请求搜索服务获取课程媒资信息。 5、搜索服务请求ElasticSearch获取课程媒资信息。 为什么要请求 ElasticSearch 查询课程媒资信息? 出于性能的考虑,公开查询课程信息从搜索服务查询,分摊 mysql 数据库的访问压力。 什么时候将课程媒资信息存储到 ElasticSearch 中? 课程媒资信息是在课程发布的时候存入 ElasticSearch,因为课程发布后课程信息将基本不再修改。 0x02 课程发布:储存媒资信息 需求分析 课程媒资信息是在课程发布的时候存入 ElasticSearch 索引库,因为课程发布后课程信息将基本不再修改,具体的业务流程如下。 1、课程发布,向课程媒资信息表写入数据。 1)根据课程 id 删除 teachplanMediaPub 中的数据 2)根据课程 id 查询 teachplanMedia 数据 3)将查询到的 teachplanMedia 数据插入到 teachplanMediaPub 中 2、Logstash 定时扫描课程媒资信息表,并将课程媒资信息写入索引库。 数据模型 在 xc_course 数据库创建课程计划媒资发布表: CREATE TABLE teachplan_media_pub (teachplan_id varchar(32) NOT NULL COMMENT '课程计划id',media_id varchar(32) NOT NULL COMMENT '媒资文件id',media_fileoriginalname varchar(128) NOT NULL COMMENT '媒资文件的原始名称',media_url varchar(256) NOT NULL COMMENT '媒资文件访问地址',courseid varchar(32) NOT NULL COMMENT '课程Id',timestamp timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT'logstash使用',PRIMARY KEY (teachplan_id)) ENGINE=InnoDB DEFAULT CHARSET=utf8 数据模型类如下: package com.xuecheng.framework.domain.course;import lombok.Data;import lombok.ToString;import org.hibernate.annotations.GenericGenerator;import javax.persistence.;import java.io.Serializable;import java.util.Date;@Data@ToString@Entity@Table(name="teachplan_media_pub")@GenericGenerator(name = "jpa-assigned", strategy = "assigned")public class TeachplanMediaPub implements Serializable {private static final long serialVersionUID = -916357110051689485L;@Id@GeneratedValue(generator = "jpa-assigned")@Column(name="teachplan_id")private String teachplanId;@Column(name="media_id")private String mediaId;@Column(name="media_fileoriginalname")private String mediaFileOriginalName;@Column(name="media_url")private String mediaUrl;@Column(name="courseid")private String courseId;@Column(name="timestamp")private Date timestamp;//时间戳} Dao 创建 TeachplanMediaPub 表的 Dao,向 TeachplanMediaPub 存储信息采用先删除该课程的媒资信息,再添加该课程的媒资信息,所以这里定义根据课程 id 删除课程计划媒资方法: public interface TeachplanMediaPubRepository extends JpaRepository<TeachplanMediaPub, String> {//根据课程id删除课程计划媒资信息long deleteByCourseId(String courseId);} 从TeachplanMedia查询课程计划媒资信息 //从TeachplanMedia查询课程计划媒资信息public interface TeachplanMediaRepository extends JpaRepository<TeachplanMedia, String> {List<TeachplanMedia> findByCourseId(String courseId);} Service 编写保存课程计划媒资信息方法,并在课程发布时调用此方法。 1、保存课程计划媒资信息方法 本方法采用先删除该课程的媒资信息,再添加该课程的媒资信息,在 CourseService 下定义该方法 //保存课程计划媒资信息private void saveTeachplanMediaPub(String courseId){//查询课程媒资信息List<TeachplanMedia> byCourseId = teachplanMediaRepository.findByCourseId(courseId);if(byCourseId == null) return; //没有查询到媒资数据则直接结束该方法//将课程计划媒资信息储存到待索引表//删除原有的索引信息teachplanMediaPubRepository.deleteByCourseId(courseId);//一个课程可能会有多个媒资信息,遍历并使用list进行储存List<TeachplanMediaPub> teachplanMediaPubList = new ArrayList<>();for (TeachplanMedia teachplanMedia: byCourseId) {TeachplanMediaPub teachplanMediaPub = new TeachplanMediaPub();BeanUtils.copyProperties(teachplanMedia, teachplanMediaPub);teachplanMediaPubList.add(teachplanMediaPub);}//保存所有信息teachplanMediaPubRepository.saveAll(teachplanMediaPubList);} 2、课程发布时调用此方法 修改课程发布的 coursePublish 方法: ....//保存课程计划媒资信息到待索引表saveTeachplanMediaPub(courseId);//页面urlString pageUrl = cmsPostPageResult.getPageUrl();return new CoursePublishResult(CommonCode.SUCCESS,pageUrl);..... 测试 测试课程发布后是否成功将课程媒资信息存储到 teachplan_media_pub 中,测试流程如下: 1、指定一个课程 2、为课程计划添加课程媒资 3、执行课程发布 4、观察课程计划媒资信息是否存储至 teachplan_media_pub 中 注意:由于此测试仅用于测试发布课程计划媒资信息的功能,可暂时将 cms页面发布的功能暂时屏蔽,提高测试效率。 测试结果如下 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Vrzs5589-1595567273126)(https://qnoss.codeyee.com/20200704_15/image7)] 0x03 Logstash:扫描课程计划媒资 Logstash 定时扫描课程媒资信息表,并将课程媒资信息写入索引库。 创建索引 1、创建 xc_course_media 索引 2、并向此索引创建如下映射 POST: http://localhost:9200/xc_course_media/doc/_mapping {"properties" : {"courseid" : {"type" : "keyword"},"teachplan_id" : {"type" : "keyword"},"media_id" : {"type" : "keyword"},"media_url" : {"index" : false,"type" : "text"},"media_fileoriginalname" : {"index" : false,"type" : "text"} }} 索引创建成功 创建模板文件 在 logstach 的 config 目录文件 xc_course_media_template.json 文件路径为 %ES_ROOT_DIR%/logstash6.8.8/config/xc_course_media_template.json %ES_ROOT_DIR% 为 ElasticSearch 和 logstash 的安装目录 内容如下: {"mappings" : {"doc" : {"properties" : {"courseid" : {"type" : "keyword"},"teachplan_id" : {"type" : "keyword"},"media_id" : {"type" : "keyword"},"media_url" : {"index" : false,"type" : "text"},"media_fileoriginalname" : {"index" : false,"type" : "text"} }},"template" : "xc_course_media"} } 配置 mysql.conf 在logstash的 config 目录下配置 mysql_course_media.conf 文件供 logstash 使用,logstash 会根据 mysql_course_media.conf 文件的配置的地址从 MySQL 中读取数据向 ES 中写入索引。 参考https://www.elastic.co/guide/en/logstash/current/plugins-inputs-jdbc.html 配置输入数据源和输出数据源。 input {stdin {} jdbc {jdbc_connection_string => "jdbc:mysql://localhost:3306/xc_course?useUnicode=true&characterEncoding=utf-8&useSSL=true&serverTimezone=UTC" 数据库信息jdbc_user => "root"jdbc_password => "123123" MYSQL 驱动地址,修改为maven仓库对应的位置jdbc_driver_library => "D:/soft/apache-maven-3.5.4/repository/mysql/mysql-connector-java/5.1.40/mysql-connector-java-5.1.40.jar" the name of the driver class for mysqljdbc_driver_class => "com.mysql.jdbc.Driver"jdbc_paging_enabled => "true"jdbc_page_size => "50000"要执行的sql文件statement_filepath => "/conf/course.sql"statement => "select from teachplan_media_pub where timestamp > date_add(:sql_last_value,INTERVAL 8 HOUR)"定时配置schedule => " "record_last_run => truelast_run_metadata_path => "D:/soft/elasticsearch/logstash-6.8.8/config/xc_course_media_metadata"} } output {elasticsearch {ES的ip地址和端口hosts => "localhost:9200"hosts => ["localhost:9200","localhost:9202","localhost:9203"]ES索引库名称index => "xc_course_media"document_id => "%{teachplan_id}"document_type => "doc"template => "D:/soft/elasticsearch/logstash-6.8.8/config/xc_course_media_template.json"template_name =>"xc_course_media"template_overwrite =>"true"} stdout {日志输出codec => json_lines} } 启动 logstash.bat 启动 logstash.bat 采集 teachplan_media_pub 中的数据,向 ES 写入索引。 logstash.bat -f ../config/mysql_course_media.conf 课程发布成功后,Logstash 会自动参加 teachplan_media_pub 表中新增的数据,效果如下 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ILPBxfXi-1595567273134)(https://qnoss.codeyee.com/20200704_15/image10)] Logstash多实例运行 由于之前我们还启动了一个 Logstash 对课程的发布信息进行采集,所以如果想两个 logstash 实例同时运行,因为每个实例都有一个.lock文件,所以不能使用同一个目录来存放数据,所以我们需要使用 --path.data= 为每个实例指定单独的数据目录,具体的代码如下: 该配置是在windows下进行的 课程发布实例 logstash_start_course_pub.bat @title logstash in course_publogstash.bat -f ..\config\mysql.conf --path.data=../data/course_pub 课程计划媒体发布实例 logstash_start_teachplan_media.bat @title logstash i n teachplan_media_publogstash.bat -f ../config/mysql_course_media.conf --path.data=../data/teachplan_media/ 同时运行效果如下 0x04 搜素服务:查询课程媒资接口 需求分析 搜索服务 提供查询课程媒资接口,此接口供学习服务调用。 Api接口定义 @ApiOperation("根据课程计划查询媒资信息")public TeachplanMediaPub getmedia(String teachplanId); Service 1、配置课程计划媒资索引库等信息 在 application.yml 中配置 xuecheng:elasticsearch:hostlist: ${eshostlist:127.0.0.1:9200} 多个结点中间用逗号分隔course:index: xc_coursetype: docsource_field: id,name,grade,mt,st,charge,valid,pic,qq,price,price_old,status,studymodel,teachmode,expires,pub_time,start_time,end_timemedia:index: xc_course_mediatype: docsource_field: courseid,media_id,media_url,teachplan_id,media_fileoriginalname 2、service 方法开发 在 课程搜索服务 中定义课程媒资查询接口,为了适应后续需求,service 参数定义为数组,可一次查询多个课程计划的媒资信息。 / 根据一个或者多个课程计划id查询媒资信息 @param teachplanIds 课程id @return QueryResponseResult/public QueryResponseResult<TeachplanMediaPub> getmedia(String [] teachplanIds){//设置索引SearchRequest searchRequest = new SearchRequest(media_index);//设置类型searchRequest.types(media_type);//创建搜索源对象SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();//源字段过滤String[] media_index_arr = media_field.split(",");searchSourceBuilder.fetchSource(media_index_arr, new String[]{});//查询条件,根据课程计划id查询(可以传入多个课程计划id)searchSourceBuilder.query(QueryBuilders.termsQuery("teachplan_id", teachplanIds));searchRequest.source(searchSourceBuilder);SearchResponse searchResponse = null;try {searchResponse = restHighLevelClient.search(searchRequest);} catch (IOException e) {e.printStackTrace();}//获取结果SearchHits hits = searchResponse.getHits();long totalHits = hits.getTotalHits();SearchHit[] searchHits = hits.getHits();//数据列表List<TeachplanMediaPub> teachplanMediaPubList = new ArrayList<>();for(SearchHit hit:searchHits){TeachplanMediaPub teachplanMediaPub =new TeachplanMediaPub();Map<String, Object> sourceAsMap = hit.getSourceAsMap();//取出课程计划媒资信息String courseid = (String) sourceAsMap.get("courseid");String media_id = (String) sourceAsMap.get("media_id");String media_url = (String) sourceAsMap.get("media_url");String teachplan_id = (String) sourceAsMap.get("teachplan_id");String media_fileoriginalname = (String) sourceAsMap.get("media_fileoriginalname");teachplanMediaPub.setCourseId(courseid);teachplanMediaPub.setMediaUrl(media_url);teachplanMediaPub.setMediaFileOriginalName(media_fileoriginalname);teachplanMediaPub.setMediaId(media_id);teachplanMediaPub.setTeachplanId(teachplan_id);//将对象加入到列表中teachplanMediaPubList.add(teachplanMediaPub);}//构建返回课程媒资信息对象QueryResult<TeachplanMediaPub> queryResult = new QueryResult<>();queryResult.setList(teachplanMediaPubList);queryResult.setTotal(totalHits);return new QueryResponseResult<TeachplanMediaPub>(CommonCode.SUCCESS,queryResult);} Controller / 根据课程计划id搜索发布后的媒资信息 @param teachplanId @return/@GetMapping(value="/getmedia/{teachplanId}")@Overridepublic TeachplanMediaPub getmedia(@PathVariable("teachplanId") String teachplanId) {//为了service的拓展性,所以我们service接收的是数组作为参数,以便后续开发查询多个ID的接口String[] teachplanIds = new String[]{teachplanId};//通过service查询ES获取课程媒资信息QueryResponseResult<TeachplanMediaPub> mediaPubQueryResponseResult = esCourseService.getmedia(teachplanIds);QueryResult<TeachplanMediaPub> queryResult = mediaPubQueryResponseResult.getQueryResult();if(queryResult!=null&& queryResult.getList()!=null&& queryResult.getList().size()>0){//返回课程计划对应课程媒资return queryResult.getList().get(0);} return new TeachplanMediaPub();} 测试 使用 swagger-ui 和 postman 测试课程媒资查询接口。 三、在线学习:接口开发 0x01 需求分析 根据下边的业务流程,本章节完成前端学习页面请求学习服务获取课程视频地址,并自动播放视频。 0x02 搭建开发环境 1、创建数据库 创建 xc_learning 数据库,学习数据库将记录学生的选课信息、学习信息。 导入:资料/xc_learning.sql 2、创建学习服务工程 参考课程管理服务工程结构,创建学习服务工程: 导入:资料/xc-service-learning.zip 项目工程结构如下 0x03 Api接口 此 api 接口是课程学习页面请求学习服务获取课程学习地址。 定义返回值类型: package com.xuecheng.framework.domain.learning.response;import com.xuecheng.framework.model.response.ResponseResult;import com.xuecheng.framework.model.response.ResultCode;import lombok.Data;import lombok.NoArgsConstructor;import lombok.ToString;@Data@ToString@NoArgsConstructorpublic class GetMediaResult extends ResponseResult {public GetMediaResult(ResultCode resultCode, String fileUrl) {super(resultCode);this.fileUrl = fileUrl;}//媒资文件播放地址private String fileUrl;} 定义接口,学习服务根据传入课程 ID、章节 Id(课程计划 ID)来取学习地址。 @Api(value = "录播课程学习管理",description = "录播课程学习管理")public interface CourseLearningControllerApi {@ApiOperation("获取课程学习地址")public GetMediaResult getMediaPlayUrl(String courseId,String teachplanId);} 0x04 服务端开发 需求分析 学习服务根据传入课程ID、章节Id(课程计划ID)请求搜索服务获取学习地址。 搜索服务注册Eureka 学习服务要调用搜索服务查询课程媒资信息,所以需要将搜索服务注册到 eureka 中。 1、查看服务名称是否为 xc-service-search 注意修改application.xml中的服务名称:spring:application:name: xc‐service‐search 2、配置搜索服务的配置文件 application.yml,加入 Eureka 配置 如下: eureka:client:registerWithEureka: true 服务注册开关fetchRegistry: true 服务发现开关serviceUrl: Eureka客户端与Eureka服务端进行交互的地址,多个中间用逗号分隔defaultZone: ${EUREKA_SERVER:http://localhost:50101/eureka/,http://localhost:50102/eureka/}instance:prefer-ip-address: true 将自己的ip地址注册到Eureka服务中ip-address: ${IP_ADDRESS:127.0.0.1}instance-id: ${spring.application.name}:${server.port} 指定实例idribbon:MaxAutoRetries: 2 最大重试次数,当Eureka中可以找到服务,但是服务连不上时将会重试,如果eureka中找不到服务则直接走断路器MaxAutoRetriesNextServer: 3 切换实例的重试次数OkToRetryOnAllOperations: false 对所有操作请求都进行重试,如果是get则可以,如果是post,put等操作没有实现幂等的情况下是很危险的,所以设置为falseConnectTimeout: 5000 请求连接的超时时间ReadTimeout: 6000 请求处理的超时时间 3、添加 eureka 依赖 <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring‐cloud‐starter‐netflix‐eureka‐client</artifactId></dependency> 4、修改启动类,在class上添加如下注解: @EnableDiscoveryClient 搜索服务客户端 在 学习服务 创建搜索服务的客户端接口,此接口会生成代理对象,调用搜索服务: package com.xuecheng.learning.client;import com.xuecheng.framework.domain.course.TeachplanMediaPub;import org.springframework.cloud.openfeign.FeignClient;import org.springframework.web.bind.annotation.GetMapping;import org.springframework.web.bind.annotation.PathVariable;@FeignClient(value = "xc‐service‐search")public interface CourseSearchClient {@GetMapping(value="/getmedia/{teachplanId}")public TeachplanMediaPub getmedia(@PathVariable("teachplanId") String teachplanId);} 自定义错误代码 我们在 com.xuecheng.framework.domain.learning.response 包下自定义一个错误消息模型 package com.xuecheng.framework.domain.learning.response;import com.xuecheng.framework.model.response.ResultCode;import lombok.ToString;@ToStringpublic enum LearningCode implements ResultCode {LEARNING_GET_MEDIA_ERROR(false,23001,"学习中心获取媒资信息错误!");//操作代码boolean success;//操作代码int code;//提示信息String message;private LearningCode(boolean success, int code, String message){this.success = success;this.code = code;this.message = message;}@Overridepublic boolean success() {return success;}@Overridepublic int code() {return code;}@Overridepublic String message() {return message;} } 该消息模型基于 ResultCode 来实现,代码如下 package com.xuecheng.framework.model.response;/ Created by mrt on 2018/3/5. 10000-- 通用错误代码 22000-- 媒资错误代码 23000-- 用户中心错误代码 24000-- cms错误代码 25000-- 文件系统/public interface ResultCode {//操作是否成功,true为成功,false操作失败boolean success();//操作代码int code();//提示信息String message(); 从 ResultCode 中我们可以看出,我们约定了用户中心的错误代码使用 23000,所以我们定义的一些错误信息的代码就从 23000 开始计数。 Service 在学习服务中定义 service 方法,此方法远程请求课程管理服务、媒资管理服务获取课程学习地址。 package com.xuecheng.learning.service.impl;import com.netflix.discovery.converters.Auto;import com.xuecheng.framework.domain.course.TeachplanMediaPub;import com.xuecheng.framework.domain.learning.response.GetMediaResult;import com.xuecheng.framework.exception.ExceptionCast;import com.xuecheng.framework.model.response.CommonCode;import com.xuecheng.learning.client.CourseSearchClient;import com.xuecheng.learning.service.LearningService;import org.springframework.beans.factory.annotation.Autowired;import org.springframework.stereotype.Service;@Servicepublic class LearningServiceImpl implements LearningService {@AutowiredCourseSearchClient courseSearchClient;/ 远程调用搜索服务获取已发布媒体信息中的url @param courseId 课程id @param teachplanId 媒体信息id @return/@Overridepublic GetMediaResult getMediaPlayUrl(String courseId, String teachplanId) {//校验学生权限,是否已付费等//远程调用搜索服务进行查询媒体信息TeachplanMediaPub mediaPub = courseSearchClient.getmedia(teachplanId);if(mediaPub == null) ExceptionCast.cast(CommonCode.FAIL);return new GetMediaResult(CommonCode.SUCCESS, mediaPub.getMediaUrl());} } Controller 调用 service 根据课程计划 id 查询视频播放地址: @RestController@RequestMapping("/learning/course")public class CourseLearningController implements CourseLearningControllerApi {@AutowiredLearningService learningService;@Override@GetMapping("/getmedia/{courseId}/{teachplanId}")public GetMediaResult getMediaPlayUrl(@PathVariable String courseId, @PathVariable String teachplanId) {//获取课程学习地址return learningService.getMedia(courseId, teachplanId);} } 测试 使用 swagger-ui 或postman 测试学习服务查询课程视频地址接口。 0x05 前端开发 需求分析 需要在学习中心前端页面需要完成如下功能: 1、进入课程学习页面需要带上 课程 Id参数及课程计划Id的参数,其中 课程 Id 参数必带,课程计划 Id 可以为空。 2、进入页面根据 课程 Id 取出该课程的课程计划显示在右侧。 3、进入页面后判断如果请求参数中有课程计划 Id 则播放该章节的视频。 4、进入页面后判断如果 课程计划id 为0则需要取出本课程第一个 课程计划的Id,并播放第一个课程计划的视频。 进入到模块 xc-ui-pc-leanring/src/module/course api方法 let sysConfig = require('@/../config/sysConfig')let apiUrl = sysConfig.xcApiUrlPre;/获取播放地址/export const get_media = (courseId,chapter) => {return http.requestGet(apiUrl+'/api/learning/course/getmedia/'+courseId+'/'+chapter);} 配置代理 在 Nginx 中的 ucenter.xuecheng.com 虚拟主机中配置 /api/learning/ 的路径转发,此url 请转发到学习服务。 学习服务upstream learning_server_pool{server 127.0.0.1:40600 weight=10;}学成网用户中心server {listen 80;server_name ucenter.xuecheng.com;个人中心location / {proxy_pass http://ucenter_server_pool;}后端搜索服务location /openapi/search/ {proxy_pass http://search_server_pool/search/; }学习服务location ^~ /api/learning/ {proxy_pass http://learning_server_pool/learning/;} } 视频播放页面 1、如果传入的课程计划id为0则取出第一个课程计划id 在 created 钩子方法中完成 created(){//当前请求的urlthis.url = window.location//课程idthis.courseId = this.$route.params.courseId//章节idthis.chapter = this.$route.params.chapter//查询课程信息systemApi.course_view(this.courseId).then((view_course)=>{if(!view_course || !view_course[this.courseId]){this.$message.error("获取课程信息失败,请重新进入此页面!")return ;}let courseInfo = view_course[this.courseId]console.log(courseInfo)this.coursename = courseInfo.nameif(courseInfo.teachplan){console.log("准备开始播放视频")let teachplan = JSON.parse(courseInfo.teachplan);this.teachplanList = teachplan.children;//开始学习if(this.chapter == "0" || !this.chapter){//取出第一个教学计划this.chapter = this.getFirstTeachplan();console.log("第一个教学计划id为 ",this.chapter);this.study(this.chapter);}else{this.study(this.chapter);} }})}, 取出第一个章节 id,用户未输入课程计划 id 或者输入为 0 时,播放第一个。 //取出第一个章节getFirstTeachplan(){for(var i=0;i<this.teachplanList.length;i++){let firstTeachplan = this.teachplanList[i];//如果当前children存在,则取出第一个返回if(firstTeachplan.children && firstTeachplan.children.length>0){let secondTeachplan = firstTeachplan.children[0];return secondTeachplan.id;} }return ;}, 开始学习: //开始学习study(chapter){// 获取播放地址courseApi.get_media(this.courseId,chapter).then((res)=>{if(res.success){let fileUrl = sysConfig.videoUrl + res.fileUrl//播放视频this.playvideo(fileUrl)}else if(res.message){this.$message.error(res.message)}else{this.$message.error("播放视频失败,请刷新页面重试")} }).catch(res=>{this.$message.error("播放视频失败,请刷新页面重试")});}, 2、点击右侧课程章节切换播放 在原有代码基础上添加 click 事件,点击调用开始学习方法(study)。 <li v‐if="teachplan_first.children!=null" v‐for="(teachplan_second, index) inteachplan_first.children"><i class="glyphicon glyphicon‐check"></i><a :href="url" @click="study(teachplan_second.id)">{ {teachplan_second.pname} }</a></li> 3、地址栏路由url变更 这里需要注意一个问题,在用户点击课程章节切换播放时,地址栏的 url 也应该同步改变为当前所选择的课程计划 id 4、在线学习按钮 将 learnstatus 默认更改为 1,这样就能显示出马上学习的按钮,方便我们后续的集成测试。 文件路径为 xc-ui-pc-static-portal/include/course_detail_dynamic.html 部分代码块如下 <script>var body= new Vue({ //创建一个Vue的实例el: "body", //挂载点是id="app"的地方data: {editLoading: false,title:'测试',courseId:'',charge:'',//203001免费,203002收费learnstatus: 1 ,//课程状态,1:马上学习,2:立即报名、3:立即购买course:{},companyId:'template',company_stat:[],course_stat:{"s601001":"","s601002":"","s601003":""} }, 简单的测试 访问在线学习页面:http://ucenter.xuecheng.com//learning/课程id/课程计划id 通过 url 传入两个参数:课程id 和 课程计划id 如果没有课程计划则传入0 测试项目如下: 1、传入正确的课程id、课程计划id,自动播放本章节的视频 2、传入正确的课程id、课程计划id传入0,自动播放第一个视频 3、传入错误的课程id 或 课程计划id,提示错误信息。 4、通过右侧章节目录切换章节及播放视频。 访问: http://ucenter.xuecheng.com//learning/4028e58161bcf7f40161bcf8b77c0000/4028e58161bd18ea0161bd1f73190008 传入正确的课程id、课程计划id,自动播放本章节的视频 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ef0xxym7-1595567273153)(https://qnoss.codeyee.com/20200704_15/image17)] 传入正确的课程id、课程计划id传入0,自动播放第一个视频 访问 http://ucenter.xuecheng.com//learning/4028e58161bcf7f40161bcf8b77c0000/0 识别出第一个课程计划的 id 需要注意的是这里的 chapter 参数是我自己在 study 函数里加上去的,可以忽略。 传入错误的课程id或课程计划id,提示错误信息。 通过右侧章节目录切换章节及播放视频。 点击章节即可播放,但是点击制定章节后 url 没有发生改变,这个问题暂时还没有解决,关注笔记后面的内容。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TOGdxwb4-1595567273158)(https://qnoss.codeyee.com/20200704_15/image20)] 完整的测试 准备工作 启动 RabbitMQ,启动 Logstash、ElasticSearch 建议把所有后端服务都开起来 启动 前端静态门户、启动 nginx 、启动课程管理前端 我们整理一下测试的流程 上传两个媒资视频文件,用于测试 进入到课程管理,为课程计划选择媒资信息 发布课程,等待 logstash 将数据采集到 ElasticSearch 的索引库中 进入学成网主页,点击课程,进入到搜索门户页面 搜索课程,进入到课程详情页面 点击开始学习,进入到课程学习页面,选择课程计划中的一个章节进行学习。 1、上传文件 首先我们使用之前开发的媒资管理模块,上传两个视频文件用于测试。 第一个文件上传成功 一些问题 在上传第二个文件时,发生了错误,我们来检查一下问题出在了哪里 在媒体服务的控制台中可以看到,在 mergeChunks 方法在校验文件 md5 时候抛出了异常 我们在 MD5 校验这里打个断点,重新上传文件,分析一下问题所在。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OpEMZGI8-1595567273166)(https://qnoss.codeyee.com/20200704_15/image23)] 单步调试后发现,合并文件后的MD5值与用户上传的源文件值不相等 方案1:删除本地分块文件重新尝试上传 考虑到可能是在用户上传完 视频的分块文件时发生了一些问题,导致合并文件后与源文件的大小不等,导致MD5也不相同,这里我们把这个视频上传到本地的文件全部删除,在媒资上传页面重新上传文件。 对比所有分块文件的字节大小和本地源文件的大小,完全是相等的 删除所有文件后重新上传,md5值还是不等,考虑从调试一下文件合并的代码。 方案2:检查前端提交的MD5值是否正确 在查阅是否有其他的MD5值获取方案时,发现了一个使用 windows 本地命令获取文件MD5值的方法 certutil -hashfile .\19-在线学习接口-集成测试.avi md5 惊奇的发现,TM的原来是前端那边转换的MD5值不正确,后端这边是没有问题的。 从前面的图可以看出,本地和后端转换的都是以一个 f6f0 开头的MD5值 那么问题就出现在前端了,还需要花一些时间去分析一下,这里暂时就先告一段落,因为上传了几个文件测试中只有这一个文件出现了问题。 2、为课程计划选择媒资信息 进入到一个课程的管理页面 http://localhost:12000//course/manage/baseinfo/4028e58161bcf7f40161bcf8b77c0000 将刚才我们上传的媒资文件的信息和课程计划绑定 选择效果如下 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-epKaqzCD-1595567273178)(https://qnoss.codeyee.com/20200704_15/image29)] 2、发布课程,等待 logstash 从 course_pub 以及 teachplan_media_pub 表中采集数据到 ElasticSearch 当中 发布成功后,我们可以从 teachplan_media_pub 表中看到刚才我们发布的媒资信息 再观察 Logstash 的控制台,发现两个 Logstash 的实例都对更新的课程发布信息进行了采集 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hTUve2ik-1595567273183)(https://qnoss.codeyee.com/20200704_15/image32)] 3、前端门户测试 打开我们的门户主站 http://www.xuecheng.com/ [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4wZe9R84-1595567273185)(https://qnoss.codeyee.com/20200704_15/image33)] 点击导航栏的课程,进入到我们的搜索门户页面 如果无法进入到搜索门户,请检查你的 xc-ui-pc-portal 前端工程是否已经启动 进入到搜索门户后,可以看到一些初始化时搜索的课程数据,默认是搜索第一页的数据,每页2个课程。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BJ1AKoJb-1595567273187)(https://qnoss.codeyee.com/20200704_15/image34)] 我们可以测试搜索一下前面我们选择媒资信息时所用的课程 点击课程,进入到课程详情页面,然后再点击开始学习。 点击马上学习后,会进入到该课程的在线学习页面,默认自动播放我们第一个课程计划中的视频。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tcuLWnf2-1595567273193)(https://qnoss.codeyee.com/20200704_15/image37)] 我们可以在右侧的目录中选择第二个课程计划,会自动播放所选的课程计划所对应的媒资视频播放地址,该 播放地址正是我们刚才通过 Logstash 自动采集到 ElasticSearch 的索引信息,效果图如下 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Cvi9Dr0Y-1595567273195)(https://qnoss.codeyee.com/20200704_15/image38)] 四、待完善的一些功能 课程发布前,校验课程计划里面是否包含二级课程计划 课程发布前,校验课程计划信息里面是否全部包含媒资信息 删除媒资信息,并且同步删除ES中的索引 在获取该课程的播放地址时校验用户的合法、 在线学习页面,点击右侧目录中的课程计划同时改变url中的课程计划地址 视频文件 19-在线学习接口-集成测试.avi 前端上传时提交的MD5值不正确 😁 认识作者 作者:👦 LCyee ,全干型代码🐕 自建博客:https://www.codeyee.com 记录学习以及项目开发过程中的笔记与心得,记录认知迭代的过程,分享想法与观点。 CSDN 博客:https://blog.csdn.net/codeyee 记录和分享一些开发过程中遇到的问题以及解决的思路。 欢迎加入微服务练习生的队伍,一起交流项目学习过程中的一些问题、分享学习心得等,不定期组织一起刷题、刷项目,共同见证成长。 本篇文章为转载内容。原文链接:https://blog.csdn.net/codeyee/article/details/107558901。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-12-16 12:41:01
73
转载
MySQL
...章详尽解读了如何精确配置用户权限以避免因权限不足导致的访问错误。文中强调了GRANT和REVOKE命令在分配、撤销特定数据库或表访问权限时的重要性,并提醒用户注意MySQL中大小写敏感设置对表名的影响。 与此同时,关于数据库运维实践,《数据库灾难恢复:从理论到实战》一文结合实例探讨了当数据库表被误删后,如何通过定期备份快速进行数据恢复,并介绍了MySQL自带的binlog日志工具在实时数据同步及增量恢复中的应用。 此外,针对MySQL连接故障问题,InfoQ的一篇报道《优化MySQL连接池配置,提升数据库性能》指出,除了确认服务器运行状态和登录凭据外,合理配置数据库连接池参数也是防止连接故障的有效手段。文章提醒开发者关注连接超时设定、最大连接数限制等关键配置项,以应对高并发场景下的数据库连接挑战。 总之,在实际操作MySQL数据库过程中,不断学习并掌握最新最佳实践,对于解决“Table 'database_name.table_name' doesn't exist”这类常见错误,乃至提高整体数据库管理水平具有深远意义。
2023-11-28 12:42:54
55
算法侠
站内搜索
用于搜索本网站内部文章,支持栏目切换。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
curl -I http://example.com
- 获取HTTP头部信息。
推荐内容
推荐本栏目内的其它文章,看看还有哪些文章让你感兴趣。
2023-04-28
2023-08-09
2023-06-18
2023-04-14
2023-02-18
2023-04-17
2024-01-11
2023-10-03
2023-09-09
2023-06-13
2023-08-07
2023-03-11
历史内容
快速导航到对应月份的历史文章列表。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"