...at因其轻量级、易于配置和良好的兼容性而在开发者中广泛使用。在本文中，Tomcat的配置优化对于提升网站响应速度至关重要。 JVM参数 , JVM（Java虚拟机）参数是指用于控制Java应用程序运行时行为的一系列选项。通过调整这些参数，可以优化Java应用程序的性能。例如，通过设置-Xms和-Xmx参数可以调整Java堆内存的初始大小和最大大小，从而避免频繁的垃圾回收操作，提高程序运行效率。本文中提到的JVM参数优化包括调整堆内存大小以及启用压缩引用等选项，以提高Tomcat服务器的性能。线程池 , 线程池是一种管理和复用线程的机制，它可以预先创建一组线程并将其放入一个池中，当有新的任务到达时，可以从池中获取一个空闲线程来执行任务，执行完毕后再归还给池中。这种方式可以减少线程创建和销毁带来的开销，提高系统响应速度和并发处理能力。在本文中，合理配置Tomcat中的线程池大小，可以有效提升服务器处理并发请求的能力，特别是在高并发场景下。

2024-10-20 16:27:48

110

雪域高原

Maven

Maven中Invalidlifecyclephase错误：识别原因与针对生命周期阶段、配置文件及插件的解决方案

...和DevOps场景，Jenkins、GitLab CI/CD等工具已全面支持Maven项目的自动化构建与部署，用户可通过配置文件精确控制Maven生命周期的执行顺序与插件使用，从而避免出现Invalidlifecyclephase错误。同时，建议开发者关注官方文档的更新内容，紧跟Maven社区的发展步伐，及时了解并适应新的最佳实践。另外，有开发专家在技术博客中深度剖析了Maven插件的自定义实现与扩展机制，通过引证实际案例说明如何正确编写插件以遵循Maven规范，防止因插件问题导致的生命周期阶段错误。这为解决Invalidlifecyclephase问题提供了更深层次的理解和更为灵活的应对策略。总之，在面对Maven Invalidlifecyclephase这类问题时，不仅需要扎实的基础知识，还要保持对Maven生态发展的敏锐度，并积极参考行业内的实践经验和前沿解读，才能确保在项目构建过程中高效无误地推进。

2023-05-18 13:56:53

155

凌波微步_t

ZooKeeper

分布式锁与配置中心：ZooKeeper中的临时顺序节点与事件监听应用

...调服务，主要用于维护配置信息、命名、提供分布式同步以及提供组服务。它用一种像文件系统一样的数据模型来存东西和管事情，这样子搞起来特别顺手，处理分布式环境下那些乱七八糟的任务也不在话下。 3. ZooKeeper的核心概念在深入探讨具体的应用之前，先来了解一下ZooKeeper的一些核心概念： - 节点（Node）：在ZooKeeper中，数据是按照路径结构存储的，这些路径就是所谓的节点。节点可以分为四种类型：持久节点、临时节点、顺序节点和临时顺序节点。 - Watcher机制：Watcher是一种事件监听机制，当某个节点的状态发生改变时，会触发相应的事件。这种机制非常适合用于监控某些关键节点的变化。 - ACL（Access Control List）：为了保证数据的安全性，ZooKeeper提供了访问控制列表，用于限制对特定节点的访问权限。 4. 实践案例一分布式锁让我们从一个最常见但也非常实用的例子开始——分布式锁。在分布式系统里，经常会发生好几个程序或者线程抢着要用同一个资源的热闹场面。这时，就需要一个可靠的分布式锁来确保资源的正确使用。 4.1 分布式锁的实现 java import org.apache.zookeeper.CreateMode; import org.apache.zookeeper.ZooDefs; import org.apache.zookeeper.ZooKeeper; public class DistributedLock { private ZooKeeper zookeeper; private String lockPath; public DistributedLock(ZooKeeper zookeeper, String lockPath) { this.zookeeper = zookeeper; this.lockPath = lockPath; } public void acquireLock() throws Exception { // 创建临时顺序节点 String lockNode = zookeeper.create(lockPath + "/lock-", new byte[0], ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL); System.out.println("Created lock node: " + lockNode); // 获取所有子节点并排序 List children = zookeeper.getChildren(lockPath, false); Collections.sort(children); // 检查是否为最小节点，如果是则获取锁 if (children.get(0).equals(lockNode.substring(lockPath.length() + 1))) { System.out.println("Acquired lock"); return; } // 否则，等待前一个节点释放锁 String previousNode = children.get(Collections.binarySearch(children, lockNode.substring(lockPath.length() + 1)) - 1); System.out.println("Waiting for lock node: " + previousNode); zookeeper.exists(lockPath + "/" + previousNode, true); } public void releaseLock() throws Exception { // 删除临时节点 zookeeper.delete(lockPath + "/" + lockNode.substring(lockPath.length() + 1), -1); } } 这个简单的实现展示了如何使用ZooKeeper来创建临时顺序节点，并通过监听前一个节点的状态变化来实现分布式锁的功能。在这过程中，我们不仅学会了怎么用ZooKeeper的基本功能，还感受到了它在实际操作中到底有多牛掰。 5. 实践案例二配置中心接下来，我们来看看另一个常见的应用场景——配置中心。在大型系统中，配置管理往往是一项繁琐而重要的工作。而ZooKeeper正好为我们提供了一个理想的解决方案。 5.1 配置中心的实现假设我们有一个配置文件，其中包含了一些关键的配置信息，例如数据库连接字符串、日志级别等。我们可以把配置信息存到ZooKeeper里，然后用监听器让各个节点实时更新，这样就省心多了。 java import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.Watcher; import org.apache.zookeeper.ZooKeeper; public class ConfigCenter implements Watcher { private ZooKeeper zookeeper; private String configPath; public ConfigCenter(ZooKeeper zookeeper, String configPath) { this.zookeeper = zookeeper; this.configPath = configPath; } public void start() throws Exception { // 监听配置节点 zookeeper.exists(configPath, this); } @Override public void process(WatchedEvent event) { if (event.getType() == Event.EventType.NodeDataChanged) { try { byte[] data = zookeeper.getData(configPath, this, null); String config = new String(data, "UTF-8"); System.out.println("New configuration: " + config); } catch (Exception e) { e.printStackTrace(); } } } } 这段代码展示了如何创建一个配置中心，通过监听配置节点的变化来实时更新配置信息。这种机制不仅提高了系统的灵活性，也大大简化了配置管理的工作量。 6. 总结与展望通过上面两个具体的案例，我们看到了ZooKeeper在实际项目中的广泛应用。无论是分布式锁还是配置中心，ZooKeeper都能为我们提供稳定可靠的支持。当然，ZooKeeper还有许多其他强大的功能等待我们去发掘。希望大家在今后的工作中也能多多尝试使用ZooKeeper，相信它一定能给我们的开发带来意想不到的帮助！ --- 希望这篇文章能让你对ZooKeeper有更深刻的理解，并激发你进一步探索的兴趣。如果你有任何问题或者想了解更多细节，请随时留言交流！

2025-02-11 15:58:01

心灵驿站

Maven

Maven自定义下载配置及依赖管理：本地仓库与引入报错问题排查

...型项目结构，或者结合Jenkins、GitLab CI等工具实现自动化构建和测试。另外，对于企业级开发环境，配置并使用Nexus或Artifactory作为私有Maven仓库，既能提高依赖下载速度，又能增强内部组件复用及版本管理能力。此外，针对Maven依赖冲突这一常见问题，可参考行业专家撰写的深度分析文章，了解如何通过Maven Enforcer插件强制执行依赖规则，以及Gradle等其他构建工具在解决类似问题上的不同策略，从而拓宽视野，提升项目构建效率和稳定性。总之，不断跟进Maven的新特性、最佳实践以及相关领域的前沿知识，将有助于我们更好地驾驭这款强大的项目管理工具，有效避免和解决实际开发中可能遇到的各种复杂问题。

2024-02-05 11:45:22

心灵驿站_t

SeaTunnel

SeaTunnel处理未知异常：从日志分析到数据倾斜调整，调试实战与资源监控实践

...别强调了对资源管理、任务监控以及错误诊断功能的优化，以帮助用户更有效地应对突发异常状况。与此同时，InfoQ的一篇深度报道《大数据处理中的故障排查艺术》中提到，调试分布式系统如SeaTunnel这样的工具时，除了基础的代码逻辑调整与资源监控，理解并运用“因果追溯”和“混沌工程”等高级调试手段也至关重要。文章指出，在实际项目中进行压力测试和故障注入实验，可以帮助提前发现潜在问题，并锻炼团队在面对未知异常时的快速响应能力。另外，阿里巴巴集团在其DataWorks平台的数据开发实践分享中，详细介绍了他们如何通过整合各类数据处理组件（包括但不限于SeaTunnel），构建健壮的数据处理流水线，其中就包括一套完善的异常预警与自愈机制设计。这为我们在处理类似SeaTunnel未知异常时提供了宝贵的参考经验，即结合实时监控、自动化运维及完善日志体系来构建全方位的问题解决方案。通过这些前沿资讯和技术解读，我们得以进一步提升在大数据处理过程中对于未知异常的探索与解决之道。

2023-09-12 21:14:29

254

海阔天空

Superset

实时代理：应对数据更新延迟的策略与配置优化

...一。报告指出，数据源配置不当、数据加载时间过长、缓存机制失效以及网络延迟等问题，不仅降低了数据分析的实时性，还可能导致决策失误。因此，寻找有效的解决方案变得尤为重要。为了应对这一挑战，业界专家提出了多方面的建议。首先，优化数据源配置是关键。这包括使用更高效的数据获取方式，如实时流式数据处理，以及对SQL查询进行优化，减少数据加载时间。其次，合理配置缓存机制，确保数据的即时更新，是提升用户体验和分析效率的重要手段。此外，增强网络监控和优化网络连接，可以显著降低数据传输延迟，从而提高数据的实时性。在实践层面，一些企业已经开始采用自动化工具和流程，定期检查数据更新状态，自动触发数据刷新或异常处理，进一步提升了数据管理的智能化水平。同时，随着云计算和边缘计算技术的发展，越来越多的企业开始探索在数据产生源头或靠近数据消费端进行数据处理，以减少数据传输延迟，实现真正的实时数据分析。综上所述，面对数据更新延迟的挑战，企业需要从数据源配置、数据加载优化、缓存管理、网络优化以及自动化流程等多个维度入手，采取综合策略。随着技术的不断进步和创新，未来有望看到更多高效、智能的数据管理和分析解决方案，助力企业更好地利用数据驱动的决策优势。

2024-08-21 16:16:57

110

青春印记

HessianRPC

分布式系统中HessianRPC自动化安全检测：关键考量与实践

...essianRPC：自动化安全检测的潜力与局限一、引言 HessianRPC的简介与地位在构建分布式系统时，高效且可靠的远程过程调用（RPC）机制是不可或缺的一部分。哎呀，HessianRPC，这玩意儿可是个了不得的家伙！它啊，用的是Java这门语言，但你别小瞧了它，它轻巧得很，功能可是一点都不马虎。性能那叫一个棒，无论是大企业的小团队，都对它赞不绝口。为啥？因为它能跨语言通信，这就意味着，不管你是用Python、C++还是别的啥语言，它都能无缝对接，方便得很！所以，你要是想在项目里搞点大动作，用上HessianRPC，绝对能让你的团队如虎添翼，效率翻倍！哎呀，随着黑客们越来越聪明，他们的攻击方式也是层出不穷，这就让咱们开发人员得时刻绷紧神经，保证系统的安全了。这可真不是件轻松活儿，每天都在跟这些看不见的敌人斗智斗勇呢！哎呀，你知道不？这篇大作啊，它要深挖HessianRPC在服务级别的自动化安全检查上能干啥，还有这个本事能怎么改变游戏规则。就像是在说，咱们得好好研究研究，HessianRPC这玩意儿在保护咱们的服务不受坏人侵扰上能起多大作用，以及它一出手，咱们的安全策略会有多大的变化。是不是感觉更接地气了？二、HessianRPC的安全考量在评估HessianRPC的安全性时，我们首先需要了解其基础设计和潜在的风险点。Hessian RPC这个东西，就像是个超级快递员，它能把各种复杂难懂的数据结构，比如大包小包的货物，都转化成容易邮寄的格式。这样一来，信息传递的速度大大提升了，但这也带来了一个问题——得保证这些包裹在运输过程中不被拆开或者丢失，还得防止别人偷看里面的东西。这就需要我们好好设计一套系统，确保数据的安全和完整性，就像给每个包裹贴上专属标签和密码一样。例如，恶意用户可以通过构造特定的输入数据来触发异常或执行未授权操作。三、服务级别的自动化安全检测服务级别的自动化安全检测旨在通过自动化工具和策略，定期对服务进行安全评估，从而及时发现并修复潜在的安全漏洞。对于HessianRPC而言，实现这一目标的关键在于： - 输入验证：确保所有传入的Hessian对象都经过严格的类型检查和边界值检查，防止任意构造的输入导致的错误行为。 - 异常处理：合理设置异常处理机制，确保异常信息不会泄露敏感信息，并提供足够的日志记录，以便后续分析和审计。 - 权限控制：通过API层面的权限校验，确保只有被授权的客户端能够调用特定的服务方法。四、HessianRPC实例代码示例下面是一个简单的HessianRPC服务端实现，用于展示如何在服务层实现基本的安全措施： java import org.apache.hessian.io.HessianInput; import org.apache.hessian.io.HessianOutput; import org.apache.hessian.message.MessageFactory; public class SimpleService { public String echo(String message) throws Exception { // 基本的输入验证 if (message == null || message.isEmpty()) { throw new IllegalArgumentException("Message cannot be null or empty"); } return message; } public void run() { try (ServerFactory sf = ServerFactory.createServerFactory(8080)) { sf.addService(new SimpleServiceImpl()); sf.start(); } catch (Exception e) { e.printStackTrace(); } } } class SimpleServiceImpl implements SimpleService { @Override public String echo(String message) { return "Echo: " + message; } } 这段代码展示了如何通过简单的异常处理和输入验证来增强服务的安全性。尽管这是一个简化的示例，但它为理解如何在实际应用中集成安全措施提供了基础。五、结论与展望 HessianRPC虽然在自动化安全检测方面存在一定的支持，但其核心依赖于开发者对安全实践的深入理解和实施。通过采用现代的编程模式、遵循最佳实践、利用现有的安全工具和技术，开发者可以显著提升HessianRPC服务的安全性。哎呀，未来啊，软件工程的那些事儿和安全技术就像开挂了一样突飞猛进。想象一下，HessianRPC这些好东西，还有它的好伙伴们，它们会变得超级厉害，能自动帮我们检查代码有没有啥安全隐患，就像个超级安全小卫士。这样一来，咱们开发分布式系统的时候，就不用那么担心安全问题了，可以更轻松地搞出既安全又高效的系统，爽歪歪！ --- 通过上述内容，我们不仅深入探讨了HessianRPC在自动化安全检测方面的支持情况，还通过具体的代码示例展示了如何在实践中应用这些安全措施。嘿，小伙伴们！这篇小文的目的是要咱们一起嗨起来，共同关注分布式系统的安全性。咱们得动动脑筋，别让那些不怀好意的小家伙有机可乘。怎么样，是不是觉得有点热血沸腾？咱们要团结起来，探索更多新鲜有趣的安全策略和技术，让我们的代码更安全，世界更美好！一起加油吧，开发者们！

2024-09-08 16:12:35

102

岁月静好

DorisDB

DorisDB：高效管理数据备份与恢复的利器

...障、软件兼容性问题、配置错误等。哎呀，兄弟！今天咱们得聊点实际的，就是用DorisDB处理数据备份时可能会遇到的一些小麻烦。咱们不光要理论分析，还得看看真家伙是怎么出问题的，然后怎么解决。就是要让你我都能明明白白地知道，这些事儿该怎么处理，别让它们成为你的技术路上的绊脚石。咱们得学着从实战中吸取经验，这样下次遇到类似的问题，你就不会一头雾水了，对吧？ 2. DorisDB简介与优势 DorisDB是一款高性能、分布式列式存储系统，专为大规模数据集提供实时查询服务。它支持SQL查询语言，并能高效地处理PB级别的数据。哎呀，你瞧，DorisDB这玩意儿可真给力！它提供了超棒的数据备份工具和机制，保证你的数据既完整又一致。不管遇到多复杂的状况，它都能稳稳地运行，就像个忠诚的守护神一样，保护着你的数据安全无虞。是不是感觉用起来既安心又省心呢？ 3. 备份策略的重要性在DorisDB中，制定有效的备份策略至关重要。哎呀，这事儿可得仔细想想！咱们得定期给数据做个备份，以防万一，万一哪天电脑突然罢工或者数据出啥问题，咱还能有东西可补救。别小瞧了这一步，选对备份文件存放在哪儿，多久检查一次备份，还有万一需要恢复数据，咱得有个顺溜的流程，这每一步都挺关键的。就像是给宝贝儿们做保险计划一样，得周全，还得实用，不能光图个形式，对吧？哎呀，兄弟，咱们得给数据做个保险啊！就像你出门前检查门窗一样，定期备份数据，能大大降低数据丢了找不回来的风险。万一哪天电脑罢工或者硬盘坏掉啥的，你也不至于急得团团转，还得去求那些所谓的“数据恢复大师”。而且，备份做得好，恢复数据的时候也快多了，省时间又省心，这事儿得重视起来！ 4. 遇到问题时的常见错误及解决方法错误1：备份失败，日志提示“空间不足” 原因：这通常是因为备份文件的大小超过了可用磁盘空间。解决方法： 1. 检查磁盘空间首先确认备份目录的磁盘空间是否足够。 2. 调整备份策略考虑使用增量备份，仅备份自上次备份以来发生变化的数据部分，减少单次备份的大小。 3. 优化数据存储定期清理不再需要的数据，释放更多空间。 python 示例代码：设置增量备份 dorisdb_backup = dorisdb.BackupManager() dorisdb_backup.set_incremental_mode(True) 错误2：备份过程中断电导致数据损坏原因：断电可能导致正在执行的备份任务中断，数据完整性受损。解决方法： 1. 使用持久化存储确保备份操作在非易失性存储设备上进行，如SSD或RAID阵列。 2. 实施数据同步在多个节点间同步数据，即使部分节点在断电时仍能继续备份过程。 python 示例代码：设置持久化备份 dorisdb_backup = dorisdb.BackupManager() dorisdb_backup.enable_persistence() 5. 数据恢复实战当备份数据出现问题时，及时且正确的恢复策略至关重要。DorisDB提供了多种恢复选项，从完全恢复到特定时间点的恢复，应根据实际情况灵活选择。步骤1：识别问题并定位首先，确定是哪个备份文件或时间点出了问题，这需要详细的日志记录和监控系统来辅助。步骤2：选择恢复方式 - 完全恢复：将数据库回滚到最近的备份状态。 - 时间点恢复：选择一个具体的时间点进行恢复，以最小化数据丢失。步骤3：执行恢复操作使用DorisDB的恢复功能，确保数据的一致性和完整性。 python 示例代码：执行时间点恢复 dorisdb_restore = dorisdb.RestoreManager() dorisdb_restore.restore_to_timepoint('2023-03-15T10:30:00Z') 6. 结语数据备份和恢复是数据库管理中的重要环节，正确理解和应用DorisDB的相关功能，能够有效避免和解决备份过程中遇到的问题。通过本篇讨论，我们不仅了解了常见的备份错误及其解决方案，还学习了如何利用DorisDB的强大功能，确保数据的安全性和业务的连续性。记住，每一次面对挑战都是成长的机会，不断学习和实践，你的数据管理技能将愈发成熟。 --- 以上内容基于实际应用场景进行了概括和举例说明，旨在提供一种实用的指导框架，帮助读者在实际工作中应对数据备份和恢复过程中可能出现的问题。希望这些信息能够对您有所帮助！

2024-07-28 16:23:58

431

山涧溪流

SeaTunnel

在SeaTunnel中实现数据迁移与实时监控：任务状态与自动化报警

...nnel中实现数据的自动化监控？ 1. 海洋中的数据船初识SeaTunnel 嘿，朋友们！想象一下，你正站在一艘巨大的数据船上，这艘船的名字叫SeaTunnel。这是一款阿里巴巴开源的数据集成工具，用起来特别顺手，能在各种数据库之间轻松搬家和同步数据。不管是从数据库倒腾到另一个数据库，还是把文件搬进数据库，甚至是在那些复杂的大数据平台之间倒腾数据，SeaTunnel都能搞定。而且，它的设计思路就是简洁易用，让数据工程师们可以更专注于数据本身，而不是被复杂的设置搞得头大。但是，仅仅是搬运数据还不够，我们还需要知道这些数据在航行过程中是否一切正常，有没有遇到任何阻碍。这就引出了我们的主题：如何在SeaTunnel中实现数据的自动化监控？ 2. 监控的重要性为何要监控数据？数据就像海洋中的鱼群，它们不断移动，不断变化。如果我们不加以监控，就可能错过重要的信息或者遇到意外的情况。比如说，数据传不过来咋办？数据质量变差了咋整？这些问题得赶紧察觉并处理掉，不然可能会影响到咱们的决策，严重的话还可能捅娄子呢。所以，建立一个可靠的监控系统是至关重要的。通过监控，我们可以随时掌握数据传输的情况，确保数据既安全又完整，一旦出现任何异常，也能迅速反应过来，保证业务平稳运行。 3. SeaTunnel监控的基本原理 SeaTunnel的监控机制主要依赖于其内置的任务管理和状态报告功能。每回有个新任务开跑，SeaTunnel就会记下它的状态，然后立马通知监控系统。监控系统就像是个细心的小管家，它会接收这些状态报告，然后仔细分析一下，看看数据传输是不是一切正常。具体来说，SeaTunnel的任务状态主要包括以下几种： - 待启动（PENDING）：任务已经创建，但尚未开始执行。 - 正在运行（RUNNING）：任务正在进行数据传输。 - 已完成（FINISHED）：任务执行完成，数据传输成功。 - 失败（FAILED）：任务执行过程中遇到了问题，导致传输失败。这些状态信息会被实时记录下来，并可以通过API或者日志的方式进行查询和分析。 4. 实现自动化监控的具体步骤现在，让我们来看看如何在SeaTunnel中实现自动化监控。我们将分步介绍，从配置到实际操作，一步步来。 4.1 配置监控插件首先，我们需要安装和配置一个监控插件。目前，SeaTunnel支持多种监控插件，如Prometheus、Grafana等。这里我们以Prometheus为例，因为它提供了强大的数据收集和可视化功能。 yaml sea_tunnel_conf.yaml plugins: - name: prometheus config: endpoint: "http://localhost:9090" 在这个配置文件中，我们指定了监控插件为Prometheus，并设置了Prometheus服务器的地址。当然，你需要根据实际情况调整这些配置。 4.2 编写监控脚本接下来，我们需要编写一个简单的脚本来定期检查SeaTunnel任务的状态，并将异常情况上报给Prometheus。 python import requests import time def check_status(): response = requests.get("http://localhost:9090/api/v1/query?query=seatail_monitor_task_status") data = response.json() for task in data['data']['result']: if task['value'][1] == 'FAILED': print(f"Task {task['metric']['job']} has failed!") while True: check_status() time.sleep(60) 每隔一分钟检查一次这个Python脚本每隔一分钟就会检查一次所有SeaTunnel任务的状态。如果某个任务的状态为“FAILED”，则会打印出错误信息。你可以根据需要修改这个脚本，例如添加邮件通知功能。 4.3 集成监控插件为了让监控插件与SeaTunnel无缝集成，我们需要在SeaTunnel的任务配置文件中添加相应的监控配置。例如： yaml tasks: - name: data_migration type: jdbc config: source: url: "jdbc:mysql://source_host/source_db" username: "username" password: "password" table: "source_table" sink: url: "jdbc:mysql://sink_host/sink_db" username: "username" password: "password" table: "sink_table" monitoring: plugin: prometheus config: endpoint: "http://localhost:9090" 在这里，我们为data_migration任务启用了Prometheus监控插件，并指定了Prometheus服务器的地址。 4.4 验证和测试最后一步，就是验证整个监控系统的有效性。你可以试试手动搞点状况，比如说断开数据库连接，然后看看监控脚本能不能抓到这些异常，并且顺利汇报给Prometheus。此外，你还可以利用Prometheus提供的图形界面，查看各个任务的状态变化趋势，以及历史数据。这对于后续的数据分析和优化非常有帮助。 5. 总结与展望通过上述步骤，我们成功地在SeaTunnel中实现了数据的自动化监控。这样做不仅让数据传输变得更稳当，还让我们能更轻松地搞定海量数据。当然，自动化监控只是一个起点。随着业务越来越忙，技术也在不断进步，咱们得不停地琢磨新招儿。比如说，可以用机器学习提前预判可能出现的问题，或者搞些更牛的警报系统，让咱们反应更快点儿。但无论如何，有了SeaTunnel作为坚实的基础，相信我们可以走得更远。这就是今天的内容，希望大家能够从中获得灵感，创造出更多有趣且实用的应用场景。如果你有任何想法或建议，欢迎随时分享交流！

2024-12-11 16:12:53

117

月影清风

Etcd

Etcd分布式系统中日志清理策略：冲突与优化实操

...d集群，用于存储服务配置信息。为了优化存储空间并提高响应速度，我们计划实施定期的日志清理策略。具体策略如下： - 策略一：每日凌晨0点，清理所有超过7天历史的过期日志条目。 - 策略二：每月末，清理所有超过30天历史的过期日志条目。问题：当策略一和策略二同时执行时，可能会出现冲突。想象一下，就像你家的书架，有一天你整理了书架（策略一），把一些不再需要的书拿走了，但过了22天，你的朋友又来帮忙整理（策略二），又把一些书从书架上取了下来。这样一来，原本在书架上的书，因为两次整理，可能就不见了，这就是数据丢失的意思。五、解决策略优化日志清理逻辑为了解决上述策略冲突，我们可以采取以下措施： 1. 引入版本控制在Etcd中，每条日志都关联着一个版本号。通过维护版本号，可以准确追踪每个操作的历史状态，避免不必要的数据删除。代码示例： go // 假设etcdClient为Etcd客户端实例 resp, err := etcdClient.Put(context.Background(), "/config/key", "value", clientv3.WithVersion(1)) if err != nil { log.Fatalf("Failed to put value: %s", err) } 2. 实施并行清理机制设计一个系统级别的时间线清理逻辑，确保同一时间点的数据不会被重复清理。代码示例： go // 清理逻辑函数 func cleanupLogs() error { // 根据时间戳进行清理，避免冲突 // 实现细节略去 return nil } 3. 引入审计跟踪对于关键操作，如日志清理，记录详细的审计日志，便于事后审查和问题定位。代码示例： go // 审计日志记录函数 func auditLog(operation string, timestamp time.Time) { // 记录审计日志 // 实现细节略去 } 六、总结与反思通过上述策略和代码示例的讨论，我们可以看到在Etcd集群中管理日志清理策略时，需要细致考虑各种潜在的冲突和影响。哎呀，你得知道，咱们要想在项目里防住那些让人头疼的策略冲突，有几个招儿可使。首先，咱们得搞个版本控制系统，就像有个大本营，随时记录着每个人对代码的修改，这样就算有冲突，也能轻松回溯，找到问题源头。然后，咱还得上个并行清理机制，就像是给团队的工作分配任务时，能确保每个人都清楚自己的责任，不会乱了套，这样就能大大减少因为分工不明产生的冲突。最后，建立一个审计跟踪系统，就相当于给项目装了个监控，每次有人改动了什么，都得有迹可循，这样一来，一旦出现矛盾，就能快速查清谁是谁非，解决起来也快多了。这三招合在一起，简直就是防冲突的无敌组合拳啊！嘿，兄弟！你得知道，监控和评估清理策略的执行效果，然后根据实际情况灵活调整，这可是保证咱们系统健健康康、高效运作的不二法门！就像咱们打游戏时，随时观察自己的状态和环境变化，及时调整战术一样，这样才能稳坐钓鱼台，轻松应对各种挑战嘛！ --- 通过本文的探讨，我们不仅深入理解了Etcd集群日志清理策略的重要性和可能遇到的挑战，还学习了如何通过实际的代码示例来解决策略冲突，从而为构建更稳定、高效的分布式系统提供了实践指导。

2024-07-30 16:28:05

455

飞鸟与鱼

RocketMQ

数据持久化：保障消息队列在高并发与高可用性下的数据完整性——防丢失与监控策略

...能搞定各种复杂的配送任务。就是因为这货在处理大规模分布式消息方面特别牛，所以啊，大家都特别喜欢用它来解决业务中的各种消息传输问题。哎呀，你知道的嘛，不管什么系统啊，总有些小意外，特别是那些大忙人、高频度交流的情况里头，数据丢丢的情况难免会发生。就像你我用手机聊天，偶尔也会有信息没发出去或者乱了套的时候，对吧？所以啊，咱们得有个心理准备，也得想想怎么防着点，别让数据丢了就找不回来了。本文将深入探讨如何通过合理的策略和实践，降低使用RocketMQ时数据丢失的风险。一、理解数据持久化的重要性数据持久化是确保消息系统稳定运行的关键环节。在咱们RocketMQ的世界里，消息的持久性就像是一场接力赛，关键在于消息是不是能稳稳地落在磁盘上，不偏不倚。想象一下，你把消息小心翼翼地放进一个超级大保险箱里，这个保险箱就是我们的磁盘。无论遇到啥突发状况，比如突然停电啊，电脑当机啊，这个保险箱都能保持它的神秘，不让里面的宝贝消息跑掉。这样一来，下次咱们再打开保险箱时，那些消息还在原地，等着我们继续接力，继续咱们的消息传递之旅。这样子，无论是系统怎么出问题，咱们的消息都不会断线！数据丢失不仅会导致业务中断，还可能引发严重的经济损失和用户体验问题。二、RocketMQ的数据持久化机制 RocketMQ采用多种机制来保障消息持久化： 1. 消息存储 RocketMQ使用HDFS（Hadoop Distributed File System）或本地文件系统作为消息存储的底层。这种方式提供了高可用性和可扩展性。 2. 多副本机制 RocketMQ支持消息的多副本存储，通过复制机制，即使单个节点故障，也可以从其他副本恢复消息，保证了数据的高冗余度。 3. 事务消息对于需要保证消息发送和接收的原子性的场景，RocketMQ提供事务消息功能，确保消息的可靠投递。三、降低数据丢失风险的策略 1. 配置优化合理设置RocketMQ的配置参数，如消息重试次数、消费超时时间等，确保在异常情况下，消息可以被正确处理或重试。 java // 示例代码：设置消息重试次数 Properties props = new Properties(); props.setProperty("producer.transactionCheckEnabled", "false"); props.setProperty("producer.transactionTimeout", "60000"); props.setProperty("producer.maxReconsumeTimes", "5"); // 设置最大重试次数为5次 RMQSender sender = new RMQSender("localhost:18831", "myQueue", props); 2. 监控与报警建立一套完善的监控系统，实时监测RocketMQ的运行状态，一旦出现异常，立即触发报警机制。 bash 假设使用Prometheus进行监控 prometheus: - job_name: 'rocketmq' metrics_path: '/actuator/metrics' static_configs: - targets: ['localhost:8080'] labels: application: 'rocketmq' 3. 备份与恢复策略定期对RocketMQ的元数据和消息进行备份，以便在发生灾难性事件时快速恢复服务。 bash 使用HDFS作为存储时，可以利用HDFS的备份功能 hdfs dfs -copyToLocal /path/to/backup /local/path/ 4. 容错与高可用架构设计在应用层面考虑容错机制，如使用负载均衡、故障转移等策略，确保在单点故障时，系统仍能正常运行。 java // 使用Nacos进行服务发现和配置中心管理 @Value("${service.provider}") private String serviceProvider; @Bean public ProviderConfig providerConfig() { return new ProviderConfig(serviceProvider); } 四、结论通过上述策略的实施，我们可以显著降低使用RocketMQ时数据丢失的风险。关键在于合理配置、有效监控、备份恢复以及高可用架构的设计。在实际应用中，还需要根据业务的具体需求和场景，灵活调整策略，以达到最佳的数据持久化效果。哎呀，兄弟！技术这东西，得不停琢磨，多实践，别老是原地踏步。咱们得时不时调整一下系统这架机器的零件，让它跑得既快又稳当。这样，咱们的应用服务才不会卡壳，用户们用起来也舒心。这可是保证业务顺畅运行的关键！

2024-10-02 15:46:59

573

蝶舞花间

Golang

Golang中配置文件错误处理：从解析到优化的日志化策略与输入验证

...lang生态下的现代配置管理实践随着云计算和微服务架构的兴起，现代应用程序的复杂度显著提升，配置管理成为确保系统稳定性和灵活性的关键环节。Golang，作为一门简洁高效的语言，因其强大的并发处理能力和模块化的特性，被广泛应用于构建高性能、可扩展的系统。然而，在快速迭代的开发环境中，传统的配置管理方式面临诸多挑战，比如配置文件的频繁变更、版本控制的困难、以及多环境部署的复杂性。本文将探讨在Golang生态下，如何采用现代配置管理实践，以适应快速发展的技术趋势和业务需求。一、动态配置与云原生应用在云原生时代，动态配置管理变得至关重要。云平台提供了丰富的服务，如配置管理、密钥管理、服务发现等，这些服务支持在运行时更新配置，无需重启服务即可生效。Golang生态系统中，可以通过集成这些云服务来实现动态配置管理。例如，使用Kubernetes的ConfigMap或Secrets功能，可以在不修改代码的情况下，轻松调整服务配置，满足不同环境和阶段的需求。二、微服务间的配置协调在微服务架构中，服务间依赖的配置往往需要统一管理和协调。传统的方法可能涉及硬编码配置或通过共享数据库存储配置，这不仅增加了维护成本，还可能导致数据同步问题。借助现代配置管理工具，如Consul、Etcd或Vault，可以实现服务之间的配置共享和安全存储。这些工具提供了强大的API和丰富的客户端库，使得在Golang项目中集成配置管理变得更加便捷和高效。三、DevOps与自动化测试 DevOps实践强调自动化和持续交付，这对配置管理提出了更高要求。在Golang项目中，可以结合CI/CD工具链，如Jenkins、GitLab CI或GitHub Actions，实现配置文件的自动化管理。通过编写脚本或使用特定的配置管理工具，可以在每次代码提交后自动触发配置更新过程，确保生产环境与开发环境的配置一致性。此外，引入自动化测试，特别是针对配置文件的测试，可以帮助检测配置错误，提前发现潜在问题，减少上线风险。四、未来展望随着技术的不断演进，Golang生态下的配置管理实践也将不断发展。未来，我们可以期待更智能的配置管理系统，能够自动检测配置冲突、预测配置变更影响，甚至通过机器学习算法优化配置性能。同时，跨平台和跨语言的配置管理工具将进一步增强Golang与其他技术栈的互操作性，促进更广泛的生态系统集成和协作。总之，Golang生态下的现代配置管理实践不仅关乎技术细节，更是企业级应用架构设计和运维策略的重要组成部分。通过采用先进的配置管理工具和技术，可以有效提升应用的可维护性、可靠性和响应速度，助力企业在竞争激烈的市场环境中保持竞争优势。

2024-08-22 15:58:15

168

落叶归根

转载文章

[转载]容器实践线路图

...容器之间共享的，这个机制可以极大减少镜像更新时候拉取镜像包的时间，通常应用程序更新升级都只是更新业务层（如Java程序的jar包），而镜像中的操作系统Lib层、运行时（如Jre）层等文件不会频繁更新。因此新版本镜像实质有变化的只有很小的一部分，在更新升级时候也只会从镜像仓库拉取很小的文件，所以速度很快。应用资源调度：资源（计算/存储/网络）都是以应用为中心的，中心体现在资源分配是按照应用粒度分配资源、资源随应用迁移。基于上述容器技术特点，可以推导出容器技术的3大使用场景：CI/CD、提升资源利用率、弹性伸缩。这3个使用场景自然推导出通用的商业层面收益：CI/CD提升研发效率、提升资源利用率降低成本、按需弹性伸缩在体验与成本之间达成平衡。当然，除了商业目标之外，可能还有其他一些考虑因素，如基于容器技术实现计算任务调度平台、保持团队技术先进性等。 CI/CD提升研发效率为什么容器技术适合CI/CD CI/CD是DevOps的关键组成部分，DevOps是一套软件工程的流程，用于持续提升软件开发效率与软件交付质量。DevOps流程来源于制造业的精益生产理念，在这个领域的领头羊是丰田公司，《丰田套路》这本书总结丰田公司如何通过PDCA(Plan-Do-Check-Act)方法实施持续改进。PDCA通常也称为PDCA循环，PDCA实施过程简要描述为：确定目标状态、分析当前状态、找出与目标状态的差距、制定实施计划、实施并总结、开始下一个PDCA过程。 DevOps基本也是这么一个PDCA流程循环，很容易认知到PDCA过程中效率是关键，同一时间段内，实施更多数量的PDCA过程，收益越高。在软件开发领域的DevOps流程中，各种等待（等待编译、等待打包、等待部署等）、各种中断（部署失败、机器故障）是影响DevOps流程效率的重要因素。容器技术出来之后，将容器技术应用到DevOps场景下，可以从技术手段消除DevOps流程中的部分等待与中断，从而大幅度提升DevOps流程中CI/CD的效率。容器的OCI标准定义了容器镜像规范，容器镜像包与传统的压缩包(zip/tgz等)相比有两个关键区别点：1）分层存储；2）打包即部署。分层存储可以极大减少镜像更新时候拉取镜像包的时间，通常应用程序更新升级都只是更新业务层（如Java程序的jar包），而镜像中的操作系统Lib层、运行时（如Jre）层等文件不会频繁更新。因此新版本镜像实质有变化的只有很小的一部分，在更新升级时候也只会从镜像仓库拉取很小的文件，所以速度很快。打包即部署是指在容器镜像制作过程包含了传统软件包部署的过程（安装依赖的操作系统库或工具、创建用户、创建运行目录、解压、设置文件权限等等），这么做的好处是把应用及其依赖封装到了一个相对封闭的环境，减少了应用对外部环境的依赖，增强了应用在各种不同环境下的行为一致性，同时也减少了应用部署时间。基于容器镜像的这些优势，容器镜像用到CI/CD场景下，可以减少CI/CD过程中的等待时间，减少因环境差异而导致的部署中断，从而提升CI/CD的效率，提升整体研发效率。 CI/CD的关键诉求与挑战快开发人员本地开发调试完成后，提交代码，执行构建与部署，等待部署完成后验证功能。这个等待的过程尽可能短，否则开发人员工作容易被打断，造成后果就是效率降低。如果提交代码后几秒钟就能够完成部署，那么开发人员几乎不用等待，工作也不会被打断；如果需要好几分钟或十几分钟，那么可以想象，这十几分钟就是浪费了，这时候很容易做点别的事情，那么思路又被打断了。所以构建CI/CD环境时候，快是第一个需要考虑的因素。要达到快，除了有足够的机器资源免除排队等待，引入并行编译技术也是常用做法，如Maven3支持多核并行构建。自定义流程不同行业存在不同的行业规范、监管要求，各个企业有一套内部质量规范，这些要求都对软件交付流程有定制需求，如要求使用商用的代码扫描工具做安全扫描，如构建结果与企业内部通信系统对接发送消息。在团队协同方面，不同的公司，对DevOps流程在不同团队之间分工有差异，典型的有开发者负责代码编写构建出构建物（如jar包），而部署模板、配置由运维人员负责；有的企业开发人员负责构建并部署到测试环境；有的企业开发人员直接可以部署到生产环境。这些不同的场景，对CI/CD的流程、权限管控都有定制需求。提升资源利用率 OCI标准包含容器镜像标准与容器运行时标准两部分，容器运行时标准聚焦在定义如何将镜像包从镜像仓库拉取到本地并更新、如何隔离运行时资源这些方面。得益于分层存储与打包即部署的特性，容器镜像从到镜像仓库拉取到本地运行速度非常快（通常小于30秒，依赖镜像本身大小等因素），基于此可以实现按需分配容器运行时资源（cpu与内存），并限定单个容器资源用量；然后根据容器进程资源使用率设定弹性伸缩规则，实现自动的弹性伸缩。这种方式相对于传统的按峰值配置资源方式，可以提升资源利用率。按需弹性伸缩在体验与成本之间达成平衡联动弹性伸缩应用运行到容器，按需分配资源之后，理想情况下，Kubernetes的池子里没有空闲的资源。这时候扩容应用实例数，新扩容的实例会因资源不足调度失败。这时候需要资源池能自动扩容，加入新的虚拟机，调度新扩容的应用。由于应用对资源的配比与Flavor有要求，因此新加入的虚拟机，应当是与应用所需要的资源配比与Flavor一致的。缩容也是类似。弹性伸缩还有一个诉求点是“平滑”，对业务做到不感知，也称为“优雅”扩容/缩容。请求风暴上面提到的弹性伸缩一般是有计划或缓慢增压的场景，存在另外一种无法预期的请求风暴场景，这种场景的特征是无法预测、突然请求量增大数倍或数十倍、持续时间短。典型的例子如行情交易系统，当行情突变的时候，用户访问量徒增，持续几十分钟或一个小时。这种场景的弹性诉求，要求短时间内能将资源池扩大数倍，关键是速度要快（秒级），否则会来不及扩容，系统已经被冲垮（如果无限流的话）。目前基于 Virtual Kubelet 与云厂家的 Serverless 容器，理论上可以提供应对请求风暴的方案。不过在具体实施时候，需要考虑传统托管式Kubernetes容器管理平台与Serverless容器之间互通的问题，需要基于具体厂家提供的能力来评估。基于容器技术实现计算调度平台计算（大数据/AI训练等）场景的特征是短时间内需要大量算力，算完即释放。容器的环境一致性以及调度便利性适合这种场景。技术选型容器技术是属于基础设施范围，但是与传统虚拟化技术（Xen/KVM）比较，容器技术是应用虚拟化，不是纯粹的资源虚拟化，与传统虚拟化存在差异。在容器技术选型时候，需要结合当前团队在应用管理与资源管理的现状，对照容器技术与虚拟化技术的差异，选择最合适的容器技术栈。什么是容器技术 (1)容器是一种轻量化的应用虚拟化技术。在讨论具体的容器技术栈的时候，先介绍目前几种常用的应用虚拟化技术，当前有3种主流的应用虚拟化技术: LXC，MicroVM，UniKernel（LibOS）。 LXC: Linux Container，通过 Linux的 namespace/cgroups/chroot 等技术隔离进程资源，目前应用最广的docker就是基于LXC实现应用虚拟化的。 MicroVM: MicroVM 介于传统的VM 与 LXC之间，隔离性比LXC好，但是比传统的VM要轻量，轻量体现在体积小（几M到几十M）、启动快（小于1s）。 AWS Firecracker 就是一种MicroVM的实现，用于AWS的Serverless计算领域，Serverless要求启动快，租户之间隔离性好。 UniKernel: 是一种专用的（特定编程语言技术栈专用）、单地址空间、使用 library OS 构建出来的镜像。UniKernel要解决的问题是减少应用软件的技术栈层次，现代软件层次太多导致越来越臃肿：硬件+HostOS+虚拟化模拟+GuestOS+APP。UniKernel目标是：硬件+HostOS+虚拟化模拟+APP-with-libos。三种技术对比表：开销体积启动速度隔离/安全生态 LXC 低（几乎为0）小快（等同进程启动）差（内核共享）好 MicroVM 高大慢(小于1s) 好中（Kata项目） UniKernel 中中中好差根据上述对比来看，LXC是应用虚拟化首选的技术，如果LXC无法满足隔离性要，则可以考虑MicroVM这种技术。当前社区已经在着手融合LXC与MicroVM这两种技术，从应用打包/发布调度/运行层面统一规范，Kubernetes集成Kata支持混合应用调度特性可以了解一下。 UniKernel 在应用生态方面相对比较落后，目前在追赶中，目前通过 linuxkit 工具可以在UniKernel应用镜像中使用docker镜像。这种方式笔者还未验证过，另外docker镜像运行起来之后，如何监控目前还未知。从上述三种应用虚拟化技术对比，可以得出结论: （2)容器技术与传统虚拟化技术不断融合中。再从规范视角来看容器技术，可以将容器技术定义为: (3)容器=OCI+CRI+辅助工具。 OCI规范包含两部分，镜像规范与运行时规范。简要的说，要实现一个OCI的规范，需要能够下载镜像并解压镜像到文件系统上组成成一个文件目录结构，运行时工具能够理解这个目录结构并基于此目录结构管理（创建/启动/停止/删除）进程。容器(container)的技术构成就是实现OCI规范的技术集合。对于不同的操作系统（Linux/Windows），OCI规范的实现技术不同，当前docker的实现，支持Windows与Linux与MacOS操作系统。当前使用最广的是Linux系统，OCI的实现，在Linux上组成容器的主要技术： chroot: 通过分层文件系统堆叠出容器进程的rootfs，然后通过chroot设置容器进程的根文件系统为堆叠出的rootfs。 cgroups: 通过cgroups技术隔离容器进程的cpu/内存资源。 namesapce: 通过pid, uts, mount, network, user namesapce 分别隔离容器进程的进程ID，时间，文件系统挂载，网络，用户资源。网络虚拟化: 容器进程被放置到独立的网络命名空间，通过Linux网络虚拟化veth, macvlan, bridge等技术连接主机网络与容器虚拟网络。存储驱动: 本地文件系统，使用容器镜像分层文件堆叠的各种实现驱动，当前推荐的是overlay2。广义的容器还包含容器编排，即当下很火热的Kubernetes。Kubernetes为了把控容器调度的生态，发布了CRI规范，通过CRI规范解耦Kubelet与容器，只要实现了CRI接口，都可以与Kubelet交互，从而被Kubernetes调度。OCI规范的容器实现与CRI标准接口对接的实现是CRI-O。辅助工具用户构建镜像，验证镜像签名，管理存储卷等。容器定义容器是一种轻量化的应用虚拟化技术。容器=OCI+CRI+辅助工具。容器技术与传统虚拟化技术不断融合中。什么是容器编排与调度选择了应用虚拟化技术之后，还需要应用调度编排，当前Kubernetes是容器领域内编排的事实标准，不管使用何种应用虚拟化技术，都已经纳入到了Kubernetes治理框架中。 Kubernetes 通过 CRI 接口规范，将应用编排与应用虚拟化实现解耦：不管使用何种应用虚拟化技术（LXC, MicroVM, LibOS），都能够通过Kubernetes统一编排。当前使用最多的是docker，其次是cri-o。docker与crio结合kata-runtime都能够支持多种应用虚拟化技术混合编排的场景，如LXC与MicroVM混合编排。 docker(now): Moby 公司贡献的 docker 相关部件，当前主流使用的模式。 docker(daemon) 提供对外访问的API与CLI(docker client) containerd 提供与 kubelet 对接的 CRI 接口实现 shim负责将Pod桥接到Host namespace。 cri-o: 由 RedHat/Intel/SUSE/IBM/Hyper 公司贡献的实现了CRI接口的符合OCI规范的运行时，当前包括 runc 与 kata-runtime ，也就是说使用 cir-o 可以同时运行LXC容器与MicroVM容器，具体在Kata介绍中有详细说明。 CRI-O: 实现了CRI接口的进程，与 kubelet 交互 crictl: 类似 docker 的命令行工具 conmon: Pod监控进程 other cri runtimes: 其他的一些cri实现，目前没有大规模应用到生产环境。容器与传统虚拟化差异容器(container)的技术构成前面主要讲到的是容器与编排，包括CRI接口的各种实现，我们把容器领域的规范归纳为南向与北向两部分，CRI属于北向接口规范，对接编排系统，OCI就属于南向接口规范，实现应用虚拟化。简单来讲，可以这么定义容器：容器(container) ~= 应用打包(build) + 应用分发(ship) + 应用运行/资源隔离(run)。 build-ship-run 的内容都被定义到了OCI规范中，因此也可以这么定义容器：容器(container) == OCI规范 OCI规范包含两部分，镜像规范与运行时规范。简要的说，要实现一个OCI的规范，需要能够下载镜像并解压镜像到文件系统上组成成一个文件目录结构，运行时工具能够理解这个目录结构并基于此目录结构管理（创建/启动/停止/删除）进程。容器(container)的技术构成就是实现OCI规范的技术集合。对于不同的操作系统（Linux/Windows），OCI规范的实现技术不同，当前docker的实现，支持Windows与Linux与MacOS操作系统。当前使用最广的是Linux系统，OCI的实现，在Linux上组成容器的主要技术： chroot: 通过分层文件系统堆叠出容器进程的rootfs，然后通过chroot设置容器进程的根文件系统为堆叠出的rootfs。 cgroups: 通过cgroups技术隔离容器进程的cpu/内存资源。 namesapce: 通过pid, uts, mount, network, user namesapce 分别隔离容器进程的进程ID，时间，文件系统挂载，网络，用户资源。网络虚拟化: 容器进程被放置到独立的网络命名空间，通过Linux网络虚拟化veth, macvlan, bridge等技术连接主机网络与容器虚拟网络。存储驱动: 本地文件系统，使用容器镜像分层文件堆叠的各种实现驱动，当前推荐的是overlay2。广义的容器还包含容器编排，即当下很火热的Kubernetes。Kubernetes为了把控容器调度的生态，发布了CRI规范，通过CRI规范解耦Kubelet与容器，只要实现了CRI接口，都可以与Kubelet交互，从而被Kubernetes调度。OCI规范的容器实现与CRI标准接口对接的实现是CRI-O。容器与虚拟机差异对比容器与虚拟机的差异可以总结为2点：应用打包与分发的差异，应用资源隔离的差异。当然，导致这两点差异的根基是容器是以应用为中心来设计的，而虚拟化是以资源为中心来设计的，本文对比容器与虚拟机的差异，更多的是站在应用视角来对比。从3个方面对比差异：资源隔离，应用打包与分发，延伸的日志/监控/DFX差异。 1.资源隔离隔离机制差异容器虚拟化 mem/cpu cgroup, 使用时候设定 require 与 limit 值 QEMU, KVM network Linux网络虚拟化技术(veth,tap,bridge,macvlan,ipvlan), 跨虚拟机或出公网访问:SNAT/DNAT, service转发:iptables/ipvs, SR-IOV Linux网络虚拟化技术(veth,tap,bridge,macvlan,ipvlan), QEMU, SR-IOV storage 本地存储: 容器存储驱动本地存储：virtio-blk 差异引入问题与实践建议应用程序未适配 cgroup 的内存隔离导致问题: 典型的是 JVM 虚拟机，在 JVM 启动时候会根据系统内存自动设置 MaxHeapSize 值，通常是系统内存的1/4，但是 JVM 并未考虑 cgroup 场景，读系统内存时候任然读取主机的内存来设置 MaxHeapSize，这样会导致内存超过 cgroup 限制从而导致进程被 kill 。问题详细阐述与解决建议参考Java inside docker: What you must know to not FAIL。多次网络虚拟化问题: 如果在虚拟机内使用容器，会多一层网络虚拟化，并加入了SNAT/DNAT技术, iptables/ipvs技术，对网络吞吐量与时延都有影响（具体依赖容器网络方案），对问题定位复杂度变高，同时还需要注意网络内核参数调优。典型的网络调优参数有：转发表大小 /proc/sys/net/netfilter/nf_conntrack_max 使用iptables 作为service转发实现的时候，在转发规则较多的时候，iptables更新由于需要全量更新导致非常耗时，建议使用ipvs。详细参考[华为云在 K8S 大规模场景下的 Service 性能优化实践](https://zhuanlan.zhihu.com/p/37230013)。容器IP地址频繁变化不固定，周边系统需要协调适配，包括基于IP地址的白名单或防火墙控制策略需要调整，CMDB记录的应用IP地址需要适配动态IP或者使用服务名替代IP地址。存储驱动带来的性能损耗: 容器本地文件系统是通过联合文件系统方式堆叠出来的，当前主推与默认提供的是overlay2驱动，这种模式应用写本地文件系统文件或修改已有文件，使用Copy-On-Write方式，也就是会先拷贝源文件到可写层然后修改，如果这种操作非常频繁，建议使用 volume 方式。 2.应用打包与分发应用打包/分发/调度差异容器虚拟化打包打包既部署一般不会把应用程序与虚拟机打包在一起，通过部署系统部署应用分发使用镜像仓库存储与分发使用文件存储调度运行使用K8S亲和/反亲和调度策略使用部署系统的调度能力差异引入问题与实践建议部署提前到构建阶段，应用需要支持动态配置与静态程序分离；如果在传统部署脚本中依赖外部动态配置，这部分需要做一些调整。打包格式发生变化，制作容器镜像需要注意安全/效率因素，可参考Dockerfile最佳实践容器镜像存储与分发是按layer来组织的，镜像在传输过程中放篡改的方式是传统软件包有差异。 3.监控/日志/DFX 差异容器虚拟化监控 cpu/mem的资源上限是cgroup定义的；containerd/shim/docker-daemon等进程的监控传统进程监控日志采集 stdout/stderr日志采集方式变化；日志持久化需要挂载到volume；进程会被随机调度到其他节点导致日志需要实时采集否则分散很难定位传统日志采集问题定位进程down之后自动拉起会导致问题定位现场丢失；无法停止进程来定位问题因为停止即删除实例传统问题定位手段差异引入问题实践与建议使用成熟的监控工具，运行在docker中的应用使用cadvisor+prometheus实现采集与警报，cadvisor中预置了常用的监控指标项对于docker管理进程（containerd/shim/docker-daemon）也需要一并监控使用成熟的日志采集工具，如果已有日志采集Agent，则可以考虑将日志文件挂载到volume后由Agent采集；需要注意的是stderr/stdout输出也要一并采集如果希望容器内应用进程退出后保留现场定位问题，则可以将Pod的restartPolicy设置为never，进程退出后进程文件都还保留着(/var/lib/docker/containers)。但是这么做的话需要进程没有及时恢复，会影响业务，需要自己实现进程重拉起。团队配合与周边的开发团队、架构团队、测试团队、运维团队评审并交流方案，与周边团队达成一致。落地策略与注意事项逐步演进过程中网络互通根据当前已经存在的基础实施情况，选择容器化落地策略。通常使用逐步演进的方式，由于容器化引入了独立的网络namespace导致容器与传统虚拟机进程网络隔离，逐步演进过程中如何打通隔离的网络是最大的挑战。分两种场景讨论：不同服务集群之间使用VIP模式互通: 这种模式相对简单，基于VIP做灰度发布。不同服务集群之间使用微服务点对点模式互通(SpringCloud/ServiceComb/Dubbo都是这一类): 这种模式相对复杂，在逐步容器化过程中，要求容器网络与传统虚拟机网络能够互通（难点是在虚拟机进程内能够直接访问到容器网络的IP地址），当前解决这个问题有几种方法。自建Kubernetes场景，可使用开源的kube-router，kube-router 使用BGP协议实现容器网络与传统虚拟机网络之间互通，要求网络交换机支持BGP协议。使用云厂商托管Kubernetes场景，选择云厂商提供的VPC-Router互通的网络插件，如阿里云的Terway网络插件, 华为云的Underlay网络模式。选择物理机还是虚拟机选择物理机运行容器还是虚拟机运行容器，需要结合基础设施与业务隔离性要求综合考虑。分两种场景：自建IDC、租用公有云。自建IDC: 理想情况是使用物理机组成一个大集群，根据业务诉求，对资源保障与安全性要求高的应用，使用MicorVM方式隔离；普通应用使用LXC方式隔离。所有物理机在一个大集群内，方便削峰填谷提升资源利用率。租用公有云：当前公有云厂家提供的裸金属服务价格较贵且只能包周期，使用裸金属性价比并不高，使用虚拟机更合适。集群规模与划分选择集群时候，是多个应用共用一个大集群，还是按应用分组分成多个小集群呢？我们把节点规模数量>=1000的定义为大集群，节点数<1000的定义为小集群。大集群的优点是资源池共享容器，方便资源调度（削峰填谷）；缺点是随着节点数量与负载数量的增多，会引入管理性能问题（需要量化）: DNS 解析表变大，增加/删除 Service 或增加/删除 Endpoint 导致DNS表刷新慢 K8S Service 转发表变大，导致工作负载增加/删除刷新iptables/ipvs记录变慢 etcd 存储空间变大，如果加上ConfigMap，可能导致 etcd 访问时延增加小集群的优点是不会有管理性能问题，缺点是会导致资源碎片化，不容易共享。共享分两种情况: 应用之间削峰填谷：目前无法实现计算任务与应用之间削峰填谷：由于计算任务是短时任务，可以通过上层的任务调度软件，在多个集群之间分发计算任务，从而达到集群之间资源共享的目的。选择集群规模的时候，可以参考上述分析，结合实际情况选择适合的集群划分。 Helm? Helm是为了解决K8S管理对象散碎的问题，在K8S中并没有"应用"的概念，只有一个个散的对象(Deployment, ConfigMap, Service, etc)，而一个"应用"是多个对象组合起来的，且这些对象之间还可能存在一定的版本配套关系。 Helm 通过将K8S多个对象打包为一个包并标注版本号形成一个"应用"，通过 Helm 管理进程部署/升级这个"应用"。这种方式解决了一些问题（应用分发更方便）同时也引入了一些问题（引入Helm增加应用发布/管理复杂度、在K8S修改了对象后如何同步到Helm）。对于是否需要使用Helm，建议如下：在自运维模式下不使用Helm: 自运维模式下，很多场景是开发团队交付一个运行包，运维团队负责部署与配置下发，内部通过兼容性或软件包与配置版本配套清单、管理软件包与配置的配套关系。在交付软件包模式下使用Helm: 交付软件包模式下，Helm 这种把散碎组件组装为一个应用的模式比较适合，使用Helm实现软件包分发/部署/升级场比较简单。 Reference DOCKER vs LXC vs VIRTUAL MACHINES Cgroup与LXC简介 Introducing Container Runtime Interface (CRI) in Kubernetes frakti rkt appc-spec OCI 和 runc：容器标准化和 docker Linux 容器技术史话：从 chroot 到未来 Linux Namespace和Cgroup Java inside docker: What you must know to not FAIL QEMU,KVM及QEMU-KVM介绍 kvm libvirt qemu实践系列(一)-kvm介绍 KVM 介绍（4）：I/O 设备直接分配和 SR-IOV [KVM PCI/PCIe Pass-Through SR-IOV] prometheus-book 到底什么是Unikernel？ The Rise and Fall of the Operating System The Design and Implementation of the Anykernel and Rump Kernels UniKernel Unikernel：从不入门到入门 OSv 京东如何打造K8s全球最大集群支撑万亿电商交易 Cloud Native App Hub 更多云最佳实践 https://best.practices.cloud 本篇文章为转载内容。原文链接：https://blog.csdn.net/sinat_33155975/article/details/118013855。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-09-17 15:03:28

225

转载

转载文章

[转载]项目维护几年了，为啥还这么卡？

...4.滑动不跟手，列表自动更新，滚动不流畅 5.网络响应慢，数据和画面展示慢、 6.过渡动画生硬。 7.界面不可交互，卡死，等等现象。卡顿是如何发生的卡顿产生的原因一般都比较复杂，如CPU内存大小，IO操作，锁操作，低效的算法等都会引起卡顿。站在开发的角度看：通常我们讲，屏幕刷新率是60fps，需要在16ms内完成所有的工作才不会造成卡顿。为什么是16ms，不是17，18呢？下面我们先来理清在UI绘制中的几个概念： SurfaceFlinger： SurfaceFlinger作用是接受多个来源的图形显示数据Surface，合成后发送到显示设备,比如我们的主界面中：可能会有statusBar，侧滑菜单，主界面，这些View都是独立Surface渲染和更新，最后提交给SF后，SF根据Zorder，透明度，大小，位置等参数，合成为一个数据buffer，传递HWComposer或者OpenGL处理，最终给显示器。在显示过程中使用到了bufferqueue，surfaceflinger作为consumer方，比如windowmanager管理的surface作为生产方产生页面，交由surfaceflinger进行合成。 VSYNC Android系统每隔16ms发出VSYNC信号，触发对UI进行渲染，VSYNC是一种在PC上很早就有应用，可以理解为一种定时中断技术。 tearing 问题：早期的 Android 是没有 vsync 机制的，CPU 和 GPU 的配合也比较混乱，这也造成著名的 tearing 问题，即 CPU/GPU 直接更新正在显示的屏幕 buffer 造成画面撕裂。后续 Android 引入了双缓冲机制，但是 buffer 的切换也需要一个比较合适的时机，也就是屏幕扫描完上一帧后的时机，这也就是引入 vsync 的原因。早先一般的屏幕刷新率是 60fps，所以每个 vsync 信号的间隔也是 16ms，不过随着技术的更迭以及厂商对于流畅性的追求，越来越多 90fps 和 120fps 的手机面世，相对应的间隔也就变成了 11ms 和 8ms。 VSYNC信号种类： 1.屏幕产生的硬件VSYNC：硬件VSYNC是一种脉冲信号，起到开关和触发某种操作的作用。 2.由SurfaceFlinger将其转成的软件VSYNC信号，经由Binder传递给Choreographer Choreographer：编舞者，用于注册VSYNC信号并接收VSYNC信号回调，当内部接收到这个信号时最终会调用到doFrame进行帧的绘制操作。 Choreographer在系统中流程：如何通过Choreographer计算掉帧情况：原理就是: 通过给Choreographer设置FrameCallback，在每次绘制前后看时间差是16.6ms的多少倍，即为前后掉帧率。使用方式如下： //Application.javapublic void onCreate() {super.onCreate();//在Application中使用postFrameCallbackChoreographer.getInstance().postFrameCallback(new FPSFrameCallback(System.nanoTime()));}public class FPSFrameCallback implements Choreographer.FrameCallback {private static final String TAG = "FPS_TEST";private long mLastFrameTimeNanos = 0;private long mFrameIntervalNanos;public FPSFrameCallback(long lastFrameTimeNanos) {mLastFrameTimeNanos = lastFrameTimeNanos;mFrameIntervalNanos = (long)(1000000000 / 60.0);}@Overridepublic void doFrame(long frameTimeNanos) {//初始化时间if (mLastFrameTimeNanos == 0) {mLastFrameTimeNanos = frameTimeNanos;}final long jitterNanos = frameTimeNanos - mLastFrameTimeNanos;if (jitterNanos >= mFrameIntervalNanos) {final long skippedFrames = jitterNanos / mFrameIntervalNanos;if(skippedFrames>30){//丢帧30以上打印日志Log.i(TAG, "Skipped " + skippedFrames + " frames! "+ "The application may be doing too much work on its main thread.");} }mLastFrameTimeNanos=frameTimeNanos;//注册下一帧回调Choreographer.getInstance().postFrameCallback(this);} } UI绘制全路径分析：有了前面几个概念，这里我们让SurfaceFlinger结合View的绘制流程用一张图来表达整个绘制流程：生产者：APP方构建Surface的过程。消费者：SurfaceFlinger UI绘制全路径分析卡顿原因：接下来，我们逐个分析，看看都会有哪些原因可能造成卡顿： 1.渲染流程 1.Vsync 调度：这个是起始点，但是调度的过程会经过线程切换以及一些委派的逻辑，有可能造成卡顿，但是一般可能性比较小，我们也基本无法介入； 2.消息调度：主要是 doframe Message 的调度，这就是一个普通的 Handler 调度，如果这个调度被其他的 Message 阻塞产生了时延，会直接导致后续的所有流程不会被触发 3.input 处理：input 是一次 Vsync 调度最先执行的逻辑，主要处理 input 事件。如果有大量的事件堆积或者在事件分发逻辑中加入大量耗时业务逻辑，会造成当前帧的时长被拉大，造成卡顿，可以尝试通过事件采样的方案，减少 event 的处理 4.动画处理：主要是 animator 动画的更新，同理，动画数量过多，或者动画的更新中有比较耗时的逻辑，也会造成当前帧的渲染卡顿。对动画的降帧和降复杂度其实解决的就是这个问题； 5.view 处理：主要是接下来的三大流程，过度绘制、频繁刷新、复杂的视图效果都是此处造成卡顿的主要原因。比如我们平时所说的降低页面层级，主要解决的就是这个问题； 6.measure/layout/draw：view 渲染的三大流程，因为涉及到遍历和高频执行，所以这里涉及到的耗时问题均会被放大，比如我们会降不能在 draw 里面调用耗时函数，不能 new 对象等等； 7.DisplayList 的更新：这里主要是 canvas 和 displaylist 的映射，一般不会存在卡顿问题，反而可能存在映射失败导致的显示问题； 8.OpenGL 指令转换：这里主要是将 canvas 的命令转换为 OpenGL 的指令，一般不存在问题 9.buffer 交换：这里主要指 OpenGL 指令集交换给 GPU，这个一般和指令的复杂度有关 10.GPU 处理：顾名思义，这里是 GPU 对数据的处理，耗时主要和任务量和纹理复杂度有关。这也就是我们降低 GPU 负载有助于降低卡顿的原因； 11.layer 合成：Android P 修改了 Layer 的计算方法 , 把这部分放到了 SurfaceFlinger 主线程去执行, 如果后台 Layer 过多, 就会导致 SurfaceFlinger 在执行 rebuildLayerStacks 的时候耗时 , 导致 SurfaceFlinger 主线程执行时间过长。可以选择降低Surface层级来优化卡顿。 12.光栅化/Display：这里暂时忽略，底层系统行为； Buffer 切换：主要是屏幕的显示，这里 buffer 的数量也会影响帧的整体延迟，不过是系统行为，不能干预。 2.系统负载内存：内存的吃紧会直接导致 GC 的增加甚至 ANR，是造成卡顿的一个不可忽视的因素； CPU：CPU 对卡顿的影响主要在于线程调度慢、任务执行的慢和资源竞争，比如 1.降频会直接导致应用卡顿； 2.后台活动进程太多导致系统繁忙，cpu \ io \ memory 等资源都会被占用, 这时候很容易出现卡顿问题，这种情况比较常见,可以使用dumpsys cpuinfo查看当前设备的cpu使用情况： 3.主线程调度不到 , 处于 Runnable 状态，这种情况比较少见 4.System 锁：system_server 的 AMS 锁和 WMS 锁 , 在系统异常的情况下 , 会变得非常严重 , 如下图所示 , 许多系统的关键任务都被阻塞 , 等待锁的释放 , 这时候如果有 App 发来的 Binder 请求带锁 , 那么也会进入等待状态 , 这时候 App 就会产生性能问题 ; 如果此时做 Window 动画 , 那么 system_server 的这些锁也会导致窗口动画卡顿 GPU：GPU 的影响见渲染流程，但是其实还会间接影响到功耗和发热；功耗/发热：功耗和发热一般是不分家的，高功耗会引起高发热，进而会引起系统保护，比如降频、热缓解等，间接的导致卡顿。如何监控卡顿线下监控：我们知道卡顿问题的原因错综复杂，但最终都可以反馈到CPU使用率上来 1.使用dumpsys cpuinfo命令这个命令可以获取当时设备cpu使用情况，我们可以在线下通过重度使用应用来检测可能存在的卡顿点 A8S:/ $ dumpsys cpuinfoLoad: 1.12 / 1.12 / 1.09CPU usage from 484321ms to 184247ms ago (2022-11-02 14:48:30.793 to 2022-11-02 14:53:30.866):2% 1053/scanserver: 0.2% user + 1.7% kernel0.6% 934/system_server: 0.4% user + 0.1% kernel / faults: 563 minor0.4% 564/signserver: 0% user + 0.4% kernel0.2% 256/ueventd: 0.1% user + 0% kernel / faults: 320 minor0.2% 474/surfaceflinger: 0.1% user + 0.1% kernel0.1% 576/vendor.sprd.hardware.gnss@2.0-service: 0.1% user + 0% kernel / faults: 54 minor0.1% 286/logd: 0% user + 0% kernel / faults: 10 minor0.1% 2821/com.allinpay.appstore: 0.1% user + 0% kernel / faults: 1312 minor0.1% 447/android.hardware.health@2.0-service: 0% user + 0% kernel / faults: 1175 minor0% 1855/com.smartpos.dataacqservice: 0% user + 0% kernel / faults: 755 minor0% 2875/com.allinpay.appstore:pushcore: 0% user + 0% kernel / faults: 744 minor0% 1191/com.android.systemui: 0% user + 0% kernel / faults: 70 minor0% 1774/com.android.nfc: 0% user + 0% kernel0% 172/kworker/1:2: 0% user + 0% kernel0% 145/irq/24-70900000: 0% user + 0% kernel0% 575/thermald: 0% user + 0% kernel / faults: 300 minor... 2.CPU Profiler 这个工具是AS自带的CPU性能检测工具，可以在PC上实时查看我们CPU使用情况。 AS提供了四种Profiling Model配置： 1.Sample Java Methods：在应用程序基于Java的代码执行过程中，频繁捕获应用程序的调用堆栈获取有关应用程序基于Java的代码执行的时间和资源使用情况信息。 2.Trace java methods：在运行时对应用程序进行检测，以在每个方法调用的开始和结束时记录时间戳。收集时间戳并进行比较以生成方法跟踪数据，包括时序信息和CPU使用率。请注意与检测每种方法相关的开销会影响运行时性能，并可能影响性能分析数据。对于生命周期相对较短的方法，这一点甚至更为明显。此外，如果您的应用在短时间内执行大量方法，则探查器可能会很快超过其文件大小限制，并且可能无法记录任何进一步的跟踪数据。 3.Sample C/C++ Functions:捕获应用程序本机线程的示例跟踪。要使用此配置，您必须将应用程序部署到运行Android 8.0（API级别26）或更高版本的设备。 4.Trace System Calls:捕获细粒度的详细信息，使您可以检查应用程序与系统资源的交互方式您可以检查线程状态的确切时间和持续时间，可视化CPU瓶颈在所有内核中的位置，并添加自定义跟踪事件进行分析。在对性能问题进行故障排除时，此类信息可能至关重要。要使用此配置，您必须将应用程序部署到运行Android 7.0（API级别24）或更高版本的设备。使用方式： Debug.startMethodTracing("");// 需要检测的代码片段...Debug.stopMethodTracing(); 优点：有比较全面的调用栈以及图像化方法时间显示，包含所有线程的情况缺点：本身也会带来一点的性能开销，可能会带偏优化方向火焰图：可以显示当前应用的方法堆栈： 3.Systrace Systrace在前面一篇分析启动优化的文章讲解过这里我们简单来复习下： Systrace用来记录当前应用的系统以及应用(使用Trace类打点)的各阶段耗时信息包括绘制信息以及CPU信息等。使用方式： Trace.beginSection("MyApp.onCreate_1");alt(200);Trace.endSection(); 在命令行中： python systrace.py -t 5 sched gfx view wm am app webview -a "com.chinaebipay.thirdcall" -o D:\trac1.html 记录的方法以及CPU中的耗时情况：优点： 1.轻量级，开销小，CPU使用率可以直观反映 2.右侧的Alerts能够根据我们应用的问题给出具体的建议，比如说，它会告诉我们App界面的绘制比较慢或者GC比较频繁。 4.StrictModel StrictModel是Android提供的一种运行时检测机制，用来帮助开发者自动检测代码中不规范的地方。主要和两部分相关： 1.线程相关 2.虚拟机相关基础代码： private void initStrictMode() {// 1、设置Debug标志位，仅仅在线下环境才使用StrictModeif (DEV_MODE) {// 2、设置线程策略StrictMode.setThreadPolicy(new StrictMode.ThreadPolicy.Builder().detectCustomSlowCalls() //API等级11，使用StrictMode.noteSlowCode.detectDiskReads().detectDiskWrites().detectNetwork() // or .detectAll() for all detectable problems.penaltyLog() //在Logcat 中打印违规异常信息// .penaltyDialog() //也可以直接跳出警报dialog// .penaltyDeath() //或者直接崩溃.build());// 3、设置虚拟机策略StrictMode.setVmPolicy(new StrictMode.VmPolicy.Builder().detectLeakedSqlLiteObjects()// 给NewsItem对象的实例数量限制为1.setClassInstanceLimit(NewsItem.class, 1).detectLeakedClosableObjects() //API等级11.penaltyLog().build());} } 线上监控：线上需要自动化的卡顿检测方案来定位卡顿，它能记录卡顿发生时的场景。自动化监控原理：采用拦截消息调度流程，在消息执行前埋点计时，当耗时超过阈值时，则认为是一次卡顿，会进行堆栈抓取和上报工作首先，我们看下Looper用于执行消息循环的loop()方法，关键代码如下所示： / Run the message queue in this thread. Be sure to call {@link quit()} to end the loop./public static void loop() {...for (;;) {Message msg = queue.next(); // might blockif (msg == null) {// No message indicates that the message queue is quitting.return;// This must be in a local variable, in case a UI event sets the loggerfinal Printer logging = me.mLogging;if (logging != null) {// 1logging.println(">>>>> Dispatching to " + msg.target + " " +msg.callback + ": " + msg.what);}...try {// 2 msg.target.dispatchMessage(msg);dispatchEnd = needEndTime ? SystemClock.uptimeMillis() : 0;} finally {if (traceTag != 0) {Trace.traceEnd(traceTag);} }...if (logging != null) {// 3logging.println("<<<<< Finished to " + msg.target + " " + msg.callback);} 在Looper的loop()方法中，在其执行每一个消息（注释2处）的前后都由logging进行了一次打印输出。可以看到，在执行消息前是输出的">>>>> Dispatching to “，在执行消息后是输出的”<<<<< Finished to ",它们打印的日志是不一样的，我们就可以由此来判断消息执行的前后时间点。具体的实现可以归纳为如下步骤： 1、首先，我们需要使用Looper.getMainLooper().setMessageLogging()去设置我们自己的Printer实现类去打印输出logging。这样，在每个message执行的之前和之后都会调用我们设置的这个Printer实现类。 2、如果我们匹配到">>>>> Dispatching to "之后，我们就可以执行一行代码：也就是在指定的时间阈值之后，我们在子线程去执行一个任务，这个任务就是去获取当前主线程的堆栈信息以及当前的一些场景信息，比如：内存大小、电脑、网络状态等。 3、如果在指定的阈值之内匹配到了"<<<<< Finished to "，那么说明message就被执行完成了，则表明此时没有产生我们认为的卡顿效果，那我们就可以将这个子线程任务取消掉。这里我们使用blockcanary来做测试: BlockCanary APM是一个非侵入式的性能监控组件，可以通过通知的形式弹出卡顿信息。它的原理就是我们刚刚讲述到的卡顿监控的实现原理。使用方式： 1.导入依赖 implementation 'com.github.markzhai:blockcanary-android:1.5.0' Application的onCreate方法中开启卡顿监控 // 注意在主进程初始化调用BlockCanary.install(this, new AppBlockCanaryContext()).start(); 3.继承BlockCanaryContext类去实现自己的监控配置上下文类 public class AppBlockCanaryContext extends BlockCanaryContext {....../ 指定判定为卡顿的阈值threshold (in millis), 你可以根据不同设备的性能去指定不同的阈值 @return threshold in mills/public int provideBlockThreshold() {return 1000;}....} 4.在Activity的onCreate方法中执行一个耗时操作 try {Thread.sleep(4000);} catch (InterruptedException e) {e.printStackTrace();} 5.结果：可以看到一个和LeakCanary一样效果的阻塞可视化堆栈图那有了BlockCanary的方法耗时监控方式是不是就可以解百愁了呢，呵呵。有那么容易就好了根据原理：我们拿到的是msg执行前后的时间和堆栈信息，如果msg中有几百上千个方法，就无法确认到底是哪个方法导致的耗时，也有可能是多个方法堆积导致。这就导致我们无法准确定位哪个方法是最耗时的。如图中：堆栈信息是T2的，而发生耗时的方法可能是T1到T2中任何一个方法甚至是堆积导致。那如何优化这块？这里我们采用字节跳动给我们提供的一个方案：基于 Sliver trace 的卡顿监控体系 Sliver trace 整体流程图：主要包含两个方面: 检测方案：在监控卡顿时，首先需要打开 Sliver 的 trace 记录能力，Sliver 采样记录 trace 执行信息，对抓取到的堆栈进行 diff 聚合和缓存。同时基于我们的需要设置相应的卡顿阈值，以 Message 的执行耗时为衡量。对主线程消息调度流程进行拦截，在消息开始分发执行时埋点，在消息执行结束时计算消息执行耗时，当消息执行耗时超过阈值，则认为产生了一次卡顿。堆栈聚合策略：当卡顿发生时，我们需要为此次卡顿准备数据，这部分工作是在端上子线程中完成的，主要是 dump trace 到文件以及过滤聚合要上报的堆栈。分为以下几步： 1.拿到缓存的主线程 trace 信息并 dump 到文件中。 2.然后从文件中读取 trace 信息，按照数据格式，从最近的方法栈向上追溯，找到当前 Message 包含的全部 trace 信息，并将当前 Message 的完整 trace 写入到待上传的 trace 文件中，删除其余 trace 信息。 3.遍历当前 Message trace，按照（Method 执行耗时 > Method 耗时阈值 & Method 耗时为该层堆栈中最耗时）为条件过滤出每一层函数调用堆栈的最长耗时函数，构成最后要上报的堆栈链路，这样特征堆栈中的每一步都是最耗时的，且最底层 Method 为最后的耗时大于阈值的 Method。之后，将 trace 文件和堆栈一同上报，这样的特征堆栈提取策略保证了堆栈聚合的可靠性和准确性，保证了上报到平台后堆栈的正确合理聚合，同时提供了进一步分析问题的 trace 文件。可以看到字节给的是一整套监控方案，和前面BlockCanary不同之处就在于，其是定时存储堆栈，缓存，然后使用diff去重的方式，并上传到服务器，可以最大限度的监控到可能发生比较耗时的方法。开发中哪些习惯会影响卡顿的发生 1.布局太乱，层级太深。 1.1：通过减少冗余或者嵌套布局来降低视图层次结构。比如使用约束布局代替线性布局和相对布局。 1.2：用 ViewStub 替代在启动过程中不需要显示的 UI 控件。 1.3：使用自定义 View 替代复杂的 View 叠加。 2.主线程耗时操作 2.1：主线程中不要直接操作数据库，数据库的操作应该放在数据库线程中完成。 2.2：sharepreference尽量使用apply，少使用commit，可以使用MMKV框架来代替sharepreference。 2.3：网络请求回来的数据解析尽量放在子线程中，不要在主线程中进行复制的数据解析操作。 2.4：不要在activity的onResume和onCreate中进行耗时操作，比如大量的计算等。 2.5：不要在 draw 里面调用耗时函数，不能 new 对象 3.过度绘制过度绘制是同一个像素点上被多次绘制，减少过度绘制一般减少布局背景叠加等方式，如下图所示右边是过度绘制的图片。 4.列表 RecyclerView使用优化，使用DiffUtil和notifyItemDataSetChanged进行局部更新等。 5.对象分配和回收优化自从Android引入 ART 并且在Android 5.0上成为默认的运行时之后，对象分配和垃圾回收（GC）造成的卡顿已经显著降低了，但是由于对象分配和GC有额外的开销，它依然又可能使线程负载过重。在一个调用不频繁的地方（比如按钮点击）分配对象是没有问题的，但如果在在一个被频繁调用的紧密的循环里，就需要避免对象分配来降低GC的压力。减少小对象的频繁分配和回收操作。好了，关于卡顿优化的问题就讲到这里，下篇文章会对卡顿中的ANR情况的处理，这里做个铺垫。如果喜欢我的文章，欢迎关注我的公众号。点击这看原文链接：参考 Android卡顿检测及优化一文读懂直播卡顿优化那些事儿 “终于懂了” 系列：Android屏幕刷新机制—VSync、Choreographer 全面理解！深入探索Android卡顿优化（上）西瓜卡顿 & ANR 优化治理及监控体系建设 5376)] 参考 Android卡顿检测及优化一文读懂直播卡顿优化那些事儿 “终于懂了” 系列：Android屏幕刷新机制—VSync、Choreographer 全面理解！深入探索Android卡顿优化（上）西瓜卡顿 & ANR 优化治理及监控体系建设本篇文章为转载内容。原文链接：https://blog.csdn.net/yuhaibing111/article/details/127682399。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-03-26 08:05:57

214

转载

转载文章

[转载]Redis 原理

...edis 的这种事务机制来实现原子性，保证数据的一致。 3、Lua脚本 Lua/ˈluə/是一种轻量级脚本语言，它是用 C 语言编写的，跟数据的存储过程有点类似。使用 Lua 脚本来执行 Redis 命令的好处: 1、一次发送多个命令，减少网络开销。 2、Redis 会将整个脚本作为一个整体执行，不会被其他请求打断，保持原子性。 3、对于复杂的组合命令，我们可以放在文件中，可以实现程序之间的命令集复用。 3.1 在Redis中调用Lua脚本使用 eval /ɪ’væl/ 方法，语法格式: redis> eval lua-script key-num [key1 key2 key3 ....] [value1 value2 value3 ....] eval代表执行Lua语言的命令。 lua-script代表Lua语言脚本内容。 key-num表示参数中有多少个key，需要注意的是Redis中key是从1开始的，如果没有key的参数，那么写0。 [key1key2key3…]是key作为参数传递给Lua语言，也可以不填，但是需要和key-num的个数对应起来。 [value1 value2 value3 …]这些参数传递给 Lua 语言，它们是可填可不填的。示例，返回一个字符串，0 个参数: redis> eval "return 'Hello World'" 0 3.2 在Lua脚本中调用Redis命令使用 redis.call(command, key [param1, param2…])进行操作。语法格式: redis> eval "redis.call('set',KEYS[1],ARGV[1])" 1 lua-key lua-value command是命令，包括set、get、del等。 key是被操作的键。 param1,param2…代表给key的参数。注意跟 Java 不一样，定义只有形参，调用只有实参。 Lua 是在调用时用 key 表示形参，argv 表示参数值(实参)。 3.2.1 设置键值对在 Redis 中调用 Lua 脚本执行 Redis 命令 redis> eval "return redis.call('set',KEYS[1],ARGV[1])" 1 gupao 2673 redis> get gupao 以上命令等价于 set gupao 2673。在 redis-cli 中直接写 Lua 脚本不够方便，也不能实现编辑和复用，通常我们会把脚本放在文件里面，然后执行这个文件。 3.2.2 在 Redis 中调用 Lua 脚本文件中的命令，操作 Redis 创建 Lua 脚本文件: cd /usr/local/soft/redis5.0.5/src vim gupao.lua Lua 脚本内容，先设置，再取值: cd /usr/local/soft/redis5.0.5/src redis-cli --eval gupao.lua 0 得到返回值: root@localhost src] redis-cli --eval gupao.lua 0 "lua666" 3.2.3 案例:对 IP 进行限流需求：在 X 秒内只能访问 Y 次。设计思路：用 key 记录 IP，用 value 记录访问次数。拿到 IP 以后，对 IP+1。如果是第一次访问，对 key 设置过期时间(参数 1)。否则判断次数，超过限定的次数(参数 2)，返回 0。如果没有超过次数则返回 1。超过时间， key 过期之后，可以再次访问。 KEY[1]是 IP， ARGV[1]是过期时间 X，ARGV[2]是限制访问的次数 Y。 -- ip_limit.lua-- IP 限流，对某个 IP 频率进行限制，6 秒钟访问 10 次 local num=redis.call('incr',KEYS[1])if tonumber(num)==1 thenredis.call('expire',KEYS[1],ARGV[1])return 1elseif tonumber(num)>tonumber(ARGV[2]) thenreturn 0 elsereturn 1 end 6 秒钟内限制访问 10 次，调用测试(连续调用 10 次): ./redis-cli --eval "ip_limit.lua" app:ip:limit:192.168.8.111 , 6 10 app:ip:limit:192.168.8.111 是 key 值，后面是参数值，中间要加上一个空格和一个逗号，再加上一个空格。即:./redis-cli –eval [lua 脚本] [key…]空格,空格[args…] 多个参数之间用一个空格分割。代码:LuaTest.java 3.2.4 缓存 Lua 脚本为什么要缓存在脚本比较长的情况下，如果每次调用脚本都需要把整个脚本传给 Redis 服务端，会产生比较大的网络开销。为了解决这个问题，Redis 提供了 EVALSHA 命令，允许开发者通过脚本内容的 SHA1 摘要来执行脚本。如何缓存 Redis 在执行 script load 命令时会计算脚本的 SHA1 摘要并记录在脚本缓存中，执行 EVALSHA 命令时 Redis 会根据提供的摘要从脚本缓存中查找对应的脚本内容，如果找到了则执行脚本，否则会返回错误:“NOSCRIPT No matching script. Please use EVAL.” 127.0.0.1:6379> script load "return 'Hello World'" "470877a599ac74fbfda41caa908de682c5fc7d4b"127.0.0.1:6379> evalsha "470877a599ac74fbfda41caa908de682c5fc7d4b" 0 "Hello World" 3.2.5 自乘案例 Redis 有 incrby 这样的自增命令，但是没有自乘，比如乘以 3，乘以 5。我们可以写一个自乘的运算，让它乘以后面的参数： local curVal = redis.call("get", KEYS[1]) if curVal == false thencurVal = 0 elsecurVal = tonumber(curVal)endcurVal = curVal tonumber(ARGV[1]) redis.call("set", KEYS[1], curVal) return curVal 把这个脚本变成单行，语句之间使用分号隔开 local curVal = redis.call("get", KEYS[1]); if curVal == false then curVal = 0 else curVal = tonumber(curVal) end; curVal = curVal tonumber(ARGV[1]); redis.call("set", KEYS[1], curVal); return curVal script load ‘命令’ 127.0.0.1:6379> script load 'local curVal = redis.call("get", KEYS[1]); if curVal == false then curVal = 0 else curVal = tonumber(curVal) end; curVal = curVal tonumber(ARGV[1]); redis.call("set", KEYS[1], curVal); return curVal' "be4f93d8a5379e5e5b768a74e77c8a4eb0434441" 调用: 127.0.0.1:6379> set num 2OK127.0.0.1:6379> evalsha be4f93d8a5379e5e5b768a74e77c8a4eb0434441 1 num 6 (integer) 12 3.2.6 脚本超时 Redis 的指令执行本身是单线程的，这个线程还要执行客户端的 Lua 脚本，如果 Lua 脚本执行超时或者陷入了死循环，是不是没有办法为客户端提供服务了呢? eval 'while(true) do end' 0 为了防止某个脚本执行时间过长导致 Redis 无法提供服务，Redis 提供了 lua-time-limit 参数限制脚本的最长运行时间，默认为 5 秒钟。 lua-time-limit 5000(redis.conf 配置文件中) 当脚本运行时间超过这一限制后，Redis 将开始接受其他命令但不会执行(以确保脚本的原子性，因为此时脚本并没有被终止)，而是会返回“BUSY”错误。 Redis 提供了一个 script kill 的命令来中止脚本的执行。新开一个客户端: script kill 如果当前执行的 Lua 脚本对 Redis 的数据进行了修改(SET、DEL 等)，那么通过 script kill 命令是不能终止脚本运行的。 127.0.0.1:6379> eval "redis.call('set','gupao','666') while true do end" 0 因为要保证脚本运行的原子性，如果脚本执行了一部分终止，那就违背了脚本原子性的要求。最终要保证脚本要么都执行，要么都不执行。 127.0.0.1:6379> script kill(error) UNKILLABLE Sorry the script already executed write commands against the dataset. You can either wait the scripttermination or kill the server in a hard way using the SHUTDOWN NOSAVE command. 遇到这种情况，只能通过 shutdown nosave 命令来强行终止 redis。 shutdown nosave 和 shutdown 的区别在于 shutdown nosave 不会进行持久化操作，意味着发生在上一次快照后的数据库修改都会丢失。 4、Redis 为什么这么快? 4.1 Redis到底有多快？根据官方的数据，Redis 的 QPS 可以达到 10 万左右(每秒请求数)。 4.2 Redis为什么这么快? 总结:1)纯内存结构、2)单线程、3)多路复用 4.2.1 内存 KV 结构的内存数据库，时间复杂度 O(1)。第二个，要实现这么高的并发性能，是不是要创建非常多的线程? 恰恰相反，Redis 是单线程的。 4.2.2 单线程单线程有什么好处呢? 1、没有创建线程、销毁线程带来的消耗 2、避免了上线文切换导致的 CPU 消耗 3、避免了线程之间带来的竞争问题，例如加锁释放锁死锁等等 4.2.3 异步非阻塞异步非阻塞 I/O，多路复用处理并发连接。 4.3 Redis为什么是单线程的? 不是白白浪费了 CPU 的资源吗? 因为单线程已经够用了，CPU 不是 redis 的瓶颈。Redis 的瓶颈最有可能是机器内存或者网络带宽。既然单线程容易实现，而且 CPU 不会成为瓶颈，那就顺理成章地采用单线程的方案了。 4.4 单线程为什么这么快? 因为 Redis 是基于内存的操作，我们先从内存开始说起。 4.4.1 虚拟存储器(虚拟内存 Vitual Memory) 名词解释:主存:内存;辅存:磁盘(硬盘) 计算机主存(内存)可看作一个由 M 个连续的字节大小的单元组成的数组，每个字节有一个唯一的地址，这个地址叫做物理地址(PA)。早期的计算机中，如果 CPU 需要内存，使用物理寻址，直接访问主存储器。这种方式有几个弊端: 1、在多用户多任务操作系统中，所有的进程共享主存，如果每个进程都独占一块物理地址空间，主存很快就会被用完。我们希望在不同的时刻，不同的进程可以共用同一块物理地址空间。 2、如果所有进程都是直接访问物理内存，那么一个进程就可以修改其他进程的内存数据，导致物理地址空间被破坏，程序运行就会出现异常。为了解决这些问题，我们就想了一个办法，在 CPU 和主存之间增加一个中间层。CPU 不再使用物理地址访问，而是访问一个虚拟地址，由这个中间层把地址转换成物理地址，最终获得数据。这个中间层就叫做虚拟存储器(Virtual Memory)。具体的操作如下所示: 在每一个进程开始创建的时候，都会分配一段虚拟地址，然后通过虚拟地址和物理地址的映射来获取真实数据，这样进程就不会直接接触到物理地址，甚至不知道自己调用的哪块物理地址的数据。目前，大多数操作系统都使用了虚拟内存，如 Windows 系统的虚拟内存、Linux 系统的交换空间等等。Windows 的虚拟内存(pagefile.sys)是磁盘空间的一部分。在 32 位的系统上，虚拟地址空间大小是 2^32bit=4G。在 64 位系统上，最大虚拟地址空间大小是多少? 是不是 2^64bit=10241014TB=1024PB=16EB?实际上没有用到 64 位，因为用不到这么大的空间，而且会造成很大的系统开销。Linux 一般用低 48 位来表示虚拟地址空间，也就是 2^48bit=256T。 cat /proc/cpuinfo address sizes : 40 bits physical, 48 bits virtual 实际的物理内存可能远远小于虚拟内存的大小。总结：引入虚拟内存，可以提供更大的地址空间，并且地址空间是连续的，使得程序编写、链接更加简单。并且可以对物理内存进行隔离，不同的进程操作互不影响。还可以通过把同一块物理内存映射到不同的虚拟地址空间实现内存共享。 4.4.2 用户空间和内核空间为了避免用户进程直接操作内核，保证内核安全，操作系统将虚拟内存划分为两部分，一部分是内核空间(Kernel-space)/ˈkɜːnl /，一部分是用户空间(User-space)。内核是操作系统的核心，独立于普通的应用程序，可以访问受保护的内存空间，也有访问底层硬件设备的权限。内核空间中存放的是内核代码和数据，而进程的用户空间中存放的是用户程序的代码和数据。不管是内核空间还是用户空间，它们都处于虚拟空间中，都是对物理地址的映射。在 Linux 系统中, 内核进程和用户进程所占的虚拟内存比例是 1:3。当进程运行在内核空间时就处于内核态，而进程运行在用户空间时则处于用户态。进程在内核空间以执行任意命令，调用系统的一切资源;在用户空间只能执行简单的运算，不能直接调用系统资源，必须通过系统接口(又称 system call)，才能向内核发出指令。 top 命令: us 代表 CPU 消耗在 User space 的时间百分比; sy 代表 CPU 消耗在 Kernel space 的时间百分比。 4.4.3 进程切换(上下文切换) 多任务操作系统是怎么实现运行远大于 CPU 数量的任务个数的? 当然，这些任务实际上并不是真的在同时运行，而是因为系统通过时间片分片算法，在很短的时间内，将 CPU 轮流分配给它们，造成多任务同时运行的错觉。为了控制进程的执行，内核必须有能力挂起正在 CPU 上运行的进程，并恢复以前挂起的某个进程的执行。这种行为被称为进程切换。什么叫上下文? 在每个任务运行前，CPU 都需要知道任务从哪里加载、又从哪里开始运行，也就是说，需要系统事先帮它设置好 CPU 寄存器和程序计数器(ProgramCounter)，这个叫做 CPU 的上下文。而这些保存下来的上下文，会存储在系统内核中，并在任务重新调度执行时再次加载进来。这样就能保证任务原来的状态不受影响，让任务看起来还是连续运行。在切换上下文的时候，需要完成一系列的工作，这是一个很消耗资源的操作。 4.4.4 进程的阻塞正在运行的进程由于提出系统服务请求(如 I/O 操作)，但因为某种原因未得到操作系统的立即响应，该进程只能把自己变成阻塞状态，等待相应的事件出现后才被唤醒。进程在阻塞状态不占用 CPU 资源。 4.4.5 文件描述符 FD Linux 系统将所有设备都当作文件来处理，而 Linux 用文件描述符来标识每个文件对象。文件描述符(File Descriptor)是内核为了高效管理已被打开的文件所创建的索引，用于指向被打开的文件，所有执行 I/O 操作的系统调用都通过文件描述符;文件描述符是一个简单的非负整数，用以表明每个被进程打开的文件。 Linux 系统里面有三个标准文件描述符。 0:标准输入(键盘); 1:标准输出(显示器); 2:标准错误输出(显示器)。 4.4.6 传统 I/O 数据拷贝以读操作为例: 当应用程序执行 read 系统调用读取文件描述符(FD)的时候，如果这块数据已经存在于用户进程的页内存中，就直接从内存中读取数据。如果数据不存在，则先将数据从磁盘加载数据到内核缓冲区中，再从内核缓冲区拷贝到用户进程的页内存中。(两次拷贝，两次 user 和 kernel 的上下文切换)。 I/O 的阻塞到底阻塞在哪里? 4.4.7 Blocking I/O 当使用 read 或 write 对某个文件描述符进行过读写时，如果当前 FD 不可读，系统就不会对其他的操作做出响应。从设备复制数据到内核缓冲区是阻塞的，从内核缓冲区拷贝到用户空间，也是阻塞的，直到 copy complete，内核返回结果，用户进程才解除 block 的状态。为了解决阻塞的问题，我们有几个思路。 1、在服务端创建多个线程或者使用线程池，但是在高并发的情况下需要的线程会很多，系统无法承受，而且创建和释放线程都需要消耗资源。 2、由请求方定期轮询，在数据准备完毕后再从内核缓存缓冲区复制数据到用户空间 (非阻塞式 I/O)，这种方式会存在一定的延迟。能不能用一个线程处理多个客户端请求? 4.4.8 I/O 多路复用(I/O Multiplexing) I/O 指的是网络 I/O。多路指的是多个 TCP 连接(Socket 或 Channel)。复用指的是复用一个或多个线程。它的基本原理就是不再由应用程序自己监视连接，而是由内核替应用程序监视文件描述符。客户端在操作的时候，会产生具有不同事件类型的 socket。在服务端，I/O 多路复用程序(I/O Multiplexing Module)会把消息放入队列中，然后通过文件事件分派器(File event Dispatcher)，转发到不同的事件处理器中。多路复用有很多的实现，以 select 为例，当用户进程调用了多路复用器，进程会被阻塞。内核会监视多路复用器负责的所有 socket，当任何一个 socket 的数据准备好了，多路复用器就会返回。这时候用户进程再调用 read 操作，把数据从内核缓冲区拷贝到用户空间。所以，I/O 多路复用的特点是通过一种机制一个进程能同时等待多个文件描述符，而这些文件描述符(套接字描述符)其中的任意一个进入读就绪(readable)状态，select() 函数就可以返回。 Redis 的多路复用，提供了 select, epoll, evport, kqueue 几种选择，在编译的时候来选择一种。 evport 是 Solaris 系统内核提供支持的; epoll 是 LINUX 系统内核提供支持的; kqueue 是 Mac 系统提供支持的; select 是 POSIX 提供的，一般的操作系统都有支撑(保底方案); 源码 ae_epoll.c、ae_select.c、ae_kqueue.c、ae_evport.c 5、内存回收 Reids 所有的数据都是存储在内存中的，在某些情况下需要对占用的内存空间进行回收。内存回收主要分为两类，一类是 key 过期，一类是内存使用达到上限(max_memory) 触发内存淘汰。 5.1 过期策略要实现 key 过期，我们有几种思路。 5.1.1 定时过期(主动淘汰) 每个设置过期时间的 key 都需要创建一个定时器，到过期时间就会立即清除。该策略可以立即清除过期的数据，对内存很友好;但是会占用大量的 CPU 资源去处理过期的数据，从而影响缓存的响应时间和吞吐量。 5.1.2 惰性过期(被动淘汰) 只有当访问一个 key 时，才会判断该 key 是否已过期，过期则清除。该策略可以最大化地节省 CPU 资源，却对内存非常不友好。极端情况可能出现大量的过期 key 没有再次被访问，从而不会被清除，占用大量内存。例如 String，在 getCommand 里面会调用 expireIfNeeded server.c expireIfNeeded(redisDb db, robj key) 第二种情况，每次写入 key 时，发现内存不够，调用 activeExpireCycle 释放一部分内存。 expire.c activeExpireCycle(int type) 5.1.3 定期过期源码:server.h typedef struct redisDb { dict dict; / 所有的键值对 /dict expires; / 设置了过期时间的键值对 /dict blocking_keys; dict ready_keys; dict watched_keys; int id;long long avg_ttl;list defrag_later; } redisDb; 每隔一定的时间，会扫描一定数量的数据库的 expires 字典中一定数量的 key，并清除其中已过期的 key。该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时，可以在不同情况下使得 CPU 和内存资源达到最优的平衡效果。 Redis 中同时使用了惰性过期和定期过期两种过期策略。 5.2 淘汰策略 Redis 的内存淘汰策略，是指当内存使用达到最大内存极限时，需要使用淘汰算法来决定清理掉哪些数据，以保证新数据的存入。 5.2.1 最大内存设置 redis.conf 参数配置: maxmemory <bytes> 如果不设置 maxmemory 或者设置为 0，64 位系统不限制内存，32 位系统最多使用 3GB 内存。动态修改: redis> config set maxmemory 2GB 到达最大内存以后怎么办? 5.2.2 淘汰策略 https://redis.io/topics/lru-cache redis.conf maxmemory-policy noeviction 先从算法来看: LRU，Least Recently Used:最近最少使用。判断最近被使用的时间，目前最远的数据优先被淘汰。 LFU，Least Frequently Used，最不常用，4.0 版本新增。 random，随机删除。如果没有符合前提条件的 key 被淘汰，那么 volatile-lru、volatile-random、 volatile-ttl 相当于 noeviction(不做内存回收)。动态修改淘汰策略: redis> config set maxmemory-policy volatile-lru 建议使用 volatile-lru，在保证正常服务的情况下，优先删除最近最少使用的 key。 5.2.3 LRU 淘汰原理问题：如果基于传统 LRU 算法实现 Redis LRU 会有什么问题? 需要额外的数据结构存储，消耗内存。 Redis LRU 对传统的 LRU 算法进行了改良，通过随机采样来调整算法的精度。如果淘汰策略是 LRU，则根据配置的采样值 maxmemory_samples(默认是 5 个), 随机从数据库中选择 m 个 key, 淘汰其中热度最低的 key 对应的缓存数据。所以采样参数m配置的数值越大, 就越能精确的查找到待淘汰的缓存数据,但是也消耗更多的CPU计算,执行效率降低。问题：如何找出热度最低的数据? Redis 中所有对象结构都有一个 lru 字段, 且使用了 unsigned 的低 24 位，这个字段用来记录对象的热度。对象被创建时会记录 lru 值。在被访问的时候也会更新 lru 的值。但是不是获取系统当前的时间戳，而是设置为全局变量 server.lruclock 的值。源码：server.h typedef struct redisObject {unsigned type:4;unsigned encoding:4;unsigned lru:LRU_BITS;int refcount;void ptr; } robj; server.lruclock 的值怎么来的? Redis 中有个定时处理的函数 serverCron，默认每 100 毫秒调用函数 updateCachedTime 更新一次全局变量的 server.lruclock 的值，它记录的是当前 unix 时间戳。源码:server.c void updateCachedTime(void) { time_t unixtime = time(NULL); atomicSet(server.unixtime,unixtime); server.mstime = mstime();struct tm tm; localtime_r(&server.unixtime,&tm);server.daylight_active = tm.tm_isdst; } 问题:为什么不获取精确的时间而是放在全局变量中?不会有延迟的问题吗? 这样函数 lookupKey 中更新数据的 lru 热度值时,就不用每次调用系统函数 time，可以提高执行效率。 OK，当对象里面已经有了 LRU 字段的值，就可以评估对象的热度了。函数 estimateObjectIdleTime 评估指定对象的 lru 热度，思想就是对象的 lru 值和全局的 server.lruclock 的差值越大(越久没有得到更新)，该对象热度越低。源码 evict.c / Given an object returns the min number of milliseconds the object was never requested, using an approximated LRU algorithm. /unsigned long long estimateObjectIdleTime(robj o) {unsigned long long lruclock = LRU_CLOCK(); if (lruclock >= o->lru) {return (lruclock - o->lru) LRU_CLOCK_RESOLUTION; } else {return (lruclock + (LRU_CLOCK_MAX - o->lru)) LRU_CLOCK_RESOLUTION;} } server.lruclock 只有 24 位，按秒为单位来表示才能存储 194 天。当超过 24bit 能表示的最大时间的时候，它会从头开始计算。 server.h define LRU_CLOCK_MAX ((1<<LRU_BITS)-1) / Max value of obj->lru / 在这种情况下，可能会出现对象的 lru 大于 server.lruclock 的情况，如果这种情况出现那么就两个相加而不是相减来求最久的 key。为什么不用常规的哈希表+双向链表的方式实现?需要额外的数据结构，消耗资源。而 Redis LRU 算法在 sample 为 10 的情况下，已经能接近传统 LRU 算法了。问题:除了消耗资源之外，传统 LRU 还有什么问题? 如图，假设 A 在 10 秒内被访问了 5 次，而 B 在 10 秒内被访问了 3 次。因为 B 最后一次被访问的时间比 A 要晚，在同等的情况下，A 反而先被回收。问题:要实现基于访问频率的淘汰机制，怎么做? 5.2.4 LFU server.h typedef struct redisObject {unsigned type:4;unsigned encoding:4;unsigned lru:LRU_BITS;int refcount;void ptr; } robj; 当这 24 bits 用作 LFU 时，其被分为两部分: 高 16 位用来记录访问时间(单位为分钟，ldt，last decrement time) 低 8 位用来记录访问频率，简称 counter(logc，logistic counter) counter 是用基于概率的对数计数器实现的，8 位可以表示百万次的访问频率。对象被读写的时候，lfu 的值会被更新。 db.c——lookupKey void updateLFU(robj val) {unsigned long counter = LFUDecrAndReturn(val); counter = LFULogIncr(counter);val->lru = (LFUGetTimeInMinutes()<<8) | counter;} 增长的速率由，lfu-log-factor 越大，counter 增长的越慢 redis.conf 配置文件。 lfu-log-factor 10 如果计数器只会递增不会递减，也不能体现对象的热度。没有被访问的时候，计数器怎么递减呢? 减少的值由衰减因子 lfu-decay-time(分钟)来控制，如果值是 1 的话，N 分钟没有访问就要减少 N。 redis.conf 配置文件 lfu-decay-time 1 6、持久化机制 https://redis.io/topics/persistence Redis 速度快，很大一部分原因是因为它所有的数据都存储在内存中。如果断电或者宕机，都会导致内存中的数据丢失。为了实现重启后数据不丢失，Redis 提供了两种持久化的方案，一种是 RDB 快照(Redis DataBase)，一种是 AOF(Append Only File)。 6.1 RDB RDB 是 Redis 默认的持久化方案。当满足一定条件的时候，会把当前内存中的数据写入磁盘，生成一个快照文件 dump.rdb。Redis 重启会通过加载 dump.rdb 文件恢复数据。什么时候写入 rdb 文件? 6.1.1 RDB 触发 1、自动触发 a)配置规则触发。 redis.conf， SNAPSHOTTING，其中定义了触发把数据保存到磁盘的触发频率。如果不需要 RDB 方案，注释 save 或者配置成空字符串""。 save 900 1 900 秒内至少有一个 key 被修改(包括添加) save 300 10 400 秒内至少有 10 个 key 被修改save 60 10000 60 秒内至少有 10000 个 key 被修改注意上面的配置是不冲突的，只要满足任意一个都会触发。 RDB 文件位置和目录: 文件路径，dir ./ 文件名称dbfilename dump.rdb 是否是LZF压缩rdb文件 rdbcompression yes 开启数据校验 rdbchecksum yes 问题：为什么停止 Redis 服务的时候没有 save，重启数据还在? RDB 还有两种触发方式: b)shutdown 触发，保证服务器正常关闭。 c)flushall，RDB 文件是空的，没什么意义(删掉 dump.rdb 演示一下)。 2、手动触发如果我们需要重启服务或者迁移数据，这个时候就需要手动触 RDB 快照保存。Redis 提供了两条命令: a)save save 在生成快照的时候会阻塞当前 Redis 服务器， Redis 不能处理其他命令。如果内存中的数据比较多，会造成 Redis 长时间的阻塞。生产环境不建议使用这个命令。为了解决这个问题，Redis 提供了第二种方式。执行 bgsave 时，Redis 会在后台异步进行快照操作，快照同时还可以响应客户端请求。具体操作是 Redis 进程执行 fork 操作创建子进程(copy-on-write)，RDB 持久化过程由子进程负责，完成后自动结束。它不会记录 fork 之后后续的命令。阻塞只发生在 fork 阶段，一般时间很短。用 lastsave 命令可以查看最近一次成功生成快照的时间。 6.1.2 RDB 数据的恢复(演示) 1、shutdown 持久化添加键值添加键值 redis> set k1 1 redis> set k2 2 redis> set k3 3 redis> set k4 4 redis> set k5 5 停服务器，触发 save redis> shutdown 备份 dump.rdb 文件 cp dump.rdb dump.rdb.bak 启动服务器 /usr/local/soft/redis-5.0.5/src/redis-server /usr/local/soft/redis-5.0.5/redis.conf 啥都没有: redis> keys 3、通过备份文件恢复数据停服务器 redis> shutdown 重命名备份文件 mv dump.rdb.bak dump.rdb 启动服务器 /usr/local/soft/redis-5.0.5/src/redis-server /usr/local/soft/redis-5.0.5/redis.conf 查看数据 redis> keys 6.1.3 RDB 文件的优势和劣势一、优势 1.RDB 是一个非常紧凑(compact)的文件，它保存了 redis 在某个时间点上的数据集。这种文件非常适合用于进行备份和灾难恢复。 2.生成 RDB 文件的时候，redis 主进程会 fork()一个子进程来处理所有保存工作，主进程不需要进行任何磁盘 IO 操作。 3.RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。二、劣势 1、RDB 方式数据没办法做到实时持久化/秒级持久化。因为 bgsave 每次运行都要执行 fork 操作创建子进程，频繁执行成本过高。 2、在一定间隔时间做一次备份，所以如果 redis 意外 down 掉的话，就会丢失最后一次快照之后的所有修改(数据有丢失)。如果数据相对来说比较重要，希望将损失降到最小，则可以使用 AOF 方式进行持久化。 6.2 AOF Append Only File AOF:Redis 默认不开启。AOF 采用日志的形式来记录每个写操作，并追加到文件中。开启后，执行更改 Redis 数据的命令时，就会把命令写入到 AOF 文件中。 Redis 重启时会根据日志文件的内容把写指令从前到后执行一次以完成数据的恢复工作。 6.2.1 AOF 配置配置文件 redis.conf 开关appendonly no 文件名appendfilename "appendonly.aof" AOF 文件的内容(vim 查看): 问题：数据都是实时持久化到磁盘吗? 由于操作系统的缓存机制，AOF 数据并没有真正地写入硬盘，而是进入了系统的硬盘缓存。什么时候把缓冲区的内容写入到 AOF 文件? 问题:文件越来越大，怎么办? 由于 AOF 持久化是 Redis 不断将写命令记录到 AOF 文件中，随着 Redis 不断的进行，AOF 的文件会越来越大，文件越大，占用服务器内存越大以及 AOF 恢复要求时间越长。例如 set xxx 666，执行 1000 次，结果都是 xxx=666。为了解决这个问题，Redis 新增了重写机制，当 AOF 文件的大小超过所设定的阈值时，Redis 就会启动 AOF 文件的内容压缩，只保留可以恢复数据的最小指令集。可以使用命令 bgrewriteaof 来重写。 AOF 文件重写并不是对原文件进行重新整理，而是直接读取服务器现有的键值对，然后用一条命令去代替之前记录这个键值对的多条命令，生成一个新的文件后去替换原来的 AOF 文件。重写触发机制 auto-aof-rewrite-percentage 100 auto-aof-rewrite-min-size 64mb 问题:重写过程中，AOF 文件被更改了怎么办? 另外有两个与 AOF 相关的参数: 6.2.2 AOF 数据恢复重启 Redis 之后就会进行 AOF 文件的恢复。 6.2.3 AOF 优势与劣势优点: 1、AOF 持久化的方法提供了多种的同步频率，即使使用默认的同步频率每秒同步一次，Redis 最多也就丢失 1 秒的数据而已。缺点: 1、对于具有相同数据的的 Redis，AOF 文件通常会比 RDB 文件体积更大(RDB 存的是数据快照)。 2、虽然 AOF 提供了多种同步的频率，默认情况下，每秒同步一次的频率也具有较高的性能。在高并发的情况下，RDB 比 AOF 具好更好的性能保证。 6.3 两种方案比较那么对于 AOF 和 RDB 两种持久化方式，我们应该如何选择呢? 如果可以忍受一小段时间内数据的丢失，毫无疑问使用 RDB 是最好的，定时生成 RDB 快照(snapshot)非常便于进行数据库备份，并且 RDB 恢复数据集的速度也要比 AOF 恢复的速度要快。否则就使用 AOF 重写。但是一般情况下建议不要单独使用某一种持久化机制，而是应该两种一起用，在这种情况下,当 redis 重启的时候会优先载入 AOF 文件来恢复原始的数据，因为在通常情况下 AOF 文件保存的数据集要比 RDB 文件保存的数据集要完整。本篇文章为转载内容。原文链接：https://blog.csdn.net/zhoutaochun/article/details/120075092。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2024-03-18 12:25:04

541

转载

Gradle

版本兼容性导致Gradle构建失败：边缘计算库依赖管理与解决方案

...发者头疼的问题——在Gradle构建脚本中使用了不支持的边缘计算库。这个问题不仅影响项目的构建效率，还可能导致一些不可预见的错误。我最近碰到了这么个事儿，想跟大家聊聊我的经历还有我是怎么解决的。 2. 问题背景我遇到的麻烦事情是这样的，我在开发一个项目时，需要用到一个最新的边缘计算库来提升数据处理能力。当时觉得这个库非常棒，因为它能显著提高边缘设备的数据处理速度。所以我兴奋地把库加到了项目的依赖里，然后满怀期待地敲下了gradle build命令。然而，结果却让我大跌眼镜——项目构建失败了！ groovy // 我在build.gradle文件中的依赖部分添加了这个边缘计算库 dependencies { implementation 'com.edge:edge-computing-lib:1.0.0' } 3. 初步调查发现问题所在开始我以为是库本身有问题，于是花了大半天时间查阅官方文档和GitHub上的Issue。但最终发现，问题出在我自己的Gradle配置上。原来，这个边缘计算库版本太新，还不被当前的Gradle版本所支持。这下子我明白了，问题的关键在于版本兼容性。 groovy // 查看Gradle版本 task showGradleVersion << { println "Gradle version is ${gradle.gradleVersion}" } 4. 探索解决方法寻找替代方案既然问题已经定位，接下来就是想办法解决它了。我想先升级Gradle版本，不过转念一想，其他依赖的库也可能有版本冲突的问题。所以，我还是先去找个更稳当的边缘计算库试试吧。经过一番搜索，我发现了一个较为成熟的边缘计算库，它不仅功能强大，而且已经被广泛使用。于是我把原来的依赖替换成了新的库，并更新了Gradle的版本。 groovy // 在build.gradle文件中修改依赖 dependencies { implementation 'com.stable:stable-edge-computing-lib:1.2.3' } // 更新Gradle版本到最新稳定版 plugins { id 'org.gradle.java' version '7.5' } 5. 实践验证看看效果如何修改完之后，我重新运行了gradle build命令。这次，项目终于成功构建了！我兴奋地打开了IDE，查看了运行日志，一切正常。虽说新库的功能跟原来计划的有点出入，但它的表现真心不错，又快又稳。这次经历让我深刻认识到，选择合适的工具和库是多么重要。 groovy // 检查构建是否成功 task checkBuildSuccess << { if (new File('build/reports').exists()) { println "Build was successful!" } else { println "Build failed, check the logs." } } 6. 总结与反思这次经历给我的启示通过这次经历，我学到了几个重要的教训。首先，你得注意版本兼容性这个问题。在你添新的依赖前，记得看看它的版本，还得确认它跟你的现有环境合不合得来。其次，面对问题时，保持冷静和乐观的态度非常重要。最后，多花时间研究和测试不同的解决方案，往往能找到更好的办法。希望我的分享对你有所帮助，如果你也有类似的经历或者有更好的解决方案，欢迎留言交流。让我们一起努力，成为更好的开发者吧！ --- 好了，以上就是我关于“构建脚本中使用了不支持的边缘计算库”的全部分享。希望你能从中获得一些启发和帮助。如果你有任何疑问或者建议，随时欢迎与我交流。

2025-03-07 16:26:30

山涧溪流

Gradle

Gradle在大型项目中的构建脚本应用与依赖管理实践：灵活性、插件库及任务定义详解

一、引言 Gradle是一个基于Groovy语言构建的开源自动化构建工具，广泛应用于各种规模的Java开发项目中。尤其是对那些超大型的项目，Gradle就像个大力士加上变形金刚，它用自己无比强大的功能和随心所欲的配置方式，帮开发者们轻松搭建出高效又稳定的构建环境，真可谓是一把开发神器啊！二、Gradle的基本概念与优势 1. Gradle是什么？ Gradle是一个高度可定制的构建系统，它可以帮助你管理项目的构建流程，并且可以在不同的环境和平台上运行。它的主要特点是模块化、依赖管理和多平台支持。 2. Gradle的优势 a) 灵活性高：Gradle允许开发者根据自己的需求来定义构建任务，这使得构建过程更加自由。 b) 支持多种编程语言：除了Java，Gradle还支持Scala、Kotlin等多种编程语言。 c) 丰富的插件库：Gradle拥有丰富的插件库，可以满足各种复杂的构建需求。 d) 强大的依赖管理能力：Gradle可以有效地处理项目中的依赖关系，避免了重复的编译和部署。三、Gradle在大型项目中的实践应用 1. 建立构建脚本首先，我们需要建立一个Gradle构建脚本（build.gradle），在这个脚本中，我们可以定义构建任务，指定构建步骤，以及配置项目的相关信息。以下是一个简单的Gradle构建脚本的例子： groovy plugins { id 'java' } group = 'com.example' version = '1.0-SNAPSHOT' sourceCompatibility = 1.8 repositories { mavenCentral() } dependencies { implementation 'org.springframework.boot:spring-boot-starter-web' } 2. 定义构建任务在构建脚本中，我们可以通过apply方法来添加Gradle插件，然后通过tasks方法来定义构建任务。例如，我们可以通过下面的代码来定义一个名为"clean"的任务，用于清理构建目录： groovy task clean(type: Delete) { delete buildDir } 3. 使用Gradle进行版本控制 Gradle可以与Git等版本控制系统集成，这样就可以方便地跟踪项目的更改历史。以下是如何使用Gradle将本地仓库与远程仓库关联起来的例子： groovy allprojects { repositories { maven { url "https://repo.spring.io/libs-milestone" } mavenLocal() jcenter() google() mavenCentral() if (project.hasProperty('sonatypeSnapshots')) { maven { url "https://oss.sonatype.org/content/repositories/snapshots/" } } maven { url "file://${projectDir}/../libs" } } } 四、结论总的来说，Gradle作为一个强大的构建工具，已经成为了大型项目不可或缺的一部分。用Gradle，咱们就能像变魔术一样，让项目的构建流程管理变得更溜、更稳当。这样一来，开发速度嗖嗖提升，产品质量也是妥妥的往上蹭，可带劲儿了！此外，随着Gradle社区的日益壮大和活跃，它的功能会越来越强大，实用性也会越来越高，这无疑让咱们在未来做项目时有了更多可以挖掘和利用的价值，绝对值得咱们进一步去探索和尝试。

2024-01-13 12:54:38

481

梦幻星空_t

Java

Spring Boot多模块项目中JSP无效问题排查：Web启动项、视图解析器配置与模块间依赖资源路径映射分析

...ew.suffix 配置解析一、引言作为Java开发者，我们时常需要处理前后端分离的项目架构，其中Spring Boot以其简洁易用性和高度自动化的特点，成为了构建现代Web应用的理想选择。然而，在实际做开发的时候，特别是在捣鼓那些老派的JSP视图渲染，还有跨模块配置这些事儿，咱们有时会遇到一些让人挠头的问题。就比如这次提到的，你设置了spring.mvc.view.suffix这个参数却没见生效的情况，是不是挺让人头疼的？接下来，我们将深入剖析这个现象，并给出针对性的解决方案。二、背景与问题描述假设我们正在使用Spring Boot构建一个多模块的应用，其中一个模块专门负责Web服务提供，使用了Spring MVC作为控制器及其视图层的框架。为了让HTML模板与Java逻辑更加清晰地分隔，我们在项目的布局中采用了如下结构： 1. module-core: 应用的核心业务逻辑和服务模块 2. module-web: 启动项，主要包含Web相关的配置与控制层逻辑，依赖于module-core 3. module-views: 存放JSP视图文件，用于前端展示在此场景下，为确保正确识别并加载JSP视图，我们需要在module-web的配置文件中指定JSP后缀名（spring.mvc.view.suffix），例如： properties spring: mvc: view: prefix: /WEB-INF/views/ suffix: .jsp 然而，当运行程序并尝试访问Controller中带有相关视图名称的方法（如@GetMapping("/home")映射到WEB-INF/views/homePage.jsp）时，浏览器却无法显示出预期的JSP页面内容，且并未抛出任何异常，而是默认返回了空响应或者错误状态码。三、问题分析与排查面对这一看似简单的配置失效问题，我们首先需要进行如下几个方面的排查： 1. 检查视图解析器配置确保视图解析器org.springframework.web.servlet.view.InternalResourceViewResolver已被正确注册并设置了prefix与suffix属性。检查Spring Boot启动类（如WebMvcConfig.java或Application.java中的WebMvcConfigurer实现）： java @Configuration public class WebMvcConfig implements WebMvcConfigurer { @Override public void configureViewResolvers(ViewResolverRegistry registry) { InternalResourceViewResolver resolver = new InternalResourceViewResolver(); resolver.setPrefix("/WEB-INF/views/"); resolver.setSuffix(".jsp"); registry.viewResolver(resolver); } } 2. 模块间依赖与资源路径映射确认module-web是否正确引入了module-views的相关JSP文件，并指定了正确的资源路径。查看module-web的pom.xml或build.gradle文件中对视图资源模块的依赖路径： xml com.example module-views 1.0.0 war runtime classes // Gradle dependencies { runtimeOnly 'com.example:module-views:1.0.0' } 以及主启动类（如Application.java)中的静态资源映射配置： java @SpringBootApplication public class Application { @Bean TomcatServletWebServerFactory tomcat() { TomcatServletWebServerFactory factory = new TomcatServletWebServerFactory(); factory.addContextCustomizer((TomcatWebServerContext context) -> { // 将模块视图目录映射到根URL下 context.addWelcomeFile("index.jsp"); WebResourceRoot resourceRoot = new TomcatWebResourceRoot(context, "static", "/"); resourceRoot.addDirectory(new File("src/main/resources/static")); context.setResources(resourceRoot); }); return factory; } public static void main(String[] args) { SpringApplication.run(Application.class, args); } } 3. 检查JSP引擎配置确保Tomcat服务器配置已启用JSP支持。在module-web对应的application.properties或application.yml文件中配置JSP引擎： properties server.tomcat.jsp-enabled=true server.tomcat.jsp.version=2.3 或者在module-web的pom.xml或build.gradle文件中为Tomcat添加Jasper依赖： xml org.apache.tomcat.embed tomcat-embed-jasper provided // Gradle dependencies { implementation 'org.apache.tomcat.embed:tomcat-embed-jasper:9.0.54' } 4. 控制器与视图名称匹配验证在完成上述配置后，请务必核实Controller中返回的视图名称与其实际路径是否一致。如果存在命名冲突或者拼写错误，将会导致Spring MVC无法找到预期的JSP视图： java @GetMapping("/home") public String home(Model model) { return "homePage"; // 视图名称应更改为"WEB-INF/views/homePage.jsp" } 四、总结与解决办法综上所述，Spring Boot返回JSP无效的问题可能源于多个因素的叠加效应，包括但不限于视图解析器配置不完整、模块间依赖关系未正确处理、JSP引擎支持未开启、或Controller与视图名称之间的不对应等。要解决这个问题，需从以上几个方面进行逐一排查和修正。切记，在面对这类问题时，要保持冷静并耐心地定位问题所在，仔细分析配置文件、源代码和日志输出，才能准确找出症结所在，进而成功解决问题。这不仅让我们实实在在地磨炼了编程功夫，更是让咱们对Spring Boot这家伙的工作内幕有了更深的洞察。这样一来，我们在实际项目中遇到问题时，调试和应对的能力都像坐火箭一样嗖嗖提升啦！

2024-02-17 11:18:11

271

半夏微凉_t

Gradle

React Native模拟器无响应：Gradle版本兼容性、环境变量及缓存问题排查

...多时候罪魁祸首可能是Gradle的配置搞砸了，或者是环境没配对劲儿。就像做饭一样，菜谱（Gradle）不对劲儿，或者锅灶（环境）不给力，菜肯定做不好嘛！Gradle作为Android构建工具，它的重要性不言而喻。今天我们就来聊聊，为什么会出现这种情况，以及如何解决它。 --- 2. 深入分析 Gradle的幕后黑手 2.1 Gradle到底是什么？首先，让我们简单回顾一下Gradle是什么。Gradle是一个强大的构建工具，专门用来管理依赖关系、编译代码和生成最终的应用程序。在React Native的项目里，Gradle就像是个神奇的“翻译官”和“包工头”。它先把咱们写的JavaScript代码变成能被手机理解的原生语言，然后又像叠积木一样，把所有东西组装好，最后给你整出一个安卓的APK文件或者iOS的IPA文件，方便你直接装到手机上用。如果你的Gradle配置有问题，那么App就无法成功安装到模拟器上。 2.2 问题可能在哪里？现在，让我们回到那个让你抓狂的问题——为什么App装不上？以下是一些常见的原因： 2.2.1 Gradle版本不匹配有时候，你的React Native版本和Gradle版本可能不兼容。比如说啊，React Native从0.60版本开始搞了个自动链接的功能，挺方便的。但你要注意啦，如果你用的Gradle版本太老了，那可能就会出问题，一些依赖项就装不全或者装不好，最后各种报错啥的，真是让人头大。嘿，之前我也碰上过这么个事儿！那时候我的 React Native 版本已经升到 0.63 了，结果 Gradle 还是老版本，就跟手机升级了系统，但壳子还是原来的那个一样，看着就别扭啊！解决方法很简单，只需要升级Gradle到最新版本即可。代码示例： gradle // build.gradle 文件中的配置 buildscript { repositories { google() jcenter() } dependencies { classpath 'com.android.tools.build:gradle:4.2.0' // 升级到最新版本 } } 2.2.2 环境变量未配置另一个常见的问题是环境变量没有正确配置。Gradle需要知道一些关键路径，比如Android SDK的位置。要是你忘了配这些路径，Gradle 就像没找到钥匙一样，干着急也使不上劲，最后只能眼睁睁看着构建任务挂掉。代码示例： bash 设置环境变量 export ANDROID_HOME=/path/to/your/android/sdk export PATH=$PATH:$ANDROID_HOME/tools:$ANDROID_HOME/platform-tools 2.2.3 缓存问题 Gradle有一个缓存机制，有时候这个缓存可能会出问题。比如说啊，有个依赖包老是下不下来，Gradle就一直在那儿较真儿，不停地重试，就跟个倔强的小孩似的，怎么劝都不停，最后还是没搞掂。这时，你可以尝试清理缓存并重新构建项目。代码示例： bash 清理Gradle缓存 cd android ./gradlew clean --- 3. 解决方案动手实践的快乐 3.1 第一步：检查Gradle版本既然Gradle版本可能是罪魁祸首，我们首先要检查一下它的版本是否符合要求。打开android/build.gradle文件，找到classpath部分，确保它指向的是最新的Gradle版本。代码示例： gradle dependencies { classpath 'com.android.tools.build:gradle:7.0.2' // 使用最新版本 } 如果版本过低，可以直接升级到最新版本。升级后，记得同步项目并重新构建。 3.2 第二步：配置环境变量接下来，检查你的环境变量是否配置正确。尤其是Android SDK的路径，必须指向真实的SDK目录。如果你不确定路径，可以去Android Studio中查看。代码示例： bash 配置环境变量 export ANDROID_HOME=/Users/username/Library/Android/sdk export PATH=$PATH:$ANDROID_HOME/tools:$ANDROID_HOME/platform-tools 配置完成后，重启终端并运行项目，看看问题是否解决了。 3.3 第三步：清理缓存如果前面两步都没有解决问题，可能是Gradle缓存出了问题。这时候，我们需要手动清理缓存。代码示例： bash 进入Android目录并清理缓存 cd android ./gradlew clean 清理完成后，重新运行项目，看看是否能正常安装App。 --- 4. 总结与反思成长的足迹通过这次经历，我深刻体会到，React Native开发不仅仅是写代码那么简单，还需要对Gradle有深入的理解。Gradle虽然强大，但也非常复杂，稍有不慎就会出问题。不过，只要我们保持耐心，一步步排查问题，总能找到解决方案。最后，我想说的是，开发过程中遇到问题并不可怕，可怕的是失去信心。每一次解决问题的过程，都是我们成长的机会。希望能帮到你，让你在碰到这些问题的时候，别再绕那么多弯子了，赶紧找到症结，把事情搞定！如果你还有其他疑问，欢迎随时交流！让我们一起在React Native的世界里探索更多可能性吧！

2025-04-15 16:14:29

青山绿水_

JQuery插件下载

基于Bootstrap的jQuery右键上下文菜单插件

...nu插件提供了灵活的触发机制，无论是文本、图片、按钮还是其他自定义区域，只需简单配置，即可实现在这些元素上右键点击时展示相应的菜单选项。此外，菜单的位置计算精准，可自动适应屏幕尺寸与元素位置，确保在任何环境下都能给用户提供舒适的操作环境。总之，BootstrapContextMenu是一个强大而实用的工具，简化了开发过程中的上下文菜单实现步骤，并能帮助开发者快速打造出专业且响应式的Web应用界面。点我下载文件大小：351.42 KB 您将下载一个JQuery插件资源包，该资源包内部文件的目录结构如下：本网站提供JQuery插件下载功能，旨在帮助广大用户在工作学习中提升效率、节约时间。本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容，请立即告知我们，我们将迅速响应并删除相关内容。免责声明：站内所有资源仅供个人学习研究及参考之用，严禁将这些资源应用于商业场景。若擅自商用导致的一切后果，由使用者承担责任。

2023-01-24 14:47:30

本站

转载文章

[转载]IDEA如何取消编译其他Java类

...a开发环境中也有类似配置选项，允许开发者根据实际需求灵活控制项目的构建行为。最近，JetBrains在其官方博客上发布了关于IntelliJ IDEA 2021.3版本更新内容的文章，其中提到了更加精细的构建项目设置，例如支持粒度更细的增量编译与热加载，这有助于提升开发效率，尤其是在大型项目中。通过这些高级设置，开发者能够更好地管理构建过程，确保只有必要的代码部分被重新编译，从而减少因无关错误阻断正确代码运行的情况发生。此外，对于持续集成和持续部署（CI/CD）场景下的自动化构建问题，可以结合诸如Maven或Gradle等构建工具进行更为定制化的构建配置。例如，可以在构建脚本中设定只编译特定模块或任务，以实现对单个Java类的独立测试和部署。总之，深入理解和掌握IDE及构建工具的配置技巧，能帮助开发者应对各类复杂项目环境下的挑战，让正确的Java类main方法在任何情况下都能顺利执行，同时也能有效提高整体开发效率和团队协作质量。

2023-12-05 16:40:42

125

转载

MySQL

怎么把mysql加入服务器

...ux服务器并进行初步配置后，进一步提升数据库管理与安全性能是至关重要的。近期，MySQL官方发布了8.0版本的重要更新，引入了诸多改进和新特性，例如增强的窗口函数、JSON支持的增强以及性能优化等，这为开发者提供了更高效便捷的数据处理工具（来源：MySQL官方网站，2022年发布）。同时，对于云端数据库的安全防护，云服务商如AWS、阿里云等也相继推出了针对MySQL数据库的安全策略和最佳实践指南，指导用户如何通过网络ACL、SSL加密连接、定期审计与备份等方式强化数据库安全（参考：AWS Security Blog, 阿里云最佳实践）。此外，深入理解MySQL权限系统及其实战应用亦是每个数据库管理员的必修课。在实际操作中，精细化权限管理能有效防止数据泄露和恶意篡改，推荐阅读《MySQL 5.7 Reference Manual》中的“Account Management and Privileges”章节，该部分详细解读了MySQL的用户账户管理、权限分配及验证机制。另外，随着DevOps理念的普及，自动化运维工具如Ansible和Chef被越来越多地应用于MySQL数据库的部署和维护。通过编写Playbook或Cookbook脚本，可以实现MySQL集群的快速搭建和动态扩容，以及日常备份恢复任务的自动化执行，这对于大规模云端数据库环境的运维管理工作具有重大意义（参阅：Ansible官方文档，Chef Cookbooks示例）。总之，在安装配置MySQL作为云端数据库之后，关注其最新版本特性、加强安全措施、深入理解权限体系，并利用自动化运维工具提高效率，都是保障数据库稳定运行、发挥其最大价值的关键所在。

2023-10-24 11:08:12

逻辑鬼才

知识学习

实践的时候请根据实际情况谨慎操作。

随机学习一条linux命令：

tac file.txt - 类似于cat但反向输出文件内容。