...配置后，读者可能对大数据存储与处理领域的最新进展和相关技术动态产生兴趣。实际上，随着数据量的持续增长和技术迭代，HDFS也在不断发展以适应更复杂的应用场景。近期，Apache Hadoop 3.3.0版本发布，引入了一系列新功能和改进。例如，HDFS现在支持EC（Erasure Coding）策略的进一步优化，能够在保证数据可靠性的同时，显著降低存储开销。此外，NameNode的高可用性和故障切换机制得到增强，确保了大规模集群的稳定运行。另一方面，为应对云原生时代的挑战，Hadoop社区正积极将HDFS与Kubernetes等容器编排平台进行整合。如Open Data Hub项目就提供了在Kubernetes上部署HDFS及整个Hadoop生态系统的解决方案，使企业能够更加灵活高效地构建和管理基于云的大数据服务。同时，对于那些寻求超越HDFS局限性的用户，可以关注到像Apache Hudi、Iceberg这样的开源项目，它们在HDFS之上构建了事务性数据湖存储层，支持ACID事务、时间旅行查询等功能，极大地丰富了大数据处理的可能性。总之，掌握HDFS是理解和使用大数据技术的基础，而关注其演进路径以及相关的创新技术和解决方案，则有助于我们在实际应用中更好地利用HDFS及其生态系统的力量，解决日益复杂的数据管理和分析需求。

2023-12-05 22:55:20

284

转载

转载文章

[转载]程序员也分三六九等？等级差异，一个看不起一个！

...业务领域内的技术发展动态进行分析研究。高级程序员高级程序员学名，工程师。到了这个level，英文名可改叫做 engineer 或 developer。此时你的功力开始增强，这与你平时的积累努力是分不开的，祝贺你～此时的你不仅可以完成任务，开始注重代码的质量，能够写出工业级的代码。你的经验可胜任模块级的系统设计，承担完成较为复杂的技术，能有效的自我管理，有帮助别人快速解决问题（trouble shooting）的能力。此阶段你需要经历到7、8年左右的体验，中间要经历一段深刻自我历练的过程。有时给人致命一击其实是心里的小蟊贼。一般人在5年前后遇到一个门槛，碰到天花板+彷徨期，或者你打心眼里不在喜欢编程，可尝试转为其它角色，如产品经理，售前售后支持等岗位，也不失为好选择。当我们熬过这段儿，就会“山随平野尽，江入大荒流“，渐入佳境矣。高级程序员定义软件功能、做开发计划推进和管理。可以带几个个帮手把产品规划的功能实现，你是团队中的”大手“，遇到难题也是你亲自攻艰克难。所以，一个高级程序员，他的职责很清晰： 1、负责产品核心复杂功能的方案设计、编码实现 2、负责疑难BUG分析诊断、攻关解决架构师到了架构师级别，想必你已经学会降龙十八掌，可登堂入世，成为一位准（lao）专（you）家（tiao）。我们大喊声：“单打独斗，老衲谁也不惧！“，遂开始领导一众技术高手，指点武功，来设计和完成一个系统，大多是分布式，高并发的系统架构平台。架构师的任务是为公司产品的业务问题提供高质量技术解决方案，主要着眼于系统的"技术实现" 。架构师的主要分类：可能每条产品线都设置了架构师，也可能多条生产品线的的后端是由一个架构师设计的平台提供，所以架构师也是有所不同的，其分类如下：软件架构师信息架构师网站架构师其主要职责如下： 1、需求分析：“知彼”有时比“知已”还重要。管理市场，产品等的需求，确立关键需求。坚持技术上的优秀与需求的愿景统一，提升技术负债意识，提供技术选项，风险预判，工期等解决方案。 2、架构设计：在产品功能中抽取中非功能的需求，由关键需求变成概念型架构。列出功能树，分层治之，如用户界面层、系统交互层，数据管理层。达成高扩展，高可用，高性能，高安全，易运维，易部署，易接入等能力。 3、功能设计与实现：对架构设计的底层代码级别实现。如公共核心类，接口实现，应用发现规则、接口变更等。技术经理人生就是不断上升的过程，你已经到达经理的层次了。如今的你，需要不断提高领导力，需要定期召开团队会议讨论问题。首先我们要更加自信，在工作中显示自己的功力，给讲话增添力量。如：“本次项目虽然有很大的困难，我们也需苦战到底。当然示先垂范，身先士卒，方能成功！” 技术经理有时候也可能叫系统分析员，一些小公司可能会整个公司或者部门有一个技术经理。技术经理承担的角色主要是系统分析、架构搭建、系统构建、代码走查等工作，如果说项目经理是总统，那么技术经理就是总理。当然不是所有公司都是这样的，有些公司项目经理是不管技术团队的，只做需求、进度和同客户沟通，那么这个时候的项目经理就好像工厂里的跟单人员了，这种情况在外包公司比较多。对于技术经理来说，着重于技术方面，你需要知道某种功能用哪些技术合适，需要知道某项功能需要多长的开发时间等。同时，技术经理也应该承担提高团队整体技术水平的工作。你需要和大家站在一起，因为人们也都有解决问题的能力，更需要有以下的能力与责任： 1、任务管理：开发工作量评估、定立开发流程、分配和追踪开发任务 2、质量管理：代码review、开发风险判断/报告/协调解决 3、效率提升：代码底层研发和培训、最佳代码实践规范总结与推广、自动化生产工具、自动化部署工具 4、技术能力提升：招聘面试、试题主拟、新人指导、项目复盘与改进技术总监如果一个研发团队超过20人，有多条产品线或业务量很大，这时已经有多个技术经理在负责每个业务，这时需要一位技术总监。主要职责： 1、组建平台研发部，与架构师共建软件公共平台，方便各条产品业务线研发。 2、通过技术平台、通过高一层的职权，管理和协调公司各个部门与本部门各条线。现在每个产品线都应该有合格的技术经理和高级程序员。结语：我们相信，每个人都能成为IT大神。现在开始，找个师兄带你入门，让你的学习之路不再迷茫。这里推荐我们的前端学习交流圈：784783012，里面都是学习前端的从最基础的HTML+CSS+JS【炫酷特效，游戏，插件封装，设计模式】到移动端HTML5的项目实战的学习资料都有整理，送给每一位前端小伙伴。最新技术，与企业需求同步。好友都在里面学习交流，每天都会有大牛定时讲解前端技术! 点击：前端技术分享本篇文章为转载内容。原文链接：https://blog.csdn.net/webDk/article/details/88917912。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2024-05-10 13:13:48

757

转载

MySQL

MySQL错误日志中Too many open files解决实录：定位+配置+运维经验+调试优化

...全球范围内云计算和大数据技术的快速发展，数据库运维领域也迎来了新的挑战与机遇。以MySQL为代表的开源关系型数据库，在企业级应用中依然占据主导地位，但伴随其广泛使用的是愈发复杂的系统架构和更高的性能需求。就在上周，某知名电商公司在其大规模分布式数据库集群中遭遇了类似的问题——由于未及时调整文件描述符限制，导致核心业务系统在高并发访问时频繁出现“Too many open files”的错误，严重影响用户体验。这一事件引发了业内对于数据库资源管理的关注。事实上，此类问题并非孤立存在。根据权威机构发布的最新报告显示，近年来因数据库配置不当而导致的服务中断比例逐年上升。特别是在互联网行业，随着微服务架构的普及，单个应用程序可能依赖数十甚至上百个数据库实例，这对数据库的稳定性提出了更高要求。此外，随着人工智能算法模型训练需求的增长，大模型的数据存储与计算任务也给传统数据库带来了前所未有的压力。针对上述趋势，国内外多家科技公司已经开始探索更加智能化的数据库运维解决方案。例如，谷歌推出的Cloud SQL自动扩展功能可以根据实时流量动态调整资源分配，从而有效缓解类似问题的发生；阿里云则推出了PolarDB-X产品线，专门针对超高并发场景进行了优化设计。这些创新举措表明，未来数据库运维将朝着自动化、智能化方向发展。与此同时，开源社区也在积极贡献力量。Linux内核开发者近日宣布，将在即将发布的5.18版本中引入一项名为“FD-PIN”的新特性，该特性能够显著提高文件描述符管理效率，为数据库等高性能应用场景提供更多可能性。这无疑为解决“Too many open files”这类经典问题提供了全新思路。综上所述，无论是从技术演进还是实际案例来看，如何高效管理数据库资源已成为当下亟待解决的重要课题。作为从业者，我们需要紧跟时代步伐，不断学习新技术，同时注重实践经验积累，唯有如此才能更好地应对未来的挑战。

2025-04-17 16:17:44

109

山涧溪流_

MemCache

MemCache服务连接超时？详解网络问题、调整超时时间、重试机制与客户端配置

...布式系统中，如何保证数据的一致性和可靠性成为了一个重要的课题。近期，某知名电商平台在大促期间遭遇了MemCache集群崩溃的情况，导致部分订单数据丢失，给公司带来了巨大的经济损失。事后调查显示，问题的根本原因在于MemCache的主从同步机制未能及时应对突发流量，加上监控系统的滞后，未能第一时间发现问题并采取措施。针对这一事件，业内专家提出了几点改进建议。首先，应该引入更先进的分布式一致性协议，如Paxos或Raft算法，确保在节点故障时数据不会丢失。其次，加强监控系统的实时性，利用Prometheus等工具对MemCache的各项指标进行持续跟踪，一旦发现异常立即触发报警。此外，还可以考虑采用多活架构，即在同一地区部署多个MemCache集群，当某个集群出现问题时，能够迅速切换到备用集群，从而最大限度地降低业务中断的风险。与此同时，开源社区也在不断推进MemCache的功能完善。例如，最新的MemCache版本已经支持动态扩容，这意味着企业在高峰期可以通过快速增加节点来应对流量激增。同时，新的插件机制也让开发者可以根据自身需求定制化功能，比如添加额外的安全认证层或者优化数据压缩算法。总之，MemCache作为一种高效的缓存解决方案，在现代IT基础设施中扮演着不可或缺的角色。但要想充分发挥其潜力，企业必须正视潜在风险，积极拥抱技术创新，才能在激烈的市场竞争中立于不败之地。

2025-04-08 15:44:16

雪落无痕

转载文章

[转载]英特尔oneAPI——异构计算学习总结

...ue类 Parallel kernel 通用的并行编程模板 Host Accessor 矢量相加源代码统一共享内存 (Unified Shared Memory USM) USM语法数据依赖 wait() depends_on in_order queue property 练习1：事件依赖练习2：事件依赖 UMS实验 oneAPI编程模型 oneAPI编程模型提供了一个全面、统一的开发人员工具组合，可用于各种硬件设备，其中包括跨多个工作负载领域的一系列性能库。这些库包括面向各目标架构而定制化代码的函数，因此相同的函数调用可为各种支持的架构提供优化的性能。DPC++基于行业标准和开放规范，旨在鼓励生态系统的协作和创新。多架构编程面临的挑战在以数据为中心的环境中，专用工作负载的数量不断增长。专用负载通常因为没有通用的编程语言或API而需要使用不同的语言和库进行编程，这就需要维护各自独立的代码库。由于跨平台的工具支持不一致，因此开发人员必须学习和使用一整套不同的工具。单独投入精力给每种硬件平台开发软件。 oneAPI则可以利用一种统一的编程模型以及支持并行性的库，支持包括CPU、GPU、FPGA等硬件等同于原生高级语言的开发性能，并且可以与现有的HPC编程模型交互。 SYCL SYCL支持C++数据并行编程，SYCL和OpenCL一样都是由Khronos Group管理的，SYCL是建立在OpenCL之上的跨平台抽象层，支持用C++用单源语言方式编写用于异构处理器的与设备无关的代码。 DPC++ DPC++(Data Parallel C++)是一种单源语言，可以将主机代码和异构加速器内核写在同一个文件当中，在主机中调用DPC++程序，计算由加速器执行。DPC++代码简洁且效率高，并且是开源的。现有的CUDA应用、Fortran应用、OpenCL应用都可以用不同方式很方便地迁移到DPC++当中。下图显示了原来使用不同架构的HPC开发人员的一些推荐的转换方法。编译和运行DPC++程序编译和运行DPC++程序主要包括三步：初始化环境变量编译DPC++源代码运行程序例如本地运行，在本地系统上安装英特尔基础工具套件，使用以下命令编译和运行DPC++程序。 source /opt/intel/inteloneapi/setvars.shdpcpp simple.cpp -o simple./simple 编程实例实现矢量加法以下实例描述了使用DPC++实现矢量加法的过程和源代码。 queue类 queue类用来提交给SYCL执行的命令组，是将作业提交到运算设备的一种机制，多个queue可以映射到同一个设备。 Parallel kernel Parallel kernel允许代码并行执行，对于一个不具有相关性的循环数据操作，可以用Parallel kernel并行实现在C++代码中的循环实现 for(int i=0; i < 1024; i++){a[i] = b[i] + c[i];}); 在Parallel kernel中的并行实现 h.parallel_for(range<1>(1024), [=](id<1> i){A[i] = B[i] + C[i];}); 通用的并行编程模板 h.parallel_for(range<1>(1024), [=](id<1> i){// CODE THAT RUNS ON DEVICE }); range用来生成一个迭代序列，1为步长，在循环体中，i表示索引。 Host Accessor Host Accessor是使用主机缓冲区访问目标的访问器，它使访问的数据可以在主机上使用。通过构建Host Accessor可以将数据同步回主机，除此之外还可以通过销毁缓冲区将数据同步回主机。 buf是存储数据的缓冲区。 host_accessor b(buf,read_only); 除此之外还可以将buf设置为局部变量，当系统超出buf生存期，buf被销毁，数据也将转移到主机中。矢量相加源代码根据上面的知识，这里展示了利用DPC++实现矢量相加的代码。 //第一行在jupyter中指明了该cpp文件的保存位置%%writefile lab/vector_add.cppinclude <CL/sycl.hpp>using namespace sycl;int main() {const int N = 256;// 初始化两个队列并打印std::vector<int> vector1(N, 10);std::cout<<"\nInput Vector1: "; for (int i = 0; i < N; i++) std::cout << vector1[i] << " ";std::vector<int> vector2(N, 20);std::cout<<"\nInput Vector2: "; for (int i = 0; i < N; i++) std::cout << vector2[i] << " ";// 创建缓存区buffer vector1_buffer(vector1);buffer vector2_buffer(vector2);// 提交矢量相加任务queue q;q.submit([&](handler &h) {// 为缓存区创建访问器accessor vector1_accessor (vector1_buffer,h);accessor vector2_accessor (vector2_buffer,h);h.parallel_for(range<1>(N), [=](id<1> index) {vector1_accessor[index] += vector2_accessor[index];});});// 创建主机访问器将设备中数据拷贝到主机当中host_accessor h_a(vector1_buffer,read_only);std::cout<<"\nOutput Values: ";for (int i = 0; i < N; i++) std::cout<< vector1[i] << " ";std::cout<<"\n";return 0;} 运行结果统一共享内存 (Unified Shared Memory USM) 统一共享内存是一种基于指针的方法，是将CPU内存和GPU内存进行统一的虚拟化方法，对于C++来说，指针操作内存是很常规的方式，USM也可以最大限度的减少C++移植到DPC++的代价。下图显示了非USM(左)和USM(右)的程序员开发视角。类型函数调用说明在主机上可访问在设备上可访问设备 malloc_device 在设备上分配（显式）否是主机 malloc_host 在主机上分配（隐式）是是共享 malloc_shared 分配可以在主机和设备之间迁移（隐式）是是 USM语法初始化： int data = malloc_shared<int>(N, q); int data = static_cast<int >(malloc_shared(N sizeof(int), q)); 释放 free(data,q); 使用共享内存之后，程序将自动在主机和运算设备之间隐式移动数据。数据依赖使用USM时，要注意数据之间的依赖关系以及事件之间的依赖关系，如果两个线程同时修改同一个内存区，将产生不可预测的结果。我们可以使用不同的选项管理数据依赖关系：内核任务中的 wait() 使用 depends_on 方法使用 in_queue 队列属性 wait() q.submit([&](handler &h) {h.parallel_for(range<1>(N), [=](id<1> i) { data[i] += 2; });}).wait(); // <--- wait() will make sure that task is complete before continuingq.submit([&](handler &h) {h.parallel_for(range<1>(N), [=](id<1> i) { data[i] += 3; });}); depends_on auto e = q.submit([&](handler &h) { // <--- e is event for kernel taskh.parallel_for(range<1>(N), [=](id<1> i) { data[i] += 2; });});q.submit([&](handler &h) {h.depends_on(e); // <--- waits until event e is completeh.parallel_for(range<1>(N), [=](id<1> i) { data[i] += 3; });}); in_order queue property queue q(property_list{property::queue::in_order()}); // <--- this will make sure all the task with q are executed sequentially 练习1：事件依赖以下代码使用 USM，并有三个提交到设备的内核。每个内核修改相同的数据阵列。三个队列之间没有数据依赖关系为每个队列提交添加 wait() 在第二个和第三个内核任务中实施 depends_on() 方法使用 in_order 队列属性，而非常规队列： queue q{property::queue::in_order()}; %%writefile lab/usm_data.cppinclude <CL/sycl.hpp>using namespace sycl;static const int N = 256;int main() {queue q{property::queue::in_order()};//用队列限制执行顺序std::cout << "Device : " << q.get_device().get_info<info::device::name>() << "\n";int data = static_cast<int >(malloc_shared(N sizeof(int), q));for (int i = 0; i < N; i++) data[i] = 10;q.parallel_for(range<1>(N), [=](id<1> i) { data[i] += 2; });q.parallel_for(range<1>(N), [=](id<1> i) { data[i] += 3; });q.parallel_for(range<1>(N), [=](id<1> i) { data[i] += 5; });q.wait();//wait阻塞进程for (int i = 0; i < N; i++) std::cout << data[i] << " ";std::cout << "\n";free(data, q);return 0;} 执行结果练习2：事件依赖以下代码使用 USM，并有三个提交到设备的内核。前两个内核修改了两个不同的内存对象，第三个内核对前两个内核具有依赖性。三个队列之间没有数据依赖关系 %%writefile lab/usm_data2.cppinclude <CL/sycl.hpp>using namespace sycl;static const int N = 1024;int main() {queue q;std::cout << "Device : " << q.get_device().get_info<info::device::name>() << "\n";//设备选择int data1 = malloc_shared<int>(N, q);int data2 = malloc_shared<int>(N, q);for (int i = 0; i < N; i++) {data1[i] = 10;data2[i] = 10;}auto e1 = q.parallel_for(range<1>(N), [=](id<1> i) { data1[i] += 2; });auto e2 = q.parallel_for(range<1>(N), [=](id<1> i) { data2[i] += 3; });//e1,e2指向两个事件内核q.parallel_for(range<1>(N),{e1,e2}, [=](id<1> i) { data1[i] += data2[i]; }).wait();//depend on e1,e2for (int i = 0; i < N; i++) std::cout << data1[i] << " ";std::cout << "\n";free(data1, q);free(data2, q);return 0;} 运行结果 UMS实验在主机中初始化两个vector，初始数据为25和49，在设备中初始化两个vector，将主机中的数据拷贝到设备当中，在设备当中并行计算原始数据的根号值，然后将data1_device和data2_device的数值相加，最后将数据拷贝回主机当中，检验最后相加的和是否是12，程序结束前将内存释放。 %%writefile lab/usm_lab.cppinclude <CL/sycl.hpp>include <cmath>using namespace sycl;static const int N = 1024;int main() {queue q;std::cout << "Device : " << q.get_device().get_info<info::device::name>() << "\n";//intialize 2 arrays on hostint data1 = static_cast<int >(malloc(N sizeof(int)));int data2 = static_cast<int >(malloc(N sizeof(int)));for (int i = 0; i < N; i++) {data1[i] = 25;data2[i] = 49;}// STEP 1 : Create USM device allocation for data1 and data2int data1_device = static_cast<int >(malloc_device(N sizeof(int),q));int data2_device = static_cast<int >(malloc_device(N sizeof(int),q));// STEP 2 : Copy data1 and data2 to USM device allocationq.memcpy(data1_device, data1, sizeof(int) N).wait();q.memcpy(data2_device, data2, sizeof(int) N).wait();// STEP 3 : Write kernel code to update data1 on device with sqrt of valueauto e1 = q.parallel_for(range<1>(N), [=](id<1> i) { data1_device[i] = std::sqrt(25); });auto e2 = q.parallel_for(range<1>(N), [=](id<1> i) { data2_device[i] = std::sqrt(49); });// STEP 5 : Write kernel code to add data2 on device to data1q.parallel_for(range<1>(N),{e1,e2}, [=](id<1> i) { data1_device[i] += data2_device[i]; }).wait();// STEP 6 : Copy data1 on device to hostq.memcpy(data1, data1_device, sizeof(int) N).wait();q.memcpy(data2, data2_device, sizeof(int) N).wait();// verify resultsint fail = 0;for (int i = 0; i < N; i++) if(data1[i] != 12) {fail = 1; break;}if(fail == 1) std::cout << " FAIL"; else std::cout << " PASS";std::cout << "\n";// STEP 7 : Free USM device allocationsfree(data1_device, q);free(data1);free(data2_device, q);free(data2);// STEP 8 : Add event based kernel dependency for the Steps 2 - 6return 0;} 运行结果本篇文章为转载内容。原文链接：https://blog.csdn.net/MCKZX/article/details/127630566。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-07-22 10:28:50

322

转载

Logstash

Logstash时间戳混乱？日志处理+data过滤器搞定格式统一与数据准确性

...来管理和分析海量日志数据。然而，正如文章所提到的，时间戳问题依然是许多用户在使用Logstash时面临的最大挑战之一。这种现象不仅出现在传统IT行业，也在云计算、大数据分析等领域频频出现。例如，最近亚马逊云科技发布的《2023年企业日志管理现状报告》显示，超过60%的企业在日志处理过程中遇到了时间戳不一致的问题，而这直接影响了他们的业务决策效率。与此同时，国内也有不少企业在实践中摸索出了更为高效的解决方案。以阿里巴巴集团为例，其自主研发的日志服务平台SLS（Log Service）特别针对时间戳处理进行了深度优化。该平台内置了多种时间戳解析算法，并支持用户自定义规则，极大地提升了日志处理的灵活性和准确性。此外，腾讯云也推出了类似的工具，通过引入机器学习技术，能够自动识别日志中的时间戳模式，大幅降低了人工干预的成本。从更深层面来看，时间戳问题的背后反映了现代企业对实时数据分析需求的增长。随着物联网设备的普及以及边缘计算的兴起，未来日志数据的规模和复杂度将进一步增加。因此，如何构建更加智能、稳定的时间戳处理机制将成为技术领域的重要课题。在此背景下，开源社区的作用愈发凸显。GitHub上活跃的开发者们不断贡献新的插件和补丁，为Logstash等工具注入更多创新元素。例如，最近有人提交了一个名为“DynamicTimestamp”的插件，它可以根据上下文动态调整时间戳格式，为用户提供了一种全新的视角。值得注意的是，时间戳问题不仅仅局限于技术层面，它还涉及到组织架构和流程设计。一些领先的企业已经开始尝试将日志管理系统与业务流程紧密结合，通过建立跨部门协作机制，确保数据采集、存储和分析的一致性。这种做法不仅提高了工作效率，也为企业的长期发展奠定了坚实的基础。总之，时间戳问题虽看似琐碎，但它却是衡量一家公司技术实力的关键指标之一。在未来，随着技术的进步和社会需求的变化，这一领域的研究必将迎来更加广阔的空间。

2025-05-13 15:58:22

林中小径

Apache Solr

外部服务依赖下，大型互联网应用的网络连接优化：缓存策略与重试机制

...其他微服务或者从远程数据库获取数据。Apache Solr，这个家伙简直就是搜索界的超级英雄！它在处理各种信息查找任务时，那叫一个稳如泰山，快如闪电，简直是让人心头一暖。你想象一下，在海量数据中快速找到你需要的信息，那种感觉就像在迷宫中找到了出口，又或者是在茫茫人海中找到了失散多年的好友。这就是Apache Solr的魅力所在，它的性能和稳定性，就像是你的私人保镖，无论你面对多复杂的搜索挑战，都能给你最坚实的后盾。哎呀，你猜怎么着？要是咱们的网络慢了、断了或者提供的服务不给力了，那可就糟糕了。这种时候，咱们的Solr系统啊，可能就会变得特别吃力，运行起来就不那么顺畅了。就像是咱们在做一件大事儿，结果突然停电了，那事儿肯定就办不成啦！所以啊，保持网络稳定和外部服务正常运行，对咱们的Solr来说，真的超级重要！嘿，兄弟！你听说了吗？这篇文章可不是普通的报告，它可是要深入地挖一挖这个问题的根源，然后给你支点招儿，让你在面对网络连接的烦恼时，Solr这个大神级别的搜索神器，能发挥出它的最佳状态！想象一下，当你在茫茫信息海洋中寻找那根救命稻草时，Solr就像你的私人导航，带你直达目的地。但是，有时候，这艘船可能会遭遇颠簸的海浪——网络连接问题。别担心，这篇文章就是你的救生圈和指南针，告诉你如何调整Solr的设置，让它在波涛汹涌的网络环境中依然航行自如。所以，准备好，让我们一起探索如何优化Solr在网络挑战中的表现吧！一、理解问题根源在讨论解决方案之前，首先需要理解外部服务依赖导致的问题。哎呀，你知道不？咱们用的那个Solr啊，它查询东西的速度啊，有时候得看外部服务的脸色。如果外部服务反应慢或者干脆不给力，那Solr就得跟着慢慢腾腾，甚至有时候都查不到结果，让人急得像热锅上的蚂蚁。这可真是个头疼的问题呢！这不仅影响了用户体验，也可能导致Solr服务本身的负载增加，进一步加剧问题。二、案例分析使用Solr查询外部数据源为了更好地理解这个问题，我们可以创建一个简单的案例。想象一下，我们有个叫Solr的小工具，专门负责在我们家里的文件堆里找东西。但是，它不是个孤军奋战的英雄，还需要借助外面的朋友——那个外部API，来给我们多提供一些额外的线索和细节，就像侦探在破案时需要咨询专家一样。这样，当我们用Solr搜索的时候，就能得到更丰富、更准确的结果了。我们使用Python和requests库来模拟这个过程： python import requests from solr import SolrClient solr_url = "http://localhost:8983/solr/core1" solr_client = SolrClient(solr_url) def search(query): results = solr_client.search(query) for result in results: 外部API请求 external_data = fetch_external_metadata(result['id']) result['additional_info'] = external_data return results def fetch_external_metadata(doc_id): url = f"https://example.com/api/{doc_id}" response = requests.get(url) if response.status_code == 200: return response.json() else: return None 在这个例子中，fetch_external_metadata函数尝试从外部API获取元数据，如果请求失败或API不可用，那么该结果将被标记为未获取到数据。当外部服务出现延迟或中断时，这将直接影响到Solr的查询效率。三、优化策略 1. 缓存策略为了避免频繁请求外部服务，可以引入缓存机制。对于频繁访问且数据变化不大的元数据，可以在本地缓存一段时间。当外部服务不可用时，可以回退使用缓存数据，直到服务恢复。 python class ExternalMetadataCache: def __init__(self, ttl=600): self.cache = {} self.ttl = ttl def get(self, doc_id): if doc_id not in self.cache or (self.cache[doc_id]['timestamp'] + self.ttl) < time.time(): self.cache[doc_id] = {'data': fetch_external_metadata(doc_id), 'timestamp': time.time()} return self.cache[doc_id]['data'] metadata_cache = ExternalMetadataCache() def fetch_external_metadata_safe(doc_id): return metadata_cache.get(doc_id) 2. 重试机制在请求外部服务时添加重试逻辑，当第一次请求失败后，可以设置一定的时间间隔后再次尝试，直到成功或达到最大重试次数。 python def fetch_external_metadata_retriable(doc_id, max_retries=3, retry_delay=5): for i in range(max_retries): try: return fetch_external_metadata(doc_id) except Exception as e: print(f"Attempt {i+1} failed with error: {e}. Retrying in {retry_delay} seconds...") time.sleep(retry_delay) raise Exception("Max retries reached.") 四、结论与展望通过上述策略，我们可以在一定程度上减轻外部服务依赖对Solr性能的影响。然而，重要的是要持续监控系统的运行状况，并根据实际情况调整优化措施。嘿，你听说了吗？科技这玩意儿啊，那可是越来越牛了！你看，现在就有人在琢磨怎么对付那些让人上瘾的东西。将来啊，说不定能搞出个既高效又结实的办法，帮咱们摆脱这个烦恼。想想都挺激动的，对吧？哎呀，兄弟！构建一个稳定又跑得快的搜索系统，那可得好好琢磨琢磨外部服务这事儿。你知道的，这些服务就像是你家里的电器，得选对了，用好了，整个家才能舒舒服服的。所以啊，咱们得先搞清楚这些服务都是干啥的，它们之间怎么配合，还有万一出了点小状况，咱们能不能快速应对。这样，咱们的搜索系统才能稳如泰山，嗖嗖地飞快，用户一搜就满意，那才叫真本事呢！ --- 请注意，以上代码示例是基于Python和相关库编写的，实际应用时需要根据具体环境和技术栈进行相应的调整。

2024-09-21 16:30:17

风轻云淡

转载文章

[转载]Codeforces Round #712 (Div. 2)-ABC

...于“在线字符串编辑与动态回文判定”的研究报告。研究者提出了一种新颖的在线算法，能够在字符串实时更新过程中高效地判断其是否为回文，并能快速找到使字符串变为非回文所需的最少编辑操作。这一成果不仅对于文本处理、数据压缩等领域具有重要价值，也对解决类似的编程挑战提供了新的思路。此外，在ACM国际大学生程序设计竞赛（ACM-ICPC）和谷歌代码 Jam 等全球顶级编程赛事中，频繁出现与回文串相关的题目，参赛者需灵活运用算法知识来解决实际问题。比如，有题目要求选手在最短时间内编写程序，找出将一个字符串转换为非回文串的最小操作次数，这与我们讨论的文章主题不谋而合，展现了理论与实践相结合的重要性。同时，回文串在密码学、遗传学以及文学创作等多个领域均有应用。例如，在DNA序列分析中，回文结构往往关联着基因调控的重要区域；在密码学中，特定类型的回文串可用于构建加密算法的关键部分。深入理解并熟练掌握回文串的相关性质及处理方法，无疑有助于我们在这些领域取得更多的技术突破。总之，从基础的编程题出发，我们可以洞察到字符串处理与算法优化在前沿科研和实际应用中的深远影响。通过持续关注和学习此类问题的最新研究成果与应用案例，我们能够不断提升自身的算法设计和问题解决能力。

2023-10-05 13:54:12

229

转载

ElasticSearch

elasticsearch与普通数据库在全文索引下的技术选择以及存储库&索引库的延伸

如果你已经是elasticsearch的使用大牛，本篇文章对你不会有什么收益。如果你要做一个搜索功能，不知道如何选型，那你可以参考一下本文。 1. 可选方案如果你需要做一个搜索功能，这时候你可能会想到很多实现方法：比如你的底层数据库用的是sql数据库（比如mysql）：你可能会想到在对应字段上使用field1 like '%?%'，?即用户输出的关键词比如你的底层数据库用的是mongo：你可能会想到在对应字段上使用db.collection.find({ "field1": { $regex: /aaa/ } })做查询，aaa即用户输入的关键词比如你的底层数据库用的是elasticsearch：那厉害了，专业全文搜索神奇，全文搜索或搜索相关的需求使用elasticsearch绝对是最合适的选择比如你的底层数据库用的是hive、impala、clickhouse等大数据计算引擎：鸟枪换炮，其实用作全文索引和搜索的场景并不合适，你可能依旧会使用sql数据库那样用like做交互 2. 方案选择调研之后，可能会发现对于数据量相对大一点的搜索场景，在当下流行的数据库或计算引擎中，elasticsearch是其中最合适的解决方案。无论是sql的like、还是mongo的regex，在线上环境下，数据量较多的情况下，都不是很高效的查询，甚至有的公司的dba会禁止在线上使用类似的查询语法。与elasticsearch是“亲戚”的，大家还常提到lucene、solr，但是无论从现在的发展趋势还是公司运维人才的储备（不得不说当下的运维人才中，对es熟悉的人才会更多一些），elasticsearch是相对较合适的选择。一些大数据计算引擎，其实更多的适合OLAP场景。当然也完全可以使用，因为比如clickhouse、starrocks等的查询速度已经发展的非常快。但你会发现在中文分词搜索上，实现起来有一定困扰。所以，如果你不差机器，首选方案还是elasticsearch。 3. elasticsearch的适用场景 3.1 经典的日志搜索场景提到elasticsearch不得不提到它的几个好朋友：一些公司里经常用elasticsearch来收集日志，然后用kibana来展示和分析。展开来说，举个例子，你的app打印日志打印到了线上日志文件，当app出现故障你需要做定位筛查的时候，可能需要登录线上机器用grep命令各种查看。但如果你不差机器资源，可以搭建上述架构，app的日志会被收集到elasticsearch中，最终你可以在kibana中查看日志，kibana里面可以很方面的做各种筛查操作。这个流畅大概是这样的： 3.2 通用搜索场景但是没有上图的beats、logstash、kibana，elasticsearch可以自己工作吗？完全可以的！ elasticsearch也支持单机部署，数据规模不是很大的情况下，表现也是不错的。所以，你也不用担心因为自己机器资源不够而对elasticsearch望而却步。当然，单机部署的情况下，更多的适合自己玩，对于可靠性的要求就不能太苛刻了。如果你在用宝塔，那你可以在宝塔面板，左侧“软件商店”中直接找到elasticsearch，并“没有痛苦”的安装。本篇文章主要讨论选型，所以不涉及安装细节。 3.2.1 性能顾虑上面提到了“表现”，其实性能只是elasticsearch的一个方面，主要你的机器资源足够（机器资源？对，包括你的机器个数，elasticsearch可以非常方便的横向扩展，以及单机的配置，cpu+内存，内存越高越好，elasticsearch比较吃内存！），它一定会给你很好的性能反应。试想，公司里的app打印线上日志的行数其实可比一般业务系统产生的订单数量要大很多很多，elasticsearch都可以常在日志的实时分析，所以如果你要做通用场景，而且机器资源不是问题，这是完全行得通的。 3.2.2 易用性和可玩性此外，在使用elasticsearch的时候，会有很多的可玩性。这里不引经据典，呈现很多elasticsearch官方文章的列举优秀特性（当然，确实很优秀！）。这里举几个例子：（1）中文分词：第一章提到的其它引擎几乎很难实现，elasticsearch对分词器的支持是原生的，因为elasticsearch天生就为全文索引而生，elasticsearch的汉语名字就是“弹性搜索”。这家伙可是专门搞搜索的！有的朋友可能不了解分词器，比如你的一个字段里存储“今天我要吃冰激凌”，在分词器的加持下，es最终会存储为“今天|我|要|吃|冰激凌”，并且使用倒排索引的形式进行存储。当你搜索“冰激凌”的时候，可以很快的反馈回来。关于elasticsearch的原理，这里不展开说明，分词器和倒排索引是elasticsearch的最基本的概念。如果有不了解的朋友，可以自行百度一下。而且这两个概念，与elasticsearch其实不挂钩，是搜索中的通用概念。关于倒排索引，其核心表现如下图：如果你要用mysql、mongo实现中文分词，这......其实挺麻烦的，可能在后面的版本支持中会实现的很好，但在当前的流行版本中，它们对中文分词是不够友好的。 mysql5.7之后支持外挂第三方分词器，支持中文分词。而在数据量较大的情况下，mysql的多机器部署几乎很难实现，elasticsearch可以很容易的水平扩展。 mongo支持西方语言的分词，但不支持中文、日语、汉语等东方语言，你需要在自己的逻辑代码中实现分词器。 ngram分词，你看看效果：依旧是“今天我要吃冰激凌”，ngram二元分词后即将得到结果“今天、天我、我要、要吃、吃冰、冰激、激凌”。这....，那你搜索冰激凌就搜不出来！咋办呢，当然可以使用三元分词。但是更好的解决方案还是中文分词器，但它们原生并不支持的。（2）自定义排名场景：比如你的搜索“冰激凌”，结果中返回了有10条，这10条应该有你想对它指定的顺序。最简单的就是用默认的得分，但是如果你想人为干预这个得分怎么办？ elasticsearch支持function_score功能（可以不用，这个是增强功能），es会在计算最终得分之前回调这个你指定的function_score回调函数，传入原始得分、行的原始数据，你可以在里面做计算，比如查询其它参考表、或查看是否是广告位，以得到新的score返回给用户。 function_scrore的功能不展开描述，是一个在自定义得分场景下十分有用又简单易用的功能！下面是一个使用示例，不仅如此，它是支持自定义函数的，自由度非常高。（3）文本高亮：你用mysql或mongo也可以实现，比如用户搜索“冰激凌”，你只需要在逻辑代码中对“冰激凌”替换为“<span class='highlight-term'>冰激凌</span>”，然后前端做样式即可。但如果用户搜索了“好吃的冰激凌”咋办呢？还有就是英文大小写的场景，用户搜索"MAIN"，那结果及时匹配到了“main”（小写的），这个单词是否应该高亮呢？也许这时候你会用业务代码实现toLowerCase下基于位置下标的匹配。挺麻烦的吧，elasticsearch，自动可以返回高亮字段！并且可以自由指定高亮的html前后标签。（4）实在太多了....这家伙天生为索引而生，而且版本还在不断地迭代。不差机器的话，用用吧！ 4. 退而求其次 4.1 普通数据库尽管elasticsearch在搜索场景下，是非常好用的利器！但是它比较消耗机器资源，如果你的数据规模并不大，而且想快速实现功能。你可以使用mysql或mongo来代替，完全没有问题。技术是为了解决特定业务场景下的问题，结合当前手头的资源，适合自己的才是最好的。也许你搞了一个单机器的elasticsearch，单机器内存只有2G，它的表现并不会比mysql、mongo来的好。当然，如果你为了使用上边提到的一些优秀的独有的特性，那elasticsearch一定还是最佳选择！对于mysql（关系型数据库）和mongo（文档数据库）的区别这里不展开描述了，但对于搜索而言，两种都合适。有时候选型也不用很纠结，其实都是差不太多的东西，适合自己的、自己熟悉的、运维起来顺手的，就是最好的。 4.2 普通数据库实现中文分词搜索的原理尽管mysql在5.7以后支持外挂第三方分词器，mongo在截止目前的版本中也不支持中文分词（你可能会看到一些文章中说可以指定language为chinese，但其实会报错的）。其实当你选择普通数据库，你就不得不在逻辑代码中自己实现一套索引分词+搜索分词逻辑。索引分词+搜索分词？为什么分开写，如果你有用过elasticsearch或solr，你会知道，在指定字段的时候，需要指定index分词器和search分词器。下面以mongo为例做简要说明。 4.2.1 index分词器意思是当数据“索引”截断如何分词。首先，这里必须要承认，数据之后存储了，才能被查询。在搜索中，这句话可以换成是“数据只有被索引了，才能被搜索”。这时候请求打过来了，要索引一条数据，其中某字段是“今天我要吃冰激凌”，分词后得到“今天|我|要|吃|冰激凌”，这个就可以入库了。如果你使用elasticsearch或solr，这个过程是自动的。如果你使用不支持外观分词器的常规数据库，这个过程你就要手动了，并把分词后的结果用空格分开（最好使用空格，因为西方语言的分词规则就是按空格拆分，以及逗号句号），存入数据库的一个待搜索的字段上。效果如下图：本站的其它博文中有介绍IKAnalyzer：https://www.52itw.com/java/6268.html 4.2.2 search分词器当用户的查询请求打过来，用户输入了“好吃的冰激凌”，分词后得到“好吃|冰激凌”（“的”作为停用词stopwords，被自动忽略了，IKAnalyzer可以指定停用词表）。于是这时候就回去上图的数据库表里面搜索“好吃冰激凌”（与index分词器结果统一，还是用空格分隔）。当然，对于mongo而言，你需要事先开启全文索引db.xxx.ensureIndex({content: "text"})，xxx是集合名，content是字段名，text是全文索引的标识。 mongo搜索的时候用这个语法：db.xxx.find( { $text: { $search: "好吃冰激凌" } },{ score: { $meta: "textScore" } }).sort( { score: { $meta: "textScore" } } ) 4.2.3 索引库和存储库分开为了减少单表的大小，为了让普通的列表查询、普通筛选可以跑的更快，你可以对原有的数据原封不动的做一张表。然后对于搜索场景，再单独对需要被搜索的字段单独拎一张表出来！然后二者之间做增量信号同步或定时差额同步，可能会有延迟，这个就看你能容忍多长时间（悄悄告诉你，elasticsearch也需要指定这个refresh时间，一般是1s到几秒、甚至分钟级。当然，二者的这个时间对饮的底层目的是不一样的）。这样，搜索的时候先查询搜索库，拿到一个指针id的列表，然后拿到指针id的列表区存储里把数据一次性捞出来。当然，也是支持分页的，你查询搜索库其实也是普通的数据库查询嘛，支持分页参数的。 4.3 存储库和索引库的延伸阅读很多有名的开源软件也是使用的存储库与索引库分离的技术方案，如apache atlas： apache atlas对于大数据领域的数据资产元数据管理、数据血缘上可谓是专家，也涉及资产搜索的特性，它的实现思路就是：从搜索库中做搜索、拿到key、再去存储库中做查询。搜索库：上图右下角，可以看到使用的是elasticsearch、solr或lucene，多个选一个存储库：上图左下角，可以看到使用的是Cassandra、HBase或BerkeleyDB，多个选一个虽然apache atlas在只有搜索库或只有存储库的时候也可以很好的工作，但只针对于数据量并不大的场景。搜索库，擅长搜索！存储库，擅长海量存储！搜索库多样化搜索，然后去存储库做点查。当你的数据达到海量的时候，es+hbase也是一种很好的解决方案，不在这里展开说明了。

2024-01-27 17:49:04

540

admin-tim

MemCache

缓存优化：高性能Web应用中的并发冲突与互斥锁管理

...布式缓存作为微服务间数据共享和状态一致性维护的重要手段，对于提升系统响应速度、降低数据库压力具有不可替代的作用。然而，在分布式系统中，缓存的一致性、失效策略、以及缓存穿透等问题日益凸显，成为影响系统稳定性和性能的关键因素。 Memcached在云原生环境中的应用面对上述挑战，Memcached通过其轻量级的设计和高效的数据访问特性，在云原生环境中找到了新的应用场景和优化路径。例如，结合Kubernetes和Docker容器技术，Memcached可以被方便地部署到集群中，实现资源的动态扩展和负载均衡。通过使用Kubernetes的服务发现和自动缩放功能，可以确保Memcached服务在高并发场景下保持良好的性能和稳定性。同时，借助现代云平台提供的监控和日志服务，如Prometheus和ELK Stack，可以实时监控Memcached的运行状态，及时发现并定位性能瓶颈，实现故障快速响应和自动化优化。此外，通过集成Redisson等开源库或自定义实现，Memcached可以支持更多高级特性，如事务、订阅/发布消息机制等，进一步增强其在复杂业务场景下的适用性。结语：持续优化与技术创新随着云原生技术的不断发展，对分布式缓存的需求也在不断演变。Memcached作为一款成熟且灵活的缓存工具，其在云原生环境中的应用与优化，是一个持续探索和创新的过程。通过结合最新的云原生技术栈，如无服务器计算、事件驱动架构等，可以进一步挖掘Memcached的潜力，为其在现代云原生应用中的角色注入新的活力。在这个过程中，不断积累实践经验，推动技术的迭代与创新，是实现系统高效、稳定运行的关键所在。通过深入分析云原生环境下的分布式缓存需求，以及Memcached在此场景下的应用实践，我们可以看到，技术的融合与创新是推动系统性能优化、应对复杂业务挑战的重要驱动力。随着技术的不断进步和应用场景的不断丰富，Memcached在云原生架构中的角色将会变得更加重要，为构建高性能、高可用的云原生应用提供坚实的基础。

2024-09-02 15:38:39

人生如戏

转载文章

[转载]著名的721法则，你我知道的越早越好（附Python零基础付费学习资料分享）

...签，标签是列表labels = [ '实践与经验','交流与反馈','培训与学习']每个标签占多大，会自动去算百分比sizes = [70,20,10]colors = ['red','yellowgreen','lightskyblue']colors = ['gray','00FFFF','FF1493']灰、粉、蓝绿将某部分爆炸出来，使用括号，将第一块分割出来，数值的大小是分割出来的与其他两块的间隙explode = (0.05,0.05,0)patches,l_text,p_text = plt.pie(sizes,explode=explode,labels=labels,colors=colors,labeldistance = 1.1,autopct = '%3.1f%%',shadow = False,startangle = 90,pctdistance = 0.6)labeldistance，文本的位置离远点有多远，1.1指1.1倍半径的位置autopct，圆里面的文本格式，%3.1f%%表示小数有三位，整数有一位的浮点数shadow，饼是否有阴影startangle，起始角度，0，表示从0开始逆时针转，为第一块。一般选择从90度开始比较好看pctdistance，百分比的text离圆心的距离patches, l_texts, p_texts，为了得到饼图的返回值，p_texts饼图内部文本的，l_texts饼图外label的文本改变文本的大小方法是把每一个text遍历。调用set_size方法设置它的属性for t in l_text:t.set_size(25)for t in p_text:t.set_size(20) 设置x，y轴刻度一致，这样饼图才能是圆的plt.axis('equal')plt.legend(loc="upper left",frameon=False,fontsize=20,borderaxespad=-5)plt.title('721法则', y=-0.1,fontsize=30,loc="center")plt.savefig("721法则.png")plt.show() 下图还是我画的，当然，没有上面那个美观。第二个图import matplotlib.pyplot as pltplt.rcParams['font.family']='SimHei'plt.figure(figsize=(6, 9))labels = '实践与经验','交流与反馈','培训与学习'sizes = [70.0,20.0,10.0]explode = (0.1,0,0)colors = ['gray','00FFFF','FF1493']plt.pie(sizes,explode=explode,labels=labels,colors=colors,labeldistance=1.1,\autopct='%d%%',shadow=True,counterclock=False)plt.legend(loc="upper left",frameon=False,fontsize=18,borderaxespad=-5)plt.axis('equal')plt.title('721法则', y=-0.1,fontsize=18)plt.savefig("721法则.png")plt.show() 结论：我们不但要会画，还要学着画得尽可能美，实践是唯一的途径。 Python入门教程如果你现在还是不会Python也没关系，下面我会给大家免费分享一份Python全套学习资料，包含视频、源码、课件，希望能帮到那些不满现状，想提升自己却又没有方向的朋友，可以和我一起来学习交流。 ① Python所有方向的学习路线图，清楚各个方向要学什么东西 ② 600多节Python课程视频，涵盖必备基础、爬虫和数据分析 ③ 100多个Python实战案例，含50个超大型项目详解，学习不再是只会理论 ④ 20款主流手游迫解爬虫手游逆行迫解教程包 ⑤ 爬虫与反爬虫攻防教程包，含15个大型网站迫解 ⑥ 爬虫APP逆向实战教程包，含45项绝密技术详解 ⑦ 超300本Python电子好书，从入门到高阶应有尽有 ⑧ 华为出品独家Python漫画教程，手机也能学习 ⑨ 历年互联网企业Python面试真题,复习时非常方便 👉Python学习视频600合集👈 观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。 👉实战案例👈 光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。 👉100道Python练习题👈 检查学习结果。 👉面试刷题👈 资料领取上述这份完整版的Python全套学习资料已经上传CSDN官方，朋友们如果需要可以微信扫描下方CSDN官方认证二维码输入“领取资料” 即可领取好文推荐了解python的前景：https://blog.csdn.net/weixin_49891576/article/details/127187029 了解python的兼职：https://blog.csdn.net/weixin_49891576/article/details/127125308 本篇文章为转载内容。原文链接：https://blog.csdn.net/weixin_49891576/article/details/130861900。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-06-04 23:38:21

107

转载

转载文章

[转载]开放式激光振镜+运动控制器(六)：双振镜运动

...开发，程序运行时需要动态库zmotion.dll。调试时可以把ZDevelop软件同时连接到控制器，从而方便调试、方便观察。 2.硬件接口 3.振镜控制过程激光振镜是一种专门用于激光加工领域的特殊的运动器件，激光振镜头内包含的主要元件是激光发生器，两个电机和两个振镜片，它靠两个电机分别控制两个振镜片X和Y反射激光，形成XY平面的运动，这两个电机使用控制器上的振镜轴接口控制。激光振镜不同于一般的电机，激光振镜具有非常小的惯量，且在运动的过程中负载非常小，只需要带动反射镜片，系统的响应非常快。 ZMC420SCAN支持XY2-100振镜协议，支持运动控制与振镜联合插补运动。上位机通过网口与控制器相连，通过XY2-100振镜协议进行控制振镜轴的运动，通过总线协议或者脉冲模式控制伺服轴运动。使用ZMC420SCAN控制器的振镜轴接口连接激光振镜头，每个振镜轴接口内包含两路振镜通道信号，分别控制振镜片X、Y的偏转，从而控制了激光打到工件的位置。 4. 控制器PWM模拟量介绍 ZMC420SCAN的外部通用输出口0-11都具有PWM输出功能，PWM 输出受正常输出功能的控制，只有输出口状态ON的时候PWM才能实际输出，这样可以用来控制激光能量。 ZMC420SCAN控制器存在两路模拟量输入输出，可进行控制激光器能量输出，模拟量精度为12位。（DA采用了内部电源） 5.控制器基本信息轴0-3为普通脉冲轴，振镜0为轴4、轴5控制振镜XY，振镜1为轴6、轴7控制XY。二C++ 进行振镜+运动控制开发 1. 新建MFC项目并添加函数库 (1)在VS2015菜单“文件”→“新建”→ “项目”，启动创建项目向导。 (2)选择开发语言为“Visual C++”和程序类型“MFC应用程序”。 (3)点击下一步即可。 (4)选择类型为“基于对话框”，下一步或者完成。 (5)找到厂家提供的光盘资料，路径如下(64位库为例)。 A.进入厂商提供的光盘资料找到“8.PC函数”文件夹，并点击进入。 B.选择“函数库2.1”文件夹。 C.选择“Windows平台”文件夹。 D.根据需要选择对应的函数库这里选择64位库。 E.解压C++的压缩包,里面有C++对应的函数库。 F.函数库具体路径如下。（6）将厂商提供的C++的库文件和相关头文件复制到新建的项目里面。 (7)在项目中添加静态库和相关头文件。 A.先右击项目文件，接着依次选择:“添加”→“现有项”。 B.在弹出的窗口中依次添加静态库和相关头文件。 (8)声明用到的头文件和定义控制器连接句柄。至此项目新建完成，可进行MFC项目开发。 2.查看PC函数手册，熟悉相关函数接口 (1)PC函数手册也在光盘资料里面，具体路径如下：“光盘资料\8.PC函数\函数库2.1\ZMotion函数库编程手册 V2.1.pdf” (2)链接控制器，获取链接句柄。 ZAux_OpenEth()接口说明： (3)振镜运动接口。为振镜运动单独封装了一个运动接口，使用movescanabs指令进行运动，采用FORCE_SPEED参数设置运动过程中的速度，运动过程中基本不存在加减速过程，支持us级别的时间控制。 3. MFC开发控制器双振镜运动例程（1）例程界面如下。（2）链接按钮的事件处理函数中调用链接控制器的接口函数ZAux_OpenEth（），与控制器进行链接,链接成功后启动定时器1监控控制器状态。 //网口链接控制器void CSingle_move_Dlg::OnOpen(){char buffer[256]; int32 iresult;//如果已经链接，则先断开链接if(NULL != g_handle){ZAux_Close(g_handle);g_handle = NULL;}//从IP下拉框中选择获取IP地址GetDlgItemText(IDC_IPLIST,buffer,255);buffer[255] = '\0';//开始链接控制器iresult = ZAux_OpenEth(buffer, &g_handle);if(ERR_SUCCESS != iresult){g_handle = NULL;MessageBox(_T("链接失败"));SetWindowText("未链接");return;}//链接成功开启定时器1SetWindowText("已链接");SetTimer( 1, 100, NULL ); } （3）通过定时器监控控制器状态。 void CSingle_move_Dlg::OnTimer(UINT_PTR nIDEvent) {// TODO: Add your message handler code here and/or call defaultif(NULL == g_handle){MessageBox(_T("链接断开"));return ;}if(1 == nIDEvent){CString string;float position = 0;ZAux_Direct_GetDpos( g_handle,m_nAxis,&position); //获取当前轴位置string.Format("振镜X1轴位置：%.2f", position );GetDlgItem( IDC_CURPOS )->SetWindowText( string );float NowSp = 0;ZAux_Direct_GetVpSpeed( g_handle,m_nAxis,&NowSp); //获取当前轴速度string.Format("振镜X1轴速度：%.2f", NowSp );GetDlgItem( IDC_CURSPEED)->SetWindowText( string );ZAux_Direct_GetDpos(g_handle, m_nAxis+1, &position); //获取当前轴位置string.Format("振镜Y1轴位置：%.2f", position);GetDlgItem(IDC_CURPOS2)->SetWindowText(string);ZAux_Direct_GetVpSpeed(g_handle, m_nAxis+1, &NowSp); //获取当前轴速度string.Format("振镜Y1轴速度：%.2f", NowSp);GetDlgItem(IDC_CURSPEED2)->SetWindowText(string);ZAux_Direct_GetDpos(g_handle, m_nAxis + 2, &position); //获取当前轴位置string.Format("振镜X2轴位置：%.2f", position);GetDlgItem(IDC_CURPOS3)->SetWindowText(string);NowSp = 0;ZAux_Direct_GetVpSpeed(g_handle, m_nAxis + 2, &NowSp); //获取当前轴速度string.Format("振镜X2轴速度：%.2f", NowSp);GetDlgItem(IDC_CURSPEED3)->SetWindowText(string);ZAux_Direct_GetDpos(g_handle, m_nAxis + 3, &position); //获取当前轴位置string.Format("振镜Y2轴位置：%.2f", position);GetDlgItem(IDC_CURPOS4)->SetWindowText(string);ZAux_Direct_GetVpSpeed(g_handle, m_nAxis + 3, &NowSp); //获取当前轴速度string.Format("振镜Y2轴速度：%.2f", NowSp);GetDlgItem(IDC_CURSPEED4)->SetWindowText(string);int status = 0; ZAux_Direct_GetIfIdle(g_handle, m_nAxis,&status); //判断当前轴状态if (status == -1){GetDlgItem( IDC_CURSTATE )->SetWindowText( "当前状态：停止" );}else{GetDlgItem( IDC_CURSTATE )->SetWindowText( "当前状态：运动中" );} }CDialog::OnTimer(nIDEvent);} （4）通过启动按钮的事件处理函数获取编辑框的移动轨迹，并设置振镜轴参数操作振镜轴运动。 void CSingle_move_Dlg::OnStart() //启动运动{if(NULL == g_handle){MessageBox(_T("链接断开状态"));return ;}UpdateData(true);//刷新参数int status = 0; ZAux_Direct_GetIfIdle(g_handle, m_nAxis,&status); //判断当前轴状态 if (status == 0) //已经在运动中{ return;} //设定轴类型 1-脉冲轴类型 for (int i = 4; i < 8; i++){ZAux_Direct_SetAtype(g_handle, i, m_Atype);ZAux_Direct_SetMerge(g_handle,i,1);//设置脉冲当量ZAux_Direct_SetUnits(g_handle, i, m_units);//设定速度，加减速ZAux_Direct_SetLspeed(g_handle, i, m_lspeed);ZAux_Direct_SetSpeed(g_handle, i, m_speed);ZAux_Direct_SetForceSpeed(g_handle, i, m_speed);ZAux_Direct_SetAccel(g_handle, i, m_acc);ZAux_Direct_SetDecel(g_handle, i, m_dec);//设定S曲线时间设置为0表示梯形加减速 ZAux_Direct_SetSramp(g_handle, i, m_sramp);}//使用MOVESCANABS运动int axislist[2] = { 4,5 };float dposlist[2] = { 0,0 };ZAux_MoveScanAbs(2, axislist, dposlist);CString str;GetDlgItem(IDC_EDIT_POSX1)->GetWindowText(str);float dbx = atof(str);GetDlgItem(IDC_EDIT_POSY1)->GetWindowText(str);float dby = atof(str);dposlist[0] = dbx;dposlist[1] = dby;ZAux_MoveScanAbs(2, axislist, dposlist);GetDlgItem(IDC_EDIT_POSX2)->GetWindowText(str);dbx = atof(str);GetDlgItem(IDC_EDIT_POSY2)->GetWindowText(str);dby = atof(str);dposlist[0] = dbx;dposlist[1] = dby;ZAux_MoveScanAbs(2, axislist, dposlist);GetDlgItem(IDC_EDIT_POSX3)->GetWindowText(str);dbx = atof(str);GetDlgItem(IDC_EDIT_POSY3)->GetWindowText(str);dby = atof(str);dposlist[0] = dbx;dposlist[1] = dby;ZAux_MoveScanAbs(2, axislist, dposlist);GetDlgItem(IDC_EDIT_POSX4)->GetWindowText(str);dbx = atof(str);GetDlgItem(IDC_EDIT_POSY4)->GetWindowText(str);dby = atof(str);dposlist[0] = dbx;dposlist[1] = dby;ZAux_MoveScanAbs(2, axislist, dposlist);//第二个振镜运动//使用MOVESCANABS运动axislist[0] = 6;axislist[1] = 7;dposlist[0] = 0;dposlist[1] = 0;ZAux_MoveScanAbs(2, axislist, dposlist);GetDlgItem(IDC_EDIT_POSX5)->GetWindowText(str);dbx = atof(str);GetDlgItem(IDC_EDIT_POSY5)->GetWindowText(str);dby = atof(str);dposlist[0] = dbx;dposlist[1] = dby;ZAux_MoveScanAbs(2, axislist, dposlist);GetDlgItem(IDC_EDIT_POSX6)->GetWindowText(str);dbx = atof(str);GetDlgItem(IDC_EDIT_POSY6)->GetWindowText(str);dby = atof(str);dposlist[0] = dbx;dposlist[1] = dby;ZAux_MoveScanAbs(2, axislist, dposlist);GetDlgItem(IDC_EDIT_POSX7)->GetWindowText(str);dbx = atof(str);GetDlgItem(IDC_EDIT_POSY7)->GetWindowText(str);dby = atof(str);dposlist[0] = dbx;dposlist[1] = dby;ZAux_MoveScanAbs(2, axislist, dposlist);GetDlgItem(IDC_EDIT_POSX8)->GetWindowText(str);dbx = atof(str);GetDlgItem(IDC_EDIT_POSY8)->GetWindowText(str);dby = atof(str);dposlist[0] = dbx;dposlist[1] = dby;ZAux_MoveScanAbs(2, axislist, dposlist);UpdateData(false); } (5) 通过断开按钮的事件处理函数来断开与控制卡的连接。 void CSingle_move_Dlg::OnClose() //断开链接{// TODO: Add your control notification handler code hereif(NULL != g_handle){KillTimer(1); //关定时器KillTimer(2);ZAux_Close(g_handle);g_handle = NULL;SetWindowText("未链接");} } （6）通过坐标清零按钮的事件处理函数移动振镜轴回零到中心零点位置，不直接使用dpos=0，修改振镜轴坐标。 void CSingle_move_Dlg::OnZero() //清零坐标{if(NULL == g_handle){MessageBox(_T("链接断开状态"));return ;}// TODO: Add your control notification handler code hereint axislist[2] = { 4,5 };float dposlist[2] = { 0 };ZAux_Direct_MoveAbs(g_handle,2,axislist,dposlist); //设置运动回零点} 三调试与监控编译运行例程，同时通过ZDevelop软件连接控制器对控制器状态进行监控。 ZDevelop软件连接控制器监控控制器的状态，查看振镜轴对应参数，并可搭配示波器检测双振镜轨迹。设置振镜轴运动，首先需要将轴类型配置成21振镜轴类型，并对应配置振镜轴的速度加减速等参数才可操作振镜进行运动。通过ZDevelop软件的示波器监控双振镜运动运行轨迹。视频演示。开放式激光振镜+运动控制器(六)-双振镜运动本次，正运动技术开放式激光振镜+运动控制器(六)：双振镜运动，就分享到这里。更多精彩内容请关注“正运动小助手”公众号，需要相关开发环境与例程代码，请咨询正运动技术销售工程师：400-089-8936。本文由正运动技术原创，欢迎大家转载，共同学习，一起提高中国智能制造水平。文章版权归正运动技术所有，如有转载请注明文章来源。本篇文章为转载内容。原文链接：https://blog.csdn.net/weixin_57350300/article/details/123402200。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-12-04 17:33:09

340

转载

转载文章

[转载]运维监控之Nagios实战(三)Nagios配置文件

...件管理比较方便,但是数据量大了之后,很难整理.所以建议将这些配置分开 cfg_file=/usr/local/nagios/etc/objects/commands.cfg cfg_file=/usr/local/nagios/etc/objects/contacts.cfg cfg_file=/usr/local/nagios/etc/objects/timeperiods.cfg cfg_file=/usr/local/nagios/etc/objects/templates.cfg cfg_file=/usr/local/nagios/etc/objects/contactgroups.cfg cfg_file=/usr/local/nagios/etc/objects/hosts.cfg cfg_file=/usr/local/nagios/etc/objects/hostgroups.cfg cfg_file=/usr/local/nagios/etc/objects/services.cfg cfg_file=/usr/local/nagios/etc/objects/servicegroups.cfg 改check_external_commands=0为check_external_commands=1.这行的作用是允许在web 界面下执行重启nagios、停止主机/服务检查等操作。把command_check_interval的值从默认的1 改成command_check_interval=15s（根据自己的情况定这个命令检查时间间隔，不要太长也不要太短）。 2.资源配置文件resource.cfg 资源文件可以保存用户自定义的宏.资源文件的一个主要用处是用于保存一些敏感的配置信息,如系统口令等不能让CGIs 程序模块获取到的东西 3.CGI配置文件cgi.cfg CGI 配置文件包含了一系列的设置,它们会影响CGIs程序模块.还有一些保存在主配置文件之中,因此CGI 程序会知道你是如何配置的Nagios并且在哪里保存了对象定义.最实际的例子就是,如果你想建立一个只有查看报警权限的用户,或者只有查看其中一些服务器或者服务状态的权限,通过修改cfi.cfg可以灵活的控制web访问端的权限. 4.主机定义文件定义你要监控的对象,这里定义的“host_name”被应用到其它的所有配置文件中，这个是我们配置Nagios 必须修改的配置文件. [root@test objects] vim hosts.cfg define host{ host_name Nagios-Server ; 设置主机的名字，该名字会出现在hostgroups.cfg 和services.cfg 中。注意，这个名字可以不是该服务器的主机名。 alias Nagios服务器 ; 别名 address 192.168.81.128 ; 主机的IP 地址 check_command check-host-alive ; 检查使用的命令，需要在命令定义文件定义，默认是定义好的。 check_interval 1 ; 检测的时间间隔 retry_interval 1 ; 检测失败后重试的时间间隔 max_check_attempts 3 ; 最大重试次数 check_period 24x7 ; 检测的时段 process_perf_data 0 retain_nonstatus_information 0 contact_groups sagroup ; 需要通知的联系组 notification_interval 30 ; 通知的时间间隔 notification_period 24x7 ; 通知的时间段 notification_options d,u,r ; 通知的选项 w—报警(warning)，u—未知(unkown) c—严重(critical)，r—从异常情况恢复正常 } define host{ host_name Nagios-Client alias Nagios客户端 address 192.168.81.129 check_command check-host-alive check_interval 1 retry_interval 1 max_check_attempts 3 check_period 24x7 process_perf_data 0 retain_nonstatus_information 0 contact_groups sagroup notification_interval 30 notification_period 24x7 notification_options d,u,r } 5.主机组定义文件主机组定义文件,可以方便的将相同功能或者在应用上相同的服务器添加到一个主机组里,在WEB 界面可以通过HOST Group 方便的查看该组主机的状态信息. 将刚才定义的两个主机加入到主机组中,针对生产环境就像把所有的MySQL 服务器加到一个MySQL主机组里,将Oracle 服务器加到一个Oracle 主机组里,方便管理和查看,可以配置多个组. [root@test objects] vim hostgroups.cfg define hostgroup { hostgroup_name Nagios-Example ; 主机组名字 alias Nagios 主机组 ; 主机组别名 members Nagios-Server,Nagios-Client ; 主机组成员，用逗号隔开 } 6.服务定义文件服务定义文件定义你需要监控的对象的服务,比如本例为检测主机是否存活,在后面会讲到如何监控其它服务,比如服务器负载、内存、磁盘等. [root@test objects] vim services.cfg define service { host_name Nagios-Server ; hosts.cfg 定义的主机名称 service_description check-host-alive ; 服务描述 check_period 24x7 ; 检测的时间段 max_check_attempts 3 ; 最大检测次数 normal_check_interval 3 retry_check_interval 2 contact_groups sagroup ; 发生故障通知的联系人组 notification_interval 10 notification_period 24x7 ; 通知的时间段 notification_options w,u,c,r check_command check-host-alive } define service { host_name Nagios-Client service_description check-host-alive check_period 24x7 max_check_attempts 3 normal_check_interval 3 retry_check_interval 2 contact_groups sagroup notification_interval 10 notification_period 24x7 notification_options w,u,c,r check_command check-host-alive } 7.服务组定义文件和主机组一样,我们可以按需将相同的服务放入一个服务组,这样有规律的分类,便于我们在WEB端查看. [root@test objects] vim servicegroups.cfg define servicegroup{ servicegroup_name Host-Alive ; 组名 alias Host Alive ; 别名设置 members Nagios-Server,check-host-alive,Nagios-Client,check-host-alive } 8.联系人定义文件定义发生故障时,需要通知的联系人信息.默认安装完成后，该配置文件已经存在,而且该文件不仅定义了联系人,也定义了联系人组,为了条理化的规划,我们把联系人定义放在contacts.cfg文件里,把联系人组放在contactgroups.cfg文件中. [root@test objects] mv contacts.cfg contacts.cfg.bak [root@test objects] vim contacts.cfg define contact{ contact_name maoxian ; 联系人的名字 alias maoxian ; 别名 service_notification_period 24x7 ; 服务报警的时间段 host_notification_period 24x7 ; 主机报警的时间段 service_notification_options w,u,c,r ; 就是在这四种情况下报警。 host_notification_options d,u,r ;同上。服务报警发消息的命令，在command.cfg 中定义。 service_notification_commands notify-service-by-email 服务报警发消息的命令，在command.cfg 中定义。 host_notification_commands notify-host-by-email email wangyx088@gmail.com ; 定义邮件地址，也就是接收报警邮件地址。 } 9.联系人组定义文件联系人组定义文件在实际应用中很有好处,我们可以把报警信息分级别,报联系人分级别存放在联系人组里面.例如：当发生一些警告信息的情况下,只发邮件给系统工程师联系人组即可,但是当发生重大问题,比如主机宕机了,可以发给领导联系人组. [root@test objects] vim contactgroups.cfg define contactgroup{ contactgroup_name sagroup ; 组名 alias Nagios Administrators ; 别名 members maoxian ; 联系人组成员 } 10.命令定义文件 commands.cfg 命令定义文件是Nagios中很重要的配置文件,所有在hosts.cfg还是services.cfg使用的命令都必须在命令定义文件中定义才能使用.默认情况下,范例配置文件已经配置好了日常需要使用的命令,所以一般不做修改. 11.时间段定义文件 timeperiods.cfg 我们在检测、通知、报警的时候都需要定义时间段,默认都是使用7x24,这也是默认配置文件里配置好的,如果你需要周六日不做检测,或者在制定的维护时间不做检测,都可以在该时间段定义文件定义好,这样固定维护的时候,就不会为大量的报警邮件或者短信烦恼 [root@test objects] cat timeperiods.cfg |grep -v "^" |grep -v "^$" 可以根据业务需求来更改 12.启动Nagios 1> 修改配置文件所有者 [root@test objects] chown -R nagios:nagios /usr/local/nagios/etc/objects/ 2> 检测配置是否正确 [root@test objects] /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg 如果配置错误,会给出相应的报错信息,可以根据信息查找,注意,如果配置文件中有不可见字符也可以导致配置错误 3> 重载Nagios [root@test objects] service nagios restart 本文出自 “毛线的linux之路” 博客，请务必保留此出处http://maoxian.blog.51cto.com/4227070/756516 本篇文章为转载内容。原文链接：https://blog.csdn.net/gzh0222/article/details/8549202。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-11-16 20:48:42

484

转载

转载文章

[转载]浅谈Linux内核RCU机制原理

...y Update）是数据同步的一种方式，在当前的Linux内核中发挥着重要的作用。RCU主要针对的数据对象是链表，目的是提高遍历读取数据的效率，为了达到目的使用RCU机制读取数据的时候不对链表进行耗时的加锁操作。这样在同一时间可以有多个线程同时读取该链表，并且允许一个线程对链表进行修改（修改的时候，需要加锁）。RCU适用于需要频繁的读取数据，而相应修改数据并不多的情景，例如在文件系统中，经常需要查找定位目录，而对目录的修改相对来说并不多，这就是RCU发挥作用的最佳场景。 Linux内核源码当中，关于RCU的文档比较齐全，你可以在 /DocumentaTIon/RCU/ 目录下找到这些文件。Paul E. McKenney 是内核中RCU源码的主要实现者，他也写了很多RCU方面的文章。今天我们就主要来说说linux内核rcu的机制详解。在RCU的实现过程中，我们主要解决以下问题：在读取过程中，另外一个线程删除了一个节点。删除线程可以把这个节点从链表中移除，但它不能直接销毁这个节点，必须等到所有的线程读取完成以后，才进行销毁操作。RCU中把这个过程称为宽限期（Grace period）。在读取过程中，另外一个线程插入了一个新节点，而读线程读到了这个节点，那么需要保证读到的这个节点是完整的。这里涉及到了发布-订阅机制（Publish-Subscribe Mechanism）。保证读取链表的完整性。新增或者删除一个节点，不至于导致遍历一个链表从中间断开。但是RCU并不保证一定能读到新增的节点或者不读到要被删除的节点。宽限期通过这个例子，方便理解这个内容。以下例子修改于Paul的文章。 struct foo {int a;char b;long c;};DEFINE_SPINLOCK（foo_mutex）;struct foo gbl_foo;void foo_read （void）{foo fp = gbl_foo;if （ fp ！= NULL ）dosomething（fp-》a， fp-》b ， fp-》c ）;}void foo_update（ foo new_fp ）{spin_lock（&foo_mutex）;foo old_fp = gbl_foo;gbl_foo = new_fp;spin_unlock（&foo_mutex）;kfee（old_fp）;} 如上的程序，是针对于全局变量gbl_foo的操作。假设以下场景。有两个线程同时运行 foo_ read和foo_update的时候，当foo_ read执行完赋值操作后，线程发生切换；此时另一个线程开始执行foo_update并执行完成。当foo_ read运行的进程切换回来后，运行dosomething 的时候，fp已经被删除，这将对系统造成危害。为了防止此类事件的发生，RCU里增加了一个新的概念叫宽限期（Grace period）。如下图所示：图中每行代表一个线程，最下面的一行是删除线程，当它执行完删除操作后，线程进入了宽限期。宽限期的意义是，在一个删除动作发生后，它必须等待所有在宽限期开始前已经开始的读线程结束，才可以进行销毁操作。这样做的原因是这些线程有可能读到了要删除的元素。图中的宽限期必须等待1和2结束；而读线程5在宽限期开始前已经结束，不需要考虑；而3，4，6也不需要考虑，因为在宽限期结束后开始后的线程不可能读到已删除的元素。为此RCU机制提供了相应的API来实现这个功能。 void foo_read（void）{rcu_read_lock（）;foo fp = gbl_foo;if （ fp ！= NULL ）dosomething（fp-》a，fp-》b，fp-》c）;rcu_read_unlock（）;}void foo_update（ foo new_fp ）{spin_lock（&foo_mutex）;foo old_fp = gbl_foo;gbl_foo = new_fp;spin_unlock（&foo_mutex）;synchronize_rcu（）;kfee（old_fp）;} 其中foo_read中增加了rcu_read_lock和rcu_read_unlock，这两个函数用来标记一个RCU读过程的开始和结束。其实作用就是帮助检测宽限期是否结束。 foo_update增加了一个函数synchronize_rcu（），调用该函数意味着一个宽限期的开始，而直到宽限期结束，该函数才会返回。我们再对比着图看一看，线程1和2，在synchronize_rcu之前可能得到了旧的gbl_foo，也就是foo_update中的old_fp，如果不等它们运行结束，就调用kfee（old_fp），极有可能造成系统崩溃。而3，4，6在synchronize_rcu之后运行，此时它们已经不可能得到old_fp，此次的kfee将不对它们产生影响。宽限期是RCU实现中最复杂的部分，原因是在提高读数据性能的同时，删除数据的性能也不能太差。订阅——发布机制当前使用的编译器大多会对代码做一定程度的优化，CPU也会对执行指令做一些优化调整，目的是提高代码的执行效率，但这样的优化，有时候会带来不期望的结果。如例： void foo_update（ foo new_fp ）{spin_lock（&foo_mutex）;foo old_fp = gbl_foo;new_fp-》a = 1;new_fp-》b = ‘b’;new_fp-》c = 100;gbl_foo = new_fp;spin_unlock（&foo_mutex）;synchronize_rcu（）;kfee（old_fp）;} 这段代码中，我们期望的是6，7，8行的代码在第10行代码之前执行。但优化后的代码并不会对执行顺序做出保证。在这种情形下，一个读线程很可能读到 new_fp，但new_fp的成员赋值还没执行完成。单独线程执行dosomething（fp-》a， fp-》b ， fp-》c ）的这个时候，就有不确定的参数传入到dosomething，极有可能造成不期望的结果，甚至程序崩溃。可以通过优化屏障来解决该问题，RCU机制对优化屏障做了包装，提供了专用的API来解决该问题。这时候，第十行不再是直接的指针赋值，而应该改为： rcu_assign_pointer（gbl_foo，new_fp）;rcu_assign_pointer的实现比较简单，如下：define rcu_assign_pointer（p， v） \__rcu_assign_pointer（（p），（v）， __rcu）define __rcu_assign_pointer（p， v， space） \do { \smp_wmb（）; \（p） = （typeof（v） __force space ）（v）; \} while （0）我们可以看到它的实现只是在赋值之前加了优化屏障 smp_wmb来确保代码的执行顺序。另外就是宏中用到的__rcu，只是作为编译过程的检测条件来使用的。在DEC Alpha CPU机器上还有一种更强悍的优化，如下所示： void foo_read（void）{rcu_read_lock（）;foo fp = gbl_foo;if （ fp ！= NULL ）dosomething（fp-》a， fp-》b ，fp-》c）;rcu_read_unlock（）;} 第六行的 fp-》a，fp-》b，fp-》c会在第3行还没执行的时候就预先判断运行，当他和foo_update同时运行的时候，可能导致传入dosomething的一部分属于旧的gbl_foo，而另外的属于新的。这样会导致运行结果的错误。为了避免该类问题，RCU还是提供了宏来解决该问题： define rcu_dereference（p） rcu_dereference_check（p， 0）define rcu_dereference_check（p， c） \__rcu_dereference_check（（p）， rcu_read_lock_held（） || （c）， __rcu）define __rcu_dereference_check（p， c， space） \（{ \typeof（p） _________p1 = （typeof（p）__force ）ACCESS_ONCE（p）; \rcu_lockdep_assert（c， “suspicious rcu_dereference_check（）” \usage”）; \rcu_dereference_sparse（p， space）; \smp_read_barrier_depends（）; \（typeof（p） __force __kernel ）（_________p1））; \}）staTIc inline int rcu_read_lock_held（void）{if （！debug_lockdep_rcu_enabled（））return 1;if （rcu_is_cpu_idle（））return 0;if （！rcu_lockdep_current_cpu_online（））return 0;return lock_is_held（&rcu_lock_map）;} 这段代码中加入了调试信息，去除调试信息，可以是以下的形式（其实这也是旧版本中的代码）： define rcu_dereference（p）（{ \typeof（p） _________p1 = p; \smp_read_barrier_depends（）; \（_________p1）; \}）在赋值后加入优化屏障smp_read_barrier_depends（）。我们之前的第四行代码改为 foo fp = rcu_dereference（gbl_foo）;，就可以防止上述问题。数据读取的完整性还是通过例子来说明这个问题：如图我们在原list中加入一个节点new到A之前，所要做的第一步是将new的指针指向A节点，第二步才是将Head的指针指向new。这样做的目的是当插入操作完成第一步的时候，对于链表的读取并不产生影响，而执行完第二步的时候，读线程如果读到new节点，也可以继续遍历链表。如果把这个过程反过来，第一步head指向new，而这时一个线程读到new，由于new的指针指向的是Null，这样将导致读线程无法读取到A，B等后续节点。从以上过程中，可以看出RCU并不保证读线程读取到new节点。如果该节点对程序产生影响，那么就需要外部调用来做相应的调整。如在文件系统中，通过RCU定位后，如果查找不到相应节点，就会进行其它形式的查找，相关内容等分析到文件系统的时候再进行叙述。我们再看一下删除一个节点的例子：如图我们希望删除B，这时候要做的就是将A的指针指向C，保持B的指针，然后删除程序将进入宽限期检测。由于B的内容并没有变更，读到B的线程仍然可以继续读取B的后续节点。B不能立即销毁，它必须等待宽限期结束后，才能进行相应销毁操作。由于A的节点已经指向了C，当宽限期开始之后所有的后续读操作通过A找到的是C，而B已经隐藏了，后续的读线程都不会读到它。这样就确保宽限期过后，删除B并不对系统造成影响。小结 RCU的原理并不复杂，应用也很简单。但代码的实现确并不是那么容易，难点都集中在了宽限期的检测上，后续分析源代码的时候，我们可以看到一些极富技巧的实现方式。本篇文章为转载内容。原文链接：https://blog.csdn.net/m0_50662680/article/details/128449401。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-09-25 09:31:10

106

转载

转载文章

[转载]【北京-望京】这些互联网公司值得你加入

...的，比如JAVA、大数据、算法等，下图从BOSS上截取的：蚂蚁金服不在望京，在环球金融中心。美团美团是望京第二大互联网公司，技术氛围浓厚。事业部很多，包括酒店事业部、闪购、美团金融、优选事业部、美团买菜等。美团的福利常常被叫做白开水福利，不过比普通公司还是要好一些，六险一金、15薪、餐补、下午茶等。面试比阿里容易一些，不过算法和八股文也是必须要准备的。常年招聘，岗位很多，下面岗位来自BOSS： Lazada 东南亚头部电商，而且业务还囊括了娱乐、金融和物流，业务主要服务于东南亚。工作地点在朝阳区阿里中心。福利待遇包括六险一金、年终奖、股权、餐补交通补等。主要招聘岗位包括java开发、游戏开发、前端、UI等。 bilibili bilibili也是非常不错的一家互联网公司，总部在上海，北京的工作地点在朝阳区东煌大厦10层。截至2021年第一季度，B站月活用户达2.23亿福利待遇比较完备，包括六险一金、餐补、全勤奖、下午茶、股权等。招聘岗位包括游戏服务端开发、java开发、C++开发、TA、linux内核开发等。从招聘岗位来看，java 开发并不是bilibili的热门岗位。每日优鲜每日优鲜近几年的发展是非常快速的，也是一家非常值得加入的公司。工作地点在万科时代中心。工作强度比较大，工作内容也比较有挑战，晋升也比较快。建议想在技术上成长的朋友们加入。福利待遇包括六险一金，股票期权。招聘岗位以java为主，架构、资深、中高级都有。 BIGO BIGO主要业务在音视频领域，主要产品有Bigo Live、Likee、Hello，目前全球月活用户近4亿，产品和服务覆盖超过150个国家和地区。福利待遇也是非常不错的，六险一金、年终奖、住房补贴、股票期权等。主要招聘岗位包括JAVA、音视频领域后端开发。 coupang 韩国电商平台，总部在首尔，成立于2010年，是一家成熟的老牌公司，在2021年3月上市。目前国内研发团队主要在上海，在北京也有研发团队。工作地点在颐堤港。 coupang工作强度不大，不加班不内卷。福利待遇也是很不错的，包括六险一金、餐补、补充公积金、节日福利等。招聘岗位主要包括JAVA、IOS、搜索工程师、全栈工程师等。面试难度比较大，前后包括五轮以上面试，第一轮是电话面试，后面线程面试会有手写代码环节。水滴公司水滴这两年发展很快，工作地点在望京科技园。福利待遇方面，属于互联公司中等偏上的水平，包括六险一金、补充公积金、免费健身房等。招聘岗位JAVA居多，各种级别的都有，还有一些中间件的岗位。据面试过水滴的求职者反馈，面试很难，对基础要求高，可能会问一些平时不太关注的非常细的问题。 keep 爱运动的小伙伴相信都熟悉keep这款软件，目前keep的用户量已经破3亿。工作地点在万科时代中心。薪资待遇行业中等，不过该有的服务也基本都有，包括六险一金、年终奖、股权等。招聘岗位以java为主，各种级别都有。雪球国内知名的投资交流平台，2020年底完成1.2亿美元 E 轮融资，发展潜力巨大。工作地点在融新科技中心。福利待遇在行业内属于中等水平，包括六险一金、年终奖、餐补、零食下午茶等。招聘岗位以java为主，还有搜索研发、全栈开发等。陌陌陌生人社交平台，深受年轻人喜爱，18年陌陌全资收购了探探，规模进一步扩大，目前月活用户在1亿+，出海业务也做的非常好。福利待遇属于行业中等偏上，互联网有的福利基本都有，包括六险一金、年终奖等。招聘岗位很多，包括java、中间件、推荐算法、自然语言处理、安全、游戏开发、IOS等。面试难度中等，会有手写sql、算法、linux命令的环节。松果出行松果出行主要业务是构建国内县域城市交通出行网络，目前主要是共享电单车和共享新能源汽车服务。目前业务已经覆盖全国21个省，5000个县。福利待遇属于行业中等，五险一金、年终奖等，没有补充医疗保险。招聘岗位很多，以JAVA为主，各种级别都有。也有物联网、传感器硬件相关的岗位。小桔科技目前研发团队主要做推荐、搜索系统，注册地在大连。福利待遇行业中等，五险一金、年终奖，没有补充医疗保险。招聘岗位包括JAVA、PHP、搜索算法、前端、数仓等。理想汽车智能电动车品牌，这两年在行业内名气比较大。福利待遇行业中等偏上，六险一金、交通补贴等。招聘岗位很多，以JAVA为主，各种级别都有。另外也招聘PaaS平台研发、搜索、车载语音、大数据等。参加过理想汽车面试的同学反馈面试体验不太好，面试官没有耐心，给大家一个参考。狮桥智慧物流+普惠金融融资租赁业务。福利待遇中等偏下，五险一金、年终奖，没有补充医疗保险。招聘岗位主要是JAVA开发。领创集团海外金融业务，主要做印度市场。福利待遇中等偏下，六险一金，年终奖，工作节奏慢。招聘岗位主要是JAVA，招聘岗位主要是java。面试过的同学反馈体验比较好，面试官比较nice，有手写代码环节。总结今天主要推荐了望京的16家值得加入的互联网公司，事实上，望京区域的互联网公司和其他科技公司至少有几百家，由于个人精力有限，主要梳理了业界比较知名和自己熟悉的公司。相信还有好多非常不错的公司值得加入，欢迎大家跟我交流讨论。欢迎关注个人公众号，一起学习进步本篇文章为转载内容。原文链接：https://blog.csdn.net/zjj2006/article/details/121412370。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-01-11 22:59:19

531

转载

Tornado

基于Tornado和Google Cloud Secret Manager构建加密存储敏感信息的Web服务

...比如 API 密钥、数据库密码啥的）的服务。对开发者而言，安全这事得放首位，要是还用那种硬编码或者直接把密钥啥的写进配置文件的老办法，那简直就是在玩火自焚啊！Google Cloud Secret Manager 提供了加密存储、访问控制等功能，简直是保护秘钥的最佳选择之一。所以，当我把这两者放在一起的时候，脑海里立刻浮现出一个画面：Tornado 快速响应前端请求，而 Secret Manager 在背后默默守护着那些珍贵的秘密。是不是很带感？接下来我们就一步步深入探索它们的合作方式吧！ --- 2. 初识Tornado 搭建一个简单的Web服务既然要玩转 Tornado，咱们得先搭个基础框架才行。好嘞，接下来我就简单搞个小网页服务，就让它回一句暖心的问候就行啦！虽然看起来简单，但这可是后续一切的基础哦！ python import tornado.ioloop import tornado.web class MainHandler(tornado.web.RequestHandler): def get(self): self.write("Hello, Tornado!") def make_app(): return tornado.web.Application([ (r"/", MainHandler), ]) if __name__ == "__main__": app = make_app() app.listen(8888) print("Server started at http://localhost:8888") tornado.ioloop.IOLoop.current().start() 这段代码超级简单对不对？我们定义了一个 MainHandler 类继承自 tornado.web.RequestHandler，重写了它的 get 方法，当收到 GET 请求时就会执行这个方法，并向客户端返回 "Hello, Tornado!"。然后呢，就用 make_app 这个函数把路由和这个处理器绑在一起，最后再启动服务器，让它开始监听 8888 端口。运行后打开浏览器输入 http://localhost:8888，就能看到页面显示 "Hello, Tornado!" 了。是不是特别爽？不过别急着高兴，这只是万里长征的第一步呢！ --- 3. 引入Google Cloud Secret Manager：让秘密不再裸奔现在我们知道如何用 Tornado 做点事情了，但问题是，如果我们的应用程序需要用到一些敏感信息（例如数据库连接字符串），该怎么办呢？直接写在代码里吗？当然不行！这就是为什么我们要引入 Google Cloud Secret Manager。 3.1 安装依赖库首先需要安装 Google Cloud 的官方 Python SDK： bash pip install google-cloud-secret-manager 3.2 获取Secret Manager中的值假设我们在 Google Cloud Console 上已经创建了一个名为 my-secret 的密钥，并且它里面保存了我们的数据库密码。我们可以这样从 Secret Manager 中读取这个值： python from google.cloud import secretmanager def access_secret_version(project_id, secret_id, version_id): client = secretmanager.SecretManagerServiceClient() name = f"projects/{project_id}/secrets/{secret_id}/versions/{version_id}" response = client.access_secret_version(name=name) payload = response.payload.data.decode('UTF-8') return payload 使用示例 db_password = access_secret_version("your-project-id", "my-secret", "latest") print(f"Database Password: {db_password}") 这段代码做了什么呢？很简单，它实例化了一个 SecretManagerServiceClient 对象，然后根据提供的项目 ID、密钥名称以及版本号去访问对应的密钥内容。注意这里的 version_id 参数可以设置为 "latest" 来获取最新的版本。 --- 4. 将两者结合起来构建更安全的应用那么问题来了，怎么才能让 Tornado 和 Google Cloud Secret Manager 协同工作呢？其实答案很简单——我们可以将从 Secret Manager 获取到的敏感数据注入到 Tornado 的配置对象中，从而在整个应用范围内使用这些信息。 4.1 修改Tornado应用以支持从Secret Manager加载配置让我们修改之前的 MainHandler 类，让它从 Secret Manager 中加载数据库密码并用于某种操作（比如查询数据库）。为了简化演示，这里我们假设有一个 get_db_password 函数负责完成这项任务： python from google.cloud import secretmanager def get_db_password(): client = secretmanager.SecretManagerServiceClient() name = f"projects/{YOUR_PROJECT_ID}/secrets/my-secret/versions/latest" response = client.access_secret_version(name=name) return response.payload.data.decode('UTF-8') class MainHandler(tornado.web.RequestHandler): def initialize(self, db_password): self.db_password = db_password def get(self): self.write(f"Connected to database with password: {self.db_password}") def make_app(): db_password = get_db_password() return tornado.web.Application([ (r"/", MainHandler, {"db_password": db_password}), ]) 在这个例子中，我们在 make_app 函数中调用了 get_db_password() 来获取数据库密码，并将其传递给 MainHandler 的构造函数作为参数。这样一来，每个 MainHandler 实例都会拥有自己的数据库密码属性。 --- 5. 总结与展望好了朋友们，今天的分享就到这里啦！通过这篇文章，我们了解了如何利用 Tornado 和 Google Cloud Secret Manager 来构建更加安全可靠的 Web 应用。虽然过程中遇到了不少挑战，但最终的效果还是让我感到非常满意。未来的话，我还想尝试更多有趣的功能组合，比如结合 Redis 缓存提高性能，或者利用 Pub/Sub 实现消息队列机制。如果你也有类似的想法或者遇到什么问题，欢迎随时跟我交流呀！最后祝大家 coding愉快，记得保护好自己的秘密哦~ 😊

2025-04-09 15:38:23

追梦人

转载文章

[转载]新生代 IT 农民工诞生：月均收入 10571 元

...展了农民工市民化进程动态监测调查。 2020年监测数据显示，新生代农民工占比达到50.1%，男性占比高于女性。新生代农民工中男性占比为66.3%，比上年提高4.6个百分点；男性占比高于女性32.5个百分点，比上年提高9.1个百分点。就业集中于劳动密集型行业，从事信息传输、软件和信息技术服务业的新生代农民工占比大幅提高。 2020年就业人数前五位的行业依次为居民服务、修理和其他服务业，制造业，建筑业，批发和零售业，住宿和餐饮业，共吸纳67.2%的新生代农民工就业。 2020年北京市外来新生代农民工监测报告为了进一步做好农民工服务工作，了解外来农民工在京工作、生活需要，国家统计局北京调查总队在全市范围开展了农民工市民化进程动态监测调查，2020年监测数据显示，新生代农民工（出生于20世纪80年代以后，年龄在16周岁及以上，在异地以非农就业为主的农业户籍人口）占比达到50.1%，已经成为农民工的主体。一、新生代农民工总体特征男性占比高于女性，差距进一步加大。新生代农民工中男性占比为66.3%，比上年提高4.6个百分点；男性占比高于女性32.5个百分点，比上年提高9.1个百分点。 31-40岁农民工占比提高。新生代农民工平均年龄31.4岁，比上年增加0.4岁。其中，31-40岁的占比为57.9%，比上年提高3.2个百分点；21-30岁的占比为39.9%，16-20岁的占比为2.2%，分别比上年下降2.6个和0.6个百分点。大学本科以上学历新生代农民工占比增加。新生代农民工中大学本科以上学历占比为21.2%，比上年提高7.9个百分点。其中，大学本科学历的占比为20.0%，研究生学历的占比为1.2%。外来新生代农民工主要来自北京周边地区。其中，河北、河南两省占比最大，河北省占比为37.3%，比上年同期提高3.5个百分点，河南省占比为12.3%，比上年同期下降3.3个百分点。二、新生代农民工就业情况（一）就业集中于劳动密集型行业，从事信息传输、软件和信息技术服务业的新生代农民工占比大幅提高调查样本中，2020年就业人数前五位的行业与上年一致，依次为居民服务、修理和其他服务业，制造业，建筑业，批发和零售业，住宿和餐饮业，共吸纳67.2%的新生代农民工就业。除上述五大行业外，从事信息传输、软件和信息技术服务业的新生代农民工比例为7.9%，比上年提高3.7个百分点，在所有行业中增幅最大。（二）收入水平整体提高，内部差距拉大调查样本中，新生代农民工月均收入6214元，比上年增加364元，增长6.2%。其中，66.5%月均收入在5000元及以上，比上年高8.6个百分点。 1.不同行业差距较大新生代农民工从业人数最多的七个行业按照收入水平排序依次为：信息传输、软件和信息技术服务业，建筑业，交通运输、仓储和邮政业，制造业，批发零售业，住宿和餐饮业，居民服务、修理和其他服务业。月均收入分别为10571元、6587元、6489元、6017元、5888元、5668元和5195元。其中，收入最高的信息传输、软件和信息技术服务业从业人员月均收入比上年同期增长15.5%；从业人数最多、收入最低的居民服务、修理和其他服务业从业人员月均收入比上年同期降低2.6%。 2.不同收入段间收入差距加大高收入段人员收入增速高于中低收入段。月均收入5000元及以上人员平均月收入为7507元，比上年同期提高2.8个百分点；月均收入4000-5000元人员平均月收入为4175元，比上年同期降低3.4个百分点；月均收入4000元以下人员平均月收入为3064元，比上年同期提高1.1个百分点。（三）自营人员收入高，工作强度大自营就业的新生代农民工月均收入6716元，比务工就业人员高568元；自营就业的新生代农民工平均每周工作6.5天，每天工作9.5小时，分别比务工就业人员多0.9天和0.7小时。三、新生代农民工生活情况（一）消费支出下降，吃穿住消费占新生代农民工总消费支出的7成以上受疫情影响，未来收入的不确定性增加，新生代农民工户均消费支出降低。2020年，新生代农民工家庭户均生活消费支出42395元，比上年减少1833元，下降4.1%。按照金额排序，新生代农民工消费支出排在前三位的依次为：食品烟酒、居住、衣着及其他日用品和服务，分别为14032元、10861元和5141元，前三位消费支出占总消费支出的70.8%。（二）居住性质略有改变，居住满意度小幅提升租赁私房人员占比减少，单位提供住房比例提升。从住房性质来看，新生代农民工主要以租赁私房为主，租赁私房的占60.5%，比上年同期降低3.2个百分点；单位提供住房的占33.1%，比上年同期提高4.7个百分点。单位提供住房，居住消费支出减少，新生代农民工对现在居住条件表示满意的占66.5%，比上年提高3.0个百分点，其中，表示非常满意的占18.6%，比较满意的占47.9%。（三）网络依赖增加，自我提升类活动减少上网已经成为新生代农民工业余时间的主要休闲活动。新生代农民工业余时间的主要活动排在前三位的依次是：上网、休息和朋友聚会，其中上网占60.1%，比上年同期提高4.7个百分点。自我提升类活动减少。业余时间参加学习培训、读书看报的新生代农民工占比分别为3.8%和7.6%，比上年同期分别下降2.5个和1.3个百分点。四、“90后”农民工工作和生活特点（一）“90后”农民工工作特点 1.“90后”农民工从事行业略有不同 “90后”农民工喜好略有不同，就业人数最多的七个行业依次为：制造业，建筑业，居民服务、修理和其他服务业，信息传输、软件和信息技术服务业，住宿和餐饮业，文化和娱乐服务业，批发和零售业。与新生代农民工群体差距最大的两个行业是信息传输、软件和信息技术服务业，批发和零售业，其中，从事信息传输、软件和信息技术服务业的占11.6%，比新生代农民工群体高3.7个百分点；从事批发和零售业的占5.8%，比新生代农民工群体低6.3个百分点。 2.“90后”农民工收入略高调查样本中，“90后”农民工月均收入6424元，比新生代农民工群体平均水平高210元。其中，月均收入在5000元及以上的占68.4%，比新生代农民工群体高1.9个百分点。 3.自营人员占比较低由于年纪尚轻，积累不够，“90后”农民工中的96.3%以受雇就业为主，自营就业人员仅占3.7%，低于新生代农民工群体7.9个百分点。（二）“90后”农民工生活特点 1.消费支出略低，更偏重于衣着及教育文化娱乐方面 “90后”农民工家庭户均生活消费支出42009元，比新生代农民工群体低386元。其中，衣着及其他日常用品和服务、教育文化娱乐支出占总消费支出的比重分别为14.0%和5.9%，分别比新生代农民工群体高1.9个和1.0个百分点；居住和交通通信费支出占总消费支出的比重分别为23.9%和9.2%，分别比新生代农民工群体低1.8个和1.0个百分点。 2.业余生活更注重休息和自我提升 “90后”农民工业余时间的主要活动排在前三位的依旧是上网、休息和朋友聚会，但与整个新生代农民工群体不同的是，“90后”农民工更注重休息和自我提升，其中，业余时间休息的占34.5%，比新生代农民工群体高5.6个百分点；业余时间参加文娱体育活动、学习培训和读书看报的占27.5%，分别比新生代农民工群体、全部外来农民工整体高5.7个和11.8个百分点。新生代农民工定义：出生于20世纪80年代以后，年龄在16周岁及以上，在异地以非农就业为主的农业户籍人口推荐阅读：世界的真实格局分析，地球人类社会底层运行原理不是你需要中台，而是一名合格的架构师（附各大厂中台建设PPT）企业IT技术架构规划方案论数字化转型——转什么，如何转？华为干部与人才发展手册（附PPT）企业10大管理流程图，数字化转型从业者必备！【中台实践】华为大数据中台架构分享.pdf 华为的数字化转型方法论华为如何实施数字化转型（附PPT）超详细280页Docker实战文档！开放下载华为大数据解决方案（PPT）本篇文章为转载内容。原文链接：https://blog.csdn.net/weixin_45727359/article/details/119745674。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-06-28 17:16:54

转载

ZooKeeper

ZooKeeper如何用临时节点和顺序节点实现分布式锁的可重用性并通过客户端连接维持锁机制

...，就容易出问题，要么数据变得乱七八糟，要么整个程序直接“崩了”，啥也干不了。比如说啊，你就想想这个场景——你在打理一家网上商店，突然好几个订单处理的小程序都跑来找你要更新同一个商品的库存，那场面就像好几个人同时抢着跟你说话，都想把自己的事儿赶紧办了，可这库存就那么点，你说这事儿咋整？要是没人管着点，就容易闹出乱子，比如商品明明已经没货了，可系统还傻乎乎地接着收订单，这不是坑人嘛！分布式锁就是解决这个问题的神器之一。它用一种特别的法子，保证在任何时候都只有一个家伙能独享某个资源，别的小伙伴只能乖乖排队等着轮到自己。而ZooKeeper，作为一款经典的分布式协调工具，就提供了这样一种强大的锁机制。不过，光有锁还不够，我们还需要保证锁的可重用性——也就是说，这个锁不能是一次性的，而是可以被反复使用，就像一把能开很多门的万能钥匙一样。那么问题来了，ZooKeeper是如何做到这一点的呢？接下来，咱们就一起深入探究一番！ --- 二、ZooKeeper的基本原理在正式讨论分布式锁之前，我们需要先搞清楚ZooKeeper的核心概念。简单说啊，ZooKeeper就像是一个分布式的小仓库，专门用来存东西的。不过呢，它可不只是个普通的储物柜，还能干不少酷炫的事儿，比如监听节点的变化，或者创建那种“限时有效”的临时小隔间啥的，功能特别强大！这些特性使得ZooKeeper成为构建复杂分布式算法的理想选择。比如说，当你往ZooKeeper里创建一个节点时，可以选择让它变成“持久型”还是“临时型”。打个比方，持久型节点就像那种“铁打的营盘”，哪怕服务器突然重启了，它也能稳如泰山，啥事没有；而临时型节点呢，就有点像“过路的客人”，只要你一断开连接，它就自觉地“卷铺盖走人”了，连影子都不剩。这种灵活性为我们实现分布式锁提供了基础。除此之外，还有一个非常重要的功能叫做“顺序节点”。这意味着当你创建一个节点时，ZooKeeper会自动为其分配一个唯一的序列号。这个功能简直太适合用来模拟排队或者搞定排序啦，而且还是实现分布式锁的核心法宝呢！ --- 三、分布式锁的实现思路现在我们明白了ZooKeeper的基本能力，接下来就该聊聊分布式锁的具体实现了。分布式锁这个东西啊，说白了原理还挺简单的：大家都想抢锁的时候，就都去创建一个临时的小节点，接着看看自己创建的那个节点是不是队列里排第一的小可爱。要是自己是“老大”，那锁就归你啦！如果是的话，那么它就获得了锁；如果不是，那就需要等待直到轮到自己为止。听起来是不是有点抽象？没关系，让我用一段伪代码来帮你理清思路： python def acquire_lock(zookeeper_client, lock_path): 创建一个临时顺序节点 node = zookeeper_client.create(lock_path + "/lock-", ephemeral=True, sequence=True) 获取所有子节点并排序 children = sorted(zookeeper_client.get_children(lock_path)) 检查自己是否是最小的节点 if node.endswith(children[0]): print("I got the lock!") return True 如果不是，就监听前一个节点的变化 predecessor = children[children.index(node) - 1] zookeeper_client.wait_for_event(lock_path + "/" + predecessor) 当前节点变成了最小节点时再次尝试获取锁 return acquire_lock(zookeeper_client, lock_path) 这段代码展示了如何通过递归的方式来不断尝试获取锁。其实吧，表面上看这事不复杂，但真要弄好还挺讲究的。比如说，怎么在出错的时候不慌不忙地重试，而不是乱成一锅粥；还有啊，怎么才能防止那些烦人的死锁情况，不然程序一卡住就头疼了。这些问题都需要我们在实际开发过程中仔细考虑。 --- 四、可重用性的秘密武器到这里，你可能会问：“既然每次获取锁都要重新创建一个新的节点，那怎么才能让锁变得可重用呢？”答案就在于ZooKeeper的“临时节点”特性。还记得我说过临时节点会在客户端断开连接时自动删除吗？这就意味着我们可以设计一种模式，在客户端成功获取锁之后，保持与ZooKeeper的长连接状态。只要连接一直保持，锁就不会丢失，其他客户端也无法抢占它。等到任务完成或者需要释放锁的时候，再主动删除对应的节点即可。为了更好地理解这一点，让我们看一个具体的例子。假设我们现在有一个任务队列系统，每个任务都需要加锁才能执行。以下是一个简化版的Python实现： python import time from kazoo.client import KazooClient zk = KazooClient(hosts='localhost:2181') zk.start() def process_task(task_id): lock_path = "/task_lock" lock_node = None try: 尝试获取锁 while not lock_node: lock_node = zk.create(lock_path + "/task-", ephemeral=True, sequence=True) print(f"Processing task {task_id}") time.sleep(5) 模拟任务耗时 finally: 确保无论如何都要释放锁 if lock_node: zk.delete(lock_node) process_task(1) process_task(2) 在这个例子中，我们定义了一个process_task函数来模拟处理任务的过程。每次调用该函数时，它都会尝试获取锁，并在任务完成后自动释放锁。你说的那个锁啊，因为它是个临时节点嘛，所以哪怕程序突然挂了或者被强制关闭了，这个锁自己就会乖乖消失，这样系统就不会乱套，挺靠谱的！ --- 五、总结与展望好了，到这里我们已经大致了解了ZooKeeper是如何实现分布式锁的可重用性的。其实吧，咱们从最开始琢磨分布式锁是干啥用的，然后一路研究它是怎么工作的、里面那些技术细节到底是啥，到现在为止，我觉得大家对这个话题应该已经搞得挺明白了，甚至可以说是心里有谱了！当然啦，ZooKeeper的应用远不止于此。它还可以用来实现配置中心、Leader选举等功能。未来如果有机会的话，我很乐意继续跟大家分享更多关于它的精彩内容！如果你有任何疑问或者想法，也欢迎随时留言交流哦～编程之路漫漫，我们一起加油吧！

2025-05-16 16:15:57

百转千回

ElasticSearch

Elasticsearch安全性提升：SSL/TLS加密通信+用户认证+授权+日志审计

如何优化Elasticsearch的安全性？ 1. 初识Elasticsearch与安全的重要性嘿，朋友们！今天咱们聊聊一个非常热门的技术——Elasticsearch。作为一个分布式搜索和分析引擎，它在大数据领域里可是大名鼎鼎。无论是日志分析、全文检索还是数据分析，Elasticsearch都能帮你搞定。不过呢，凡事都有两面性。Elasticsearch虽然强大，但也存在一些安全隐患。如果你的集群暴露在公网下，或者权限设置不当，那可就麻烦了。你可以想想啊，要是你的数据被人偷走了，或者被乱改得面目全非，甚至整个系统都直接崩了，那可真是够呛，绝对不是闹着玩的！所以，今天我们来聊聊如何优化Elasticsearch的安全性。我会用一些接地气的例子和代码片段，让你轻松理解这些概念。别担心，咱们会一步步来，保证你听得懂！ --- 2. 配置SSL/TLS加密通信首先，咱们得确保数据在传输过程中是安全的。SSL/TLS加密就是用来干这个的。 2.1 为什么需要SSL/TLS？简单来说，SSL/TLS就像是一层保护罩，让别人即使截获了你的数据包，也看不懂里面的内容。想象一下，你的Elasticsearch集群要是直接暴露在网上，还不设防，那可就相当于把家里保险箱的密码和存折都摆在了大马路上。黑客轻轻松松就能闻到“香味”，啥用户的密码啊、查询出来的机密信息啊，通通被他们盯上，那后果简直不敢想！这简直太可怕了！ 2.2 实现步骤 2.2.1 生成证书首先，我们需要生成自签名证书。虽然自签名证书不能用于生产环境，但它能帮助我们快速测试。 bash openssl req -x509 -newkey rsa:4096 -keyout elastic.key -out elastic.crt -days 365 -nodes 这段命令会生成一个有效期为一年的证书文件elastic.crt和私钥文件elastic.key。 2.2.2 修改配置文件接下来，我们需要在Elasticsearch的配置文件elasticsearch.yml中启用SSL/TLS。找到以下配置项： yaml xpack.security.http.ssl: enabled: true keystore.path: "/path/to/elastic.keystore" 这里的keystore.path指向你刚刚生成的证书和私钥文件。 2.2.3 启动Elasticsearch 启动Elasticsearch后，客户端连接时必须提供对应的证书才能正常工作。例如，使用curl命令时可以这样： bash curl --cacert elastic.crt https://localhost:9200/ 2.3 小结通过SSL/TLS加密，我们可以大大降低数据泄露的风险。不过，自签名证书只适合开发和测试环境。如果是在生产环境中，建议购买由权威机构签发的证书。 --- 3. 用户认证与授权接下来，咱们谈谈用户认证和授权。想象一下，如果没有身份验证机制，任何人都可以访问你的Elasticsearch集群，那简直是噩梦！ 3.1 背景故事有一次，我在调试一个项目时，无意间发现了一个未设置密码的Elasticsearch集群。我当时心里一惊，心想：“乖乖，要是有谁发现这个漏洞，那可就麻烦大了！”赶紧招呼团队的小伙伴们注意一下，提醒大家赶紧加上用户认证功能，别让问题溜走。 3.2 使用内置角色管理 Elasticsearch自带了一些内置角色，比如superuser和read_only。你可以根据需求创建自定义角色，并分配给不同的用户。 3.2.1 创建用户假设我们要创建一个名为admin的管理员用户，可以使用以下命令： bash curl -X POST "https://localhost:9200/_security/user/admin" \ -H 'Content-Type: application/json' \ -u elastic \ -d' { "password" : "changeme", "roles" : [ "superuser" ] }' 这里的-u elastic表示使用默认的elastic用户进行操作。 3.2.2 测试用户权限创建完用户后，我们可以尝试登录并执行操作。例如，使用admin用户查看索引列表： bash curl -X GET "https://localhost:9200/_cat/indices?v" \ -u admin:changeme 如果一切正常，你应该能看到所有索引的信息。 3.3 RBAC（基于角色的访问控制）除了内置角色外，Elasticsearch还支持RBAC。你可以给每个角色设定超级详细的权限，比如说准不准用某个API，能不能访问特定的索引之类的。 json { "role": "custom_role", "cluster": ["monitor"], "indices": [ { "names": [ "logstash-" ], "privileges": [ "read", "view_index_metadata" ] } ] } 这段JSON定义了一个名为custom_role的角色，允许用户读取logstash-系列索引的数据。 --- 4. 日志审计与监控最后，咱们得关注日志审计和监控。即使你做了所有的安全措施，也不能保证万无一失。定期检查日志和监控系统可以帮助我们及时发现问题。 4.1 日志审计 Elasticsearch自带的日志功能非常强大。你可以通过配置日志级别来记录不同级别的事件。例如，启用调试日志： yaml logger.org.elasticsearch: debug 将这条配置添加到logging.yml文件中即可。 4.2 监控工具推荐使用Kibana来监控Elasticsearch的状态。装好Kibana之后，你就能通过网页界面瞅一眼你的集群健不健康、各个节点都在干嘛，还能看看性能指标啥的，挺直观的！ 4.2.1 配置Kibana 在Kibana的配置文件kibana.yml中，添加以下内容： yaml elasticsearch.hosts: ["https://localhost:9200"] elasticsearch.username: "kibana_system" elasticsearch.password: "changeme" 然后重启Kibana服务，打开浏览器访问http://localhost:5601即可。 --- 5. 总结好了，朋友们，今天的分享就到这里啦！优化Elasticsearch的安全性并不是一件容易的事，但只要我们用心去做，就能大大降低风险。从SSL/TLS加密到用户认证，再到日志审计和监控，每一个环节都很重要。我希望这篇文章对你有所帮助，如果你还有其他问题或者经验分享，欢迎随时留言交流！让我们一起打造更安全、更可靠的Elasticsearch集群吧！

2025-05-12 15:42:52

100

星辰大海

.net

DI容器配置错误导致的生命周期管理问题及服务注册解耦单元测试隐患

...nsole.WriteLine("Doing work..."); } } 假设我们有一个Service类实现了IService接口，现在我们需要在程序中使用这个服务。按照传统的做法，可能会直接在类内部实例化： csharp public class Worker { private readonly IService _service = new Service(); public void Execute() { _service.DoWork(); } } 这种方式看起来没什么问题，但实际上隐藏着巨大的隐患。比如，如果你需要替换Service为其他实现（比如MockService），你就得修改Worker类的代码。这违背了开闭原则。于是，我们引入了依赖注入框架，比如Microsoft的Microsoft.Extensions.DependencyInjection。让我们看看如何正确配置。 --- 3. 正确配置 DI容器的正确姿势首先，你需要注册服务。比如，在Program.cs文件中： csharp using Microsoft.Extensions.DependencyInjection; var services = new ServiceCollection(); services.AddTransient(); var serviceProvider = services.BuildServiceProvider(); 这里的关键点在于Transient这个词。它表示每次请求时都会生成一个新的实例。对了，还有别的选择呢，比如说 Scoped——在一个作用域里大家用同一个实例，挺节省资源的；再比如 Singleton——在整个应用跑着的时候大家都用一个“独苗”实例，从头到尾都不换。选择合适的生命周期很重要，否则可能会导致意想不到的行为。接下来，我们可以通过依赖注入获取实例： csharp public class Worker { private readonly IService _service; public Worker(IService service) { _service = service; } public void Execute() { _service.DoWork(); } } 在这个例子中，Worker类不再负责创建IService的实例，而是由DI容器提供。这种解耦的方式让代码更加灵活。 --- 4. 配置错误常见的坑然而，现实总是比理想复杂得多。以下是一些常见的DI配置错误，以及它们可能带来的后果。 4.1 注册类型时搞错了有时候我们会不小心把类型注册错了。比如： csharp services.AddTransient(); // 想注册MockService，却写成了Service 结果就是，无论你在代码中怎么尝试，拿到的永远是Service而不是MockService。其实这个坑挺容易被忽略的，毕竟编译器又不报错，一切都看起来风平浪静，直到程序跑起来的时候，问题才突然冒出来，啪叽一下给你整一个大 surprise！我的建议是，尽量使用常量或者枚举来定义服务名称，这样可以减少拼写错误的风险： csharp public static class ServiceNames { public const string MockService = "MockService"; public const string RealService = "RealService"; } services.AddTransient(ServiceNames.MockService, typeof(MockService)); 4.2 生命周期设置不当另一个常见的问题是生命周期设置错误。比如说，你要是想弄个单例服务，结果不小心把它设成了 Transient，那每次调用的时候都会新生成一个实例。这就好比你本来想让一个人负责一件事，结果每次都换个人来干，不仅效率低得让人崩溃，搞不好还会出大乱子呢！ csharp // 错误示范 services.AddTransient(); // 正确示范 services.AddSingleton(); 记住，单例模式适用于那些无状态或者状态不重要的场景。嘿，想象一下，你正在用一个数据库连接池这种“有状态”的服务，要是把它搞成单例模式，那可就热闹了——多个线程或者任务同时去抢着用它，结果就是互相踩脚、搞砸事情，什么竞争条件啦、数据混乱啦，各种麻烦接踵而至。就好比大家伙儿都盯着同一个饼干罐子，都想伸手拿饼干，但谁也没个规矩，结果不是抢得太猛把罐子摔了，就是谁都拿不痛快。所以啊，这种情况下，还是别让单例当这个“独裁者”了，分清楚责任才靠谱！ 4.3 忘记注册依赖有时候，我们可能会忘记注册某些依赖项。比如： csharp public class SomeClass { private readonly IAnotherService _anotherService; public SomeClass(IAnotherService anotherService) { _anotherService = anotherService; } } 如果IAnotherService没有被注册到DI容器中，那么在运行时就会抛出异常。为了避免这种情况，你可以使用AddScoped或AddTransient来确保所有依赖都被正确注册。 --- 5. 探讨与总结通过今天的讨论，我们可以看到，虽然依赖注入能够极大地提高代码的质量和可维护性，但它并不是万能的。设置搞错了，那可就麻烦大了，小到一个单词拼错了，大到程序跑偏、东西乱套，什么幺蛾子都可能出现。我的建议是，在使用DI框架时要多花时间去理解和实践。不要害怕犯错，因为正是这些错误教会了我们如何更好地编写代码。同时，也要学会利用工具和日志来帮助自己排查问题。最后，我想说的是，编程不仅仅是解决问题的过程，更是一个不断学习和成长的过程。希望大家能够在实践中找到乐趣，享受每一次成功的喜悦！好了，今天的分享就到这里啦，如果你有任何疑问或者想法，欢迎随时留言交流哦！😄

2025-05-07 15:53:50

夜色朦胧

转载文章

[转载]deepin虚拟机安装常用软件

...，了解相关领域的最新动态和技术趋势也至关重要。例如，在Node.js社区中，Node.js 16.x已成为最新的LTS版本，提供了更多性能优化和新特性支持，开发者可以通过官方文档快速掌握升级方法并充分利用新版本优势（参考来源：Node.js官方网站）。同时，MySQL数据库也在不断迭代更新，MySQL 8.0带来了诸如窗口函数、Caching_sha2_password等安全性和功能性的重大改进，对于提升项目的数据处理效率和安全性具有重要意义（参考来源：MySQL官网博客）。在云服务和镜像源方面，阿里云、腾讯云等国内服务商也推出了针对deepin系统的加速镜像源服务，用户可根据自身网络状况选择合适的镜像源以提高软件安装和更新的速度（参考来源：阿里云、腾讯云官方文档）。此外，随着Web开发技术的发展，Vue.js、React等前端框架持续火爆，配合Webpack、Vite等现代构建工具，可以更高效地搭建和维护前端项目结构（参考来源：Vue.js、React官网及技术社区文章）。在办公领域，WPS Office不仅实现了对Linux系统的全面支持，还不断优化跨平台兼容性，并且积极跟进Microsoft Office的新功能，使得国产办公软件在用户体验上逐渐与国际接轨（参考来源：WPS官方公告及媒体报道）。而在浏览器市场，除了Edge浏览器之外，Firefox、Chromium-based浏览器如Chrome和Opera同样提供Linux版，它们之间的性能对比、隐私保护策略以及对Web新技术的支持情况值得深入研究（参考来源：各大浏览器官网及第三方评测报告）。总之，随着开源生态的繁荣和Linux发行版的普及，关注和掌握deepin系统及其周边软件的最新发展动态，将有助于我们更好地利用这一平台进行高效开发和舒适办公。

2023-11-15 19:14:44

转载

Hadoop

Hadoop结合HDFS实现跨硬件复制保障分布式系统数据可靠性与副本策略

...。作为一个程序员或者数据工程师，你可能已经听说过这个名字。Hadoop是一种开源的大数据处理框架，它的核心功能是存储和处理海量的数据。不过，我今天想带大家深入探讨的是Hadoop的一个非常实用的功能：跨硬件复制文件。为什么这个功能这么重要呢？想象一下，如果你正在运行一个大型的分布式系统，突然某个节点挂了怎么办？数据丢了？那可太惨了！Hadoop通过分布式文件系统（HDFS）来解决这个问题。HDFS 可不只是简单地把大文件切成小块儿，它还特聪明，会把这些小块儿分散存到不同的机器上。这就跟把鸡蛋放在好几个篮子里一个道理，哪怕有一台机器突然“罢工”了（也就是挂掉了），你的数据还是稳稳的，一点都不会丢。那么，Hadoop是如何做到这一点的呢？咱们先来看看它是怎么工作的。 --- 2. HDFS的工作原理数据块与副本 HDFS是一个分布式的文件系统，它的设计理念就是让数据更加可靠。简单讲啊，HDFS会把一个大文件切成好多小块儿（每块默认有128MB这么大），接着把这些小块分开放到集群里的不同电脑上存着。更关键的是，HDFS会为每个数据块多弄几个备份，一般是三个副本。这就相当于给你的数据买了“多重保险”，哪怕有一台机器突然“罢工”或者出问题了，你的数据还是妥妥地躺在别的机器上，一点都不会丢。举个例子，假设你有一个1GB的文件，HDFS会把这个文件分成8个128MB的小块，并且每个小块会被复制成3份，分别存储在不同的服务器上。这就意味着啊，就算有一台服务器“挂了”或者出问题了，另外两台服务器还能顶上，数据照样能拿得到，完全不受影响。说到这里，你可能会问：“为什么要复制这么多份？会不会浪费空间？”确实，多副本策略会占用更多的磁盘空间，但它的优点远远超过这一点。先说白了就是，它能让数据更好用、更靠谱啊！再说了，在那种超大的服务器集群里头，这样的备份机制还能帮着分散压力，不让某一个地方出问题就整个崩掉。 --- 3. 实战演示如何使用Hadoop进行跨硬件复制？接下来，让我们动手试试看！我会通过一些实际的例子来展示Hadoop是如何完成文件跨硬件复制的。 3.1 安装与配置Hadoop 首先，你需要确保自己的环境已经安装好了Hadoop。如果你还没有安装，可以参考官方文档一步步来配置。对新手来说，建议先试试伪分布式模式，相当于在一台电脑上“假装”有一个完整的集群，方便你熟悉环境又不用折腾多台机器。 3.2 创建一个简单的文本文件我们先创建一个简单的文本文件，用来测试Hadoop的功能。你可以使用以下命令： bash echo "Hello, Hadoop!" > test.txt 然后，我们将这个文件上传到HDFS中： bash hadoop fs -put test.txt /user/hadoop/ 这里的/user/hadoop/是HDFS上的一个目录路径。 3.3 查看文件的副本分布上传完成后，我们可以检查一下这个文件的副本分布情况。使用以下命令： bash hadoop fsck /user/hadoop/test.txt -files -blocks -locations 这段命令会输出类似如下的结果： /user/hadoop/test.txt 128 bytes, 1 block(s): OK 0. BP-123456789-192.168.1.1:50010 file:/path/to/local/file 1. BP-123456789-192.168.1.2:50010 file:/path/to/local/file 2. BP-123456789-192.168.1.3:50010 file:/path/to/local/file 从这里可以看到，我们的文件已经被复制到了三台不同的服务器上。 --- 4. 深度解读 Hadoop的副本策略在前面的步骤中，我们已经看到了Hadoop是如何将文件复制到不同节点上的。但是，你知道吗？Hadoop的副本策略其实是非常灵活的。它可以根据网络拓扑结构来决定副本的位置。例如，默认情况下，第一个副本会放在与客户端最近的节点上，第二个副本会放在另一个机架上，而第三个副本则会放在同一个机架的不同节点上。这样的策略可以最大限度地减少网络延迟，提高读取效率。当然，如果你对默认的副本策略不满意，也可以自己定制。比如，如果你想让所有副本都放在同一个机架内，可以通过修改dfs.replication.policy参数来实现。 --- 5. 总结与展望通过今天的讨论，我们了解了Hadoop是如何通过HDFS实现文件的跨硬件复制的。虽然这个功能看似简单，但它背后蕴含着复杂的设计理念和技术细节。正是这些设计，才使得Hadoop成为了一个强大的大数据处理工具。最后，我想说的是，学习新技术的过程就像探险一样，充满了未知和挑战。嘿，谁还没遇到过点麻烦事儿呢？有时候一头雾水，感觉前路茫茫，但这不正是探索的开始嘛！别急着放弃，熬过去你会发现，那些让人头疼的问题其实藏着不少小惊喜，等你拨开云雾时，成就感绝对让你觉得值了！希望这篇文章能给你带来一些启发，也希望你能亲自尝试一下Hadoop的实际操作，感受一下它的魅力！好了，今天的分享就到这里啦！如果你有任何疑问或者想法，欢迎随时留言交流。让我们一起探索更多有趣的技术吧！

2025-03-26 16:15:40

冬日暖阳

知识学习

实践的时候请根据实际情况谨慎操作。

随机学习一条linux命令：

screen 或 tmux - 创建持久化会话，可以在断开SSH连接后恢复工作。