...atch 模式下实现编译完成后的文件拷贝回调功能在前端开发过程中，webpack 是一个不可或缺的构建工具。它的模块化打包功能超级强大，而且插件机制灵活得不得了，这让我们能够轻轻松松应对各种千奇百怪、复杂的构建需求，一点儿也不费劲儿。今天，咱们要聊一聊一个实际操作的问题，就是在用 webpack --watch 实时监控文件变动并自动重新编译之后，怎么才能顺手牵羊地执行一个我们自定义的回调函数，把部分文件悄无声息地搬到我们指定的目录里去。这个功能在我们日常开发里头，尤其给力。比如当你需要同步更新那些静态资源、模板文件啥的，它就能派上大用场，超级实用嘞！ 1. 理解webpack-watch模式首先，我们需要理解 webpack --watch 命令的作用。当你在项目根目录运行 webpack --watch 时，webpack 将持续监听你的源代码文件，一旦检测到有改动，它会立即重新进行编译打包。这是一种实时反馈开发成果的高效工作模式。 2. 使用webpack插件实现回调功能 webpack 的强大之处在于它的插件系统。我们可以编写自定义插件来扩展其功能。下面，我们将创建一个自定义webpack插件，用于在每次编译完成后执行文件拷贝操作。 javascript class CopyAfterCompilePlugin { constructor(options) { this.options = options || {}; } apply(compiler) { compiler.hooks.done.tap('CopyAfterCompilePlugin', (stats) => { if (!stats.hasErrors()) { const { copyFrom, copyTo } = this.options; // 这里假设copyFrom和copyTo是待拷贝文件和目标路径 fs.copyFileSync(copyFrom, copyTo); console.log(已成功将${copyFrom}拷贝至${copyTo}); } }); } } // 在webpack配置文件中引入并使用该插件 const CopyWebpackPlugin = require('./CopyAfterCompilePlugin'); module.exports = { // ... 其他webpack配置项 plugins: [ new CopyWebpackPlugin({ copyFrom: 'src/assets/myfile.js', copyTo: 'dist/static/myfile.js' }), ], }; 上述代码中，我们定义了一个名为 CopyAfterCompilePlugin 的webpack插件，它会在编译过程结束后触发 done 钩子，并执行文件拷贝操作。这里使用了 Node.js 的 fs 模块提供的 copyFileSync 方法进行文件拷贝。 3. 插件应用与思考在实际开发中，你可能需要拷贝多个文件或整个目录，这时可以通过遍历文件列表或者递归调用 copyFileSync 来实现。同时，为了提高健壮性，可以增加错误处理逻辑，确保拷贝失败时能给出友好的提示信息。通过这种方式，我们巧妙地利用了webpack的生命周期钩子，实现了编译完成后的自动化文件管理任务。这种做法，可不光是让手动操作变得省心省力，工作效率嗖嗖往上升，更重要的是，它让构建流程变得更聪明、更自动化了。就好比给生产线装上了智能小助手，让webpack插件系统那灵活多变、随时拓展的特性展现得淋漓尽致。总结一下，面对“webpack --watch 编译完成之后执行一个callback，将部分文件拷贝到指定目录”的需求，通过编写自定义webpack插件，我们可以轻松解决这个问题，这也是前端工程化实践中的一个小技巧，值得我们在日常开发中加以运用和探索。当然啦，每个项目的个性化需求肯定是各不相同的，所以呢，咱们就可以在这个基础上灵活变通，根据实际情况来个“私人订制”，把咱们的构建过程打磨得更贴合项目的独特需求，让每一个环节都充满浓浓的人情味儿，更有温度。

2023-12-07 22:55:37

690

月影清风_

Maven

Maven自定义下载配置及依赖管理：本地仓库与引入报错问题排查

...om.xml的XML文件来给项目“画图纸”。这个文件可厉害了，它详细规划了项目的结构布局、各个部分之间的依赖关系，还负责制定构建任务等一系列重要信息。这样一来，整个项目的构建过程就变得既规范又自动化，跟流水线生产似的。这不仅让工作流程顺畅无比，更是让团队成员间的协作效率蹭蹭上涨，效果那是杠杠滴！ 2. Maven生命周期与核心模块 Maven项目存在默认的生命阶段，如clean, initialize, validate, compile, test-compile, test, package, install, deploy等。这些阶段按照顺序执行，并在每个阶段内部执行相应的任务。此外，Maven的核心模块主要包括：Artifact（即我们常说的jar包）、Repository（仓库）、Plugin（插件）等。三、自定义下载Maven及配置 1. 下载与安装Maven 在互联网上，官方提供了Maven的预编译发行版供用户直接下载。下载完成后，解压得到Maven安装目录，通常为apache-maven-X.X.X-bin.tar.gz（X.X.X为版本号）。将此目录添加至系统的PATH环境变量即可全局使用。 bash Linux/Mac tar -xzf apache-maven-X.X.X-bin.tar.gz export MVN_HOME=路径/to/maven_home export PATH=$MVN_HOME/bin:$PATH powershell Windows $env:Path += ";$env:mvn_home\bin" 2. 配置本地仓库与远程仓库 Maven在构建过程中会首先检查本地仓库是否有所需依赖，如果没有则从远程仓库下载。配置这两个仓库需要在settings.xml文件中进行： xml path/to/local/repo central https://repo1.maven.org/maven2/ 四、自定义下载Maven引入报错分析当我们自定义下载Maven并正确配置后，常见的引入报错主要有以下几种： 1. 标签错误如果我们在pom.xml文件中的标签内书写依赖声明不规范，如缺少groupId、artifactId、version等属性，Maven会在编译阶段抛出异常。示例： xml example-dependency 正确写法： xml com.example example-dependency 1.0.0 2. 依赖版本冲突当两个或多个模块引用了同一个依赖的不同版本，导致版本冲突时，Maven无法确定使用哪个版本，从而引发依赖冲突。示例： xml ... org.slf4j slf4j-api 1.7.30 ... org.slf4j slf4j-api 2.0.0 解决方案：统一各模块对同一依赖使用的版本，或者利用Maven的dependencyManagement或dependencyResolutionProblemAggregator插件来处理。五、总结与反思面对自定义下载Maven引入报错问题，我们需要仔细排查并理解依赖声明、配置设置、版本管理等方面可能存在的问题。有时候，这不仅仅是在考验我们的编程功夫，更是实实在在地磨炼我们搞定问题、排解代码bug的硬实力。想要真正地玩转Maven，让这个家伙在项目构建这条道路上为你效力到极致，那就必须不断动手实践、积极摸索，没别的捷径可走。所以，请勇敢地面对报错，学会从中吸取教训，相信每一个Maven新手最终都能成为真正的专家！

2024-02-05 11:45:22

心灵驿站_t

SeaTunnel

数据库容量预警：监控MySQL表大小并发送邮件告警

...洋里爆炸。我最近就在处理这个问题，感觉就像是在跟时间赛跑。咱们不急，一步步来，慢慢分析，看看怎么用Apache SeaTunnel（以前叫Dlink）搞定这个难题。 2. 数据库容量预警的重要性首先，我们得明白为什么数据库容量预警这么重要。想象一下，如果你的数据库突然撑破了天花板，那可不只是系统要罢工了，搞不好你辛辛苦苦存的东西都会打水漂呢！要是真摊上这事，那你可有的忙了，不仅要拼命恢复数据，还得应付客户和老板的一堆问题。所以说，有个靠谱的预警系统能在数据库快要爆满时提前通知你，这真是太关键了。 3. 当前预警机制的不足目前，很多公司依赖手动监控或者一些基本的告警工具。但是这些方法往往不够及时和准确。比如说吧，我以前就碰到过这么一回。有个表格的数据量突然像坐火箭一样猛增，结果我们没收到任何预警，存储空间就被塞得满满当当的了。结果就是，系统崩溃，用户投诉，还得加班加点解决问题。这让我意识到，必须找到一种更智能、更自动化的解决方案。 4. 使用SeaTunnel进行数据库容量预警 4. 1. 安装与配置要开始使用SeaTunnel进行数据库容量预警，首先需要安装并配置好环境。假设你已经安装好了Java环境和Maven，那么接下来就是安装SeaTunnel本身。你可以从GitHub上克隆项目，然后按照官方文档中的步骤进行编译和打包。 bash git clone https://github.com/apache/incubator-seatunnel.git cd incubator-seatunnel mvn clean package -DskipTests 接着，你需要配置SeaTunnel的配置文件seatunnel-env.sh，确保环境变量正确设置： bash export SEATUNNEL_HOME=/path/to/seatunnel 4. 2. 创建任务配置文件接下来，我们需要创建一个任务配置文件来定义我们的预警逻辑。比如说，我们要盯着MySQL里某个表的个头，一旦它长得太大，超出了我们定的界限，就赶紧发封邮件提醒我们。我们可以创建一个名为capacity_alert.conf的配置文件： yaml job { name = "DatabaseCapacityAlert" parallelism = 1 sources { mysql_source { type = "jdbc" url = "jdbc:mysql://localhost:3306/mydb" username = "root" password = "password" query = "SELECT table_schema, table_name, data_length + index_length AS total_size FROM information_schema.tables WHERE table_schema = 'mydb' AND table_name = 'my_table'" } } sinks { mail_sink { type = "mail" host = "smtp.example.com" port = 587 username = "alert@example.com" password = "alert_password" from = "alert@example.com" to = "admin@example.com" subject = "Database Capacity Alert" content = """ The database capacity is approaching the threshold. Please take necessary actions. """ } } } 4. 3. 运行任务配置完成后，就可以启动SeaTunnel任务了。你可以通过以下命令运行： bash bin/start-seatunnel.sh --config conf/capacity_alert.conf 4. 4. 监控与调整运行后，你可以通过日志查看任务的状态和输出。如果一切正常，你应该会看到类似如下的输出： [INFO] DatabaseCapacityAlert - Running task with parallelism 1... [INFO] MailSink - Sending email alert to admin@example.com... [INFO] MailSink - Email sent successfully. 如果发现任何问题，比如邮件发送失败，可以检查配置文件中的SMTP设置是否正确，或者尝试重新运行任务。 5. 总结与展望通过这次实践，我发现SeaTunnel真的非常强大，能够帮助我们构建复杂的ETL流程，包括数据库容量预警这样的高级功能。当然了，这个过程也不是一路畅通的，中间遇到了不少坑，但好在最后都解决了。将来，我打算继续研究怎么把SeaTunnel和其他监控工具连起来，打造出一个更全面、更聪明的预警系统。这样就能更快地发现问题，省去很多麻烦。希望这篇文章对你有所帮助，如果你有任何疑问或建议，欢迎在评论区留言交流！

2025-01-29 16:02:06

月下独酌

转载文章

[转载]java开发操作系统：一个程序向另一个程序伸出的咸猪手

...给系统内核增加了中断处理，于是当应用程序妄图执行特权指令，想要染指内核运行时，中断会把程序强行切断，内核从中断中重新获得CPU的执行权限。虽说恶意用户程序难以攻击内核，但是系统当前还存在一个漏洞，使得恶意程序能取攻击另一个程序，我们看看这个问题到底是怎么实现的。我们先在内核C语言部分做简单修改，把原来的cmd_hlt函数改为cmd_execute_program: nt show_pos = 179;void cmd_execute_program(char file) {io_cli();struct Buffer appBuffer = (struct Buffer)memman_alloc(memman, 16);struct TASK task = task_now();task->pTaskBuffer = appBuffer;file_loadfile(file, appBuffer);struct SEGMENT_DESCRIPTOR gdt =(struct SEGMENT_DESCRIPTOR )get_addr_gdt();//select is multiply of 8, divided by 8 get the original valueint code_seg = 21 + (task->sel - first_task_cons_selector) / 8;//change hereint mem_seg = 30 + (task->sel - first_task_cons_selector) / 8;//22;char p = intToHexStr(mem_seg);showString(shtctl, sht_back, 0, show_pos, COL8_FFFFFF, p); show_pos += 16;set_segmdesc(gdt + code_seg, 0xfffff, (int) appBuffer->pBuffer, 0x409a + 0x60);//new memory char q = (char ) memman_alloc_4k(memman, 641024);appBuffer->pDataSeg = (unsigned char)q;set_segmdesc(gdt + mem_seg, 64 1024 - 1,(int) q ,0x4092 + 0x60);task->tss.esp0 = 0;io_sti();start_app(0, code_seg8,641024, mem_seg8, &(task->tss.esp0));io_cli();memman_free_4k(memman,(unsigned int) appBuffer->pBuffer, appBuffer->length);memman_free_4k(memman, (unsigned int) q, 64 1024);memman_free(memman,(unsigned int)appBuffer, 16);task->pTaskBuffer = 0;io_sti();}void console_task(struct SHEET sheet, int memtotal) {....for(;;) { ....else if (i == KEY_RETURN) {....} else if (strcmp(cmdline, "hlt") == 1) {//change herecmd_execute_program("abc.exe");}....}...} 原来的cmd_hlt函数默认加载并执行软盘中的abc.exe程序，现在我们把cmd_hlt改名为cmd_execute_program，并且函数需要传入一个字符串，用于表明要加载执行的程序名字。在该函数的代码实现中，我们使用showString函数把被加载执行的用户进程数据段所对应的全局描述符号给显示到桌面上，上面代码执行后情况如下：我们看到，在控制台中执行hlt命令后，内核加载了用户进程，同时在控制台下方输出了一个字符串，也就是0x1E,这个数值对应的就是当前运行用户进程其数据段对应的全局描述符号。一旦有这个信息之后，另一个进程就可以有机可乘了。接着我们在本地目录创建一个新文件叫crack.c,其内容如下： void main() {char p = (char)0x123;p[0] = 'c';p[1] = 'r';p[2] = 'a';p[3] = 'c';p[4] = 'k';p[5] = 0;} 它的目的简单，就是针对内存地址0x123处写入字符串”crack”.接着我们修改一下makefile，使得内核编译时，能把crack.c编译成二进制文件： CFLAGS=-fno-stack-protectorckernel : ckernel_u.asm app_u.asm crack_u.asm cp ckernel_u.asm win_sheet.h win_sheet.c mem_util.h mem_util.c write_vga_desktop.c timer.c timer.h global_define.h global_define.c multi_task.c multi_task.h app_u.asm app.c crack_u.asm crack.c makefile '/media/psf/Home/Documents/操作系统/文档/19/OS-kernel-win-sheet/'ckernel_u.asm : ckernel.o....crack_u.asm : crack.o./objconv -fnasm crack.o crack_u.asmcrack.o : crack.cgcc -m32 -fno-stack-protector -fno-asynchronous-unwind-tables -s -c -o crack.o crack.c 然后我们在本地目录下，把api_call.asm拷贝一份，并命名为crack_call.asm,后者内容与前者完全相同，只不过稍微有那么一点点改变，例如： BITS 32mov AX, 30 8mov DS, axcall mainmov edx, 4 ;返回内核int 02Dh.... 这里需要注意，语句： mov AX, 30 8mov DS, ax 其中30对应的就是前面显示的0x1E，这两句汇编的作用是，把程序crack的数据段设置成下标为30的全局描述符所指向的内存段一致。这就意味着crack进程所使用的数据段就跟hlt启动的进程所使用的数据段一致了！于是在crack.c中，它对内存地址为0x123的地方写入字符串”crack”,那就意味着对hlt加载用户进程的内存空间写入对应字符串！完成上面代码后，我们在java项目中，增加代码，一是用来编译crack进程，而是把crack代码写入虚拟磁盘。在OperatingSystem.java中，将代码做如下添加： public void makeFllopy() {writeFileToFloppy("kernel.bat", false, 1, 1);....header = new FileHeader();header.setFileName("crack");header.setFileExt("exe");file = new File("crack.bat");in = null;try {in = new FileInputStream(file);long len = file.length();int count = 0;while (count < file.length()) {bbuf[count] = (byte) in.read();count++;}in.close();}catch(IOException e) {e.printStackTrace();return;}header.setFileContent(bbuf);fileSys.addHeader(header);....}public static void main(String[] args) {CKernelAsmPrecessor kernelPrecessor = new CKernelAsmPrecessor();kernelPrecessor.process();kernelPrecessor.createKernelBinary();CKernelAsmPrecessor appPrecessor = new CKernelAsmPrecessor("hlt.bat", "app_u.asm", "app.asm", "api_call.asm");appPrecessor.process();appPrecessor.createKernelBinary();CKernelAsmPrecessor crackPrecessor = new CKernelAsmPrecessor("crack.bat", "crack_u.asm", "crack.asm", "crack_call.asm");crackPrecessor.process();crackPrecessor.createKernelBinary();OperatingSystem op = new OperatingSystem("boot.bat");op.makeFllopy();} 在main函数中，我们把crack.c及其附属汇编文件结合在一起，编译成二进制文件crack.bat，在makeFllopy中，我们把编译后的crack.bat二进制数据读入，并把它写入到虚拟磁盘中，当系统运行起来后，可以把crack.bat二进制内容作为进程加载执行。完成上面代码后，回到内核的C语言部分，也就是write_vga_desktop.c做一些修改，在kernel_api函数中，修改如下： int kernel_api(int edi, int esi, int ebp, int esp,int ebx, int edx, int ecx, int eax) {....else if (edx == 14) {sheet_free(shtctl, (struct SHEET)ebx);//change herecons_putstr((char)(task->pTaskBuffer->pDataSeg + 0x123));}....}void console_task(struct SHEET sheet, int memtotal) {....for(;;) {....else if (i == KEY_RETURN) {....else if (strcmp(cmdline, "crack") == 1) {cmd_execute_program("crack.exe");}....}....} 在kernel_api中，if(edx == 14)对应的api调用是api_closewin，也就是当用户进程关闭窗口时，我们把进程数据偏移0x123处的数据当做字符串打印到控制台窗口上，在console_task控制台进程主函数中，我们增加了对命令crack的响应，当用户在控制台上输入命令”crack”时，将crack代码加载到内核中运行。上面代码完成后，编译内核，然后用虚拟机将内核加载，系统启动后，我们现在一个控制台中输入hlt，先启动用户进程。然后点击”shift + w”,启动另一个控制台窗口，在其中输入crack，运行crack程序：接着把点击tab键，把焦点恢复到窗口task_a，然后用鼠标点击运行hlt命令的窗口，把输入焦点切换到该控制台，然后再次点击tab键，把执行权限提交给运行hlt命令的控制台，此时点击回车，介绍用户进程启动的窗口，结果情况如下：此时我们可以看到，运行hlt命令，执行用户进程的控制台窗口居然输出了字符串”crack”,而这个字符串正是crack.c在执行时，写入地址0x123的字符串。这就意味着一个恶意进程成功修改了另一个进程的内存数据，也相当于一个流氓程序把一只咸猪手伸到其他用户进程的裙底，蹂躏一番后留下了猥琐的证据。那么如何防范恶意进程对其他程序的非法入侵呢，这就得使用CPU提供的LDT机制，也就是局部描述符表，该机制的使用，我们将在下一节详细讲解。更详细的讲解和代码演示调试，请参看视频：更详细的讲解和代码调试演示过程，请参看视频 Linux kernel Hacker, 从零构建自己的内核更多技术信息，包括操作系统，编译器，面试算法，机器学习，人工智能，请关照我的公众号：本篇文章为转载内容。原文链接：https://blog.csdn.net/tyler_download/article/details/78731905。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-03-14 19:08:07

254

转载

转载文章

[转载]Postgres-XL集群软件介绍及搭建

...，具有足够的灵活性来处理不同的数据库任务。 Postgres-XL功能特性开放源代码：（源协议使用宽松的“Mozilla Public License”许可，允许将开源代码与闭源代码混在一起使用。）完全的ACID支持可横向扩展的关系型数据库（RDBMS）支持OLAP应用，采用MPP（Massively Parallel Processing：大规模并行处理系统）架构模式支持OLTP应用，读写性能可扩展集群级别的ACID特性多租户安全也可被用作分布式Key-Value存储事务处理与数据分析处理混合型数据库支持丰富的SQL语句类型，比如：关联子查询支持绝大部分PostgreSQL的SQL语句分布式多版本并发控制（MVCC：Multi-version Concurrency Control）支持JSON和XML格式 Postgres-XL缺少的功能内建的高可用机制使用外部机制实现高可能，如：Corosync/Pacemaker 有未来功能提升的空间增加节点/重新分片数据（re-shard）的简便性数据重分布（redistribution）期间会锁表可采用预分片（pre-shard）方式解决，在同台物理服务器上建立多个数据节点，每个节点存储一个数据分片。数据重分布时，将一些数据节点迁出即可某些外键、唯一性约束功能 Postgres-XL架构 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-M9lFuEIP-1640133702200)(./assets/postgre-xl.jpg)] 基于开源项目Postgres-XC XL增加了MPP，允许数据节点间直接通讯，交换复杂跨节点关联查询相关数据信息，减少协调器负载。多个协调器（Coordinator）应用程序的数据库连入点分析查询语句，生成执行计划多个数据节点（DataNode）实际的数据存储数据自动打散分布到集群中各数据节点本地执行查询一个查询在所有相关节点上并行查询全局事务管理器（GTM：Global Transaction Manager）提供事务间一致性视图部署GTM Proxy实例，以提高性能 Postgre-XL主要组件 GTM (Global Transaction Manager) - 全局事务管理器 GTM是Postgres-XL的一个关键组件，用于提供一致的事务管理和元组可见性控制。 GTM Standby GTM的备节点，在pgxc,pgxl中，GTM控制所有的全局事务分配，如果出现问题，就会导致整个集群不可用，为了增加可用性，增加该备用节点。当GTM出现问题时，GTM Standby可以升级为GTM，保证集群正常工作。 GTM-Proxy GTM需要与所有的Coordinators通信，为了降低压力，可以在每个Coordinator机器上部署一个GTM-Proxy。 Coordinator --协调器协调器是应用程序到数据库的接口。它的作用类似于传统的PostgreSQL后台进程，但是协调器不存储任何实际数据。实际数据由数据节点存储。协调器接收SQL语句，根据需要获取全局事务Id和全局快照，确定涉及哪些数据节点，并要求它们执行(部分)语句。当向数据节点发出语句时，它与GXID和全局快照相关联，以便多版本并发控制(MVCC)属性扩展到集群范围。 Datanode --数据节点用于实际存储数据。表可以分布在各个数据节点之间，也可以复制到所有数据节点。数据节点没有整个数据库的全局视图，它只负责本地存储的数据。接下来，协调器将检查传入语句，并制定子计划。然后，根据需要将这些数据连同GXID和全局快照一起传输到涉及的每个数据节点。数据节点可以在不同的会话中接收来自各个协调器的请求。但是，由于每个事务都是惟一标识的，并且与一致的(全局)快照相关联，所以每个数据节点都可以在其事务和快照上下文中正确执行。 Postgres-XL继承了PostgreSQL Postgres-XL是PostgreSQL的扩展并继承了其很多特性：复杂查询外键触发器视图事务 MVCC(多版本控制) 此外，类似于PostgreSQL，用户可以通过多种方式扩展Postgres-XL，例如添加新的数据类型函数操作聚合函数索引类型过程语言安装环境说明由于资源有限，gtm一台、另外两台身兼数职。主机名 IP 角色端口 nodename 数据目录 gtm 192.168.20.132 GTM 6666 gtm /nodes/gtm 协调器 5432 coord1 /nodes/coordinator xl1 192.168.20.133 数据节点 5433 node1 /nodes/pgdata gtm代理 6666 gtmpoxy01 /nodes/gtm_pxy1 协调器 5432 coord2 /nodes/coordinator xl2 192.168.20.134 数据节点 5433 node2 /nodes/pgdata gtm代理 6666 gtmpoxy02 /nodes/gtm_pxy2 要求 GNU make版本 3.8及以上版本 [root@pg ~] make --versionGNU Make 3.82Built for x86_64-redhat-linux-gnuCopyright (C) 2010 Free Software Foundation, Inc.License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>This is free software: you are free to change and redistribute it.There is NO WARRANTY, to the extent permitted by law. 需安装GCC包需安装tar包用于解压缩文件默认需要GNU Readline library 其作用是可以让psql命令行记住执行过的命令，并且可以通过键盘上下键切换命令。但是可以通过--without-readline禁用这个特性，或者可以指定--withlibedit-preferred选项来使用libedit 默认使用zlib压缩库可通过--without-zlib选项来禁用配置hosts 所有主机上都配置 [root@xl2 11] cat /etc/hosts127.0.0.1 localhost192.168.20.132 gtm192.168.20.133 xl1192.168.20.134 xl2 关闭防火墙、Selinux 所有主机都执行关闭防火墙： [root@gtm ~] systemctl stop firewalld.service[root@gtm ~] systemctl disable firewalld.service selinux设置: [root@gtm ~]vim /etc/selinux/config 设置SELINUX=disabled，保存退出。 This file controls the state of SELinux on the system. SELINUX= can take one of these three values: enforcing - SELinux security policy is enforced. permissive - SELinux prints warnings instead of enforcing. disabled - No SELinux policy is loaded.SELINUX=disabled SELINUXTYPE= can take one of three two values: targeted - Targeted processes are protected, minimum - Modification of targeted policy. Only selected processes are protected. mls - Multi Level Security protection. 安装依赖包所有主机上都执行 yum install -y flex bison readline-devel zlib-devel openjade docbook-style-dsssl gcc 创建用户所有主机上都执行 [root@gtm ~] useradd postgres[root@gtm ~] passwd postgres[root@gtm ~] su - postgres[root@gtm ~] mkdir ~/.ssh[root@gtm ~] chmod 700 ~/.ssh 配置SSH免密登录仅仅在gtm节点配置如下操作： [root@gtm ~] su - postgres[postgres@gtm ~] ssh-keygen -t rsa[postgres@gtm ~] cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys[postgres@gtm ~] chmod 600 ~/.ssh/authorized_keys 将刚生成的认证文件拷贝到xl1到xl2中，使得gtm节点可以免密码登录xl1~xl2的任意一个节点： [postgres@gtm ~] scp ~/.ssh/authorized_keys postgres@xl1:~/.ssh/[postgres@gtm ~] scp ~/.ssh/authorized_keys postgres@xl2:~/.ssh/ 对所有提示都不要输入，直接enter下一步。直到最后，因为第一次要求输入目标机器的用户密码，输入即可。下载源码下载地址：https://www.postgres-xl.org/download/ [root@slave ~] ll postgres-xl-10r1.1.tar.gz-rw-r--r-- 1 root root 28121666 May 30 05:21 postgres-xl-10r1.1.tar.gz 编译、安装Postgres-XL 所有节点都安装，编译需要一点时间，最好同时进行编译。 [root@slave ~] tar xvf postgres-xl-10r1.1.tar.gz[root@slave ~] ./configure --prefix=/home/postgres/pgxl/[root@slave ~] make[root@slave ~] make install[root@slave ~] cd contrib/ --安装必要的工具,在gtm节点上安装即可[root@slave ~] make[root@slave ~] make install 配置环境变量所有节点都要配置进入postgres用户，修改其环境变量，开始编辑 [root@gtm ~]su - postgres[postgres@gtm ~]vi .bashrc --不是.bash_profile 在打开的文件末尾，新增如下变量配置： export PGHOME=/home/postgres/pgxlexport LD_LIBRARY_PATH=$PGHOME/lib:$LD_LIBRARY_PATHexport PATH=$PGHOME/bin:$PATH 按住esc，然后输入:wq!保存退出。输入以下命令对更改重启生效。 [postgres@gtm ~] source .bashrc --不是.bash_profile 输入以下语句，如果输出变量结果，代表生效 [postgres@gtm ~] echo $PGHOME 应该输出/home/postgres/pgxl代表生效配置集群生成pgxc_ctl.conf配置文件 [postgres@gtm ~] pgxc_ctl prepare/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxl/pgxc_ctl/pgxc_ctl_bash.ERROR: File "/home/postgres/pgxl/pgxc_ctl/pgxc_ctl.conf" not found or not a regular file. No such file or directoryInstalling pgxc_ctl_bash script as /home/postgres/pgxl/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxl/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxl/pgxc_ctl --configuration /home/postgres/pgxl/pgxc_ctl/pgxc_ctl.confFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxl/pgxc_ctl 配置pgxc_ctl.conf 新建/home/postgres/pgxc_ctl/pgxc_ctl.conf文件，编辑如下：对着模板文件一个一个修改，否则会造成初始化过程出现各种神奇问题。 pgxcInstallDir=$PGHOMEpgxlDATA=$PGHOME/data pgxcOwner=postgres---- GTM Master -----------------------------------------gtmName=gtmgtmMasterServer=gtmgtmMasterPort=6666gtmMasterDir=$pgxlDATA/nodes/gtmgtmSlave=y Specify y if you configure GTM Slave. Otherwise, GTM slave will not be configured and all the following variables will be reset.gtmSlaveName=gtmSlavegtmSlaveServer=gtm value none means GTM slave is not available. Give none if you don't configure GTM Slave.gtmSlavePort=20001 Not used if you don't configure GTM slave.gtmSlaveDir=$pgxlDATA/nodes/gtmSlave Not used if you don't configure GTM slave.---- GTM-Proxy Master -------gtmProxyDir=$pgxlDATA/nodes/gtm_proxygtmProxy=y gtmProxyNames=(gtm_pxy1 gtm_pxy2) gtmProxyServers=(xl1 xl2) gtmProxyPorts=(6666 6666) gtmProxyDirs=($gtmProxyDir $gtmProxyDir) ---- Coordinators ---------coordMasterDir=$pgxlDATA/nodes/coordcoordNames=(coord1 coord2) coordPorts=(5432 5432) poolerPorts=(6667 6667) coordPgHbaEntries=(0.0.0.0/0)coordMasterServers=(xl1 xl2) coordMasterDirs=($coordMasterDir $coordMasterDir)coordMaxWALsernder=0 没设置备份节点，设置为0coordMaxWALSenders=($coordMaxWALsernder $coordMaxWALsernder) 数量保持和coordMasterServers一致coordSlave=n---- Datanodes ----------datanodeMasterDir=$pgxlDATA/nodes/dn_masterprimaryDatanode=xl1 主数据节点datanodeNames=(node1 node2)datanodePorts=(5433 5433) datanodePoolerPorts=(6668 6668) datanodePgHbaEntries=(0.0.0.0/0)datanodeMasterServers=(xl1 xl2)datanodeMasterDirs=($datanodeMasterDir $datanodeMasterDir)datanodeMaxWalSender=4datanodeMaxWALSenders=($datanodeMaxWalSender $datanodeMaxWalSender) 集群初始化，启动，停止初始化 pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf init all 输出结果： /bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlStopping all the coordinator masters.Stopping coordinator master coord1.Stopping coordinator master coord2.pg_ctl: directory "/home/postgres/pgxc/nodes/coord/coord1" does not existpg_ctl: directory "/home/postgres/pgxc/nodes/coord/coord2" does not existDone.Stopping all the datanode masters.Stopping datanode master datanode1.Stopping datanode master datanode2.pg_ctl: PID file "/home/postgres/pgxc/nodes/datanode/datanode1/postmaster.pid" does not existIs server running?Done.Stop GTM masterwaiting for server to shut down.... doneserver stopped[postgres@gtm ~]$ echo $PGHOME/home/postgres/pgxl[postgres@gtm ~]$ ll /home/postgres/pgxl/pgxc/nodes/gtm/gtm.^C[postgres@gtm ~]$ pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf init all/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlInitialize GTM masterERROR: target directory (/home/postgres/pgxc/nodes/gtm) exists and not empty. Skip GTM initilializationDone.Start GTM masterserver startingInitialize all the coordinator masters.Initialize coordinator master coord1.ERROR: target coordinator master coord1 is running now. Skip initilialization.Initialize coordinator master coord2.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/coord/coord2 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.Done.Starting coordinator master.Starting coordinator master coord1ERROR: target coordinator master coord1 is already running now. Skip initialization.Starting coordinator master coord22019-05-30 21:09:25.562 EDT [2148] LOG: listening on IPv4 address "0.0.0.0", port 54322019-05-30 21:09:25.562 EDT [2148] LOG: listening on IPv6 address "::", port 54322019-05-30 21:09:25.563 EDT [2148] LOG: listening on Unix socket "/tmp/.s.PGSQL.5432"2019-05-30 21:09:25.601 EDT [2149] LOG: database system was shut down at 2019-05-30 21:09:22 EDT2019-05-30 21:09:25.605 EDT [2148] LOG: database system is ready to accept connections2019-05-30 21:09:25.612 EDT [2156] LOG: cluster monitor startedDone.Initialize all the datanode masters.Initialize the datanode master datanode1.Initialize the datanode master datanode2.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/datanode/datanode1 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/datanode/datanode2 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.Done.Starting all the datanode masters.Starting datanode master datanode1.WARNING: datanode master datanode1 is running now. Skipping.Starting datanode master datanode2.2019-05-30 21:09:33.352 EDT [2404] LOG: listening on IPv4 address "0.0.0.0", port 154322019-05-30 21:09:33.352 EDT [2404] LOG: listening on IPv6 address "::", port 154322019-05-30 21:09:33.355 EDT [2404] LOG: listening on Unix socket "/tmp/.s.PGSQL.15432"2019-05-30 21:09:33.392 EDT [2404] LOG: redirecting log output to logging collector process2019-05-30 21:09:33.392 EDT [2404] HINT: Future log output will appear in directory "pg_log".Done.psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"Done.psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"Done.[postgres@gtm ~]$ pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf stop all/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlStopping all the coordinator masters.Stopping coordinator master coord1.Stopping coordinator master coord2.pg_ctl: directory "/home/postgres/pgxc/nodes/coord/coord1" does not existDone.Stopping all the datanode masters.Stopping datanode master datanode1.Stopping datanode master datanode2.pg_ctl: PID file "/home/postgres/pgxc/nodes/datanode/datanode1/postmaster.pid" does not existIs server running?Done.Stop GTM masterwaiting for server to shut down.... doneserver stopped[postgres@gtm ~]$ pgxc_ctl/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlPGXC monitor allNot running: gtm masterRunning: coordinator master coord1Not running: coordinator master coord2Running: datanode master datanode1Not running: datanode master datanode2PGXC stop coordinator master coord1Stopping coordinator master coord1.pg_ctl: directory "/home/postgres/pgxc/nodes/coord/coord1" does not existDone.PGXC stop datanode master datanode1Stopping datanode master datanode1.pg_ctl: PID file "/home/postgres/pgxc/nodes/datanode/datanode1/postmaster.pid" does not existIs server running?Done.PGXC monitor allNot running: gtm masterRunning: coordinator master coord1Not running: coordinator master coord2Running: datanode master datanode1Not running: datanode master datanode2PGXC monitor allNot running: gtm masterNot running: coordinator master coord1Not running: coordinator master coord2Not running: datanode master datanode1Not running: datanode master datanode2PGXC exit[postgres@gtm ~]$ pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf init all/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlInitialize GTM masterERROR: target directory (/home/postgres/pgxc/nodes/gtm) exists and not empty. Skip GTM initilializationDone.Start GTM masterserver startingInitialize all the coordinator masters.Initialize coordinator master coord1.Initialize coordinator master coord2.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/coord/coord1 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/coord/coord2 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.Done.Starting coordinator master.Starting coordinator master coord1Starting coordinator master coord22019-05-30 21:13:03.998 EDT [25137] LOG: listening on IPv4 address "0.0.0.0", port 54322019-05-30 21:13:03.998 EDT [25137] LOG: listening on IPv6 address "::", port 54322019-05-30 21:13:04.000 EDT [25137] LOG: listening on Unix socket "/tmp/.s.PGSQL.5432"2019-05-30 21:13:04.038 EDT [25138] LOG: database system was shut down at 2019-05-30 21:13:00 EDT2019-05-30 21:13:04.042 EDT [25137] LOG: database system is ready to accept connections2019-05-30 21:13:04.049 EDT [25145] LOG: cluster monitor started2019-05-30 21:13:04.020 EDT [2730] LOG: listening on IPv4 address "0.0.0.0", port 54322019-05-30 21:13:04.020 EDT [2730] LOG: listening on IPv6 address "::", port 54322019-05-30 21:13:04.021 EDT [2730] LOG: listening on Unix socket "/tmp/.s.PGSQL.5432"2019-05-30 21:13:04.057 EDT [2731] LOG: database system was shut down at 2019-05-30 21:13:00 EDT2019-05-30 21:13:04.061 EDT [2730] LOG: database system is ready to accept connections2019-05-30 21:13:04.062 EDT [2738] LOG: cluster monitor startedDone.Initialize all the datanode masters.Initialize the datanode master datanode1.Initialize the datanode master datanode2.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/datanode/datanode1 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/datanode/datanode2 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.Done.Starting all the datanode masters.Starting datanode master datanode1.Starting datanode master datanode2.2019-05-30 21:13:12.077 EDT [25392] LOG: listening on IPv4 address "0.0.0.0", port 154322019-05-30 21:13:12.077 EDT [25392] LOG: listening on IPv6 address "::", port 154322019-05-30 21:13:12.079 EDT [25392] LOG: listening on Unix socket "/tmp/.s.PGSQL.15432"2019-05-30 21:13:12.114 EDT [25392] LOG: redirecting log output to logging collector process2019-05-30 21:13:12.114 EDT [25392] HINT: Future log output will appear in directory "pg_log".2019-05-30 21:13:12.079 EDT [2985] LOG: listening on IPv4 address "0.0.0.0", port 154322019-05-30 21:13:12.079 EDT [2985] LOG: listening on IPv6 address "::", port 154322019-05-30 21:13:12.081 EDT [2985] LOG: listening on Unix socket "/tmp/.s.PGSQL.15432"2019-05-30 21:13:12.117 EDT [2985] LOG: redirecting log output to logging collector process2019-05-30 21:13:12.117 EDT [2985] HINT: Future log output will appear in directory "pg_log".Done.psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"Done.psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"Done. 启动 pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf start all 关闭 pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf stop all 查看集群状态 [postgres@gtm ~]$ pgxc_ctl monitor all/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlRunning: gtm masterRunning: coordinator master coord1Running: coordinator master coord2Running: datanode master datanode1Running: datanode master datanode2 配置集群信息分别在数据节点、协调器节点上分别执行以下命令：注：本节点只执行修改操作即可(alert node)，其他节点执行创建命令(create node)。因为本节点已经包含本节点的信息。 create node coord1 with (type=coordinator,host=xl1, port=5432);create node coord2 with (type=coordinator,host=xl2, port=5432);alter node coord1 with (type=coordinator,host=xl1, port=5432);alter node coord2 with (type=coordinator,host=xl2, port=5432);create node datanode1 with (type=datanode, host=xl1,port=15432,primary=true,PREFERRED);create node datanode2 with (type=datanode, host=xl2,port=15432);alter node datanode1 with (type=datanode, host=xl1,port=15432,primary=true,PREFERRED);alter node datanode2 with (type=datanode, host=xl2,port=15432);select pgxc_pool_reload(); 分别登陆数据节点、协调器节点验证 postgres= select from pgxc_node;node_name | node_type | node_port | node_host | nodeis_primary | nodeis_preferred | node_id-----------+-----------+-----------+-----------+----------------+------------------+-------------coord1 | C | 5432 | xl1 | f | f | 1885696643coord2 | C | 5432 | xl2 | f | f | -1197102633datanode2 | D | 15432 | xl2 | f | f | -905831925datanode1 | D | 15432 | xl1 | t | f | 888802358(4 rows) 测试插入数据在数据节点1，执行相关操作。通过协调器端口登录PG [postgres@xl1 ~]$ psql -p 5432psql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= create database lei;CREATE DATABASEpostgres= \c lei;You are now connected to database "lei" as user "postgres".lei= create table test1(id int,name text);CREATE TABLElei= insert into test1(id,name) select generate_series(1,8),'测试';INSERT 0 8lei= select from test1;id | name----+------1 | 测试2 | 测试5 | 测试6 | 测试8 | 测试3 | 测试4 | 测试7 | 测试(8 rows) 注：默认创建的表为分布式表，也就是每个数据节点值存储表的部分数据。关于表类型具体说明，下面有说明。通过15432端口登录数据节点，查看数据有5条数据 [postgres@xl1 ~]$ psql -p 15432psql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= \c lei;You are now connected to database "lei" as user "postgres".lei= select from test1;id | name----+------1 | 测试2 | 测试5 | 测试6 | 测试8 | 测试(5 rows) 登录到节点2，查看数据有3条数据 [postgres@xl2 ~]$ psql -p15432psql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= \c lei;You are now connected to database "lei" as user "postgres".lei= select from test1;id | name----+------3 | 测试4 | 测试7 | 测试(3 rows) 两个节点的数据加起来整个8条，没有问题。至此Postgre-XL集群搭建完成。创建数据库、表时可能会出现以下错误： ERROR: Failed to get pooled connections 是因为pg_hba.conf配置不对，所有节点加上host all all 192.168.20.0/0 trust并重启集群即可。 ERROR: No Datanode defined in cluster 首先确认是否创建了数据节点，也就是create node相关的命令。如果创建了则执行select pgxc_pool_reload();使其生效即可。集群管理与应用表类型说明 REPLICATION表：各个datanode节点中，表的数据完全相同，也就是说，插入数据时，会分别在每个datanode节点插入相同数据。读数据时，只需要读任意一个datanode节点上的数据。建表语法： CREATE TABLE repltab (col1 int, col2 int) DISTRIBUTE BY REPLICATION; DISTRIBUTE ：会将插入的数据，按照拆分规则，分配到不同的datanode节点中存储，也就是sharding技术。每个datanode节点只保存了部分数据，通过coordinate节点可以查询完整的数据视图。 CREATE TABLE disttab(col1 int, col2 int, col3 text) DISTRIBUTE BY HASH(col1); 模拟数据插入任意登录一个coordinate节点进行建表操作 [postgres@gtm ~]$ psql -h xl1 -p 5432 -U postgrespostgres= INSERT INTO disttab SELECT generate_series(1,100), generate_series(101, 200), 'foo';INSERT 0 100postgres= INSERT INTO repltab SELECT generate_series(1,100), generate_series(101, 200);INSERT 0 100 查看数据分布结果： DISTRIBUTE表分布结果 postgres= SELECT xc_node_id, count() FROM disttab GROUP BY xc_node_id;xc_node_id | count ------------+-------1148549230 | 42-927910690 | 58(2 rows) REPLICATION表分布结果 postgres= SELECT count() FROM repltab;count -------100(1 row) 查看另一个datanode2中repltab表结果 [postgres@datanode2 pgxl9.5]$ psql -p 15432psql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= SELECT count() FROM repltab;count -------100(1 row) 结论：REPLICATION表中，datanode1,datanode2中表是全部数据，一模一样。而DISTRIBUTE表，数据散落近乎平均分配到了datanode1,datanode2节点中。新增数据节点与数据重分布在线新增节点、并重新分布数据。新增datanode节点在gtm集群管理节点上执行pgxc_ctl命令 [postgres@gtm ~]$ pgxc_ctl/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.confFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlPGXC 在服务器xl3上，新增一个master角色的datanode节点，名称是datanode3 端口号暂定5430，pool master暂定6669 ，指定好数据目录位置，从两个节点升级到3个节点，之后要写3个none none应该是datanodeSpecificExtraConfig或者datanodeSpecificExtraPgHba配置PGXC add datanode master datanode3 xl3 15432 6671 /home/postgres/pgxc/nodes/datanode/datanode3 none none none 等待新增完成后，查询集群节点状态： postgres= select from pgxc_node;node_name | node_type | node_port | node_host | nodeis_primary | nodeis_preferred | node_id-----------+-----------+-----------+-----------+----------------+------------------+-------------datanode1 | D | 15432 | xl1 | t | f | 888802358datanode2 | D | 15432 | xl2 | f | f | -905831925datanode3 | D | 15432 | xl3 | f | f | -705831925coord1 | C | 5432 | xl1 | f | f | 1885696643coord2 | C | 5432 | xl2 | f | f | -1197102633(4 rows) 节点新增完毕数据重新分布由于新增节点后无法自动完成数据重新分布，需要手动操作。 DISTRIBUTE表分布在了node1,node2节点上，如下： postgres= SELECT xc_node_id, count() FROM disttab GROUP BY xc_node_id;xc_node_id | count ------------+-------1148549230 | 42-927910690 | 58(2 rows) 新增一个节点后，将sharding表数据重新分配到三个节点上，将repl表复制到新节点重分布sharding表postgres= ALTER TABLE disttab ADD NODE (datanode3);ALTER TABLE 复制数据到新节点postgres= ALTER TABLE repltab ADD NODE (datanode3);ALTER TABLE 查看新的数据分布： postgres= SELECT xc_node_id, count() FROM disttab GROUP BY xc_node_id;xc_node_id | count ------------+--------700122826 | 36-927910690 | 321148549230 | 32(3 rows) 登录datanode3(新增的时候，放在了xl3服务器上，端口15432)节点查看数据： [postgres@gtm ~]$ psql -h xl3 -p 15432 -U postgrespsql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= select count() from repltab;count -------100(1 row) 很明显,通过 ALTER TABLE tt ADD NODE (dn)命令，可以将DISTRIBUTE表数据重新分布到新节点，重分布过程中会中断所有事务。可以将REPLICATION表数据复制到新节点。从datanode节点中回收数据 postgres= ALTER TABLE disttab DELETE NODE (datanode3);ALTER TABLEpostgres= ALTER TABLE repltab DELETE NODE (datanode3);ALTER TABLE 删除数据节点 Postgresql-XL并没有检查将被删除的datanode节点是否有replicated/distributed表的数据，为了数据安全，在删除之前需要检查下被删除节点上的数据，有数据的话，要回收掉分配到其他节点，然后才能安全删除。删除数据节点分为四步骤： 1.查询要删除节点dn3的oid postgres= SELECT oid, FROM pgxc_node;oid | node_name | node_type | node_port | node_host | nodeis_primary | nodeis_preferred | node_id -------+-----------+-----------+-----------+-----------+----------------+------------------+-------------11819 | coord1 | C | 5432 | datanode1 | f | f | 188569664316384 | coord2 | C | 5432 | datanode2 | f | f | -119710263316385 | node1 | D | 5433 | datanode1 | f | t | 114854923016386 | node2 | D | 5433 | datanode2 | f | f | -92791069016397 | dn3 | D | 5430 | datanode1 | f | f | -700122826(5 rows) 2.查询dn3对应的oid中是否有数据 testdb= SELECT FROM pgxc_class WHERE nodeoids::integer[] @> ARRAY[16397];pcrelid | pclocatortype | pcattnum | pchashalgorithm | pchashbuckets | nodeoids ---------+---------------+----------+-----------------+---------------+-------------------16388 | H | 1 | 1 | 4096 | 16397 16385 1638616394 | R | 0 | 0 | 0 | 16397 16385 16386(2 rows) 3.有数据的先回收数据 postgres= ALTER TABLE disttab DELETE NODE (dn3);ALTER TABLEpostgres= ALTER TABLE repltab DELETE NODE (dn3);ALTER TABLEpostgres= SELECT FROM pgxc_class WHERE nodeoids::integer[] @> ARRAY[16397];pcrelid | pclocatortype | pcattnum | pchashalgorithm | pchashbuckets | nodeoids ---------+---------------+----------+-----------------+---------------+----------(0 rows) 4.安全删除dn3 PGXC$ remove datanode master dn3 clean 故障节点FAILOVER 1.查看当前集群状态 [postgres@gtm ~]$ psql -h xl1 -p 5432psql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= SELECT oid, FROM pgxc_node;oid | node_name | node_type | node_port | node_host | nodeis_primary | nodeis_preferred | node_id-------+-----------+-----------+-----------+-----------+----------------+------------------+-------------11739 | coord1 | C | 5432 | xl1 | f | f | 188569664316384 | coord2 | C | 5432 | xl2 | f | f | -119710263316387 | datanode2 | D | 15432 | xl2 | f | f | -90583192516388 | datanode1 | D | 15432 | xl1 | t | t | 888802358(4 rows) 2.模拟datanode1节点故障直接关闭即可 PGXC stop -m immediate datanode master datanode1Stopping datanode master datanode1.Done. 3.测试查询只要查询涉及到datanode1上的数据，那么该查询就会报错 postgres= SELECT xc_node_id, count() FROM disttab GROUP BY xc_node_id;WARNING: failed to receive file descriptors for connectionsERROR: Failed to get pooled connectionsHINT: This may happen because one or more nodes are currently unreachable, either because of node or network failure.Its also possible that the target node may have hit the connection limit or the pooler is configured with low connections.Please check if all nodes are running fine and also review max_connections and max_pool_size configuration parameterspostgres= SELECT xc_node_id, FROM disttab WHERE col1 = 3;xc_node_id | col1 | col2 | col3------------+------+------+-------905831925 | 3 | 103 | foo(1 row) 测试发现，查询范围如果涉及到故障的node1节点，会报错，而查询的数据范围不在node1上的话，仍然可以查询。 4.手动切换要想切换，必须要提前配置slave节点。 PGXC$ failover datanode node1 切换完成后，查询集群 postgres= SELECT oid, FROM pgxc_node;oid | node_name | node_type | node_port | node_host | nodeis_primary | nodeis_preferred | node_id -------+-----------+-----------+-----------+-----------+----------------+------------------+-------------11819 | coord1 | C | 5432 | datanode1 | f | f | 188569664316384 | coord2 | C | 5432 | datanode2 | f | f | -119710263316386 | node2 | D | 15432 | datanode2 | f | f | -92791069016385 | node1 | D | 15433 | datanode2 | f | t | 1148549230(4 rows) 发现datanode1节点的ip和端口都已经替换为配置的slave了。本篇文章为转载内容。原文链接：https://blog.csdn.net/qianglei6077/article/details/94379331。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-01-30 11:09:03

转载

转载文章

[转载]Redis 原理

...ist 中是否有等待处理的消息(比如写一个 while 循环)。为了减少通信的消耗，可以 sleep()一段时间再消费，但是会有两个问题: 1、如果生产者生产消息的速度远大于消费者消费消息的速度，List 会占用大量的内存。 2、消息的实时性降低。 list 还提供了一个阻塞的命令:blpop，没有任何元素可以弹出的时候，连接会被阻塞。基于 list 实现的消息队列，不支持一对多的消息分发。 1.2 发布订阅模式除了通过 list 实现消息队列之外，Redis 还提供了一组命令实现发布/订阅模式。这种方式，发送者和接收者没有直接关联(实现了解耦)，接收者也不需要持续尝试获取消息。 1.2.1 订阅频道首先，我们有很多的频道(channel)，我们也可以把这个频道理解成 queue。订阅者可以订阅一个或者多个频道。消息的发布者(生产者)可以给指定的频道发布消息。只要有消息到达了频道，所有订阅了这个频道的订阅者都会收到这条消息。需要注意的注意是，发出去的消息不会被持久化，因为它已经从队列里面移除了，所以消费者只能收到它开始订阅这个频道之后发布的消息。下面我们来看一下发布订阅命令的使用方法。订阅者订阅频道：可以一次订阅多个，比如这个客户端订阅了 3 个频道。 subscribe channel-1 channel-2 channel-3 发布者可以向指定频道发布消息(并不支持一次向多个频道发送消息): publish channel-1 2673 取消订阅(不能在订阅状态下使用): unsubscribe channel-1 1.2.2 按规则(Pattern)订阅频道支持 ?和占位符。? 代表一个字符，代表 0 个或者多个字符。消费端 1，关注运动信息: psubscribe sport 消费端 2，关注所有新闻: psubscribe news 消费端 3，关注天气新闻: psubscribe news-weather 生产者，发布 3 条信息 publish news-sport yaoming publish news-music jaychou publish news-weather rain 2、Redis 事务 2.1 为什么要用事务我们知道 Redis 的单个命令是原子性的(比如 get set mget mset)，如果涉及到多个命令的时候，需要把多个命令作为一个不可分割的处理序列，就需要用到事务。例如我们之前说的用 setnx 实现分布式锁，我们先 set，然后设置对 key 设置 expire，防止 del 发生异常的时候锁不会被释放，业务处理完了以后再 del，这三个动作我们就希望它们作为一组命令执行。 Redis 的事务有两个特点: 1、按进入队列的顺序执行。 2、不会受到其他客户端的请求的影响。 Redis 的事务涉及到四个命令:multi(开启事务)，exec(执行事务)，discard (取消事务)，watch(监视) 2.2 事务的用法案例场景:tom 和 mic 各有 1000 元，tom 需要向 mic 转账 100 元。tom 的账户余额减少 100 元，mic 的账户余额增加 100 元。通过 multi 的命令开启事务。事务不能嵌套，多个 multi 命令效果一样。 multi 执行后，客户端可以继续向服务器发送任意多条命令，这些命令不会立即被执行，而是被放到一个队列中，当 exec 命令被调用时，所有队列中的命令才会被执行。通过 exec 的命令执行事务。如果没有执行 exec，所有的命令都不会被执行。如果中途不想执行事务了，怎么办? 可以调用 discard 可以清空事务队列，放弃执行。 2.3 watch命令在 Redis 中还提供了一个 watch 命令。它可以为 Redis 事务提供 CAS 乐观锁行为(Check and Set / Compare and Swap)，也就是多个线程更新变量的时候，会跟原值做比较，只有它没有被其他线程修改的情况下，才更新成新的值。我们可以用 watch 监视一个或者多个 key，如果开启事务之后，至少有一个被监视 key 键在 exec 执行之前被修改了，那么整个事务都会被取消(key 提前过期除外)。可以用 unwatch 取消。 2.4 事务可能遇到的问题我们把事务执行遇到的问题分成两种，一种是在执行 exec 之前发生错误，一种是在执行 exec 之后发生错误。 2.4.1 在执行 exec 之前发生错误比如：入队的命令存在语法错误，包括参数数量，参数名等等(编译器错误)。在这种情况下事务会被拒绝执行，也就是队列中所有的命令都不会得到执行。 2.4.2 在执行 exec 之后发生错误比如，类型错误，比如对 String 使用了 Hash 的命令，这是一种运行时错误。最后我们发现 set k1 1 的命令是成功的，也就是在这种发生了运行时异常的情况下，只有错误的命令没有被执行，但是其他命令没有受到影响。这个显然不符合我们对原子性的定义，也就是我们没办法用 Redis 的这种事务机制来实现原子性，保证数据的一致。 3、Lua脚本 Lua/ˈluə/是一种轻量级脚本语言，它是用 C 语言编写的，跟数据的存储过程有点类似。使用 Lua 脚本来执行 Redis 命令的好处: 1、一次发送多个命令，减少网络开销。 2、Redis 会将整个脚本作为一个整体执行，不会被其他请求打断，保持原子性。 3、对于复杂的组合命令，我们可以放在文件中，可以实现程序之间的命令集复用。 3.1 在Redis中调用Lua脚本使用 eval /ɪ’væl/ 方法，语法格式: redis> eval lua-script key-num [key1 key2 key3 ....] [value1 value2 value3 ....] eval代表执行Lua语言的命令。 lua-script代表Lua语言脚本内容。 key-num表示参数中有多少个key，需要注意的是Redis中key是从1开始的，如果没有key的参数，那么写0。 [key1key2key3…]是key作为参数传递给Lua语言，也可以不填，但是需要和key-num的个数对应起来。 [value1 value2 value3 …]这些参数传递给 Lua 语言，它们是可填可不填的。示例，返回一个字符串，0 个参数: redis> eval "return 'Hello World'" 0 3.2 在Lua脚本中调用Redis命令使用 redis.call(command, key [param1, param2…])进行操作。语法格式: redis> eval "redis.call('set',KEYS[1],ARGV[1])" 1 lua-key lua-value command是命令，包括set、get、del等。 key是被操作的键。 param1,param2…代表给key的参数。注意跟 Java 不一样，定义只有形参，调用只有实参。 Lua 是在调用时用 key 表示形参，argv 表示参数值(实参)。 3.2.1 设置键值对在 Redis 中调用 Lua 脚本执行 Redis 命令 redis> eval "return redis.call('set',KEYS[1],ARGV[1])" 1 gupao 2673 redis> get gupao 以上命令等价于 set gupao 2673。在 redis-cli 中直接写 Lua 脚本不够方便，也不能实现编辑和复用，通常我们会把脚本放在文件里面，然后执行这个文件。 3.2.2 在 Redis 中调用 Lua 脚本文件中的命令，操作 Redis 创建 Lua 脚本文件: cd /usr/local/soft/redis5.0.5/src vim gupao.lua Lua 脚本内容，先设置，再取值: cd /usr/local/soft/redis5.0.5/src redis-cli --eval gupao.lua 0 得到返回值: root@localhost src] redis-cli --eval gupao.lua 0 "lua666" 3.2.3 案例:对 IP 进行限流需求：在 X 秒内只能访问 Y 次。设计思路：用 key 记录 IP，用 value 记录访问次数。拿到 IP 以后，对 IP+1。如果是第一次访问，对 key 设置过期时间(参数 1)。否则判断次数，超过限定的次数(参数 2)，返回 0。如果没有超过次数则返回 1。超过时间， key 过期之后，可以再次访问。 KEY[1]是 IP， ARGV[1]是过期时间 X，ARGV[2]是限制访问的次数 Y。 -- ip_limit.lua-- IP 限流，对某个 IP 频率进行限制，6 秒钟访问 10 次 local num=redis.call('incr',KEYS[1])if tonumber(num)==1 thenredis.call('expire',KEYS[1],ARGV[1])return 1elseif tonumber(num)>tonumber(ARGV[2]) thenreturn 0 elsereturn 1 end 6 秒钟内限制访问 10 次，调用测试(连续调用 10 次): ./redis-cli --eval "ip_limit.lua" app:ip:limit:192.168.8.111 , 6 10 app:ip:limit:192.168.8.111 是 key 值，后面是参数值，中间要加上一个空格和一个逗号，再加上一个空格。即:./redis-cli –eval [lua 脚本] [key…]空格,空格[args…] 多个参数之间用一个空格分割。代码:LuaTest.java 3.2.4 缓存 Lua 脚本为什么要缓存在脚本比较长的情况下，如果每次调用脚本都需要把整个脚本传给 Redis 服务端，会产生比较大的网络开销。为了解决这个问题，Redis 提供了 EVALSHA 命令，允许开发者通过脚本内容的 SHA1 摘要来执行脚本。如何缓存 Redis 在执行 script load 命令时会计算脚本的 SHA1 摘要并记录在脚本缓存中，执行 EVALSHA 命令时 Redis 会根据提供的摘要从脚本缓存中查找对应的脚本内容，如果找到了则执行脚本，否则会返回错误:“NOSCRIPT No matching script. Please use EVAL.” 127.0.0.1:6379> script load "return 'Hello World'" "470877a599ac74fbfda41caa908de682c5fc7d4b"127.0.0.1:6379> evalsha "470877a599ac74fbfda41caa908de682c5fc7d4b" 0 "Hello World" 3.2.5 自乘案例 Redis 有 incrby 这样的自增命令，但是没有自乘，比如乘以 3，乘以 5。我们可以写一个自乘的运算，让它乘以后面的参数： local curVal = redis.call("get", KEYS[1]) if curVal == false thencurVal = 0 elsecurVal = tonumber(curVal)endcurVal = curVal tonumber(ARGV[1]) redis.call("set", KEYS[1], curVal) return curVal 把这个脚本变成单行，语句之间使用分号隔开 local curVal = redis.call("get", KEYS[1]); if curVal == false then curVal = 0 else curVal = tonumber(curVal) end; curVal = curVal tonumber(ARGV[1]); redis.call("set", KEYS[1], curVal); return curVal script load ‘命令’ 127.0.0.1:6379> script load 'local curVal = redis.call("get", KEYS[1]); if curVal == false then curVal = 0 else curVal = tonumber(curVal) end; curVal = curVal tonumber(ARGV[1]); redis.call("set", KEYS[1], curVal); return curVal' "be4f93d8a5379e5e5b768a74e77c8a4eb0434441" 调用: 127.0.0.1:6379> set num 2OK127.0.0.1:6379> evalsha be4f93d8a5379e5e5b768a74e77c8a4eb0434441 1 num 6 (integer) 12 3.2.6 脚本超时 Redis 的指令执行本身是单线程的，这个线程还要执行客户端的 Lua 脚本，如果 Lua 脚本执行超时或者陷入了死循环，是不是没有办法为客户端提供服务了呢? eval 'while(true) do end' 0 为了防止某个脚本执行时间过长导致 Redis 无法提供服务，Redis 提供了 lua-time-limit 参数限制脚本的最长运行时间，默认为 5 秒钟。 lua-time-limit 5000(redis.conf 配置文件中) 当脚本运行时间超过这一限制后，Redis 将开始接受其他命令但不会执行(以确保脚本的原子性，因为此时脚本并没有被终止)，而是会返回“BUSY”错误。 Redis 提供了一个 script kill 的命令来中止脚本的执行。新开一个客户端: script kill 如果当前执行的 Lua 脚本对 Redis 的数据进行了修改(SET、DEL 等)，那么通过 script kill 命令是不能终止脚本运行的。 127.0.0.1:6379> eval "redis.call('set','gupao','666') while true do end" 0 因为要保证脚本运行的原子性，如果脚本执行了一部分终止，那就违背了脚本原子性的要求。最终要保证脚本要么都执行，要么都不执行。 127.0.0.1:6379> script kill(error) UNKILLABLE Sorry the script already executed write commands against the dataset. You can either wait the scripttermination or kill the server in a hard way using the SHUTDOWN NOSAVE command. 遇到这种情况，只能通过 shutdown nosave 命令来强行终止 redis。 shutdown nosave 和 shutdown 的区别在于 shutdown nosave 不会进行持久化操作，意味着发生在上一次快照后的数据库修改都会丢失。 4、Redis 为什么这么快? 4.1 Redis到底有多快？根据官方的数据，Redis 的 QPS 可以达到 10 万左右(每秒请求数)。 4.2 Redis为什么这么快? 总结:1)纯内存结构、2)单线程、3)多路复用 4.2.1 内存 KV 结构的内存数据库，时间复杂度 O(1)。第二个，要实现这么高的并发性能，是不是要创建非常多的线程? 恰恰相反，Redis 是单线程的。 4.2.2 单线程单线程有什么好处呢? 1、没有创建线程、销毁线程带来的消耗 2、避免了上线文切换导致的 CPU 消耗 3、避免了线程之间带来的竞争问题，例如加锁释放锁死锁等等 4.2.3 异步非阻塞异步非阻塞 I/O，多路复用处理并发连接。 4.3 Redis为什么是单线程的? 不是白白浪费了 CPU 的资源吗? 因为单线程已经够用了，CPU 不是 redis 的瓶颈。Redis 的瓶颈最有可能是机器内存或者网络带宽。既然单线程容易实现，而且 CPU 不会成为瓶颈，那就顺理成章地采用单线程的方案了。 4.4 单线程为什么这么快? 因为 Redis 是基于内存的操作，我们先从内存开始说起。 4.4.1 虚拟存储器(虚拟内存 Vitual Memory) 名词解释:主存:内存;辅存:磁盘(硬盘) 计算机主存(内存)可看作一个由 M 个连续的字节大小的单元组成的数组，每个字节有一个唯一的地址，这个地址叫做物理地址(PA)。早期的计算机中，如果 CPU 需要内存，使用物理寻址，直接访问主存储器。这种方式有几个弊端: 1、在多用户多任务操作系统中，所有的进程共享主存，如果每个进程都独占一块物理地址空间，主存很快就会被用完。我们希望在不同的时刻，不同的进程可以共用同一块物理地址空间。 2、如果所有进程都是直接访问物理内存，那么一个进程就可以修改其他进程的内存数据，导致物理地址空间被破坏，程序运行就会出现异常。为了解决这些问题，我们就想了一个办法，在 CPU 和主存之间增加一个中间层。CPU 不再使用物理地址访问，而是访问一个虚拟地址，由这个中间层把地址转换成物理地址，最终获得数据。这个中间层就叫做虚拟存储器(Virtual Memory)。具体的操作如下所示: 在每一个进程开始创建的时候，都会分配一段虚拟地址，然后通过虚拟地址和物理地址的映射来获取真实数据，这样进程就不会直接接触到物理地址，甚至不知道自己调用的哪块物理地址的数据。目前，大多数操作系统都使用了虚拟内存，如 Windows 系统的虚拟内存、Linux 系统的交换空间等等。Windows 的虚拟内存(pagefile.sys)是磁盘空间的一部分。在 32 位的系统上，虚拟地址空间大小是 2^32bit=4G。在 64 位系统上，最大虚拟地址空间大小是多少? 是不是 2^64bit=10241014TB=1024PB=16EB?实际上没有用到 64 位，因为用不到这么大的空间，而且会造成很大的系统开销。Linux 一般用低 48 位来表示虚拟地址空间，也就是 2^48bit=256T。 cat /proc/cpuinfo address sizes : 40 bits physical, 48 bits virtual 实际的物理内存可能远远小于虚拟内存的大小。总结：引入虚拟内存，可以提供更大的地址空间，并且地址空间是连续的，使得程序编写、链接更加简单。并且可以对物理内存进行隔离，不同的进程操作互不影响。还可以通过把同一块物理内存映射到不同的虚拟地址空间实现内存共享。 4.4.2 用户空间和内核空间为了避免用户进程直接操作内核，保证内核安全，操作系统将虚拟内存划分为两部分，一部分是内核空间(Kernel-space)/ˈkɜːnl /，一部分是用户空间(User-space)。内核是操作系统的核心，独立于普通的应用程序，可以访问受保护的内存空间，也有访问底层硬件设备的权限。内核空间中存放的是内核代码和数据，而进程的用户空间中存放的是用户程序的代码和数据。不管是内核空间还是用户空间，它们都处于虚拟空间中，都是对物理地址的映射。在 Linux 系统中, 内核进程和用户进程所占的虚拟内存比例是 1:3。当进程运行在内核空间时就处于内核态，而进程运行在用户空间时则处于用户态。进程在内核空间以执行任意命令，调用系统的一切资源;在用户空间只能执行简单的运算，不能直接调用系统资源，必须通过系统接口(又称 system call)，才能向内核发出指令。 top 命令: us 代表 CPU 消耗在 User space 的时间百分比; sy 代表 CPU 消耗在 Kernel space 的时间百分比。 4.4.3 进程切换(上下文切换) 多任务操作系统是怎么实现运行远大于 CPU 数量的任务个数的? 当然，这些任务实际上并不是真的在同时运行，而是因为系统通过时间片分片算法，在很短的时间内，将 CPU 轮流分配给它们，造成多任务同时运行的错觉。为了控制进程的执行，内核必须有能力挂起正在 CPU 上运行的进程，并恢复以前挂起的某个进程的执行。这种行为被称为进程切换。什么叫上下文? 在每个任务运行前，CPU 都需要知道任务从哪里加载、又从哪里开始运行，也就是说，需要系统事先帮它设置好 CPU 寄存器和程序计数器(ProgramCounter)，这个叫做 CPU 的上下文。而这些保存下来的上下文，会存储在系统内核中，并在任务重新调度执行时再次加载进来。这样就能保证任务原来的状态不受影响，让任务看起来还是连续运行。在切换上下文的时候，需要完成一系列的工作，这是一个很消耗资源的操作。 4.4.4 进程的阻塞正在运行的进程由于提出系统服务请求(如 I/O 操作)，但因为某种原因未得到操作系统的立即响应，该进程只能把自己变成阻塞状态，等待相应的事件出现后才被唤醒。进程在阻塞状态不占用 CPU 资源。 4.4.5 文件描述符 FD Linux 系统将所有设备都当作文件来处理，而 Linux 用文件描述符来标识每个文件对象。文件描述符(File Descriptor)是内核为了高效管理已被打开的文件所创建的索引，用于指向被打开的文件，所有执行 I/O 操作的系统调用都通过文件描述符;文件描述符是一个简单的非负整数，用以表明每个被进程打开的文件。 Linux 系统里面有三个标准文件描述符。 0:标准输入(键盘); 1:标准输出(显示器); 2:标准错误输出(显示器)。 4.4.6 传统 I/O 数据拷贝以读操作为例: 当应用程序执行 read 系统调用读取文件描述符(FD)的时候，如果这块数据已经存在于用户进程的页内存中，就直接从内存中读取数据。如果数据不存在，则先将数据从磁盘加载数据到内核缓冲区中，再从内核缓冲区拷贝到用户进程的页内存中。(两次拷贝，两次 user 和 kernel 的上下文切换)。 I/O 的阻塞到底阻塞在哪里? 4.4.7 Blocking I/O 当使用 read 或 write 对某个文件描述符进行过读写时，如果当前 FD 不可读，系统就不会对其他的操作做出响应。从设备复制数据到内核缓冲区是阻塞的，从内核缓冲区拷贝到用户空间，也是阻塞的，直到 copy complete，内核返回结果，用户进程才解除 block 的状态。为了解决阻塞的问题，我们有几个思路。 1、在服务端创建多个线程或者使用线程池，但是在高并发的情况下需要的线程会很多，系统无法承受，而且创建和释放线程都需要消耗资源。 2、由请求方定期轮询，在数据准备完毕后再从内核缓存缓冲区复制数据到用户空间 (非阻塞式 I/O)，这种方式会存在一定的延迟。能不能用一个线程处理多个客户端请求? 4.4.8 I/O 多路复用(I/O Multiplexing) I/O 指的是网络 I/O。多路指的是多个 TCP 连接(Socket 或 Channel)。复用指的是复用一个或多个线程。它的基本原理就是不再由应用程序自己监视连接，而是由内核替应用程序监视文件描述符。客户端在操作的时候，会产生具有不同事件类型的 socket。在服务端，I/O 多路复用程序(I/O Multiplexing Module)会把消息放入队列中，然后通过文件事件分派器(File event Dispatcher)，转发到不同的事件处理器中。多路复用有很多的实现，以 select 为例，当用户进程调用了多路复用器，进程会被阻塞。内核会监视多路复用器负责的所有 socket，当任何一个 socket 的数据准备好了，多路复用器就会返回。这时候用户进程再调用 read 操作，把数据从内核缓冲区拷贝到用户空间。所以，I/O 多路复用的特点是通过一种机制一个进程能同时等待多个文件描述符，而这些文件描述符(套接字描述符)其中的任意一个进入读就绪(readable)状态，select() 函数就可以返回。 Redis 的多路复用，提供了 select, epoll, evport, kqueue 几种选择，在编译的时候来选择一种。 evport 是 Solaris 系统内核提供支持的; epoll 是 LINUX 系统内核提供支持的; kqueue 是 Mac 系统提供支持的; select 是 POSIX 提供的，一般的操作系统都有支撑(保底方案); 源码 ae_epoll.c、ae_select.c、ae_kqueue.c、ae_evport.c 5、内存回收 Reids 所有的数据都是存储在内存中的，在某些情况下需要对占用的内存空间进行回收。内存回收主要分为两类，一类是 key 过期，一类是内存使用达到上限(max_memory) 触发内存淘汰。 5.1 过期策略要实现 key 过期，我们有几种思路。 5.1.1 定时过期(主动淘汰) 每个设置过期时间的 key 都需要创建一个定时器，到过期时间就会立即清除。该策略可以立即清除过期的数据，对内存很友好;但是会占用大量的 CPU 资源去处理过期的数据，从而影响缓存的响应时间和吞吐量。 5.1.2 惰性过期(被动淘汰) 只有当访问一个 key 时，才会判断该 key 是否已过期，过期则清除。该策略可以最大化地节省 CPU 资源，却对内存非常不友好。极端情况可能出现大量的过期 key 没有再次被访问，从而不会被清除，占用大量内存。例如 String，在 getCommand 里面会调用 expireIfNeeded server.c expireIfNeeded(redisDb db, robj key) 第二种情况，每次写入 key 时，发现内存不够，调用 activeExpireCycle 释放一部分内存。 expire.c activeExpireCycle(int type) 5.1.3 定期过期源码:server.h typedef struct redisDb { dict dict; / 所有的键值对 /dict expires; / 设置了过期时间的键值对 /dict blocking_keys; dict ready_keys; dict watched_keys; int id;long long avg_ttl;list defrag_later; } redisDb; 每隔一定的时间，会扫描一定数量的数据库的 expires 字典中一定数量的 key，并清除其中已过期的 key。该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时，可以在不同情况下使得 CPU 和内存资源达到最优的平衡效果。 Redis 中同时使用了惰性过期和定期过期两种过期策略。 5.2 淘汰策略 Redis 的内存淘汰策略，是指当内存使用达到最大内存极限时，需要使用淘汰算法来决定清理掉哪些数据，以保证新数据的存入。 5.2.1 最大内存设置 redis.conf 参数配置: maxmemory <bytes> 如果不设置 maxmemory 或者设置为 0，64 位系统不限制内存，32 位系统最多使用 3GB 内存。动态修改: redis> config set maxmemory 2GB 到达最大内存以后怎么办? 5.2.2 淘汰策略 https://redis.io/topics/lru-cache redis.conf maxmemory-policy noeviction 先从算法来看: LRU，Least Recently Used:最近最少使用。判断最近被使用的时间，目前最远的数据优先被淘汰。 LFU，Least Frequently Used，最不常用，4.0 版本新增。 random，随机删除。如果没有符合前提条件的 key 被淘汰，那么 volatile-lru、volatile-random、 volatile-ttl 相当于 noeviction(不做内存回收)。动态修改淘汰策略: redis> config set maxmemory-policy volatile-lru 建议使用 volatile-lru，在保证正常服务的情况下，优先删除最近最少使用的 key。 5.2.3 LRU 淘汰原理问题：如果基于传统 LRU 算法实现 Redis LRU 会有什么问题? 需要额外的数据结构存储，消耗内存。 Redis LRU 对传统的 LRU 算法进行了改良，通过随机采样来调整算法的精度。如果淘汰策略是 LRU，则根据配置的采样值 maxmemory_samples(默认是 5 个), 随机从数据库中选择 m 个 key, 淘汰其中热度最低的 key 对应的缓存数据。所以采样参数m配置的数值越大, 就越能精确的查找到待淘汰的缓存数据,但是也消耗更多的CPU计算,执行效率降低。问题：如何找出热度最低的数据? Redis 中所有对象结构都有一个 lru 字段, 且使用了 unsigned 的低 24 位，这个字段用来记录对象的热度。对象被创建时会记录 lru 值。在被访问的时候也会更新 lru 的值。但是不是获取系统当前的时间戳，而是设置为全局变量 server.lruclock 的值。源码：server.h typedef struct redisObject {unsigned type:4;unsigned encoding:4;unsigned lru:LRU_BITS;int refcount;void ptr; } robj; server.lruclock 的值怎么来的? Redis 中有个定时处理的函数 serverCron，默认每 100 毫秒调用函数 updateCachedTime 更新一次全局变量的 server.lruclock 的值，它记录的是当前 unix 时间戳。源码:server.c void updateCachedTime(void) { time_t unixtime = time(NULL); atomicSet(server.unixtime,unixtime); server.mstime = mstime();struct tm tm; localtime_r(&server.unixtime,&tm);server.daylight_active = tm.tm_isdst; } 问题:为什么不获取精确的时间而是放在全局变量中?不会有延迟的问题吗? 这样函数 lookupKey 中更新数据的 lru 热度值时,就不用每次调用系统函数 time，可以提高执行效率。 OK，当对象里面已经有了 LRU 字段的值，就可以评估对象的热度了。函数 estimateObjectIdleTime 评估指定对象的 lru 热度，思想就是对象的 lru 值和全局的 server.lruclock 的差值越大(越久没有得到更新)，该对象热度越低。源码 evict.c / Given an object returns the min number of milliseconds the object was never requested, using an approximated LRU algorithm. /unsigned long long estimateObjectIdleTime(robj o) {unsigned long long lruclock = LRU_CLOCK(); if (lruclock >= o->lru) {return (lruclock - o->lru) LRU_CLOCK_RESOLUTION; } else {return (lruclock + (LRU_CLOCK_MAX - o->lru)) LRU_CLOCK_RESOLUTION;} } server.lruclock 只有 24 位，按秒为单位来表示才能存储 194 天。当超过 24bit 能表示的最大时间的时候，它会从头开始计算。 server.h define LRU_CLOCK_MAX ((1<<LRU_BITS)-1) / Max value of obj->lru / 在这种情况下，可能会出现对象的 lru 大于 server.lruclock 的情况，如果这种情况出现那么就两个相加而不是相减来求最久的 key。为什么不用常规的哈希表+双向链表的方式实现?需要额外的数据结构，消耗资源。而 Redis LRU 算法在 sample 为 10 的情况下，已经能接近传统 LRU 算法了。问题:除了消耗资源之外，传统 LRU 还有什么问题? 如图，假设 A 在 10 秒内被访问了 5 次，而 B 在 10 秒内被访问了 3 次。因为 B 最后一次被访问的时间比 A 要晚，在同等的情况下，A 反而先被回收。问题:要实现基于访问频率的淘汰机制，怎么做? 5.2.4 LFU server.h typedef struct redisObject {unsigned type:4;unsigned encoding:4;unsigned lru:LRU_BITS;int refcount;void ptr; } robj; 当这 24 bits 用作 LFU 时，其被分为两部分: 高 16 位用来记录访问时间(单位为分钟，ldt，last decrement time) 低 8 位用来记录访问频率，简称 counter(logc，logistic counter) counter 是用基于概率的对数计数器实现的，8 位可以表示百万次的访问频率。对象被读写的时候，lfu 的值会被更新。 db.c——lookupKey void updateLFU(robj val) {unsigned long counter = LFUDecrAndReturn(val); counter = LFULogIncr(counter);val->lru = (LFUGetTimeInMinutes()<<8) | counter;} 增长的速率由，lfu-log-factor 越大，counter 增长的越慢 redis.conf 配置文件。 lfu-log-factor 10 如果计数器只会递增不会递减，也不能体现对象的热度。没有被访问的时候，计数器怎么递减呢? 减少的值由衰减因子 lfu-decay-time(分钟)来控制，如果值是 1 的话，N 分钟没有访问就要减少 N。 redis.conf 配置文件 lfu-decay-time 1 6、持久化机制 https://redis.io/topics/persistence Redis 速度快，很大一部分原因是因为它所有的数据都存储在内存中。如果断电或者宕机，都会导致内存中的数据丢失。为了实现重启后数据不丢失，Redis 提供了两种持久化的方案，一种是 RDB 快照(Redis DataBase)，一种是 AOF(Append Only File)。 6.1 RDB RDB 是 Redis 默认的持久化方案。当满足一定条件的时候，会把当前内存中的数据写入磁盘，生成一个快照文件 dump.rdb。Redis 重启会通过加载 dump.rdb 文件恢复数据。什么时候写入 rdb 文件? 6.1.1 RDB 触发 1、自动触发 a)配置规则触发。 redis.conf， SNAPSHOTTING，其中定义了触发把数据保存到磁盘的触发频率。如果不需要 RDB 方案，注释 save 或者配置成空字符串""。 save 900 1 900 秒内至少有一个 key 被修改(包括添加) save 300 10 400 秒内至少有 10 个 key 被修改save 60 10000 60 秒内至少有 10000 个 key 被修改注意上面的配置是不冲突的，只要满足任意一个都会触发。 RDB 文件位置和目录: 文件路径，dir ./ 文件名称dbfilename dump.rdb 是否是LZF压缩rdb文件 rdbcompression yes 开启数据校验 rdbchecksum yes 问题：为什么停止 Redis 服务的时候没有 save，重启数据还在? RDB 还有两种触发方式: b)shutdown 触发，保证服务器正常关闭。 c)flushall，RDB 文件是空的，没什么意义(删掉 dump.rdb 演示一下)。 2、手动触发如果我们需要重启服务或者迁移数据，这个时候就需要手动触 RDB 快照保存。Redis 提供了两条命令: a)save save 在生成快照的时候会阻塞当前 Redis 服务器， Redis 不能处理其他命令。如果内存中的数据比较多，会造成 Redis 长时间的阻塞。生产环境不建议使用这个命令。为了解决这个问题，Redis 提供了第二种方式。执行 bgsave 时，Redis 会在后台异步进行快照操作，快照同时还可以响应客户端请求。具体操作是 Redis 进程执行 fork 操作创建子进程(copy-on-write)，RDB 持久化过程由子进程负责，完成后自动结束。它不会记录 fork 之后后续的命令。阻塞只发生在 fork 阶段，一般时间很短。用 lastsave 命令可以查看最近一次成功生成快照的时间。 6.1.2 RDB 数据的恢复(演示) 1、shutdown 持久化添加键值添加键值 redis> set k1 1 redis> set k2 2 redis> set k3 3 redis> set k4 4 redis> set k5 5 停服务器，触发 save redis> shutdown 备份 dump.rdb 文件 cp dump.rdb dump.rdb.bak 启动服务器 /usr/local/soft/redis-5.0.5/src/redis-server /usr/local/soft/redis-5.0.5/redis.conf 啥都没有: redis> keys 3、通过备份文件恢复数据停服务器 redis> shutdown 重命名备份文件 mv dump.rdb.bak dump.rdb 启动服务器 /usr/local/soft/redis-5.0.5/src/redis-server /usr/local/soft/redis-5.0.5/redis.conf 查看数据 redis> keys 6.1.3 RDB 文件的优势和劣势一、优势 1.RDB 是一个非常紧凑(compact)的文件，它保存了 redis 在某个时间点上的数据集。这种文件非常适合用于进行备份和灾难恢复。 2.生成 RDB 文件的时候，redis 主进程会 fork()一个子进程来处理所有保存工作，主进程不需要进行任何磁盘 IO 操作。 3.RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。二、劣势 1、RDB 方式数据没办法做到实时持久化/秒级持久化。因为 bgsave 每次运行都要执行 fork 操作创建子进程，频繁执行成本过高。 2、在一定间隔时间做一次备份，所以如果 redis 意外 down 掉的话，就会丢失最后一次快照之后的所有修改(数据有丢失)。如果数据相对来说比较重要，希望将损失降到最小，则可以使用 AOF 方式进行持久化。 6.2 AOF Append Only File AOF:Redis 默认不开启。AOF 采用日志的形式来记录每个写操作，并追加到文件中。开启后，执行更改 Redis 数据的命令时，就会把命令写入到 AOF 文件中。 Redis 重启时会根据日志文件的内容把写指令从前到后执行一次以完成数据的恢复工作。 6.2.1 AOF 配置配置文件 redis.conf 开关appendonly no 文件名appendfilename "appendonly.aof" AOF 文件的内容(vim 查看): 问题：数据都是实时持久化到磁盘吗? 由于操作系统的缓存机制，AOF 数据并没有真正地写入硬盘，而是进入了系统的硬盘缓存。什么时候把缓冲区的内容写入到 AOF 文件? 问题:文件越来越大，怎么办? 由于 AOF 持久化是 Redis 不断将写命令记录到 AOF 文件中，随着 Redis 不断的进行，AOF 的文件会越来越大，文件越大，占用服务器内存越大以及 AOF 恢复要求时间越长。例如 set xxx 666，执行 1000 次，结果都是 xxx=666。为了解决这个问题，Redis 新增了重写机制，当 AOF 文件的大小超过所设定的阈值时，Redis 就会启动 AOF 文件的内容压缩，只保留可以恢复数据的最小指令集。可以使用命令 bgrewriteaof 来重写。 AOF 文件重写并不是对原文件进行重新整理，而是直接读取服务器现有的键值对，然后用一条命令去代替之前记录这个键值对的多条命令，生成一个新的文件后去替换原来的 AOF 文件。重写触发机制 auto-aof-rewrite-percentage 100 auto-aof-rewrite-min-size 64mb 问题:重写过程中，AOF 文件被更改了怎么办? 另外有两个与 AOF 相关的参数: 6.2.2 AOF 数据恢复重启 Redis 之后就会进行 AOF 文件的恢复。 6.2.3 AOF 优势与劣势优点: 1、AOF 持久化的方法提供了多种的同步频率，即使使用默认的同步频率每秒同步一次，Redis 最多也就丢失 1 秒的数据而已。缺点: 1、对于具有相同数据的的 Redis，AOF 文件通常会比 RDB 文件体积更大(RDB 存的是数据快照)。 2、虽然 AOF 提供了多种同步的频率，默认情况下，每秒同步一次的频率也具有较高的性能。在高并发的情况下，RDB 比 AOF 具好更好的性能保证。 6.3 两种方案比较那么对于 AOF 和 RDB 两种持久化方式，我们应该如何选择呢? 如果可以忍受一小段时间内数据的丢失，毫无疑问使用 RDB 是最好的，定时生成 RDB 快照(snapshot)非常便于进行数据库备份，并且 RDB 恢复数据集的速度也要比 AOF 恢复的速度要快。否则就使用 AOF 重写。但是一般情况下建议不要单独使用某一种持久化机制，而是应该两种一起用，在这种情况下,当 redis 重启的时候会优先载入 AOF 文件来恢复原始的数据，因为在通常情况下 AOF 文件保存的数据集要比 RDB 文件保存的数据集要完整。本篇文章为转载内容。原文链接：https://blog.csdn.net/zhoutaochun/article/details/120075092。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2024-03-18 12:25:04

541

转载

Python

python正则匹配卡死

...问题后，我们了解到在处理大规模字符串时，不恰当的使用可能导致程序运行缓慢甚至卡死。实际上，这一问题不仅局限于Python语言本身，而是所有支持正则表达式的编程环境都需要关注的核心性能议题。最近，在一篇由《Software Performance Engineering》杂志发布的文章中，作者深度剖析了正则表达式引擎的工作原理，并分享了一些实用的优化技巧，包括如何利用懒惰匹配、预编译正则以及针对特定文本结构设计更高效的模式等。例如，针对大数据场景，可以结合内存映射文件技术，将大文件分块进行正则匹配，从而有效避免一次性加载大量数据导致的内存溢出和性能瓶颈。同时，Python社区也一直在积极改进其内置的re模块。近期，Python 3.9版本引入了新的regex库作为实验性功能，该库提供了更强大且灵活的正则表达式工具，特别在处理复杂和大规模文本时具有更高的性能表现。此外，许多第三方库如regex-tdfa和aho-corasick通过采用不同的算法策略来提升搜索效率，也是值得开发者关注和研究的方向。综上所述，对正则表达式性能问题的关注和解决并非一蹴而就，而是需要持续跟踪最新的技术动态，结合实际应用场景灵活运用各种优化策略和技术手段，才能在保障程序稳定性和准确性的同时，最大程度地提升处理大规模字符串任务的效率。

2023-05-13 20:11:01

259

程序媛

转载文章

[转载]ERROR in static/js/vendor.js from UglifyJs UUnexpected token: name (Dom7）

...在项目构建过程中妥善处理这些新语法以适应不同环境和工具的要求显得尤为重要。UglifyJS作为一款广泛使用的JavaScript压缩工具，其对ES6语法的支持并非原生具备，这就需要开发者借助Babel等转译工具将ES6代码转换为ES5以便于压缩。最近，Webpack 5发布并逐步成为主流，其内置了对ES6语法更好的支持，并且推荐使用 terser-webpack-plugin 代替 UglifyJS，它不仅能够很好地处理ES6及更高版本的语法，同时优化了性能和资源占用。对于Vue CLI用户来说，在创建的新项目中，Webpack配置已经默认包含了对ES6+语法的支持，但对于一些包含ES6语法的第三方库，依然需要根据实际情况调整babel-loader的include或exclude选项。此外，值得注意的是，随着浏览器对ES6标准支持度的提升，许多现代项目开始选择“渐进式编译”策略，即仅对不支持最新JavaScript特性的旧版浏览器进行代码转译，从而减少构建时的开销，提高开发效率。因此，在实际项目中，不仅要关注如何解决当下遇到的压缩问题，更要持续关注前端生态的发展趋势，适时调整构建方案，以确保项目既满足兼容性要求，又能充分利用最新的技术成果。另外，深入理解和掌握Babel的工作原理及其配置方法，例如通过preset-env按需加载polyfill、自定义插件规则等，也是前端开发者持续优化项目构建流程的重要环节。只有紧跟社区步伐，才能在应对类似UglifyJS压缩ES6语法这类问题时更加游刃有余，高效地完成项目构建任务。

2023-07-11 23:10:34

转载

VUE

vue叉吗

...题。其中之一就是如何处理版本不一致。当多个研制人员并行修改同一个Vue组件时，就会引发冲突，这会导致代码合并时出现问题。此时，我们就需要使用Vue叉吗来解决这个问题。  npm install --save-dev vue-cli-plugin-fork  vue-cli-service fork Vue叉吗是Vue.js官方提供的一个插件，它可以帮助我们处理Vue组件的版本不一致。Vue叉吗会在编辑Vue组件之前，将代码备份到一个临时文件中。当代码编辑完成后，Vue叉吗会比较编辑前后的代码，然后自动解决版本不一致。当我们使用Vue叉吗处理冲突时，需要注意以下几点：尽量减少对同一组件的并行修改。编辑前要及时更新代码，确保本地代码与仓库代码保持一致。在解决冲突时，要仔细阅读提示信息，并根据提示进行选择。总之，Vue叉吗是一个非常实用的工具，它可以帮助我们有效地解决版本不一致的问题。当我们在使用Vue.js研制大型项目时，一定要注意避免出现版本不一致问题，以保障代码质量和研制效率。

2023-08-19 09:28:38

键盘勇士

AngularJS

AngularJS中'$rootScope'报错：'noctrl Controller '0' not found'问题的控制器注册与模块排查及解决方案

...ot found”的处理方式和思路的介绍。大家伙儿，我真心希望大家读完这篇文章后，以后在用 AngularJS 进行开发的时候，能绕过那些坑坑洼洼的小路，一路顺风顺水地把项目搞定，顺利完成任务。

2024-01-18 15:53:01

430

春暖花开-t

JQuery

jquery控制标签被点击

...化了 HTML 页面处理、事件响应、动画效果和 AJAX 等常见任务。在网页开发中，管理元素被触碰是与用户交流的重要功能之一种，下面我们将介绍如何使用 jQuery 完成这一功能。 <!DOCTYPE html> <html> <head> <title>jQuery 管理元素被触碰</title> <meta charset="UTF-8"> <script src="https://cdn.bootcss.com/jquery/3.3.1/jquery.min.js"></script> <style> click-text { font-size: 24px; cursor: pointer; } .myclass { color: red; } </style> </head> <body> <p id="click-text">触碰我测试</p> <script> $(document).ready(function() { $("click-text").click(function() { $(this).addClass("myclass"); alert("你触碰了我！"); }); }); </script> </body> </html> 代码介绍： <script src="https://cdn.bootcss.com/jquery/3.3.1/jquery.min.js"></script> 这一行是加载 jQuery 脚本文件。 <p id="click-text">触碰我测试</p> 这一行是一个待触碰的 p 元素。 $(document).ready(function() {}); 这一行是等页面加载完成后运行的代码。 $("click-text").click(function() {}); 这一行是给触碰事件赋予一个响应函数，当该 p 元素被触碰时，运行该响应函数内的代码。 $(this).addClass("myclass"); 这一行是给被触碰的 p 元素赋予一个名为 myclass 的类，以便在 CSS 样式中使用。 alert("你触碰了我！"); 这一行是弹出一个警告对话框，通知用户触碰了该 p 元素。 .myclass { color: red; } 这一段是将 myclass 类的字体颜色变为红色。使用以上代码，即可在网页中完成触碰某个元素后启动某些处理的功能。

2023-01-01 08:53:25

312

码农

MySQL

您已安装mysql 或3306

...个可移植的SQL脚本文件。通过执行mysqldump命令，用户能够完整地备份整个数据库或者部分特定的数据库表，便于在数据丢失或需要恢复时快速还原到某个时间点的状态，确保数据的安全性和完整性。例如，在MySQL中，用户可以通过命令行运行mysqldump命令，指定要备份的数据库名和其他相关参数来完成备份任务。

2023-02-05 14:43:17

程序媛

转载文章

[转载]uniapp打包app，调用相机功能时在真机调试可以，打包成app之后不行

...ifest.json文件中声明了相关权限，应用在首次调用时仍需动态申请并获得用户的明确授权。这意味着，在uni-app项目打包成原生app后，除了确保代码层面和配置文件中的权限设置无误外，还需要在运行时正确处理权限请求流程，避免因权限问题导致的功能失效或用户体验下降。此外，GDPR（欧盟一般数据保护条例）等相关国际法规也在不断强调数据收集与使用的透明度，包括获取用户照片在内的个人数据行为都需严格遵循告知同意原则。因此，uni-app开发者在设计功能时，不仅要考虑技术实现，还要充分尊重并落实用户隐私权，通过清晰的引导提示帮助用户理解为何需要调用相机权限以及如何进行管理。综上所述，对于uni-app开发者而言，在实际开发过程中应密切关注行业动态和法律法规更新，确保在提供便捷功能的同时兼顾用户隐私保护，从而打造出既实用又合规的应用产品。同时，通过查阅官方文档、参与社区交流等方式持续优化权限管理策略，是当前及未来移动应用开发领域不容忽视的关键任务之一。

2023-08-01 22:36:09

转载

C#编程中运行错误详解：异常错误、资源泄露与编译问题的排查与解决

...们还能给程序加个异常处理机制，这样一来，就算遇到点儿小差错，程序也能稳稳当当地运行下去，不至于突然崩掉。 2. 资源泄露错误这种错误通常发生在我们使用了某个资源（如文件、网络连接等）后忘记关闭的情况下。例如： csharp FileStream fs = new FileStream("test.txt", FileMode.Open); // ... 程序在这里做了一些操作 ... fs.Close(); // 忘记关闭流为了解决这个问题，我们需要养成良好的编程习惯，在使用完资源后立即关闭。同时，我们也可以使用using语句块来自动管理资源，如下所示： csharp using (FileStream fs = new FileStream("test.txt", FileMode.Open)) { // ... 程序在这里做了一些操作 ... } 3. 编译错误这种错误通常是由于语法错误或者编译器无法识别的语句引起的。例如： csharp public class MyClass { public void MyMethod() { System.out.println("Hello, World!"); // 这里就有一个编译错误，因为System.out.println是Java语言的语句，而不是C } } 为了解决这个问题，我们需要仔细检查我们的代码，并确保使用的语句是正确的。同时，我们还需要注意不同编程语言之间的差异。四、总结总的来说，解决编程错误并不是一件难事，只要我们有足够的耐心和细心，就一定能找到解决问题的方法。同时，我们也应该养成良好的编程习惯，避免出现不必要的错误。最后，我希望这篇文章能够帮助你解决你在使用C编程时遇到的问题。如果你有任何疑问，欢迎留言讨论，我会尽力为你解答。希望这篇文章对你有所帮助，也希望大家多多支持我！

2023-11-12 22:43:56

549

林中小径_t

Shell

Shell编程中的`trap`命令：精确处理SIGINT、SIGTERM与SIGHUP系统信号实践

...在Shell中捕获并处理信号？在Linux Shell编程的世界里，进程间的通信和协作往往离不开对系统信号的巧妙运用。在咱们这个领域里，trap命令可是个大宝贝，它能够帮我们把特定的信号给逮住，一旦接收到这些信号，就能按照我们自定义的方式来操作，可灵活多啦！今天，咱们就一块儿来好好唠唠怎么巧妙运用trap命令，让咱的Shell脚本变得更结实、更机灵。 1. trap命令的基本概念首先，让我们揭开trap命令的神秘面纱。在Shell脚本中，trap命令用于指定在接收到指定信号时要执行的命令或函数。它的基本语法如下： bash trap command signal_list 其中，command是要在接收到信号时执行的命令或函数，而signal_list则是一个或多个以空格分隔的信号名称或数字。例如，我们可以设置当脚本接收到SIGINT（即用户按下Ctrl+C）时打印一条消息然后退出： bash !/bin/bash trap 'echo "Caught SIGINT, exiting now..."; exit' INT while true; do echo "This is an infinite loop" sleep 1 done 在这个例子中，如果我们试图中断这个无限循环，shell将捕获到SIGINT信号，并执行预设的命令——打印信息并退出脚本。 2. 多个信号的捕获与处理 trap命令可以同时为多个信号指定处理程序，只需将它们列在signal_list中即可： bash !/bin/bash trap 'echo "Caught a signal: $1"; exit' INT TERM HUP 主体代码... 在此例中，脚本会在接收到SIGINT（中断）、SIGTERM（终止）或SIGHUP（挂起）任一信号时，输出相应的信息并退出。 3. 清理操作与临时退出除了用于直接响应信号外，trap命令还可以用来进行必要的清理工作，比如关闭文件描述符、删除临时文件等。假设我们在脚本中打开了一个日志文件： bash !/bin/bash LOGFILE=log.txt exec 3>> "$LOGFILE" 将文件描述符3关联到日志文件设置一个trap来清理资源 trap 'echo "Cleaning up..."; exec 3>&-; exit' EXIT 主体代码，往日志文件写入数据 while :; do date >>&3 sleep 1 done 在这段代码中，无论脚本是正常结束还是因信号退出，都会先执行trap中的命令，关闭关联的日志文件，从而确保资源得到妥善释放。 4. 恢复默认信号处理有时候，我们需要在完成某些任务后恢复信号的默认处理方式。这可以通过重新设置trap命令实现： bash !/bin/bash 首先捕获SIGINT并打印信息 trap 'echo "Interupt received but ignored for now.";' INT 执行一些需要防止被中断的任务 your_critical_task_here 恢复SIGINT的默认行为（即终止进程） trap - INT echo "Now SIGINT will terminate the script." 后续代码... 通过这样的设计，我们可以在关键操作期间暂时忽略中断信号，待操作完成后，再恢复信号的默认处理机制。总结起来，trap命令赋予了Shell脚本更强大的生存能力，使其能够优雅地应对各种外部事件。要真正把Shell编程这门手艺玩得溜，掌握trap命令的使用绝对是你不能绕过的关键一环，这一步走稳了，你的编程技能绝对能蹭蹭往上涨。希望以上示例能帮助大家更好地理解和应用这一强大功能，让你的脚本变得更加聪明、可靠！

2024-02-06 11:30:03

131

断桥残雪

Gradle

Gradle任务优先级配置：在build.gradle与gradle.properties中的设置及其对编译与测试任务执行顺序的影响

...问题。比如说，这么多任务到底该按照什么顺序一个个来执行呢？又或者，怎样才能把每个任务的执行时间调整到最佳状态，省时高效地完成它们？这时候啊，Gradle这个神器的任务优先级配置功能就显得特别的关键和给力了！二、理解任务优先级在Gradle中，每个任务都有一个默认的优先级。这个优先级就像是给任务排了个队，决定了它们谁先谁后开始执行。简单来说，就是那个优先级标得高的任务，就像插队站在队伍前面的那位，总是能比那些优先级低、乖乖排队在后面的任务更快地得到处理。三、设置任务优先级的方法那么，如何设置任务的优先级呢？主要有以下几种方法： 3.1 在build.gradle文件中直接设置我们可以在每个任务定义的时候明确指定其优先级，例如： task test(type: Test) { group = 'test' description = 'Run tests' dependsOn(':compileJava') runOrder='random' } 在这里，我们通过runOrder属性指定了测试任务的运行顺序为随机。 3.2 使用gradle.properties文件如果我们想对所有任务都应用相同的优先级规则，可以将这些规则放在gradle.properties文件中。例如： org.gradle.parallel=true org.gradle.caching=true 这里，org.gradle.parallel=true表示开启并行构建，而org.gradle.caching=true则表示启用缓存。四、调整任务优先级的影响调整任务优先级可能会对构建流程产生显著影响。比如，如果我们把编译任务的优先级调得高高的，就像插队站在队伍前面一样，那么每次构建开始的时候，都会先让编译任务冲在前头完成。这样一来，就相当于减少了让人干着急的等待时间，使得整个过程更顺畅、高效了。另一方面，如果我们的项目包含大量的单元测试任务，那么我们应该将其优先级设置得较低，以便让其他更重要的任务先执行。这样可以避免在测试过程中出现阻塞，影响整个项目的进度。五、结论总的来说，理解和正确地配置Gradle任务的优先级是非常重要的。这不仅能够帮咱们把构建流程整得更顺溜，工作效率嗖嗖提升，更能稳稳当当地保证项目的牢靠性和稳定性，妥妥的！所以，在我们用Gradle搞开发的时候，得先把任务优先级的那些门道整明白，然后根据实际情况灵活调整，这样才能玩转它。六、参考文献 1. Gradle官方网站 https://docs.gradle.org/current/userguide/more_about_tasks.htmlsec:ordering_of_tasks 2. Gradle用户手册 https://docs.gradle.org/current/userguide/userguide.html 3. Gradle官方文档 https://docs.gradle.org/current/userguide/tutorial_using_tasks.html

2023-09-01 22:14:44

476

雪域高原-t

Mahout

Mahout在大规模文本分类中的应用：从数据预处理到模型测试，涵盖TF-IDF特征提取与Naive Bayes、Logistic Regression算法实践

...文本分类是一个重要的任务。Mahout，这可是个不得了的开源神器，专门用来处理大规模机器学习问题。甭管你的数据有多大、多复杂，它都能轻松应对。就拿文本分类来说吧，有了Mahout这个好帮手，你就能轻轻松松地对海量文本进行高效分类，简直就像给每篇文章都贴上合适的标签一样简单便捷！本文将介绍如何使用Mahout进行大规模文本分类。二、安装Mahout 首先，我们需要下载并安装Mahout。你可以在Mahout的官方网站上找到最新的版本。三、数据预处理对于任何机器学习任务，数据预处理都是非常重要的一步。在Mahout中，我们可以使用JDOM工具对原始数据进行处理。以下是一个简单的例子： java import org.jdom2.Document; import org.jdom2.Element; import org.jdom2.input.SAXBuilder; // 创建一个SAX解析器 SAXBuilder saxBuilder = new SAXBuilder(); // 解析XML文件 Document doc = saxBuilder.build("data.xml"); // 获取根元素 Element root = doc.getRootElement(); // 遍历所有子元素 for (Element element : root.getChildren()) { // 对每个子元素进行处理 } 四、特征提取在Mahout中，我们可以使用TF-IDF算法来提取文本的特征。以下是一个简单的例子： java import org.apache.mahout.math.Vector; import org.apache.mahout.text.TfidfVectorizer; // 创建一个TF-IDF向量化器 TfidfVectorizer vectorizer = new TfidfVectorizer(); // 将文本转换为向量 Vector vector = vectorizer.transform(text); 五、模型训练在Mahout中，我们可以使用Naive Bayes、Logistic Regression等算法来进行模型训练。以下是一个简单的例子： java import org.apache.mahout.classifier.NaiveBayes; // 创建一个朴素贝叶斯分类器 NaiveBayes classifier = new NaiveBayes(); // 使用训练集进行训练 classifier.train(trainingData); 六、模型测试在模型训练完成后，我们可以使用测试集对其进行测试。以下是一个简单的例子： java import org.apache.mahout.classifier.NaiveBayes; // 使用测试集进行测试 double accuracy = classifier.evaluate(testData); System.out.println("Accuracy: " + accuracy); 七、总结通过上述步骤，我们就可以使用Mahout进行大规模文本分类了。其实呢，这只是个入门级别的例子，实际上咱们可能要面对更复杂的操作，像是给数据“洗洗澡”（预处理）、抽取出关键信息（特征提取），还有对模型进行深度调教（训练）这些步骤。希望这个教程能帮助你在实际工作中更好地使用Mahout。

2023-03-23 19:56:32

108

青春印记-t

c++

CMakeList.txt在项目构建阶段的关键作用：跨平台构建与编译器选项设置

...List.txt配置文件捯饬妥当之后，它会在哪些环节里施展拳脚，咱们来重点掰扯掰扯。二、什么是CMake？ CMake是一种跨平台的自动化构建系统，它可以生成多个支持不同构建系统的项目文件，如Visual Studio解决方案文件、Xcode项目文件、Unix Makefiles等。它的最大亮点就是能够超级轻松地进行跨平台开发，这样一来，开发者无论在哪个操作系统上，都能轻轻松松构建和部署自己的项目，毫无压力，简直像在各个平台上自由穿梭一样便利。三、CMakeList.txt的作用 CMakeList.txt是一个文本文件，其中包含了构建项目的指令。当我们动手运行cmake这个命令时，它就像个聪明的小助手，会认真读取咱们在CMakeList.txt文件里写的各种“小纸条”（也就是指令啦），然后根据这些“小纸条”的指示，自动生成对应的构建文件，这样一来，我们就可以更方便地搭建和构建项目了。所以呢，CMakeList.txt这个文件啊，它可是咱们项目里的顶梁柱，相当于一份详细的构建指南，决定了咱们整个项目该走怎样的构建路径。四、CMakeList.txt在哪些阶段起作用？首先，我们需要了解的是，当我们在本地开发时，通常会经历以下几个阶段： 1. 编码阶段在这个阶段，我们编写我们的C++代码，完成我们的项目设计和实现。 2. 构建阶段在这个阶段，我们需要使用一些工具来构建我们的项目，生成可执行文件或其他类型的输出文件。 3. 测试阶段在这个阶段，我们需要对我们的项目进行全面的测试，确保其能够正常工作。 4. 发布阶段在这个阶段，我们需要将我们的项目发布给用户，供他们下载和使用。那么，在这些阶段中，CMakeList.txt分别会起到什么作用呢？ 1. 编码阶段在编码阶段，我们并不需要直接使用CMakeList.txt。在这个阶段，我们的主要任务是编写高质量的C++代码。嘿，你知道吗？CMakeList.txt这个小玩意儿可厉害了，它就像个项目经理，能帮我们把项目结构整得明明白白的。比如，它可以告诉我们哪些源代码文件之间是“你离不开我、我离不开你”的依赖关系，还能指导编译器用特定的方式去构建项目，真可谓咱们开发过程中的得力小助手！ 2. 构建阶段在构建阶段，CMakeList.txt就显得尤为重要了。当我们动手运行cmake这个命令时，它就像个聪明的小助手，会认真读取咱们在CMakeList.txt文件里写的各种“小纸条”（也就是指令啦），然后根据这些“小纸条”的指示，自动生成对应的构建文件，这样一来，我们就可以更方便地搭建和构建项目了。这些构建文件可以是各种类型的，包括Visual Studio解决方案文件、Xcode项目文件、Unix Makefiles等。用这种方式，咱们就能轻轻松松地在不同的操作系统之间切换，继续我们项目的搭建工作啦！ 3. 测试阶段在测试阶段，我们通常不会直接使用CMakeList.txt。不过，假如我们的项目里头捣鼓了一些个性化的测试框架，那我们可能就得在CMakeList.txt这个文件里头写上一些特别的命令行“暗号”，这样咱们的测试框架才能在构建的过程中乖乖地、准确无误地跑起来。 4. 发布阶段在发布阶段，我们通常也不会直接使用CMakeList.txt。然而，如果我们希望在发布过程中自动打包我们的项目，那么我们可能需要在CMakeList.txt中定义一些特殊的指令，以便自动打包我们的项目。五、总结总的来说，CMakeList.txt在我们的项目开发过程中扮演着非常重要的角色。无论是编码阶段、构建阶段、测试阶段还是发布阶段，我们都离不开它。只要咱们搞明白了CMakeList.txt这个文件的基本操作和用法，那就相当于拿到一把神奇的钥匙，能够轻松玩转我们的项目管理，让工作效率嗖嗖地往上窜，简直不要太爽！所以，无论是刚入门的小白，还是身经百战的老司机，都得好好研究琢磨这个CMakeList.txt文件，把它整明白了才行！

2023-12-09 16:39:31

395

彩虹之上_t

Nginx

使用Nginx反向代理隐藏Web应用端口号配置详解

...的服务器大哥，等大哥处理完，再把结果送回给客户。简单来说，就是个中转站，让客户和服务器之间的交流更顺畅。这样做的好处有很多，比如负载均衡、缓存管理等。而我们今天要关注的是它能帮助我们隐藏端口号。 3. 端口号的重要性与问题在互联网上，每个应用服务都会绑定到特定的端口上，比如HTTP通常使用80端口，HTTPS使用443端口。不过嘛，如果我们的应用用的是非标准端口（比如8080），那用户就得在网址里加上端口号。这样挺麻烦的，还容易按错键。想让用户访问的时候不用输端口号？那就得用Nginx反向代理来帮忙啦！ 4. 如何配置Nginx反向代理？现在，让我们看看具体的配置步骤。想象一下，我们有个Web应用在后台占着8080端口，但咱们想让用户打开http://example.com就能直接看到，完全不用管什么端口号的事。以下是具体的操作步骤： 4.1 安装Nginx 首先，你需要确保已经安装了Nginx。如果你还没有安装，可以参考以下命令（以Ubuntu为例）： bash sudo apt update sudo apt install nginx 4.2 编辑Nginx配置文件接下来，编辑你的Nginx配置文件。通常情况下，该文件位于/etc/nginx/nginx.conf或/etc/nginx/sites-available/default。这里我们以默认配置文件为例进行修改。 bash sudo nano /etc/nginx/sites-available/default 4.3 添加反向代理配置在配置文件中添加如下内容： nginx server { listen 80; server_name example.com; location / { proxy_pass http://localhost:8080; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme; } } 这段配置做了两件事：一是监听80端口（即HTTP协议的标准端口），二是将所有请求转发到本地的8080端口。 4.4 测试并重启Nginx 配置完成后，我们需要测试配置是否正确，并重启Nginx服务： bash sudo nginx -t sudo systemctl restart nginx 4.5 验证配置最后，打开浏览器访问http://example.com，如果一切正常，你应该能够看到你的Web应用，而不需要输入任何端口号！ 5. 深入探讨在这个过程中，我不得不感叹Nginx的强大。它不仅可以轻松地完成反向代理的任务，还能帮助我们解决很多实际问题。当然啦，Nginx 能做的可不仅仅这些呢。比如说 SSL/TLS 加密和负载均衡，这些都是挺有意思的玩意儿，值得咱们好好研究一番。 6. 结语通过今天的分享，希望大家对如何使用Nginx反向代理来隐藏端口号有了更深入的理解。虽说配置起来得花些时间和耐心，但等你搞定后，肯定会觉得这一切都超级值！说到底，让用户体验更贴心、更简便，这可是咱们每个程序员努力的方向呢！希望你们也能在自己的项目中尝试使用Nginx，体验它带来的便利！

2025-02-07 15:35:30

111

翡翠梦境_

Kubernetes

Pod内MountVolume难题：'MountVolumeSetUp failed'错误的精确排查与实例修复

...限不够，路径不合拍，文件系统不认你，或者是哪个设置不小心搞错了，总之就是挂载路上遇到阻碍了。你知道吗，那个"exit status"后面的小数字就像个神秘的密码，它其实是个超级详细的错误信号灯，能帮咱们精准地找出问题出在哪儿。三、问题分类与排查 1. 权限问题 bash kubectl logs -n | grep "Permission denied" 如果输出中有类似信息，检查PV的owner和group是否与Pod的对应设置一致，或者给予Pod适当的权限。 2. 路径冲突 yaml apiVersion: v1 kind: PersistentVolumeClaim metadata: name: pv-volume-claim spec: accessModes: [ "ReadWriteOnce" ] storageClassName: standard resources: requests: storage: 1Gi --- apiVersion: apps/v1 kind: Deployment metadata: name: my-app spec: template: metadata: name: my-pod spec: containers: - name: my-container volumeMounts: - mountPath: /data name: pv-volume subPath: 检查subPath是否指向了已存在的目录，如果有冲突，可能需要调整路径或清理。 3. 文件系统类型不兼容 yaml apiVersion: v1 kind: PersistentVolume metadata: name: pv-volume spec: storageClassName: nfs capacity: storage: 1Gi nfs: path: /export/mydata 确保PV的存储类型与Pod中期望的挂载类型匹配，如NFS、HostPath等。四、解决方案与实践 1. 更新权限 bash kubectl exec -it -- chown : /path/to/mount 2. 调整Pod配置如果是路径冲突，可以修改Pod的subPath，或者在创建PV时指定一个特定的挂载点。 3. 修改PV类型 yaml apiVersion: v1 kind: PersistentVolume spec: ... fsType: ext4 更改为与应用兼容的文件系统类型五、预防措施 - 定期检查集群资源和配置，确保PV与Pod之间的映射正确。 - 使用Kubernetes的健康检查机制，监控挂载状态，早期发现问题。 - 在应用部署前，先在测试环境中验证PV的挂载。六、结语解决“MountVolumeSetUp failed”错误并不是一次性的任务，而是一个持续的过程，需要我们对Kubernetes有深入的理解和实践经验。通过以上步骤和实例，相信你已经在处理这类问题上更加得心应手了。记住，遇到问题不要慌张，一步步分析，代码调试，总能找到答案。Happy Kubernetesing!

2024-05-03 11:29:06

127

红尘漫步

Hibernate

SessionFactory在Hibernate中的初始化步骤及生成Session对象、配置文件加载与数据库连接详解

...快地和数据库打交道，处理数据啥的简直不要太方便！今天我们要讲的主题是SessionFactory的初始化与作用。这可真是咱们不能忽视的关键一步呀，它可是会直接影响到我们程序跑得顺不顺畅，数据安不安全的大问题嘞！那么，我们一起来学习一下吧！二、什么是SessionFactory 首先，我们需要明确一点：SessionFactory是一个工厂类，用于创建Session对象。Session是Hibernate的核心，它负责处理所有的持久化操作。SessionFactory，你就想象成一个超级能干的制造小能手，它的任务就是帮咱们精心打造出一个个我们需要的Session对象。三、SessionFactory初始化过程接下来，我们就来详细讲解一下SessionFactory的初始化过程。 1. 配置文件加载我们先看第一步，配置文件加载。在这里，我们主要指的是hibernate.cfg.xml这个文件。这个文件里头记录了一些Hibernate的基础配置内容，就好比是数据库连接的小秘籍，还有实体类映射的说明书啥的。 2. 创建SessionFactory实例有了配置文件之后，我们就可以开始创建SessionFactory实例了。这个过程是通过调用Configuration类的configure()方法实现的。 java Configuration configuration = new Configuration().configure(); SessionFactory sessionFactory = configuration.buildSessionFactory(); 3. 初始化SessionFactory 最后一步就是初始化SessionFactory了。这一步骤的重点，就像是给Hibernate来一场赛前热身，做些“幕后工作”，像是把SQL语句好好捯饬捯饬、让它跑得更快更顺溜，还有就是调整缓存设置，让数据存取效率嗖嗖地提升。 java sessionFactory.openSession(); 四、SessionFactory的作用了解了SessionFactory的初始化过程后，我们再来谈谈它的作用。 1. Session对象的生成就像前面提到的那样，SessionFactory是一个工厂类，它的主要任务就是生成Session对象。我们可以利用SessionFactory来创建多个Session对象，每个Session对象都可以用来进行持久化操作。 2. 事务管理 SessionFactory还可以帮助我们管理事务。在Hibernate中，事务是由Session对象管理的。如果你想在一个操作流程里搞定多个要保存的东西，其实特别简单，你只需要在一个Session对象里面挨个调用对应的方法就OK啦，就像咱们平时在电脑上打开一个窗口，然后在这个窗口里完成一系列操作一样方便。 3. 数据库优化除了上述功能外，SessionFactory还有一个很重要的作用就是进行数据库优化。例如，它可以预编译SQL语句，从而提高执行速度；它还可以设置缓存策略，避免频繁从数据库中读取数据。五、总结以上就是关于SessionFactory的初始化过程以及作用的详细介绍。总的来说，SessionFactory在Hibernate里扮演着核心角色，对我们这些开发者来说，掌握它的一些基本操作和原理，那可是必不可少的！希望通过这篇文章，能让你对SessionFactory有一个更深入的理解。如果你还有其他问题，欢迎随时留言，我会尽力回答你的。六、致谢最后，我要感谢每一位读者朋友的支持和鼓励。大家伙儿对我的支持和热爱，就像火把一样点燃了我前进的动力！我会倍加努力，不断钻研，给大家带来更多新鲜、有趣、接地气的技术分享，让咱们一起在技术的海洋里畅游吧！谢谢大家，期待下次再见！ Best regards, [你的名字]

2023-07-29 23:00:44

491

半夏微凉-t

Go Iris

Go Iris框架中跨操作系统路径分隔符兼容处理：`path/filepath`包与`filepath.Join()`函数在Windows、Linux和Mac OS的应用

...挠头的细节问题，比如文件路径这块儿，咱们可千万不能忽视一个虽不起眼却至关重要的小点——路径分隔符的兼容性问题。这次，咱们一起手牵手，踏入Go Iris的大门，来聊聊如何在Windows、Linux还有Mac OS这些五花八门的操作系统之间，实现路径分隔符的灵活、无缝切换，让程序跑起来像滑板鞋在不同地面一样自如流畅。 02 路径分隔符的挑战在不同的操作系统中，路径分隔符是各异的。例如，Windows系统使用反斜杠\作为路径分隔符，而Unix/Linux系列（包括Mac OS）则采用正斜杠/。如果你直接在代码里把某个特定操作系统的路径分隔符给死板地写死了，那么当你这应用跑到其他系统上跑的时候，可能会遇到一个让人抓狂的问题，就是系统压根认不出你设置的路径，那场面可就尴尬啦！ 03 Go标准库中的解决方案幸运的是，Go语言的标准库已经为我们提供了解决这个问题的方法。你知道吗，在path/filepath这个包里头，藏着一个挺机智的小家伙——它叫Separator，是个常量。这家伙可灵光了，能根据咱们当前运行的环境，自动给出最合适的路径分隔符，省得咱们自己操心。同时，filepath.Join()函数可以用来安全地连接路径元素，无需担心路径分隔符的问题。 go import ( "path/filepath" ) func main() { // 不论在哪种操作系统下，这都将生成正确的路径 path := filepath.Join("src", "github.com", "kataras", "iris") fmt.Println(path) // 在nix系统下输出："src/github.com/kataras/iris" // 在Windows系统下输出："src\github.com\kataras\iris" } 04 Go Iris框架中的实践在Iris框架中，我们同样需要关注路径的兼容性问题。比如在设置静态文件目录或视图模板目录时： go import ( "github.com/kataras/iris/v12" "path/filepath" ) func main() { app := iris.New() // 使用filepath.Join确保路径兼容所有操作系统 staticPath := filepath.Join("web", "static") app.HandleDir("/static", staticPath) tmplPath := filepath.Join("web", "templates") ts, _ := iris.HTML(tmplPath, ".html").Layout("shared/layout.html").Build() app.RegisterView(ts) app.Listen(":8080") } 在这个示例中，无论我们的应用部署在哪种操作系统上，都能正确找到并服务静态资源和模板文件。 05 总结与思考作为一名开发者，在编写跨平台应用时，我们必须对这些看似微小但至关重要的细节保持敏感。你知道吗，Go语言这玩意儿，加上它那个超牛的生态系统——比如那个Iris框架，简直是我们解决这类问题时的得力小助手，既方便又靠谱！你知道吗，借助path/filepath这个神奇的工具包，我们就能轻轻松松解决路径分隔符在不同操作系统之间闹的小矛盾，让咱们编写的程序真正做到“写一次，到处都能顺畅运行”，再也不用担心系统差异带来的小麻烦啦！在整个探索过程中，我们要不断提醒自己，编程不仅仅是完成任务，更是一种细致入微的艺术，每一个细节都可能影响到最终用户体验。所以，咱们一块儿拉上Go Iris这位好伙伴，一起跨过不同操作系统之间的大峡谷，让咱的代码变得更结实、更灵活，同时也充满更多的人性化关怀和温度，就像给代码注入了生命力一样。

2023-11-22 12:00:57

384

翡翠梦境

知识学习

实践的时候请根据实际情况谨慎操作。

随机学习一条linux命令：

traceroute host - 显示数据包到目标主机经过的路由路径。