... 引言在大数据时代，高效的数据分析成为企业决策的重要支撑。Apache Impala，这个家伙可真不简单！它就像个超级英雄，专门负责搞定那些海量数据的大任务。别看数据量大得能装满好几座山（PB级别），Impala一上阵，立马就能飞快地帮我们查询到需要的信息，而且还是那种边聊天边玩手机也能随时翻阅数据的那种速度，简直不要太爽！所以，如果你想找一个既能快速响应又能处理大数据的小伙伴，Impala绝对是你的菜！嘿，你知道吗？Impala的厉害之处在于它有个超酷的设计理念！那就是不让那些中间的数据白白地躺在那儿不动，而是尽可能地让所有的任务一起并肩作战。这样一来，不管你的数据有多大，Impala都能像小菜一碟一样，高效地完成查询，让你的数据分析快人一步！是不是超级牛逼啊？然而，要充分发挥Impala的潜力，硬件配置的选择与优化至关重要。嘿，兄弟！这篇大作就是要好好扒一扒 Impala 这个家伙的查询速度和咱们硬件设备之间的那点事儿。咱们要拿真实的代码例子来说明，怎么才能把这事儿给整得既高效又顺溜。咱们得聊聊，怎么根据你的硬件配置，调整 Impala 的设置，让它跑起来更快，效率更高。别担心，咱们不会用一堆干巴巴的术语让你头疼，而是用一些接地气的语言，让你一看就懂，一学就会的那种。准备好了吗？咱们这就开始，探索这个神秘的关系，找出最佳的优化策略，让你的查询快如闪电，流畅如丝！ 1. Impala查询性能的关键因素 Impala的性能受到多种因素的影响，包括但不限于硬件资源、数据库架构、查询优化策略等。硬件配置作为基础，直接影响着查询的响应时间和效率。 - 内存：Impala需要足够的内存来缓存查询计划和执行状态，同时存储中间结果。内存的大小直接影响到并行度和缓存效果，进而影响查询性能。 - CPU：CPU的计算能力决定了查询执行的速度，尤其是在多线程环境下。合理的CPU分配可以显著提升查询速度。 - 网络：数据存储和计算之间的网络延迟也会影响查询性能，尤其是在分布式环境中。优化网络配置可以减少数据传输时间。 2. 实例代码配置与优化接下来，我们通过一段简单的代码实例，展示如何通过配置和优化来提升Impala的查询性能。示例代码：查询性能调优配置 python 假设我们正在使用Cloudera Manager进行配置管理调整Impala节点的内存配置 cloudera_manager.set_impala_config('memory', { 'query_mem_limit': '2GB', 根据实际需求调整查询内存限制 'coordinator_memory_limit': '16GB', 协调器的最大内存限制 'executor_memory_limit': '16GB' 执行器的最大内存限制 }) 调整CPU配额 cloudera_manager.set_impala_config('cpu', { 'max_threads_per_node': 8, 每个节点允许的最大线程数 'max_threads_per_core': 2 每个核心允许的最大线程数 }) 开启并行查询功能 cloudera_manager.set_impala_config('parallelism', { 'default_parallelism': 'auto' 自动选择最佳并行度 }) 运行查询前，确保表数据更新已同步到Impala cloudera_manager.refresh_table('your_table_name') cloudera_manager.compute_stats('your_table_name') print("配置已更新，查询性能调优已完成。") 这段代码展示了如何通过Cloudera Manager调整Impala节点的内存限制、CPU配额以及开启自动并行查询功能。通过这样的配置，我们可以针对特定的查询场景和数据集进行优化，提高查询性能。 3. 性能监控与诊断为了确保硬件配置达到最佳状态，持续的性能监控和诊断至关重要。利用Impala自带的诊断工具，如Explain Plan和Profile，可以帮助我们深入了解查询执行的详细信息，包括但不限于执行计划、CPU和内存使用情况、I/O操作等。 Examine Plan 示例 bash 使用Explain Plan分析查询执行计划 impala-shell> EXPLAIN SELECT FROM your_table WHERE column = 'value'; 输出的结果将展示查询的执行计划，帮助识别瓶颈所在，为后续的优化提供依据。 4. 结语 Impala的查询性能与硬件配置息息相关，合理的配置不仅能提升查询效率，还能优化资源利用，降低运行成本。通过本文的探讨和示例代码的展示，希望能够激发读者对Impala性能优化的兴趣，并鼓励大家在实践中不断探索和尝试，以实现大数据分析的最佳效能。嘿，兄弟！你得明白，真正的硬仗可不只在找答案，而是在于找到那个对特定工作环境最合适的平衡点。这事儿啊，一半靠的是技巧，另一半还得靠点智慧。就像调鸡尾酒一样，你得知道加多少冰，放什么酒，才能调出那个完美的味道。所以，别急着去死记硬背那些公式和规则，多琢磨琢磨，多试试错，慢慢你会发现，找到那个平衡点，其实挺像在创作一首诗，又像是在解一道谜题。

2024-08-19 16:08:50

晚秋落叶

Apache Lucene

Apache Lucene索引与搜索：Java中避免NullPointerException策略

...代码中，特别是在处理复杂数据结构时。那么，让我们一边学习如何优雅地使用Lucene，一边看看如何巧妙地避开NullPointerException吧！二、Lucene的魅力所在从概念到实践首先，让我们来了解一下Lucene的基本概念。Lucene可真是个厉害的角色，它是个超级能打的文本搜索小能手，给咱们提供了全套的工具，不管是建索引、搜东西还是让搜索结果更给力，都能搞定！简单来说，Lucene就像是你电脑上的超级搜索引擎，但它的能力远不止于此。 2.1 创建你的第一个索引在开始之前，你需要确保已经在你的项目中引入了Lucene的相关依赖。接下来，让我们通过一些简单的步骤来创建一个基本的索引： java import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.IndexWriterConfig; import org.apache.lucene.store.Directory; import org.apache.lucene.store.RAMDirectory; public class SimpleIndexer { public static void main(String[] args) throws Exception { // 创建内存中的目录，用于存储索引 Directory directory = new RAMDirectory(); // 创建索引配置 IndexWriterConfig config = new IndexWriterConfig(new StandardAnalyzer()); // 创建索引写入器 IndexWriter indexWriter = new IndexWriter(directory, config); // 创建文档对象 Document doc = new Document(); doc.add(new Field("content", "Hello Lucene!", Field.Store.YES, Field.Index.ANALYZED)); // 添加文档到索引 indexWriter.addDocument(doc); // 关闭索引写入器 indexWriter.close(); } } 在这个例子中，我们首先创建了一个内存中的目录（RAMDirectory），这是为了方便演示。接着，我们定义了索引配置，并使用StandardAnalyzer对文本进行分析。最后，我们创建了一个文档，并将它添加到了索引中。是不是很简单呢？ 2.2 解决NullPointerException：预防胜于治疗现在，让我们回到那个恼人的NullPointerException问题上。在用Lucene做索引的时候，经常会被空指针异常坑到，特别是当你试图去访问那些还没被初始化的对象或者字段时。为了避免这种情况，我们需要养成良好的编程习惯，比如： - 检查null值：在访问任何对象前，先检查是否为null。 - 初始化变量：确保所有对象在使用前都被正确初始化。 - 使用Optional类：Java 8引入的Optional类可以帮助我们更好地处理可能为空的情况。例如，假设我们在处理索引文档时遇到了一个可能为空的字段，我们可以这样处理： java // 假设我们有一个可能为空的内容字段 String content = getContent(); // 这里可能会返回null if (content != null) { doc.add(new Field("content", content, Field.Store.YES, Field.Index.ANALYZED)); } else { System.out.println("内容字段为空！"); } 三、深入探索 Lucene的高级特性 3.1 搜索：不仅仅是查找除了创建索引外，Lucene还提供了强大的搜索功能。让我们来看一个简单的搜索示例： java import org.apache.lucene.index.DirectoryReader; import org.apache.lucene.queryparser.classic.QueryParser; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.search.ScoreDoc; import org.apache.lucene.search.TopDocs; import org.apache.lucene.store.Directory; public class SimpleSearcher { public static void main(String[] args) throws Exception { Directory directory = new RAMDirectory(); IndexWriterConfig config = new IndexWriterConfig(new StandardAnalyzer()); IndexWriter indexWriter = new IndexWriter(directory, config); Document doc = new Document(); doc.add(new Field("content", "Hello Lucene!", Field.Store.YES, Field.Index.ANALYZED)); indexWriter.addDocument(doc); indexWriter.close(); DirectoryReader reader = DirectoryReader.open(directory); IndexSearcher searcher = new IndexSearcher(reader); QueryParser parser = new QueryParser("content", new StandardAnalyzer()); Query query = parser.parse("lucene"); TopDocs results = searcher.search(query, 10); for (ScoreDoc scoreDoc : results.scoreDocs) { System.out.println(searcher.doc(scoreDoc.doc).get("content")); } reader.close(); } } 这段代码展示了如何使用QueryParser解析查询字符串，并使用IndexSearcher执行搜索操作。通过这种方式，我们可以轻松地从索引中检索出相关的文档。 3.2 高级搜索技巧：优化你的查询当你开始构建更复杂的搜索逻辑时，Lucene提供了许多高级功能来帮助你优化搜索结果。比如说，你可以用布尔查询把好几个搜索条件拼在一起，或者用模糊匹配让搜索变得更灵活一点。这样找东西就方便多了！ java import org.apache.lucene.index.Term; import org.apache.lucene.search.BooleanClause; import org.apache.lucene.search.BooleanQuery; import org.apache.lucene.search.FuzzyQuery; // 构建布尔查询 BooleanQuery booleanQuery = new BooleanQuery(); booleanQuery.add(new TermQuery(new Term("content", "hello")), BooleanClause.Occur.MUST); booleanQuery.add(new FuzzyQuery(new Term("content", "lucen")), BooleanClause.Occur.SHOULD); TopDocs searchResults = searcher.search(booleanQuery, 10); 在这个例子中，我们创建了一个布尔查询，其中包含两个子查询：一个是必须满足的精确匹配查询，另一个是可选的模糊匹配查询。这种组合可以显著提升搜索的准确性和相关性。四、结语享受编码的乐趣通过这篇文章，我们不仅学习了如何使用Apache Lucene来创建和搜索索引，还一起探讨了如何有效地避免NullPointerException。希望这些示例代码和技巧能对你有所帮助。记住，编程不仅仅是一门技术，更是一种艺术。尽情享受编程的乐趣吧，一路探索和学习，你会发现自己的收获多到让人惊喜！如果你有任何问题或想法，欢迎随时与我交流！ --- 以上就是关于Apache Lucene与javalangNullPointerException: null的讨论。希望能通过这篇文章点燃你对Lucene的热情，让你在实际开发中游刃有余，玩得更嗨！让我们一起继续探索更多有趣的技术吧！

2024-10-16 15:36:29

岁月静好

Logstash

Logstash+Elasticsearch：实时索引与日志分析中的Grok过滤器和批量处理

...csearch：实时数据处理的黄金搭档嘿，朋友们！今天我要带大家走进一个非常有趣的技术领域——Logstash与Elasticsearch的结合。这俩在大数据处理界可是响当当的角色，特别是在实时索引优化这块，简直绝了！想象一下，你正面对着一大堆日志数据，每天都得迅速搞定它们的分析和查找，这时候，Logstash加上Elasticsearch简直就是你的超级英雄搭档，简直不要太好用！ 1.1 什么是Logstash？ Logstash 是一个开源的数据收集引擎，它能够从多个来源采集数据，然后进行转换，最后输出到各种存储系统中。它的设计初衷就是用来处理日志和事件数据的，但其实它的能力远不止于此。这家伙挺能来事儿的，不仅能搞定各种输入插件——比如文件啊、网页数据啊、数据库啥的，还能用过滤插件整点儿花样，比如说正则表达式匹配或者修改字段之类的。最后，它还支持不少输出插件，比如往Elasticsearch或者Kafka里面扔数据，简直不要太方便！这种灵活性使得Logstash成为了处理复杂数据流的理想选择。 1.2 Elasticsearch：实时搜索与分析的利器 Elasticsearch 是一个基于Lucene构建的开源分布式搜索引擎，它提供了强大的全文搜索功能，同时也支持结构化搜索、数值搜索以及地理空间搜索等多种搜索类型。此外，Elasticsearch还拥有出色的实时分析能力，这得益于其独特的倒排索引机制。当你将数据导入Elasticsearch后，它会自动对数据进行索引，从而大大提高了查询速度。 2. 实时索引优化让数据飞起来现在我们已经了解了Logstash和Elasticsearch各自的特点，接下来就让我们看看如何通过它们来实现高效的实时索引优化吧！ 2.1 数据采集与预处理首先，我们需要利用Logstash从各种数据源采集数据。好嘞，咱们换个说法：比如说，我们要从服务器的日志里挖出点儿有用的东西，就像找宝藏一样，目标就是那些访问时间、用户ID和请求的网址这些信息。我们可以用Filebeat这个工具来读取日志文件，然后再用Grok这个插件来解析这些数据，让信息变得更清晰易懂。下面是一个具体的配置示例： yaml input { file { path => "/var/log/nginx/access.log" start_position => "beginning" } } filter { grok { match => { "message" => "%{COMBINEDAPACHELOG}" } } } 这段配置告诉Logstash，从/var/log/nginx/access.log这个路径下的日志文件开始读取，并使用Grok插件中的COMBINEDAPACHELOG模式来解析每一行日志内容。这样子一来，原始的文本信息就被拆成了一个个有组织的小块儿，给接下来的处理铺平了道路，简直不要太方便！ 2.2 高效索引策略一旦数据被Logstash处理完毕，下一步就是将其导入Elasticsearch。为了确保索引操作尽可能高效，我们可以采取一些策略： - 批量处理：减少网络往返次数，提高吞吐量。 - 动态映射：允许Elasticsearch根据文档内容自动创建字段类型，简化索引管理。 - 分片与副本：合理设置分片数量和副本数量，平衡查询性能与集群稳定性。下面是一个简单的Logstash输出配置示例，演示了如何将处理后的数据批量发送给Elasticsearch： yaml output { elasticsearch { hosts => ["localhost:9200"] index => "nginx-access-%{+YYYY.MM.dd}" document_type => "_doc" user => "elastic" password => "changeme" manage_template => false template => "/path/to/template.json" template_name => "nginx-access" template_overwrite => true flush_size => 5000 idle_flush_time => 1 } } 在这段配置中，我们设置了批量大小为5000条记录，以及空闲时间阈值为1秒，这意味着当达到这两个条件之一时，Logstash就会将缓冲区内的数据一次性发送至Elasticsearch。此外，我还指定了自定义的索引模板，以便更好地控制字段映射规则。 3. 实战案例打造高性能日志分析平台好了，理论讲得差不多了，接下来让我们通过一个实际的例子来看看这一切是如何运作的吧！假设你是一家电商网站的运维工程师，最近你们网站频繁出现访问异常的问题，客户投诉不断。为了找出问题根源，你需要对Nginx服务器的日志进行深入分析。幸运的是，你们已经部署了Logstash和Elasticsearch作为日志处理系统。 3.1 日志采集与预处理首先，我们需要确保Logstash能够正确地从Nginx服务器上采集到所有相关的日志信息。根据上面说的设置，我们可以搞一个Logstash配置文件，用来从特定的日志文件里扒拉出重要的信息。嘿，为了让大家看日志的时候能更轻松明了，我们可以加点小技巧，比如说统计每个用户逛网站的频率，或者找出那些怪怪的访问模式啥的。这样一来，信息就一目了然啦！ 3.2 索引优化与查询分析接下来，我们将这些处理后的数据发送给Elasticsearch进行索引存储。有了合适的索引设置，就算同时来一大堆请求，我们的查询也能嗖嗖地快，不会拖泥带水的。比如说，在上面那个输出配置的例子里面，我们调高了批量处理的门槛，同时把空闲时间设得比较短，这样就能大大加快数据写入的速度啦！一旦数据被成功索引，我们就可以利用Elasticsearch的强大查询功能来进行深度分析了。比如说，你可以写个DSL查询，找出最近一周内访问量最大的10个页面；或者，你还可以通过用户ID捞出某个用户的操作记录，看看能不能从中发现问题。 4. 结语拥抱变化，不断探索通过以上介绍，相信大家已经对如何使用Logstash与Elasticsearch实现高效的实时索引优化有了一个全面的认识。当然啦，技术这东西总是日新月异的，所以我们得保持一颗好奇的心，不停地学新技术，这样才能更好地迎接未来的各种挑战嘛！希望这篇文章能对你有所帮助，如果你有任何疑问或建议，欢迎随时留言交流。让我们一起加油，共同成长！

2024-12-17 15:55:35

追梦人

转载文章

[转载]c++ 智能指针的问题_窥见C++11智能指针

...我们，我们将第一时间进行核实并删除相应内容。导语: C++指针的内存管理相信是大部分C++入门程序员的梦魇，受到Boost的启发，C++11标准推出了智能指针，让我们从指针的内存管理中释放出来，几乎消灭所有new和delete。既然智能指针如此强大，今天我们来一窥智能指针的原理以及在多线程操作中需要注意的细节。智能指针的由来在远古时代，C++发明了指针这把双刃剑，既可以让程序员精确地控制堆上每一块内存，也让程序更容易发生crash，大大增加了使用指针的技术门槛。因此，从C++98开始便推出了auto_ptr，对裸指针进行封装，让程序员无需手动释放指针指向的内存区域，在auto_ptr生命周期结束时自动释放，然而，由于auto_ptr在转移指针所有权后会产生野指针，导致程序运行时crash，如下面示例代码所示： auto_ptr<int> p1(new int(10));auto_ptr<int> p2 = p1; //转移控制权p1 += 10; //crash，p1为空指针，可以用p1->get判空做保护因此在C++11又推出了unique_ptr、shared_ptr、weak_ptr三种智能指针，慢慢取代auto_ptr。 unique_ptr的使用 unique_ptr是auto_ptr的继承者，对于同一块内存只能有一个持有者，而unique_ptr和auto_ptr唯一区别就是unique_ptr不允许赋值操作，也就是不能放在等号的右边（函数的参数和返回值例外），这一定程度避免了一些误操作导致指针所有权转移，然而，unique_str依然有提供所有权转移的方法move，调用move后，原unique_ptr就会失效，再用其访问裸指针也会发生和auto_ptr相似的crash，如下面示例代码，所以，即使使用了unique_ptr，也要慎重使用move方法，防止指针所有权被转移。 unique_ptr<int> up(new int(5));//auto up2 = up; // 编译错误auto up2 = move(up);cout << up << endl; //crash，up已经失效，无法访问其裸指针除了上述用法，unique_ptr还支持创建动态数组。在C++中，创建数组有很多方法，如下所示： // 静态数组，在编译时决定了数组大小int arr[10];// 通过指针创建在堆上的数组，可在运行时动态指定数组大小，但需要手动释放内存int arr = new int[10];// 通过std::vector容器创建动态数组，无需手动释放数组内存vector<int> arr(10);// 通过unique_ptr创建动态数组，也无需手动释放数组内存，比vector更轻量化unique_ptr<int[]> arr(new int[10]); 这里需要注意的是，不管vector还是unique_ptr，虽然可以帮我们自动释放数组内存，但如果数组的元素是复杂数据类型时，我们还需要在其析构函数中正确释放内存。真正的智能指针：shared_ptr auto_ptr和unique_ptr都有或多或少的缺陷，因此C++11还推出了shared_ptr，这也是目前工程内使用最多最广泛的智能指针，他使用引用计数（感觉有参考Objective-C的嫌疑），实现对同一块内存可以有多个引用，在最后一个引用被释放时，指向的内存才释放，这也是和unique_ptr最大的区别。另外，使用shared_ptr过程中有几点需要注意：构造shared_ptr的方法，如下示例代码所示，我们尽量使用shared_ptr构造函数或者make_shared的方式创建shared_ptr，禁止使用裸指针赋值的方式，这样会shared_ptr难于管理指针的生命周期。 // 使用裸指针赋值构造，不推荐，裸指针被释放后，shared_ptr就野了，不能完全控制裸指针的生命周期，失去了智能指针价值int p = new int(10);shared_ptr<int>sp = p;delete p; // sp将成为野指针，使用sp将crash// 将裸指针作为匿名指针传入构造函数，一般做法，让shared_ptr接管裸指针的生命周期，更安全shared_ptr<int>sp1(new int(10));// 使用make_shared，推荐做法，更符合工厂模式，可以连代码中的所有new，更高效；方法的参数是用来初始化模板类shared_ptr<int>sp2 = make_shared<int>(10); 禁止使用指向shared_ptr的裸指针，也就是智能指针的指针，这听起来就很奇怪，但开发中我们还需要注意，使用shared_ptr的指针指向一个shared_ptr时，引用计数并不会加一，操作shared_ptr的指针很容易就发生野指针异常。 shared_ptr<int>sp = make_shared<int>(10);cout << sp.use_count() << endl; //输出1shared_ptr<int> sp1 = &sp;cout << (sp1).use_count() << endl; //输出依然是1(sp1).reset(); //sp成为野指针cout << sp << endl; //crash 使用shared_ptr创建动态数组，在介绍unique_ptr时我们就讲过创建动态数组，而shared_ptr同样可以做到，不过稍微复杂一点，如下代码所示，除了要显示指定析构方法外（因为默认是T的析构函数，不是T[]），另外对外的数据类型依然是shared_ptr<T>，非常有迷惑性，看不出来是数组，最后不能直接使用下标读写数组，要先get()获取裸指针才可以使用下标。所以，不推荐使用shared_ptr来创建动态数组，尽量使用unique_ptr，这可是unique_ptr为数不多的优势了。 template <typename T>shared_ptr<T> make_shared_array(size_t size) {return shared_ptr<T>(new T[size], default_delete<T[]>());}shared_ptr<int>sp = make_shared_array(10); //看上去是shared<int>类型，实际上是数组sp.get()[0] = 100; //不能直接使用下标读写数组元素，需要通过get()方法获取裸指针后再操作用shared_ptr实现多态，在我们使用裸指针时，实现多态就免不了定义虚函数，那么用shared_ptr时也不例外，不过有一处是可以省下的，就是析构函数我们不需要定义为虚函数了，如下面代码所示： class A {public:~A() {cout << "dealloc A" << endl;} };class B : public A {public:~B() {cout << "dealloc B" << endl;} };int main(int argc, const char argv[]) {A a = new B();delete a; //只打印dealloc Ashared_ptr<A>spa = make_shared(); //析构spa是会先打印dealloc B，再打印dealloc Areturn 0;} 循环引用，笔者最先接触引用计数的语言就是Objective-C，而OC中最常出现的内存问题就是循环引用，如下面代码所示，A中引用B，B中引用A，spa和spb的强引用计数永远大于等于1，所以直到程序退出前都不会被退出，这种情况有时候在正常的业务逻辑中是不可避免的，而解决循环引用的方法最有效就是改用weak_ptr，具体可见下一章。 class A {public:shared_ptr b;};class B {public:shared_ptr<A> a;};int main(int argc, const char argv[]) {shared_ptr<A> spa = make_shared<A>();shared_ptr spb = make_shared();spa->b = spb;spb->a = spa;return 0;} //main函数退出后，spa和spb强引用计数依然为1，无法释放刚柔并济：weak_ptr 正如上一章提到，使用shared_ptr过程中有可能会出现循环引用，关键原因是使用shared_ptr引用一个指针时会导致强引用计数+1，从此该指针的生命周期就会取决于该shared_ptr的生命周期，然而，有些情况我们一个类A里面只是想引用一下另外一个类B的对象，类B对象的创建不在类A，因此类A也无需管理类B对象的释放，这个时候weak_ptr就应运而生了，使用shared_ptr赋值给一个weak_ptr不会增加强引用计数（strong_count），取而代之的是增加一个弱引用计数（weak_count），而弱引用计数不会影响到指针的生命周期，这就解开了循环引用，上一章最后的代码使用weak_ptr可改造为如下代码。 class A {public:shared_ptr b;};class B {public:weak_ptr<A> a;};int main(int argc, const char argv[]) {shared_ptr<A> spa = make_shared<A>();shared_ptr spb = make_shared();spa->b = spb; //spb强引用计数为2，弱引用计数为1spb->a = spa; //spa强引用计数为1，弱引用计数为2return 0;} //main函数退出后，spa先释放，spb再释放，循环解开了使用weak_ptr也有需要注意的点，因为既然weak_ptr不负责裸指针的生命周期，那么weak_ptr也无法直接操作裸指针，我们需要先转化为shared_ptr，这就和OC的Strong-Weak Dance有点像了，具体操作如下：shared_ptr<int> spa = make_shared<int>(10);weak_ptr<int> spb = spa; //weak_ptr无法直接使用裸指针创建if (!spb.expired()) { //weak_ptr最好判断是否过期，使用expired或use_count方法，前者更快spb.lock() += 10; //调用weak_ptr转化为shared_ptr后再操作裸指针}cout << spa << endl; //20 智能指针原理看到这里，智能指针的用法基本介绍完了，后面笔者来粗浅地分析一下为什么智能指针可以有效帮我们管理裸指针的生命周期。使用栈对象管理堆对象在C++中，内存会分为三部分，堆、栈和静态存储区，静态存储区会存放全局变量和静态变量，在程序加载时就初始化，而堆是由程序员自行分配，自行释放的，例如我们使用裸指针分配的内存；而最后栈是系统帮我们分配的，所以也会帮我们自动回收。因此，智能指针就是利用这一性质，通过一个栈上的对象（shared_ptr或unique_ptr）来管理一个堆上的对象（裸指针），在shared_ptr或unique_ptr的析构函数中判断当前裸指针的引用计数情况来决定是否释放裸指针。 shared_ptr引用计数的原理一开始笔者以为引用计数是放在shared_ptr这个模板类中，但是细想了一下，如果这样将shared_ptr赋值给另一个shared_ptr时，是怎么做到两个shared_ptr的引用计数同时加1呢，让等号两边的shared_ptr中的引用计数同时加1？不对，如果还有第二个shared_ptr再赋值给第三个shared_ptr那怎么办呢？或许通过下面的类图便清楚个中奥秘。 [ boost中shared_ptr与weak_ptr类图 ] 我们重点关注shared_ptr<T>的类图，它就是我们可以直接操作的类，这里面包含裸指针T，还有一个shared_count的对象，而shared_count对象还不是最终的引用计数，它只是包含了一个指向sp_counted_base的指针，这应该就是真正存放引用计数的地方，包括强应用计数和弱引用计数，而且shared_count中包含的是sp_counted_base的指针，不是对象，这也就意味着假如shared_ptr<T> a = b，那么a和b底层pi_指针指向的是同一个sp_counted_base对象，这就很容易做到多个shared_ptr的引用计数永远保持一致了。多线程安全本章所说的线程安全有两种情况：多个线程操作多个不同的shared_ptr对象 C++11中声明了shared_ptr的计数操作具有原子性，不管是赋值导致计数增加还是释放导致计数减少，都是原子性的，这个可以参考sp_counted_base的源码，因此，基于这个特性，假如有多个shared_ptr共同管理一个裸指针，那么多个线程分别通过不同的shared_ptr进行操作是线程安全的。多个线程操作同一个shared_ptr对象同样的道理，既然C++11只负责sp_counted_base的原子性，那么shared_ptr本身就没有保证线程安全了，加入两个线程同时访问同一个shared_ptr对象，一个进行释放（reset），另一个读取裸指针的值，那么最后的结果就不确定了，很有可能发生野指针访问crash。作者：腾讯技术工程 https://mp.weixin.qq.com/s?__biz=MjM5ODYwMjI2MA==&mid=2649743462&idx=1&sn=c9d94ddc25449c6a0052dc48392a33c2&utm_source=tuicool&utm_medium=referralmp.weixin.qq.com 本篇文章为转载内容。原文链接：https://blog.csdn.net/weixin_31467557/article/details/113049179。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-02-24 18:25:46

141

转载

Sqoop

Sqoop在数据迁移中因透明性不足导致作业失败的案例分析

...p是一个用于在关系型数据库和Hadoop生态系统之间进行高效数据迁移的工具。它能够将数据从MySQL等关系型数据库导入到Hadoop的HDFS中，也可以将HDFS中的数据导出到关系型数据库。文章中提到，Sqoop在处理某些特殊字符或复杂数据类型时可能会出现问题，尤其是在数据量较大或存在复杂约束条件的情况下。为了确保数据迁移的成功，用户需要深入了解Sqoop的工作原理，并通过调整分隔符、换行符等参数来优化配置。透明性 , 透明性是指Sqoop能否准确理解用户需求并按照预期方式执行任务的能力。文章中指出，当涉及多列且某些列包含复杂数据类型时，Sqoop可能无法正确识别这些数据类型而导致作业失败。此外，它不会给出明确提示，而是默默报错，让用户感到困惑。为了提高透明性，作者建议在操作前使用describe命令查看表结构，并通过指定检查列等方式确认所有字段都被正确识别。增量作业 , 增量作业是一种通过定期更新目标目录中的数据来避免一次性加载过多数据造成性能瓶颈的方法。文章中展示了一个创建增量作业的例子，使用sqoop job命令定义了一个名为my_job的作业，用于从MySQL数据库的employees表中导入数据到HDFS的目标目录中。该作业通过指定--check-column参数检查是否有重复记录，并使用--incremental append模式追加新数据，从而实现了高效的增量数据迁移。这种方法特别适合于需要持续更新的大规模数据集。

2025-03-22 15:39:31

风中飘零

转载文章

[转载]关于mysql的一些小知识

在深入理解SQL数据库操作的诸多要素之后，我们可以关注近期关于数据库优化和安全性的前沿动态。近日，MySQL官方发布了8.0.28版本，该版本强化了对窗口函数的支持，并提升了索引条件推送的性能，使得复杂查询得以更高效地执行。同时，针对多表查询优化策略，许多数据库专家和社区成员正在探讨如何借助物化视图、分区表等高级功能进一步提升查询速度。此外，随着数据安全问题日益凸显，触发器在保障数据一致性与合规性方面的作用受到更多重视。例如，在金融交易系统中，通过精心设计的触发器可实现对关键业务数据的实时审计追踪。而在数据同步场景下，触发器结合流处理技术（如Debezium）实现实时增量数据同步，已被广泛应用在微服务架构中。另一方面，存储过程的安全性与性能优化也成为了热门话题。有研究指出，通过合理设计和使用参数化存储过程，不仅可以减少SQL注入风险，还能有效提高数据库系统的整体性能。尤其在大数据环境下，企业开始探索利用存储过程进行批量化数据清洗和预处理，以减轻服务器负载并确保数据质量。最后，针对数据库隐私保护，各大云服务商正积极引入同态加密、动态数据屏蔽等前沿技术，这些技术在不影响查询性能的前提下，增强了数据在存储及传输过程中的安全性，为用户提供了更为全面的数据安全保障。对于SQL开发者而言，紧跟这些技术趋势和实践案例，无疑将有助于更好地应对未来数据库管理和查询优化的挑战。

2023-04-26 19:09:16

转载

转载文章

[转载]Postgres-XL集群软件介绍及搭建

...我们，我们将第一时间进行核实并删除相应内容。介绍Postgres-XL Postgres-XL 全称为 Postgres eXtensible Lattice，是TransLattice公司及其收购数据库技术公司–StormDB的产品。Postgres-XL是一个横向扩展的开源数据库集群，具有足够的灵活性来处理不同的数据库任务。 Postgres-XL功能特性开放源代码：（源协议使用宽松的“Mozilla Public License”许可，允许将开源代码与闭源代码混在一起使用。）完全的ACID支持可横向扩展的关系型数据库（RDBMS）支持OLAP应用，采用MPP（Massively Parallel Processing：大规模并行处理系统）架构模式支持OLTP应用，读写性能可扩展集群级别的ACID特性多租户安全也可被用作分布式Key-Value存储事务处理与数据分析处理混合型数据库支持丰富的SQL语句类型，比如：关联子查询支持绝大部分PostgreSQL的SQL语句分布式多版本并发控制（MVCC：Multi-version Concurrency Control）支持JSON和XML格式 Postgres-XL缺少的功能内建的高可用机制使用外部机制实现高可能，如：Corosync/Pacemaker 有未来功能提升的空间增加节点/重新分片数据（re-shard）的简便性数据重分布（redistribution）期间会锁表可采用预分片（pre-shard）方式解决，在同台物理服务器上建立多个数据节点，每个节点存储一个数据分片。数据重分布时，将一些数据节点迁出即可某些外键、唯一性约束功能 Postgres-XL架构 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-M9lFuEIP-1640133702200)(./assets/postgre-xl.jpg)] 基于开源项目Postgres-XC XL增加了MPP，允许数据节点间直接通讯，交换复杂跨节点关联查询相关数据信息，减少协调器负载。多个协调器（Coordinator）应用程序的数据库连入点分析查询语句，生成执行计划多个数据节点（DataNode）实际的数据存储数据自动打散分布到集群中各数据节点本地执行查询一个查询在所有相关节点上并行查询全局事务管理器（GTM：Global Transaction Manager）提供事务间一致性视图部署GTM Proxy实例，以提高性能 Postgre-XL主要组件 GTM (Global Transaction Manager) - 全局事务管理器 GTM是Postgres-XL的一个关键组件，用于提供一致的事务管理和元组可见性控制。 GTM Standby GTM的备节点，在pgxc,pgxl中，GTM控制所有的全局事务分配，如果出现问题，就会导致整个集群不可用，为了增加可用性，增加该备用节点。当GTM出现问题时，GTM Standby可以升级为GTM，保证集群正常工作。 GTM-Proxy GTM需要与所有的Coordinators通信，为了降低压力，可以在每个Coordinator机器上部署一个GTM-Proxy。 Coordinator --协调器协调器是应用程序到数据库的接口。它的作用类似于传统的PostgreSQL后台进程，但是协调器不存储任何实际数据。实际数据由数据节点存储。协调器接收SQL语句，根据需要获取全局事务Id和全局快照，确定涉及哪些数据节点，并要求它们执行(部分)语句。当向数据节点发出语句时，它与GXID和全局快照相关联，以便多版本并发控制(MVCC)属性扩展到集群范围。 Datanode --数据节点用于实际存储数据。表可以分布在各个数据节点之间，也可以复制到所有数据节点。数据节点没有整个数据库的全局视图，它只负责本地存储的数据。接下来，协调器将检查传入语句，并制定子计划。然后，根据需要将这些数据连同GXID和全局快照一起传输到涉及的每个数据节点。数据节点可以在不同的会话中接收来自各个协调器的请求。但是，由于每个事务都是惟一标识的，并且与一致的(全局)快照相关联，所以每个数据节点都可以在其事务和快照上下文中正确执行。 Postgres-XL继承了PostgreSQL Postgres-XL是PostgreSQL的扩展并继承了其很多特性：复杂查询外键触发器视图事务 MVCC(多版本控制) 此外，类似于PostgreSQL，用户可以通过多种方式扩展Postgres-XL，例如添加新的数据类型函数操作聚合函数索引类型过程语言安装环境说明由于资源有限，gtm一台、另外两台身兼数职。主机名 IP 角色端口 nodename 数据目录 gtm 192.168.20.132 GTM 6666 gtm /nodes/gtm 协调器 5432 coord1 /nodes/coordinator xl1 192.168.20.133 数据节点 5433 node1 /nodes/pgdata gtm代理 6666 gtmpoxy01 /nodes/gtm_pxy1 协调器 5432 coord2 /nodes/coordinator xl2 192.168.20.134 数据节点 5433 node2 /nodes/pgdata gtm代理 6666 gtmpoxy02 /nodes/gtm_pxy2 要求 GNU make版本 3.8及以上版本 [root@pg ~] make --versionGNU Make 3.82Built for x86_64-redhat-linux-gnuCopyright (C) 2010 Free Software Foundation, Inc.License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>This is free software: you are free to change and redistribute it.There is NO WARRANTY, to the extent permitted by law. 需安装GCC包需安装tar包用于解压缩文件默认需要GNU Readline library 其作用是可以让psql命令行记住执行过的命令，并且可以通过键盘上下键切换命令。但是可以通过--without-readline禁用这个特性，或者可以指定--withlibedit-preferred选项来使用libedit 默认使用zlib压缩库可通过--without-zlib选项来禁用配置hosts 所有主机上都配置 [root@xl2 11] cat /etc/hosts127.0.0.1 localhost192.168.20.132 gtm192.168.20.133 xl1192.168.20.134 xl2 关闭防火墙、Selinux 所有主机都执行关闭防火墙： [root@gtm ~] systemctl stop firewalld.service[root@gtm ~] systemctl disable firewalld.service selinux设置: [root@gtm ~]vim /etc/selinux/config 设置SELINUX=disabled，保存退出。 This file controls the state of SELinux on the system. SELINUX= can take one of these three values: enforcing - SELinux security policy is enforced. permissive - SELinux prints warnings instead of enforcing. disabled - No SELinux policy is loaded.SELINUX=disabled SELINUXTYPE= can take one of three two values: targeted - Targeted processes are protected, minimum - Modification of targeted policy. Only selected processes are protected. mls - Multi Level Security protection. 安装依赖包所有主机上都执行 yum install -y flex bison readline-devel zlib-devel openjade docbook-style-dsssl gcc 创建用户所有主机上都执行 [root@gtm ~] useradd postgres[root@gtm ~] passwd postgres[root@gtm ~] su - postgres[root@gtm ~] mkdir ~/.ssh[root@gtm ~] chmod 700 ~/.ssh 配置SSH免密登录仅仅在gtm节点配置如下操作： [root@gtm ~] su - postgres[postgres@gtm ~] ssh-keygen -t rsa[postgres@gtm ~] cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys[postgres@gtm ~] chmod 600 ~/.ssh/authorized_keys 将刚生成的认证文件拷贝到xl1到xl2中，使得gtm节点可以免密码登录xl1~xl2的任意一个节点： [postgres@gtm ~] scp ~/.ssh/authorized_keys postgres@xl1:~/.ssh/[postgres@gtm ~] scp ~/.ssh/authorized_keys postgres@xl2:~/.ssh/ 对所有提示都不要输入，直接enter下一步。直到最后，因为第一次要求输入目标机器的用户密码，输入即可。下载源码下载地址：https://www.postgres-xl.org/download/ [root@slave ~] ll postgres-xl-10r1.1.tar.gz-rw-r--r-- 1 root root 28121666 May 30 05:21 postgres-xl-10r1.1.tar.gz 编译、安装Postgres-XL 所有节点都安装，编译需要一点时间，最好同时进行编译。 [root@slave ~] tar xvf postgres-xl-10r1.1.tar.gz[root@slave ~] ./configure --prefix=/home/postgres/pgxl/[root@slave ~] make[root@slave ~] make install[root@slave ~] cd contrib/ --安装必要的工具,在gtm节点上安装即可[root@slave ~] make[root@slave ~] make install 配置环境变量所有节点都要配置进入postgres用户，修改其环境变量，开始编辑 [root@gtm ~]su - postgres[postgres@gtm ~]vi .bashrc --不是.bash_profile 在打开的文件末尾，新增如下变量配置： export PGHOME=/home/postgres/pgxlexport LD_LIBRARY_PATH=$PGHOME/lib:$LD_LIBRARY_PATHexport PATH=$PGHOME/bin:$PATH 按住esc，然后输入:wq!保存退出。输入以下命令对更改重启生效。 [postgres@gtm ~] source .bashrc --不是.bash_profile 输入以下语句，如果输出变量结果，代表生效 [postgres@gtm ~] echo $PGHOME 应该输出/home/postgres/pgxl代表生效配置集群生成pgxc_ctl.conf配置文件 [postgres@gtm ~] pgxc_ctl prepare/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxl/pgxc_ctl/pgxc_ctl_bash.ERROR: File "/home/postgres/pgxl/pgxc_ctl/pgxc_ctl.conf" not found or not a regular file. No such file or directoryInstalling pgxc_ctl_bash script as /home/postgres/pgxl/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxl/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxl/pgxc_ctl --configuration /home/postgres/pgxl/pgxc_ctl/pgxc_ctl.confFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxl/pgxc_ctl 配置pgxc_ctl.conf 新建/home/postgres/pgxc_ctl/pgxc_ctl.conf文件，编辑如下：对着模板文件一个一个修改，否则会造成初始化过程出现各种神奇问题。 pgxcInstallDir=$PGHOMEpgxlDATA=$PGHOME/data pgxcOwner=postgres---- GTM Master -----------------------------------------gtmName=gtmgtmMasterServer=gtmgtmMasterPort=6666gtmMasterDir=$pgxlDATA/nodes/gtmgtmSlave=y Specify y if you configure GTM Slave. Otherwise, GTM slave will not be configured and all the following variables will be reset.gtmSlaveName=gtmSlavegtmSlaveServer=gtm value none means GTM slave is not available. Give none if you don't configure GTM Slave.gtmSlavePort=20001 Not used if you don't configure GTM slave.gtmSlaveDir=$pgxlDATA/nodes/gtmSlave Not used if you don't configure GTM slave.---- GTM-Proxy Master -------gtmProxyDir=$pgxlDATA/nodes/gtm_proxygtmProxy=y gtmProxyNames=(gtm_pxy1 gtm_pxy2) gtmProxyServers=(xl1 xl2) gtmProxyPorts=(6666 6666) gtmProxyDirs=($gtmProxyDir $gtmProxyDir) ---- Coordinators ---------coordMasterDir=$pgxlDATA/nodes/coordcoordNames=(coord1 coord2) coordPorts=(5432 5432) poolerPorts=(6667 6667) coordPgHbaEntries=(0.0.0.0/0)coordMasterServers=(xl1 xl2) coordMasterDirs=($coordMasterDir $coordMasterDir)coordMaxWALsernder=0 没设置备份节点，设置为0coordMaxWALSenders=($coordMaxWALsernder $coordMaxWALsernder) 数量保持和coordMasterServers一致coordSlave=n---- Datanodes ----------datanodeMasterDir=$pgxlDATA/nodes/dn_masterprimaryDatanode=xl1 主数据节点datanodeNames=(node1 node2)datanodePorts=(5433 5433) datanodePoolerPorts=(6668 6668) datanodePgHbaEntries=(0.0.0.0/0)datanodeMasterServers=(xl1 xl2)datanodeMasterDirs=($datanodeMasterDir $datanodeMasterDir)datanodeMaxWalSender=4datanodeMaxWALSenders=($datanodeMaxWalSender $datanodeMaxWalSender) 集群初始化，启动，停止初始化 pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf init all 输出结果： /bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlStopping all the coordinator masters.Stopping coordinator master coord1.Stopping coordinator master coord2.pg_ctl: directory "/home/postgres/pgxc/nodes/coord/coord1" does not existpg_ctl: directory "/home/postgres/pgxc/nodes/coord/coord2" does not existDone.Stopping all the datanode masters.Stopping datanode master datanode1.Stopping datanode master datanode2.pg_ctl: PID file "/home/postgres/pgxc/nodes/datanode/datanode1/postmaster.pid" does not existIs server running?Done.Stop GTM masterwaiting for server to shut down.... doneserver stopped[postgres@gtm ~]$ echo $PGHOME/home/postgres/pgxl[postgres@gtm ~]$ ll /home/postgres/pgxl/pgxc/nodes/gtm/gtm.^C[postgres@gtm ~]$ pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf init all/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlInitialize GTM masterERROR: target directory (/home/postgres/pgxc/nodes/gtm) exists and not empty. Skip GTM initilializationDone.Start GTM masterserver startingInitialize all the coordinator masters.Initialize coordinator master coord1.ERROR: target coordinator master coord1 is running now. Skip initilialization.Initialize coordinator master coord2.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/coord/coord2 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.Done.Starting coordinator master.Starting coordinator master coord1ERROR: target coordinator master coord1 is already running now. Skip initialization.Starting coordinator master coord22019-05-30 21:09:25.562 EDT [2148] LOG: listening on IPv4 address "0.0.0.0", port 54322019-05-30 21:09:25.562 EDT [2148] LOG: listening on IPv6 address "::", port 54322019-05-30 21:09:25.563 EDT [2148] LOG: listening on Unix socket "/tmp/.s.PGSQL.5432"2019-05-30 21:09:25.601 EDT [2149] LOG: database system was shut down at 2019-05-30 21:09:22 EDT2019-05-30 21:09:25.605 EDT [2148] LOG: database system is ready to accept connections2019-05-30 21:09:25.612 EDT [2156] LOG: cluster monitor startedDone.Initialize all the datanode masters.Initialize the datanode master datanode1.Initialize the datanode master datanode2.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/datanode/datanode1 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/datanode/datanode2 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.Done.Starting all the datanode masters.Starting datanode master datanode1.WARNING: datanode master datanode1 is running now. Skipping.Starting datanode master datanode2.2019-05-30 21:09:33.352 EDT [2404] LOG: listening on IPv4 address "0.0.0.0", port 154322019-05-30 21:09:33.352 EDT [2404] LOG: listening on IPv6 address "::", port 154322019-05-30 21:09:33.355 EDT [2404] LOG: listening on Unix socket "/tmp/.s.PGSQL.15432"2019-05-30 21:09:33.392 EDT [2404] LOG: redirecting log output to logging collector process2019-05-30 21:09:33.392 EDT [2404] HINT: Future log output will appear in directory "pg_log".Done.psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"Done.psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"Done.[postgres@gtm ~]$ pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf stop all/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlStopping all the coordinator masters.Stopping coordinator master coord1.Stopping coordinator master coord2.pg_ctl: directory "/home/postgres/pgxc/nodes/coord/coord1" does not existDone.Stopping all the datanode masters.Stopping datanode master datanode1.Stopping datanode master datanode2.pg_ctl: PID file "/home/postgres/pgxc/nodes/datanode/datanode1/postmaster.pid" does not existIs server running?Done.Stop GTM masterwaiting for server to shut down.... doneserver stopped[postgres@gtm ~]$ pgxc_ctl/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlPGXC monitor allNot running: gtm masterRunning: coordinator master coord1Not running: coordinator master coord2Running: datanode master datanode1Not running: datanode master datanode2PGXC stop coordinator master coord1Stopping coordinator master coord1.pg_ctl: directory "/home/postgres/pgxc/nodes/coord/coord1" does not existDone.PGXC stop datanode master datanode1Stopping datanode master datanode1.pg_ctl: PID file "/home/postgres/pgxc/nodes/datanode/datanode1/postmaster.pid" does not existIs server running?Done.PGXC monitor allNot running: gtm masterRunning: coordinator master coord1Not running: coordinator master coord2Running: datanode master datanode1Not running: datanode master datanode2PGXC monitor allNot running: gtm masterNot running: coordinator master coord1Not running: coordinator master coord2Not running: datanode master datanode1Not running: datanode master datanode2PGXC exit[postgres@gtm ~]$ pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf init all/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlInitialize GTM masterERROR: target directory (/home/postgres/pgxc/nodes/gtm) exists and not empty. Skip GTM initilializationDone.Start GTM masterserver startingInitialize all the coordinator masters.Initialize coordinator master coord1.Initialize coordinator master coord2.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/coord/coord1 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/coord/coord2 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.Done.Starting coordinator master.Starting coordinator master coord1Starting coordinator master coord22019-05-30 21:13:03.998 EDT [25137] LOG: listening on IPv4 address "0.0.0.0", port 54322019-05-30 21:13:03.998 EDT [25137] LOG: listening on IPv6 address "::", port 54322019-05-30 21:13:04.000 EDT [25137] LOG: listening on Unix socket "/tmp/.s.PGSQL.5432"2019-05-30 21:13:04.038 EDT [25138] LOG: database system was shut down at 2019-05-30 21:13:00 EDT2019-05-30 21:13:04.042 EDT [25137] LOG: database system is ready to accept connections2019-05-30 21:13:04.049 EDT [25145] LOG: cluster monitor started2019-05-30 21:13:04.020 EDT [2730] LOG: listening on IPv4 address "0.0.0.0", port 54322019-05-30 21:13:04.020 EDT [2730] LOG: listening on IPv6 address "::", port 54322019-05-30 21:13:04.021 EDT [2730] LOG: listening on Unix socket "/tmp/.s.PGSQL.5432"2019-05-30 21:13:04.057 EDT [2731] LOG: database system was shut down at 2019-05-30 21:13:00 EDT2019-05-30 21:13:04.061 EDT [2730] LOG: database system is ready to accept connections2019-05-30 21:13:04.062 EDT [2738] LOG: cluster monitor startedDone.Initialize all the datanode masters.Initialize the datanode master datanode1.Initialize the datanode master datanode2.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/datanode/datanode1 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.The files belonging to this database system will be owned by user "postgres".This user must also own the server process.The database cluster will be initialized with locale "en_US.UTF-8".The default database encoding has accordingly been set to "UTF8".The default text search configuration will be set to "english".Data page checksums are disabled.fixing permissions on existing directory /home/postgres/pgxc/nodes/datanode/datanode2 ... okcreating subdirectories ... okselecting default max_connections ... 100selecting default shared_buffers ... 128MBselecting dynamic shared memory implementation ... posixcreating configuration files ... okrunning bootstrap script ... okperforming post-bootstrap initialization ... creating cluster information ... oksyncing data to disk ... okfreezing database template0 ... okfreezing database template1 ... okfreezing database postgres ... okWARNING: enabling "trust" authentication for local connectionsYou can change this by editing pg_hba.conf or using the option -A, or--auth-local and --auth-host, the next time you run initdb.Success.Done.Starting all the datanode masters.Starting datanode master datanode1.Starting datanode master datanode2.2019-05-30 21:13:12.077 EDT [25392] LOG: listening on IPv4 address "0.0.0.0", port 154322019-05-30 21:13:12.077 EDT [25392] LOG: listening on IPv6 address "::", port 154322019-05-30 21:13:12.079 EDT [25392] LOG: listening on Unix socket "/tmp/.s.PGSQL.15432"2019-05-30 21:13:12.114 EDT [25392] LOG: redirecting log output to logging collector process2019-05-30 21:13:12.114 EDT [25392] HINT: Future log output will appear in directory "pg_log".2019-05-30 21:13:12.079 EDT [2985] LOG: listening on IPv4 address "0.0.0.0", port 154322019-05-30 21:13:12.079 EDT [2985] LOG: listening on IPv6 address "::", port 154322019-05-30 21:13:12.081 EDT [2985] LOG: listening on Unix socket "/tmp/.s.PGSQL.15432"2019-05-30 21:13:12.117 EDT [2985] LOG: redirecting log output to logging collector process2019-05-30 21:13:12.117 EDT [2985] HINT: Future log output will appear in directory "pg_log".Done.psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"Done.psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"psql: FATAL: no pg_hba.conf entry for host "192.168.20.132", user "postgres", database "postgres"Done. 启动 pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf start all 关闭 pgxc_ctl -c /home/postgres/pgxc_ctl/pgxc_ctl.conf stop all 查看集群状态 [postgres@gtm ~]$ pgxc_ctl monitor all/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.conf/home/postgres/pgxc_ctl/pgxc_ctl.conf: line 189: $coordExtraConfig: ambiguous redirectFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlRunning: gtm masterRunning: coordinator master coord1Running: coordinator master coord2Running: datanode master datanode1Running: datanode master datanode2 配置集群信息分别在数据节点、协调器节点上分别执行以下命令：注：本节点只执行修改操作即可(alert node)，其他节点执行创建命令(create node)。因为本节点已经包含本节点的信息。 create node coord1 with (type=coordinator,host=xl1, port=5432);create node coord2 with (type=coordinator,host=xl2, port=5432);alter node coord1 with (type=coordinator,host=xl1, port=5432);alter node coord2 with (type=coordinator,host=xl2, port=5432);create node datanode1 with (type=datanode, host=xl1,port=15432,primary=true,PREFERRED);create node datanode2 with (type=datanode, host=xl2,port=15432);alter node datanode1 with (type=datanode, host=xl1,port=15432,primary=true,PREFERRED);alter node datanode2 with (type=datanode, host=xl2,port=15432);select pgxc_pool_reload(); 分别登陆数据节点、协调器节点验证 postgres= select from pgxc_node;node_name | node_type | node_port | node_host | nodeis_primary | nodeis_preferred | node_id-----------+-----------+-----------+-----------+----------------+------------------+-------------coord1 | C | 5432 | xl1 | f | f | 1885696643coord2 | C | 5432 | xl2 | f | f | -1197102633datanode2 | D | 15432 | xl2 | f | f | -905831925datanode1 | D | 15432 | xl1 | t | f | 888802358(4 rows) 测试插入数据在数据节点1，执行相关操作。通过协调器端口登录PG [postgres@xl1 ~]$ psql -p 5432psql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= create database lei;CREATE DATABASEpostgres= \c lei;You are now connected to database "lei" as user "postgres".lei= create table test1(id int,name text);CREATE TABLElei= insert into test1(id,name) select generate_series(1,8),'测试';INSERT 0 8lei= select from test1;id | name----+------1 | 测试2 | 测试5 | 测试6 | 测试8 | 测试3 | 测试4 | 测试7 | 测试(8 rows) 注：默认创建的表为分布式表，也就是每个数据节点值存储表的部分数据。关于表类型具体说明，下面有说明。通过15432端口登录数据节点，查看数据有5条数据 [postgres@xl1 ~]$ psql -p 15432psql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= \c lei;You are now connected to database "lei" as user "postgres".lei= select from test1;id | name----+------1 | 测试2 | 测试5 | 测试6 | 测试8 | 测试(5 rows) 登录到节点2，查看数据有3条数据 [postgres@xl2 ~]$ psql -p15432psql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= \c lei;You are now connected to database "lei" as user "postgres".lei= select from test1;id | name----+------3 | 测试4 | 测试7 | 测试(3 rows) 两个节点的数据加起来整个8条，没有问题。至此Postgre-XL集群搭建完成。创建数据库、表时可能会出现以下错误： ERROR: Failed to get pooled connections 是因为pg_hba.conf配置不对，所有节点加上host all all 192.168.20.0/0 trust并重启集群即可。 ERROR: No Datanode defined in cluster 首先确认是否创建了数据节点，也就是create node相关的命令。如果创建了则执行select pgxc_pool_reload();使其生效即可。集群管理与应用表类型说明 REPLICATION表：各个datanode节点中，表的数据完全相同，也就是说，插入数据时，会分别在每个datanode节点插入相同数据。读数据时，只需要读任意一个datanode节点上的数据。建表语法： CREATE TABLE repltab (col1 int, col2 int) DISTRIBUTE BY REPLICATION; DISTRIBUTE ：会将插入的数据，按照拆分规则，分配到不同的datanode节点中存储，也就是sharding技术。每个datanode节点只保存了部分数据，通过coordinate节点可以查询完整的数据视图。 CREATE TABLE disttab(col1 int, col2 int, col3 text) DISTRIBUTE BY HASH(col1); 模拟数据插入任意登录一个coordinate节点进行建表操作 [postgres@gtm ~]$ psql -h xl1 -p 5432 -U postgrespostgres= INSERT INTO disttab SELECT generate_series(1,100), generate_series(101, 200), 'foo';INSERT 0 100postgres= INSERT INTO repltab SELECT generate_series(1,100), generate_series(101, 200);INSERT 0 100 查看数据分布结果： DISTRIBUTE表分布结果 postgres= SELECT xc_node_id, count() FROM disttab GROUP BY xc_node_id;xc_node_id | count ------------+-------1148549230 | 42-927910690 | 58(2 rows) REPLICATION表分布结果 postgres= SELECT count() FROM repltab;count -------100(1 row) 查看另一个datanode2中repltab表结果 [postgres@datanode2 pgxl9.5]$ psql -p 15432psql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= SELECT count() FROM repltab;count -------100(1 row) 结论：REPLICATION表中，datanode1,datanode2中表是全部数据，一模一样。而DISTRIBUTE表，数据散落近乎平均分配到了datanode1,datanode2节点中。新增数据节点与数据重分布在线新增节点、并重新分布数据。新增datanode节点在gtm集群管理节点上执行pgxc_ctl命令 [postgres@gtm ~]$ pgxc_ctl/bin/bashInstalling pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Installing pgxc_ctl_bash script as /home/postgres/pgxc_ctl/pgxc_ctl_bash.Reading configuration using /home/postgres/pgxc_ctl/pgxc_ctl_bash --home /home/postgres/pgxc_ctl --configuration /home/postgres/pgxc_ctl/pgxc_ctl.confFinished reading configuration. PGXC_CTL START Current directory: /home/postgres/pgxc_ctlPGXC 在服务器xl3上，新增一个master角色的datanode节点，名称是datanode3 端口号暂定5430，pool master暂定6669 ，指定好数据目录位置，从两个节点升级到3个节点，之后要写3个none none应该是datanodeSpecificExtraConfig或者datanodeSpecificExtraPgHba配置PGXC add datanode master datanode3 xl3 15432 6671 /home/postgres/pgxc/nodes/datanode/datanode3 none none none 等待新增完成后，查询集群节点状态： postgres= select from pgxc_node;node_name | node_type | node_port | node_host | nodeis_primary | nodeis_preferred | node_id-----------+-----------+-----------+-----------+----------------+------------------+-------------datanode1 | D | 15432 | xl1 | t | f | 888802358datanode2 | D | 15432 | xl2 | f | f | -905831925datanode3 | D | 15432 | xl3 | f | f | -705831925coord1 | C | 5432 | xl1 | f | f | 1885696643coord2 | C | 5432 | xl2 | f | f | -1197102633(4 rows) 节点新增完毕数据重新分布由于新增节点后无法自动完成数据重新分布，需要手动操作。 DISTRIBUTE表分布在了node1,node2节点上，如下： postgres= SELECT xc_node_id, count() FROM disttab GROUP BY xc_node_id;xc_node_id | count ------------+-------1148549230 | 42-927910690 | 58(2 rows) 新增一个节点后，将sharding表数据重新分配到三个节点上，将repl表复制到新节点重分布sharding表postgres= ALTER TABLE disttab ADD NODE (datanode3);ALTER TABLE 复制数据到新节点postgres= ALTER TABLE repltab ADD NODE (datanode3);ALTER TABLE 查看新的数据分布： postgres= SELECT xc_node_id, count() FROM disttab GROUP BY xc_node_id;xc_node_id | count ------------+--------700122826 | 36-927910690 | 321148549230 | 32(3 rows) 登录datanode3(新增的时候，放在了xl3服务器上，端口15432)节点查看数据： [postgres@gtm ~]$ psql -h xl3 -p 15432 -U postgrespsql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= select count() from repltab;count -------100(1 row) 很明显,通过 ALTER TABLE tt ADD NODE (dn)命令，可以将DISTRIBUTE表数据重新分布到新节点，重分布过程中会中断所有事务。可以将REPLICATION表数据复制到新节点。从datanode节点中回收数据 postgres= ALTER TABLE disttab DELETE NODE (datanode3);ALTER TABLEpostgres= ALTER TABLE repltab DELETE NODE (datanode3);ALTER TABLE 删除数据节点 Postgresql-XL并没有检查将被删除的datanode节点是否有replicated/distributed表的数据，为了数据安全，在删除之前需要检查下被删除节点上的数据，有数据的话，要回收掉分配到其他节点，然后才能安全删除。删除数据节点分为四步骤： 1.查询要删除节点dn3的oid postgres= SELECT oid, FROM pgxc_node;oid | node_name | node_type | node_port | node_host | nodeis_primary | nodeis_preferred | node_id -------+-----------+-----------+-----------+-----------+----------------+------------------+-------------11819 | coord1 | C | 5432 | datanode1 | f | f | 188569664316384 | coord2 | C | 5432 | datanode2 | f | f | -119710263316385 | node1 | D | 5433 | datanode1 | f | t | 114854923016386 | node2 | D | 5433 | datanode2 | f | f | -92791069016397 | dn3 | D | 5430 | datanode1 | f | f | -700122826(5 rows) 2.查询dn3对应的oid中是否有数据 testdb= SELECT FROM pgxc_class WHERE nodeoids::integer[] @> ARRAY[16397];pcrelid | pclocatortype | pcattnum | pchashalgorithm | pchashbuckets | nodeoids ---------+---------------+----------+-----------------+---------------+-------------------16388 | H | 1 | 1 | 4096 | 16397 16385 1638616394 | R | 0 | 0 | 0 | 16397 16385 16386(2 rows) 3.有数据的先回收数据 postgres= ALTER TABLE disttab DELETE NODE (dn3);ALTER TABLEpostgres= ALTER TABLE repltab DELETE NODE (dn3);ALTER TABLEpostgres= SELECT FROM pgxc_class WHERE nodeoids::integer[] @> ARRAY[16397];pcrelid | pclocatortype | pcattnum | pchashalgorithm | pchashbuckets | nodeoids ---------+---------------+----------+-----------------+---------------+----------(0 rows) 4.安全删除dn3 PGXC$ remove datanode master dn3 clean 故障节点FAILOVER 1.查看当前集群状态 [postgres@gtm ~]$ psql -h xl1 -p 5432psql (PGXL 10r1.1, based on PG 10.6 (Postgres-XL 10r1.1))Type "help" for help.postgres= SELECT oid, FROM pgxc_node;oid | node_name | node_type | node_port | node_host | nodeis_primary | nodeis_preferred | node_id-------+-----------+-----------+-----------+-----------+----------------+------------------+-------------11739 | coord1 | C | 5432 | xl1 | f | f | 188569664316384 | coord2 | C | 5432 | xl2 | f | f | -119710263316387 | datanode2 | D | 15432 | xl2 | f | f | -90583192516388 | datanode1 | D | 15432 | xl1 | t | t | 888802358(4 rows) 2.模拟datanode1节点故障直接关闭即可 PGXC stop -m immediate datanode master datanode1Stopping datanode master datanode1.Done. 3.测试查询只要查询涉及到datanode1上的数据，那么该查询就会报错 postgres= SELECT xc_node_id, count() FROM disttab GROUP BY xc_node_id;WARNING: failed to receive file descriptors for connectionsERROR: Failed to get pooled connectionsHINT: This may happen because one or more nodes are currently unreachable, either because of node or network failure.Its also possible that the target node may have hit the connection limit or the pooler is configured with low connections.Please check if all nodes are running fine and also review max_connections and max_pool_size configuration parameterspostgres= SELECT xc_node_id, FROM disttab WHERE col1 = 3;xc_node_id | col1 | col2 | col3------------+------+------+-------905831925 | 3 | 103 | foo(1 row) 测试发现，查询范围如果涉及到故障的node1节点，会报错，而查询的数据范围不在node1上的话，仍然可以查询。 4.手动切换要想切换，必须要提前配置slave节点。 PGXC$ failover datanode node1 切换完成后，查询集群 postgres= SELECT oid, FROM pgxc_node;oid | node_name | node_type | node_port | node_host | nodeis_primary | nodeis_preferred | node_id -------+-----------+-----------+-----------+-----------+----------------+------------------+-------------11819 | coord1 | C | 5432 | datanode1 | f | f | 188569664316384 | coord2 | C | 5432 | datanode2 | f | f | -119710263316386 | node2 | D | 15432 | datanode2 | f | f | -92791069016385 | node1 | D | 15433 | datanode2 | f | t | 1148549230(4 rows) 发现datanode1节点的ip和端口都已经替换为配置的slave了。本篇文章为转载内容。原文链接：https://blog.csdn.net/qianglei6077/article/details/94379331。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-01-30 11:09:03

转载

Python

python检查是否数字

...程实践中，对用户输入数据的验证是保证程序稳定性和安全性的关键环节。近期，随着Python 3.9版本的发布和更新，开发者在处理数字验证时拥有了更多高效、安全的选择。例如，除了文中提到的isdigit()、isnumeric()及isdecimal()函数外，Python引入了zoneinfo模块以支持国际化时间处理，这使得在处理包含日期、时间戳等混合型数字格式的用户输入时更为精准。同时，在大型项目中，为确保代码健壮性，推荐使用类型注解（Type Annotations）配合库如typeguard进行更严格的输入校验。Python 3.8及以上版本强化了类型提示功能，可以有效预防因类型错误导致的运行时异常，尤其对于涉及复杂数字结构如numpy数组或pandas DataFrame的数据验证具有重要意义。此外，针对Web开发场景下的用户输入验证，框架Django和Flask提供了内置的表单验证机制，能够自动检查并转换用户提交的数字信息，极大地提升了开发效率和用户体验。总的来说，Python在数字处理与验证方面持续优化和发展，开发者应紧跟社区动态，充分利用新特性与最佳实践，以提升应用程序的安全性和稳定性。

2023-01-16 10:24:29

404

软件工程师

VUE

vue在$router

...的组件，并通过响应式数据绑定实现视图与数据模型之间的自动同步更新。在本文语境中，Vue.js 作为前端框架提供了路由系统$router来管理应用程序中的页面导航和交互。路由系统（$router） , Vue.js 的路由系统是一个内置的核心功能模块，通过$router对象实现。这个系统允许开发者定义应用程序中各个页面的路由规则和对应的组件，从而实现在单页面应用（SPA）中模拟多页面应用的切换效果。开发者可以通过调用$router的方法（如push、replace等）进行页面跳转，同时支持动态参数传递、查询参数设置以及hash值操作，使得页面间的导航更流畅且具备良好的数据通信能力。单页面应用程序（SPA） , 单页面应用程序是一种特殊的Web应用程序设计模式，其特点是整个网站或应用程序只有一个完整的HTML页面，内容的切换和加载并非通过传统的页面刷新方式完成，而是利用JavaScript和Ajax技术动态替换或添加页面片段（DOM元素）。在Vue.js中，结合路由系统$router，可以方便地构建单页面应用程序，提供无缝的用户体验和高效的前后端交互。用户在访问不同“页面”时，实际上只是在同一个HTML文档内进行部分内容的更新和显示，无需重新加载整个页面资源。

2023-05-14 15:02:10

109

程序媛

JSON

json 查询 jquery

...的发展和Web应用的复杂性日益增强，JSON在现代Web开发中的作用愈发关键。除了jQuery中对JSON数据的操作之外，开发者们还可以关注当下更为现代化的JavaScript库和框架对于JSON处理的最新实践。例如，Vue.js、React和Angular等主流前端框架均提供了强大且便捷的JSON数据绑定与处理机制。Vue.js利用其响应式的数据绑定特性，可以直接将JSON对象赋值给组件的状态（state），实现视图的自动更新；React通过setState方法更新状态，并结合JSX语法实现JSON数据到UI的渲染；Angular则凭借其强大的模板表达式和变更检测系统，让JSON数据操作变得直观高效。此外，在Node.js后端环境中，诸如Express框架支持直接将JSON传递给路由处理器，并内建了中间件来解析JSON请求体。同时，使用诸如axios或fetch这类现代HTTP客户端库，可以更加优雅地发起异步请求并处理返回的JSON数据。近期，ECMAScript标准也在JSON支持上进行了优化，如引入JSON.stringify()的第三个参数用于定制化序列化过程，以及JSON.parse()可选的reviver函数对反序列化结果进行深度处理。这些新特性的运用能够帮助开发者更精细地控制JSON数据在程序中的流转和表现形式。总的来说，理解并熟练掌握JSON数据处理已经成为现代全栈开发者的必备技能，持续关注相关技术和最佳实践的发展，能更好地适应快速变化的Web开发环境，提升开发效率和代码质量。

2023-07-24 23:16:09

441

逻辑鬼才

JSON

json 的遍历方法

...历JSON对象及处理复杂数据结构之后，我们可以进一步关注现代Web开发中JSON的更广泛应用及其最新发展动态。随着前后端分离架构的普及，RESTful API设计原则备受推崇，JSON作为数据交换格式的重要性日益凸显。例如，近期各大云服务商如AWS、Azure等推出了一系列优化JSON数据传输性能的服务和工具，允许开发者以更低延迟、更高效率的方式处理JSON数据。此外，针对JSON的安全性问题，Mozilla基金会发布了一项关于JSON安全漏洞的研究报告，提醒开发者注意防范由于不恰当的数据验证导致的XSS攻击，强调在解析JSON时进行严格的数据类型检查与过滤。同时，ECMAScript（ES）规范也在不断演进，例如ES2019引入了JSON.stringify()方法的可选参数replacer，它能提供更为精细的控制，使得开发者能够选择性地序列化JSON对象中的特定属性。另外，在前端框架React、Vue.js中，JSON数据的处理也得到了深度集成，通过状态管理库如Redux、Vuex，开发者可以便捷地操作JSON数据并在组件间传递。这些框架通常会提供工具函数或API，简化对JSON数据的遍历、更新和响应式绑定。综上所述，掌握JavaScript中遍历JSON数据的基本技巧仅仅是开始，了解JSON在现代Web开发中的前沿应用、安全风险以及相关技术的发展趋势，对于提升项目质量和开发效率具有重要意义。

2023-03-20 23:03:41

516

程序媛

转载文章

[转载]oracle cel函数：ORA-01722 无效数字，bug分析

...深入理解Oracle数据库中CEIL和FLOOR函数的运用及它们与其他函数结合时可能出现的问题后，进一步的延伸阅读可关注近期数据库优化实践以及如何确保数据处理的准确性和性能。近日，一篇关于Oracle 19c版本中数值函数性能提升的文章引起了广泛关注。文中详细介绍了新版本对CEIL、FLOOR等内建函数进行了底层优化，显著降低了处理大数据量时的CPU消耗，并通过实际测试案例展示了其在金融风控业务场景中的高效应用。例如，在处理涉及货币转换与金额四舍五入问题时，借助增强后的CEIL和FLOOR函数，能够更精确地执行批量数据处理任务，同时有效避免了因数据类型不匹配导致的错误。此外，对于数据库开发者而言，深入理解SQL查询中的类型转换规则是至关重要的。Oracle官方社区近期发布的一篇技术解读文章，以丰富的实例阐述了NVL、TO_NUMBER、REPLACE等函数与CEIL、FLOOR函数联合使用时的最佳实践。作者强调，在进行复杂数据预处理时，务必注意隐式类型转换可能导致的潜在风险，如ORA-01722（无效数字）错误，提倡通过明确的数据类型转换操作确保函数调用的正确性。综上所述，随着Oracle数据库技术的不断演进，用户在实际业务场景中灵活运用CEIL、FLOOR等数值函数的同时，也需紧跟官方更新动态和技术指南，以便更好地规避数据处理过程中可能遇到的问题，提升系统的稳定性和效率。

2023-11-18 18:54:51

343

转载

Element-UI

Vue.js项目中利用Element-UI el-table实现行点击展开/收起子内容：row-click事件与状态变量应用

...式的Web应用，实现数据驱动视图的更新。 Element-UI , Element-UI是基于Vue.js的开源UI组件库，提供了丰富的可复用UI组件，如表格、按钮、输入框等，帮助开发者快速搭建企业级前端页面。在本文中，主要讨论了如何利用Element-UI的el-table组件来实现表格行点击展开/收起的效果。 row-click事件 , row-click是Element-UI el-table组件提供的一个原生事件，当用户点击表格中的某一行时会触发该事件，并将被点击行的数据作为参数传递给绑定的事件处理函数。在此应用场景下，通过监听row-click事件，开发者能够获取到用户点击的具体行数据，进而控制该行的展开或收起状态。 ARIA角色属性 , ARIA（Accessible Rich Internet Applications）角色属性是一种W3C标准，用于增强网页元素的语义和辅助功能信息，以便于辅助技术（如屏幕阅读器）识别和解释网页内容。在无障碍设计领域，为el-table组件添加合适的ARIA角色属性有助于确保其展开/收起功能对键盘操作友好，符合WCAG 2.1标准，使得所有用户都能顺畅地与具有此功能的数据表格进行交互。

2023-10-23 16:53:41

404

青山绿水_t

JSON

json 数组加上

...其在现代web开发与数据传输领域的实际应用场景及最新进展。近年来，随着RESTful API接口设计的普及，JSON作为主流的数据交换格式，在前后端交互中扮演着至关重要的角色。例如，2021年，GitHub宣布对其API v4进行全面升级，其中就包括了对GraphQL的支持，这是一种基于JSON的强大查询语言，能够更灵活地获取和操作JSON数据结构。开发者可以利用GraphQL构建高度定制化的请求，只获取他们需要的数据，大大提升了效率并减少了网络带宽消耗。此外，JSON Schema作为一种用于描述JSON数据结构的标准模式语言，也正在逐步获得广泛接纳。通过定义JSON数据结构的模式，可以实现对JSON数据的有效验证和约束，从而提升数据质量，并为自动化工具提供支持，如自动生成表单、文档或者代码模型。最近，一些前沿的JavaScript框架，如React、Vue.js等，都在强化对JSON数据处理的支持，提供了便捷的方法将JSON数据映射到组件状态或视图层，简化了开发流程，提高了开发效率。总的来说，JSON数组不仅在基础层面服务于数据交换，还在不断演进和发展中，适应了现代web服务日益复杂和高效的需求。无论是新的数据查询语言的出现，还是数据校验和前端框架层面的支持，都展现了JSON数组在未来web开发领域广阔的应用前景。

2023-06-02 13:33:53

291

数据库专家

VUE

vue可视化h5编辑器

...el）解耦，通过双向数据绑定机制，实现视图模型对模型层（Model）的操作，并自动更新视图，使得开发者能够专注于业务逻辑处理和界面展示，提高开发效率和代码可维护性。 Vuex , Vuex是Vue.js官方提供的状态管理库，用于集中管理组件层级间的状态或数据。在Vue可视化H5编辑器中，Vuex用来存储和管理编辑器内部所有元素的状态信息，如元素的位置、大小、样式等属性，确保复杂交互场景下各组件间的通信与状态同步。 Vue-Router , Vue Router是Vue.js官方提供的路由管理器，用于构建单页面应用（SPA）的路由系统。在Vue可视化H5编辑器中，尽管并未直接说明使用了Vue Router的具体场景，但作为一款功能全面的前端工具，可能利用Vue Router实现不同编辑页面之间的导航和跳转，提供更加顺畅的多页面工作流体验。 H5网页 , H5全称为HTML5，是最新一代超文本标记语言标准。H5网页指采用HTML5技术制作的网页，相较于传统HTML网页，其支持更丰富的多媒体元素、图形绘制、离线存储、地理位置定位等功能，以及更好的跨平台兼容性。Vue可视化H5编辑器正是帮助用户便捷地创建这些具有丰富特性和交互性的H5网页的工具。

2023-09-25 09:42:00

逻辑鬼才

Java

Java中按输入和输出

...近期，随着云原生和大数据时代的来临，Java生态体系也在不断优化和完善其输入输出功能的性能和灵活性。例如，Java 15引入了全新的文本块（Text Blocks）特性，极大地简化了多行字符串的输入输出处理，特别是对于JSON、XML等格式化数据的读写操作，程序员可以更加便捷地编写和输出复杂结构的数据内容，提高了代码可读性和维护性。同时，为应对大规模并发场景下的I/O瓶颈问题，Java NIO（非阻塞I/O）框架的应用愈发广泛。通过Channel和Selector机制，Java能够实现高效的数据读写，尤其适用于网络通信、文件系统交互等高吞吐量场景。此外，随着函数式编程范式的流行，Java 8及后续版本推出的Stream API提供了流畅且易于并行化的数据处理能力，极大提升了集合类数据的输入输出效率，特别是在数据过滤、转换、聚合等操作上，体现了现代化编程语言对输入输出处理的更高层次抽象。综上所述，Java输入输出功能已从基础的控制台输入输出发展到支持高级数据流处理、高性能并发I/O以及更友好的字符串表示形式，未来将随着技术趋势持续演进，以满足日益复杂的软件工程应用场景需求。开发者应当关注这些最新进展，以便在实际项目中充分利用Java提供的强大工具和框架，提升程序效能和用户体验。

2023-12-24 11:21:23

397

数据库专家

JSON

json 数据操作

...了JSON作为轻量级数据交换格式的基础概念及其在JavaScript中的应用后，我们可进一步探索这一技术在现代Web开发及跨平台数据交互领域的最新动态与实践。近年来，随着API经济的快速发展和微服务架构的广泛应用，JSON愈发成为主流的数据传输格式。例如，在GraphQL这一新兴的API查询语言中，JSON不仅被用作请求和响应的数据载体，还支持丰富的自定义类型系统，以满足日益复杂的应用场景需求。此外，诸如AJAX、RESTful API等技术也都深度依赖JSON进行前后端数据交互。与此同时，考虑到性能优化和数据压缩的问题，业界也出现了对JSON的改进方案。比如，Facebook推出的Msgpack是一种二进制序列化格式，它在保持类似JSON语法简洁性的同时，显著提高了数据传输效率。另外，JSONB（Binary JSON）是PostgreSQL数据库为存储和检索JSON数据而提供的高效二进制格式。不仅如此，针对JSON的安全性问题，开发者需关注如何有效验证和过滤JSON数据，防止注入攻击等安全风险。为此，一些库如ajv、 Joi等提供了严谨的数据模式验证功能，确保接收到的JSON数据符合预期结构和类型。综上所述，深入理解和掌握JSON相关的最新技术和最佳实践，对于提升应用程序的数据处理能力、保障数据交互安全以及优化系统性能等方面具有重要价值。建议读者持续关注JSON及相关领域的发展趋势，并结合具体项目需求灵活运用各种解决方案。

2023-05-11 17:44:41

267

代码侠

转载文章

[转载]如何访问嵌套母版页中的控件

...VC中， Razor视图组件（View Components）被广泛用于实现可重用的UI逻辑块，它在某种程度上可以视为母版页功能的增强版，尤其是在处理复杂嵌套场景时。近期一篇名为“Exploring View Components in ASP.NET Core: A Modern Alternative to Nested Master Pages”的文章深入探讨了这一话题。作者通过实例分析了如何利用Razor视图组件替代传统的多层嵌套母版页，以更简洁、模块化的代码来组织和复用页面内容。该文章还强调了使用视图组件所带来的性能优势以及对现代化前端开发实践的良好支持，如服务器端渲染与前端框架（如React或Angular）的集成。此外，针对ASP.NET传统项目中FindControl方法的局限性，有开发者提出采用强类型视图模型结合Tag Helpers的方式，使得在处理嵌套布局时能够直接且安全地访问任何层级的控件，从而避免了动态查找可能导致的运行时错误和性能损耗。这种方案在社区内得到了积极反响，并在许多实际项目中得以应用。综上所述，尽管原始文章讨论了在旧版ASP.NET中访问嵌套母版页控件的方法，但随着技术发展，我们可以转向研究ASP.NET Core中的新型解决方案，这些方案不仅解决了原有问题，还引入了更多优化和便捷特性，有助于提升开发效率和用户体验。对于关注此领域的开发者来说，紧跟最新技术趋势并适时进行技术栈升级，无疑具有极高的实践价值。

2023-11-19 12:06:40

299

转载

Python

Python中运算符的幂运算功能与类型保持性：高效处理大整数阶乘及数学计算

...日，随着机器学习和大数据分析的蓬勃发展，对高效率数值计算的需求日益增长，Python作为科学计算的重要工具，其内置的NumPy库提供了更强大的向量化和矩阵运算功能，其中包括高效的幂运算方法。例如，在处理大规模数据集时，通过NumPy的numpy.power()函数可以快速进行数组元素的幂运算，极大地提升了处理复杂模型训练、特征工程等场景下的计算性能。此外，对于涉及复杂数学概念如指数函数、对数函数等高级运算，Python的SciPy库也提供了丰富且高效的实现。同时，对于初学者或者想要深化理解计算机如何实现快速幂运算的人来说，可以进一步研究算法层面的“快速幂”算法。这种算法利用分治思想，将指数运算转化为一系列位操作，从而大大降低了时间复杂度，尤其在处理大整数幂运算时优势明显，是ACM竞赛、密码学等领域必备的基础知识。综上所述，Python中幂运算符的高效运用只是冰山一角，结合现代编程库以及底层算法原理的学习与探索，能够帮助我们在实际项目开发和科学研究中更好地驾驭各类数学运算挑战。

2023-06-01 22:08:13

575

人生如戏-t

VUE

vue和小程序哪个好

...开发模式，通过响应式数据绑定机制简化了前后端交互逻辑，允许开发者以更加简洁、直观的方式来构建复杂的单页应用和其他类型的前端项目。在本文语境中，Vue拥有完备且成熟的生态系统，丰富的插件和组件资源，适合处理复杂的前端需求。微信小程序 , 微信小程序是腾讯公司推出的一种无需下载安装即可使用的应用程序，运行于微信内，实现了接近原生APP的用户体验。小程序具有独立的生态系统，可以无缝接入微信的各种功能服务，如支付、分享等。在文章中，微信小程序被描述为提供一体化体验的开发平台，其优势在于能够快速开发并高效利用微信生态系统的功能。响应式编程模型 , 响应式编程是一种编程范式，它的核心思想是数据驱动视图的变化。在Vue.js中，通过实现响应式数据绑定（例如v-model指令），当底层数据发生变化时，依赖该数据的UI部分会自动更新，无需手动操作DOM元素。文中提及Vue的数据绑定与响应式编程模型，使得开发者能够更便捷地处理用户交互和数据更新。

2023-05-24 10:32:34

128

程序媛

VUE

vue和svga

双向数据绑定 , 双向数据绑定是Vue.js框架中的一个重要特性，它允许视图（View）和模型（Model）之间自动同步。在实际应用中，当模型的数据发生变化时，依赖该数据的视图会自动更新；反之，如果用户通过视图界面改变了表单输入或触发了相关操作导致数据变化，模型层的数据也会相应地被更新。这样就极大地简化了开发过程中对数据状态管理和界面更新的操作，使得开发者无需手动编写大量DOM操作代码来保持数据与视图的一致性。组件化 , 组件化是一种将UI拆分成独立、可复用的代码块（即组件）的设计模式，在Vue.js中得到了广泛应用。每个组件都拥有自身的视图模板和逻辑，可以包含样式、HTML结构和JavaScript代码。组件间可以通过属性（props）进行数据传递，通过自定义事件实现通信。通过组件化，大型复杂的前端项目可以被组织成一系列相互独立、易于理解和维护的小型组件，从而提升开发效率和代码复用率。 SVGA（Scalable Vector Graphics Animation） , SVGA是一种专为移动设备优化的高度矢量化动画格式。不同于基于像素的传统动画格式，SVGA利用SVG（Scalable Vector Graphics）技术，使动画能够在不同分辨率和屏幕尺寸上清晰展示，不会因为放大或缩放而失真。在移动端应用程序开发中，尤其是在游戏、动画场景下，SVGA因其文件体积小、渲染性能高且支持复杂动画效果等特点，成为一种高效实用的动画解决方案。通过SVGA.Parser可以加载并解析SVGA格式的动画文件，然后利用SVGA.Player进行播放控制，为用户提供流畅丰富的视觉体验。

2023-01-11 22:10:45

程序媛

Datax

Datax连接源数据库授权失败问题解析：从用户名密码错误、权限不足到服务器与防火墙设置解决方案

...讨了Datax连接源数据库授权失败的问题及其解决方案后，我们进一步了解该问题所处的行业背景和最新进展。近年来，随着大数据技术的快速发展，数据同步工具的重要性日益凸显，尤其在云计算、数据中心迁移等场景中，Datax这类开源工具扮演着至关重要的角色。近日，阿里云发布了Datax的全新升级版本，针对用户在使用过程中遇到的各种权限和连接问题进行了深度优化。新版本增强了对多种数据库协议的支持，并改进了权限管理和错误提示机制，使得在面对复杂网络环境下的数据库连接与授权问题时，用户能够更便捷地定位问题并进行快速修复。此外，在数据安全领域，国内外对于数据库权限管控和防火墙策略设置的标准日趋严格，例如《欧盟通用数据保护条例》（GDPR）对数据处理者的访问控制提出了更高要求。因此，企业在利用Datax进行数据同步时，不仅需要关注工具本身的配置问题，更要符合相关法规政策，确保数据传输过程中的合规性和安全性。同时，业内专家也建议，在日常运维工作中，应定期检查和更新数据库用户的权限分配情况，以及防火墙规则设定，结合Datax等工具的功能特性，构建高效且安全的数据同步体系，以应对不断变化的技术环境与业务需求。

2023-05-11 15:12:28

564

星辰大海-t

知识学习

实践的时候请根据实际情况谨慎操作。

随机学习一条linux命令：

nohup command & - 在后台运行命令且在退出终端后仍继续运行。