...经常会遇到各种各样的异常。其中，UnknownHostException是一种常见的网络连接错误。当我们试图访问一个不存在或者不可达的主机时，就会抛出这个异常。那么，假设我们现在正用Apache Spark来对付大数据这块硬骨头，我们该如何巧妙又体面地解决这个问题呢？这篇文章就打算给大家伙分享一些超级实用的招数！二、什么是UnknownHostException？首先，让我们了解一下什么是UnknownHostException。在Java的世界里，有一个特别的异常类，它专门负责处理这样一种情况：当你试图解析一个压根儿就不在DNS服务器上的主机名或者IP地址时，系统就会抛出这个异常，告诉你这次解析尝试失败了。简单来说，就是我们的应用程序试图访问一个不存在的服务器。三、UnknownHostException在Spark中的常见表现在Spark应用中，UnknownHostException通常会在以下几种情况下出现： 1. 尝试连接到外部数据源时例如，Hive、Kafka等。 2. 在使用Spark SQL进行操作时，需要从外部系统读取数据。 3. 使用Spark Streaming进行实时流处理时，可能会因为无法建立与上游系统的连接而抛出此异常。四、解决UnknownHostException的方法那么，我们该如何优雅地处理UnknownHostException呢？以下是几种常用的方法：方法一：增加重试次数当遇到UnknownHostException时，我们可以选择增加重试次数。这样，如果服务器只是暂时不可用，那么程序仍有可能成功运行。下面是使用Scala编写的一个示例： scala val conf = new SparkConf().setAppName("MyApp") val sc = new SparkContext(conf) val maxRetries = 5 var retryCount = 0 while (retryCount < maxRetries) { try { // 这里是你的代码... ... break } catch { case e: UnknownHostException => if (retryCount == maxRetries - 1) { throw e } println(s"Received UnknownHostException, retrying in ${maxRetries - retryCount} seconds...") Thread.sleep(maxRetries - retryCount 1000) retryCount += 1 } } 在这个示例中，我们设置了最大重试次数为5次。每次重试之间会等待一段时间，避免过度消耗资源。方法二：使用备用数据源如果主数据源经常出现问题，我们可以考虑使用备用数据源。这可以保证即使主数据源不可用，我们的程序仍然能够正常运行。以下是一个简单的示例： scala val conf = new SparkConf().setAppName("MyApp") val sc = new SparkContext(conf) val master = "spark://:7077" val spark = SparkSession.builder() .appName("MyApp") .master(master) .getOrCreate() // 查询数据 val data = spark.sql("SELECT FROM my_table") // 处理数据 data.show() 在这个示例中，我们设置了两个Spark配置项：spark.master和spark.sql.warehouse.dir。这两个选项分别指定了Spark集群的Master节点和数据仓库目录。这样子做的话，我们就能保证，就算某个地方的数据出了岔子，我们的程序依旧能稳稳当当地运行下去，一点儿不受影响。方法三：检查网络连接最后，我们还可以尝试检查网络连接是否存在问题。比如，咱们可以试试给那个疑似出问题的服务器丢个ping包瞧瞧，看看它是不是还健在，能给出正常回应不。要是搞不定的话，可能就得瞅瞅咱们的网络配置是否出了啥问题，或者直接找IT部门的大神们求救了。五、总结总的来说，处理UnknownHostException的关键在于找到问题的原因并采取适当的措施。不管是多试几次，还是找个备胎数据源来顶上，都能实实在在地让咱们的程序更加稳如磐石。在使用Spark开发应用的时候，我们还能充分挖掘Spark的硬核实力，比如灵活运用SQL查询功能，实时处理数据流等招数，这都能让咱们的应用性能嗖嗖提升，更上一层楼。希望通过这篇文章，你能学到一些实用的技巧，并在未来的开发工作中游刃有余。

2024-01-09 16:02:17

136

星辰大海-t

Spark

Spark任务失败解决：内存配置与JDBC依赖问题处理

.... 引言最近在使用Spark进行大数据处理时，遇到了一个让我抓狂的问题：“Lost task 00 in stage 00 TID 0, localhost, executor driver: java.lang.RuntimeException”。这个问题不仅耽误了我很多时间，还让我一度怀疑自己的代码水平。不过，经过一番研究和尝试，我发现了解决这个问题的一些有效方法。接下来，我会分享我的经验，希望能帮助遇到相同问题的小伙伴们。 2. 问题背景在使用Spark处理数据的过程中，我们经常会遇到各种各样的错误。这个错误信息一般意味着有个任务在运行时出了岔子，最后没能顺利完成。在这个案例中，具体是task 00在stage 00中的TID 0执行失败了，而且异常发生在executor driver上。这看起来像是一个简单的错误，但背后可能隐藏着一些复杂的原因。 3. 分析原因首先，我们需要分析一下这个错误的根本原因。在Spark里，如果一个任务运行时出了问题抛了异常，系统就会把它标成“丢失”状态，而且不会自动重新来过。这事儿可能是因为好几个原因，比如内存不够用、代码写得不太对劲，或者是有个外部的东西不给力。 - 内存不足：Spark任务可能会因为内存不足而失败。我们可以检查executor和driver的内存配置是否合理。 - 代码逻辑错误：代码中可能存在逻辑错误，导致某些操作无法正确执行。 - 外部依赖问题：如果任务依赖于外部资源（如数据库连接、文件系统等），这些资源可能存在问题。 4. 解决方案在找到问题原因后，我们需要采取相应的措施来解决问题。这里列出了一些常见的解决方案： 4.1 检查内存配置内存不足是导致任务失败的一个常见原因。咱们可以调节一下executor和driver的内存设置，让它们手头宽裕点，好顺利完成任务。 scala val spark = SparkSession.builder() .appName("ExampleApp") .config("spark.executor.memory", "4g") // 设置executor内存为4GB .config("spark.driver.memory", "2g") // 设置driver内存为2GB .getOrCreate() 4.2 优化代码逻辑代码中的逻辑错误也可能导致任务失败。我们需要仔细检查代码，确保所有的操作都能正常执行。 scala val data = spark.read.text("input.txt") val words = data.flatMap(line => line.split("\\s+")) val wordCounts = words.groupBy($"value").count() wordCounts.show() // 显示结果 4.3 处理外部依赖如果任务依赖于外部资源，我们需要确保这些资源是可用的。例如，如果任务需要访问数据库，我们需要检查数据库连接是否正常。 scala val jdbcDF = spark.read .format("jdbc") .option("url", "jdbc:mysql://localhost:3306/database_name") .option("dbtable", "table_name") .option("user", "username") .option("password", "password") .load() jdbcDF.show() 4.4 日志分析最后，我们可以通过查看日志来获取更多的信息。日志中可能会包含更详细的错误信息，帮助我们更好地定位问题。 bash spark-submit --class com.example.MyJob --master local[] my-job.jar 5. 总结通过以上步骤，我成功解决了这个令人头疼的问题。虽然过程中遇到了不少困难，但最终还是找到了合适的解决方案。希望我的经验能对大家有所帮助。如果还有其他问题，欢迎随时交流讨论！ --- 这篇文章涵盖了从问题背景到具体解决方案的全过程，希望对你有所帮助。如果你在实际操作中遇到其他问题，不妨多查阅官方文档或者向社区求助，相信总能找到答案。

2025-03-02 15:38:28

林中小径

Spark

Spark Executor在YARN中因资源超限被杀原因与对策：内存限制、心跳丢失及配置优化这个包含了中的核心关键词Spark Executor、YARN ResourceManager和资源超限，同时也提到了问题的应对策略——通过配置优化来解决由于内存限制和心跳丢失引发的问题。同时，它保持了简洁性，在50个字以内准确传达了的内容。

Spark Executor进程被YARN ResourceManager提前杀死：原因、影响与对策在大数据处理领域，Apache Spark以其高效、易用的特点广受青睐。嘿，你知道吗？当我们用Spark在YARN集群模式上跑任务的时候，有时候会遇到个挺让人头疼的小插曲。就是那个Executor进程，它会被YARN ResourceManager这个家伙给提前“咔嚓”掉，真是让人有点小郁闷呢！这篇文章，咱们要深入地“扒一扒”这个现象背后的真正原因，琢磨琢磨它对咱做作业的影响有多大，并且还会分享一些超实用的应对小妙招~ 1. 现象描述在Spark应用运行过程中，YARN ResourceManager作为集群资源的管理者，可能会出现异常终止某个或多个Executor进程的情况。此时，您可能会在日志中看到类似“Container killed by YARN for exceeding memory limits”这样的错误提示。这就意味着，由于某些状况，ResourceManager觉着你的Executor吃掉的资源有点超出了给它的额度限制，所以呢，它就决定出手，采取了强制关闭这招来应对。 2. 原因分析 2.1 资源超限最常见的原因是Executor占用的内存超出预设限制。例如，当我们的Spark应用程序进行大规模数据处理或者计算密集型任务时，如果未合理设置executor-memory参数，可能会导致内存溢出： scala val conf = new SparkConf() .setAppName("MyApp") .setMaster("yarn") .set("spark.executor.memory", "4g") // 如果实际需求大于4G，则可能出现问题 val sc = new SparkContext(conf) 2.2 心跳丢失另一种可能是Executor与ResourceManager之间的心跳信号中断，导致ResourceManager误判Executor已经失效并将其杀掉。这可能与网络状况、系统负载等因素有关。 2.3 其他因素此外，还有诸如垃圾回收(GC)频繁，长时间阻塞等其他情况，都可能导致Executor表现异常，进而被YARN ResourceManager提前结束。 3. 影响与后果当Executor被提前杀死时，不仅会影响正在进行的任务，造成任务失败或重启，还会降低整个作业的执行效率。比如，如果你老是让任务重试，这就相当于在延迟上添砖加瓦。再者，要是Executor频繁地启动、关闭，这无疑就是在额外开销上雪上加霜啊。 4. 应对策略 4.1 合理配置资源根据实际业务需求，合理设置Executor的内存、CPU核心数等参数，避免资源过载： scala conf.set("spark.executor.memory", "8g") // 根据实际情况调整 conf.set("spark.executor.cores", "4") // 同理 4.2 监控与调优通过监控工具密切关注Executor的运行状态，包括内存使用情况、GC频率等，及时进行调优。例如，可以通过调节spark.memory.fraction和spark.memory.storageFraction来优化内存管理策略。 4.3 网络与稳定性优化确保集群网络稳定，避免因为网络抖动导致的心跳丢失问题。对于那些需要长时间跑的任务，咱们可以琢磨琢磨采用更为结实牢靠的消息处理机制，这样一来，就能有效避免因为心跳问题引发的误操作，让任务运行更稳当、更皮实。 5. 总结与思考面对Spark Executor在YARN上被提前杀死的问题，我们需要从源头入手，深入理解问题背后的原理，结合实际应用场景细致调整资源配置，并辅以严谨的监控与调优手段。这样不仅能一举摆脱当前的困境，还能让Spark应用在复杂环境下的表现更上一层楼，既稳如磐石又快如闪电。在整个探索和解决问题的过程中，我们的人类智慧和技术实践得到了充分融合，这也正是技术的魅力所在！

2023-07-08 15:42:34

190

断桥残雪

Spark

日志记录驱动的分布式计算：错误诊断与性能监控在大数据处理中的应用与应对

Spark应用程序执行时出现错误的日志记录：一个深入探索一、引言日志记录的重要性在软件开发领域，尤其是大规模数据处理项目中，如使用Apache Spark构建的分布式计算框架，日志记录成为了不可或缺的一部分。哎呀，这些家伙可真是帮了大忙了！它们就像是你编程时的私人侦探，随时盯着你的代码，一有风吹草动就给你报信。特别是当你遇上疑难杂症，它们能迅速揪出问题所在，就像医生找病因一样专业。有了它们，找bug、修bug的过程变得快捷又高效，简直就像开了挂一样爽快！哎呀，咱们这篇文章啊，就是要好好聊聊在Spark这个超级棒的大数据处理工具里，咱们可能会遇到的各种小麻烦，还有呢，怎么用那些日志记录来帮咱们找到问题的根儿。你想象一下，就像你在厨房里做饭，突然发现菜炒糊了，这时候你就会看看锅底，找找是火开太大了还是调料放多了，对吧？这文章呢，就是想教你用同样的方法，在大数据的世界里，通过查看日志，找出你的Spark程序哪里出了问题，然后迅速解决它，让一切恢复正常。是不是听起来既实用又有趣？咱们这就开始吧！二、Spark错误类型概述 Spark应用程序可能遭遇多种错误类型，从内存溢出、任务失败到网络通信异常等。这些错误通常由日志系统捕获并记录下来，为后续分析提供依据。下面，我们将通过几个具体的错误示例来了解如何阅读和解析Spark日志文件。三、实例代码简单的Spark Word Count应用首先，让我们构建一个简单的Spark Word Count应用作为起点。这个应用旨在统计文本文件中单词的频率。 scala import org.apache.spark.SparkConf import org.apache.spark.SparkContext object WordCount { def main(args: Array[String]) { val conf = new SparkConf().setAppName("Word Count").setMaster("local") val sc = new SparkContext(conf) val textFile = sc.textFile("file:///path/to/your/textfile.txt") val counts = textFile.flatMap(line => line.split(" ")) .map(word => (word, 1)) .reduceByKey(_ + _) counts.saveAsTextFile("output") sc.stop() } } 四、错误日志分析内存溢出问题在实际运行上述应用时，如果输入文本文件过大，可能会导致内存溢出错误。日志文件中可能会出现类似以下的信息： org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 37.0 failed 1 times, most recent failure: Lost task 0.3 in stage 37.0 (TID 208, localhost): java.lang.OutOfMemoryError: Java heap space 这段日志信息清晰地指出错误原因（OutOfMemoryError: Java heap space），并提供了关键细节，包括任务编号、所在节点以及错误类型。针对这一问题，可以通过增加Spark集群的内存资源或者优化数据处理逻辑来解决。五、调试策略与最佳实践 1. 使用日志级别调整日志级别（如INFO、DEBUG）可以帮助开发者在日志中获取更多详细信息。 2. 定期检查日志通过自动化工具定期检查日志文件，可以及时发现潜在问题。 3. 利用Spark UI Spark自带的Web UI提供了详细的作业监控界面，直观显示任务状态和性能指标。 4. 错误重试机制合理配置Spark任务的重试策略，避免因一次失败而影响整体进程。 5. 性能监控工具集成性能监控工具（如Prometheus、Grafana）有助于实时监控系统性能，预防内存泄漏等严重问题。六、总结与展望日志记录是Spark应用程序开发和维护过程中的关键环节。哎呀，你知道吗？程序员们在遇到bug（小错误）的时候，那可是得使出浑身解数了！他们可不是对着电脑屏幕发呆，而是会仔细地分析问题，就像侦探破案一样。找到问题的源头后，他们就开始了他们的“调试大作战”，就像是医生给病人开药一样精准。通过这些努力，他们能优化代码，让程序跑得更顺畅，就像给汽车加了润滑剂，不仅跑得快，还稳当当的。这样，我们的应用就能更加可靠，用户用起来也更舒心啦！哎呀，你懂的，随着咱们每天产生的数据就像自来水一样哗哗流，那处理这些数据的大数据工具就得越来越厉害才行。特别是那些记录我们操作痕迹的日志管理系统，不仅要快得跟闪电一样，操作起来还得像玩手机游戏一样简单，最好还能自己动脑筋分析出点啥有价值的信息来。这样，未来日志记录这事儿就不仅仅是记录，还能帮我们找到问题、优化流程，简直就是一大神器嘛！所以，你看，这发展方向就是越来越智能、好用、高效，让科技真正服务于人，而不是让人被科技牵着鼻子走。 --- 通过本文的探讨，我们不仅学习了如何理解和利用Spark的日志信息来诊断问题，还了解了一些实用的调试技巧和最佳实践。希望这些内容能帮助你更有效地管理你的Spark应用程序，确保其在复杂的数据处理场景下稳定运行。

2024-09-07 16:03:18

141

秋水共长天一色

转载文章

[转载]大数据IMF传奇行动绝密课程第104-114课：Spark Streaming电商广告点击综合案例

...实并删除相应内容。 Spark Streaming电商广告点击综合案例需求分析和技术架构广告点击系统实时分析广告来自于广告或者移动App等，广告需要设定在具体的广告位，当用户点击广告的时候，一般都会通过ajax或Socket往后台发送日志数据，在这里我们是要做基于SparkStreaming做实时在线统计。那么数据就需要放进消息系统（Kafka）中，我们的Spark Streaming应用程序就会去Kafka中Pull数据过来进行计算和消费，并把计算后的数据放入到持久化系统中（MySQL）广告点击系统实时分析的意义：因为可以在线实时的看见广告的投放效果，就为广告的更大规模的投入和调整打下了坚实的基础，从而为公司带来最大化的经济回报。核心需求： 1、实时黑名单动态过滤出有效的用户广告点击行为：因为黑名单用户可能随时出现，所以需要动态更新； 2、在线计算广告点击流量； 3、Top3热门广告； 4、每个广告流量趋势； 5、广告点击用户的区域分布分析 6、最近一分钟的广告点击量； 7、整个广告点击Spark Streaming处理程序724小时运行；数据格式：时间、用户、广告、城市等技术细节：在线计算用户点击的次数分析，屏蔽IP等；使用updateStateByKey或者mapWithState进行不同地区广告点击排名的计算； Spark Streaming+Spark SQL+Spark Core等综合分析数据；使用Window类型的操作；高可用和性能调优等等；流量趋势，一般会结合DB等； Spark Core / /package com.tom.spark.SparkApps.sparkstreaming;import java.util.Date;import java.util.HashMap;import java.util.Map;import java.util.Properties;import java.util.Random;import kafka.javaapi.producer.Producer;import kafka.producer.KeyedMessage;import kafka.producer.ProducerConfig;/ 数据生成代码，Kafka Producer产生数据/public class MockAdClickedStat {/ @param args/public static void main(String[] args) {final Random random = new Random();final String[] provinces = new String[]{"Guangdong", "Zhejiang", "Jiangsu", "Fujian"};final Map<String, String[]> cities = new HashMap<String, String[]>();cities.put("Guangdong", new String[]{"Guangzhou", "Shenzhen", "Dongguan"});cities.put("Zhejiang", new String[]{"Hangzhou", "Wenzhou", "Ningbo"});cities.put("Jiangsu", new String[]{"Nanjing", "Suzhou", "Wuxi"});cities.put("Fujian", new String[]{"Fuzhou", "Xiamen", "Sanming"});final String[] ips = new String[] {"192.168.112.240","192.168.112.239","192.168.112.245","192.168.112.246","192.168.112.247","192.168.112.248","192.168.112.249","192.168.112.250","192.168.112.251","192.168.112.252","192.168.112.253","192.168.112.254",};/ Kafka相关的基本配置信息/Properties kafkaConf = new Properties();kafkaConf.put("serializer.class", "kafka.serializer.StringEncoder");kafkaConf.put("metadeta.broker.list", "Master:9092,Worker1:9092,Worker2:9092");ProducerConfig producerConfig = new ProducerConfig(kafkaConf);final Producer<Integer, String> producer = new Producer<Integer, String>(producerConfig);new Thread(new Runnable() {public void run() {while(true) {//在线处理广告点击流的基本数据格式：timestamp、ip、userID、adID、province、cityLong timestamp = new Date().getTime();String ip = ips[random.nextInt(12)]; //可以采用网络上免费提供的ip库int userID = random.nextInt(10000);int adID = random.nextInt(100);String province = provinces[random.nextInt(4)];String city = cities.get(province)[random.nextInt(3)];String clickedAd = timestamp + "\t" + ip + "\t" + userID + "\t" + adID + "\t" + province + "\t" + city;producer.send(new KeyedMessage<Integer, String>("AdClicked", clickedAd));try {Thread.sleep(50);} catch (InterruptedException e) {// TODO Auto-generated catch blocke.printStackTrace();} }} }).start();} } package com.tom.spark.SparkApps.sparkstreaming;import java.sql.Connection;import java.sql.DriverManager;import java.sql.PreparedStatement;import java.sql.ResultSet;import java.sql.SQLException;import java.util.ArrayList;import java.util.Arrays;import java.util.HashMap;import java.util.HashSet;import java.util.Iterator;import java.util.List;import java.util.Map;import java.util.Set;import java.util.concurrent.LinkedBlockingQueue;import kafka.serializer.StringDecoder;import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaPairRDD;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.api.java.function.Function;import org.apache.spark.api.java.function.Function2;import org.apache.spark.api.java.function.PairFunction;import org.apache.spark.api.java.function.VoidFunction;import org.apache.spark.sql.DataFrame;import org.apache.spark.sql.Row;import org.apache.spark.sql.RowFactory;import org.apache.spark.sql.hive.HiveContext;import org.apache.spark.sql.types.DataTypes;import org.apache.spark.sql.types.StructType;import org.apache.spark.streaming.Durations;import org.apache.spark.streaming.api.java.JavaDStream;import org.apache.spark.streaming.api.java.JavaPairDStream;import org.apache.spark.streaming.api.java.JavaPairInputDStream;import org.apache.spark.streaming.api.java.JavaStreamingContext;import org.apache.spark.streaming.api.java.JavaStreamingContextFactory;import org.apache.spark.streaming.kafka.KafkaUtils;import com.google.common.base.Optional;import scala.Tuple2;/ 数据处理，Kafka消费者/public class AdClickedStreamingStats {/ @param args/public static void main(String[] args) {// TODO Auto-generated method stub//好处：1、checkpoint 2、工厂final SparkConf conf = new SparkConf().setAppName("SparkStreamingOnKafkaDirect").setMaster("hdfs://Master:7077/");final String checkpointDirectory = "hdfs://Master:9000/library/SparkStreaming/CheckPoint_Data";JavaStreamingContextFactory factory = new JavaStreamingContextFactory() {public JavaStreamingContext create() {// TODO Auto-generated method stubreturn createContext(checkpointDirectory, conf);} };/ 可以从失败中恢复Driver，不过还需要指定Driver这个进程运行在Cluster，并且在提交应用程序的时候制定--supervise;/JavaStreamingContext javassc = JavaStreamingContext.getOrCreate(checkpointDirectory, factory);/ 第三步：创建Spark Streaming输入数据来源input Stream: 1、数据输入来源可以基于File、HDFS、Flume、Kafka、Socket等 2、在这里我们指定数据来源于网络Socket端口，Spark Streaming连接上该端口并在运行的时候一直监听该端口的数据 (当然该端口服务首先必须存在），并且在后续会根据业务需要不断有数据产生（当然对于Spark Streaming 应用程序的运行而言，有无数据其处理流程都是一样的） 3、如果经常在每间隔5秒钟没有数据的话不断启动空的Job其实会造成调度资源的浪费，因为并没有数据需要发生计算；所以实际的企业级生成环境的代码在具体提交Job前会判断是否有数据，如果没有的话就不再提交Job；///创建Kafka元数据来让Spark Streaming这个Kafka Consumer利用Map<String, String> kafkaParameters = new HashMap<String, String>();kafkaParameters.put("metadata.broker.list", "Master:9092,Worker1:9092,Worker2:9092");Set<String> topics = new HashSet<String>();topics.add("SparkStreamingDirected");JavaPairInputDStream<String, String> adClickedStreaming = KafkaUtils.createDirectStream(javassc, String.class, String.class, StringDecoder.class, StringDecoder.class,kafkaParameters, topics);/因为要对黑名单进行过滤，而数据是在RDD中的，所以必然使用transform这个函数；但是在这里我们必须使用transformToPair，原因是读取进来的Kafka的数据是Pair<String,String>类型, 另一个原因是过滤后的数据要进行进一步处理，所以必须是读进的Kafka数据的原始类型在此再次说明，每个Batch Duration中实际上讲输入的数据就是被一个且仅被一个RDD封装的，你可以有多个 InputDStream，但其实在产生job的时候，这些不同的InputDStream在Batch Duration中就相当于Spark基于HDFS 数据操作的不同文件来源而已罢了。/JavaPairDStream<String, String> filteredadClickedStreaming = adClickedStreaming.transformToPair(new Function<JavaPairRDD<String,String>, JavaPairRDD<String,String>>() {public JavaPairRDD<String, String> call(JavaPairRDD<String, String> rdd) throws Exception {/ 在线黑名单过滤思路步骤： 1、从数据库中获取黑名单转换成RDD，即新的RDD实例封装黑名单数据； 2、然后把代表黑名单的RDD的实例和Batch Duration产生的RDD进行Join操作，准确的说是进行leftOuterJoin操作，也就是说使用Batch Duration产生的RDD和代表黑名单的RDD实例进行 leftOuterJoin操作，如果两者都有内容的话，就会是true，否则的话就是false 我们要留下的是leftOuterJoin结果为false； /final List<String> blackListNames = new ArrayList<String>();JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();jdbcWrapper.doQuery("SELECT FROM blacklisttable", null, new ExecuteCallBack() {public void resultCallBack(ResultSet result) throws Exception {while(result.next()){blackListNames.add(result.getString(1));} }});List<Tuple2<String, Boolean>> blackListTuple = new ArrayList<Tuple2<String,Boolean>>();for(String name : blackListNames) {blackListTuple.add(new Tuple2<String, Boolean>(name, true));}List<Tuple2<String, Boolean>> blacklistFromListDB = blackListTuple; //数据来自于查询的黑名单表并且映射成为<String, Boolean>JavaSparkContext jsc = new JavaSparkContext(rdd.context());/ 黑名单的表中只有userID，但是如果要进行join操作的话就必须是Key-Value，所以在这里我们需要基于数据表中的数据产生Key-Value类型的数据集合/JavaPairRDD<String, Boolean> blackListRDD = jsc.parallelizePairs(blacklistFromListDB);/ 进行操作的时候肯定是基于userID进行join，所以必须把传入的rdd进行mapToPair操作转化成为符合格式的RDD/JavaPairRDD<String, Tuple2<String, String>> rdd2Pair = rdd.mapToPair(new PairFunction<Tuple2<String,String>, String, Tuple2<String, String>>() {public Tuple2<String, Tuple2<String, String>> call(Tuple2<String, String> t) throws Exception {// TODO Auto-generated method stubString userID = t._2.split("\t")[2];return new Tuple2<String, Tuple2<String,String>>(userID, t);} });JavaPairRDD<String, Tuple2<Tuple2<String, String>, Optional<Boolean>>> joined = rdd2Pair.leftOuterJoin(blackListRDD);JavaPairRDD<String, String> result = joined.filter(new Function<Tuple2<String,Tuple2<Tuple2<String,String>,Optional<Boolean>>>, Boolean>() {public Boolean call(Tuple2<String, Tuple2<Tuple2<String, String>, Optional<Boolean>>> tuple)throws Exception {// TODO Auto-generated method stubOptional<Boolean> optional = tuple._2._2;if(optional.isPresent() && optional.get()){return false;} else {return true;} }}).mapToPair(new PairFunction<Tuple2<String,Tuple2<Tuple2<String,String>,Optional<Boolean>>>, String, String>() {public Tuple2<String, String> call(Tuple2<String, Tuple2<Tuple2<String, String>, Optional<Boolean>>> t)throws Exception {// TODO Auto-generated method stubreturn t._2._1;} });return result;} });//广告点击的基本数据格式：timestamp、ip、userID、adID、province、cityJavaPairDStream<String, Long> pairs = filteredadClickedStreaming.mapToPair(new PairFunction<Tuple2<String,String>, String, Long>() {public Tuple2<String, Long> call(Tuple2<String, String> t) throws Exception {String[] splited=t._2.split("\t");String timestamp = splited[0]; //YYYY-MM-DDString ip = splited[1];String userID = splited[2];String adID = splited[3];String province = splited[4];String city = splited[5]; String clickedRecord = timestamp + "_" +ip + "_"+userID+"_"+adID+"_"+province +"_"+city;return new Tuple2<String, Long>(clickedRecord, 1L);} });/ 第4.3步：在单词实例计数为1基础上，统计每个单词在文件中出现的总次数/JavaPairDStream<String, Long> adClickedUsers= pairs.reduceByKey(new Function2<Long, Long, Long>() {public Long call(Long i1, Long i2) throws Exception{return i1 + i2;} });/判断有效的点击，复杂化的采用机器学习训练模型进行在线过滤简单的根据ip判断1天不超过100次；也可以通过一个batch duration的点击次数判断是否非法广告点击，通过一个batch来判断是不完整的，还需要一天的数据也可以每一个小时来判断。/JavaPairDStream<String, Long> filterClickedBatch = adClickedUsers.filter(new Function<Tuple2<String,Long>, Boolean>() {public Boolean call(Tuple2<String, Long> v1) throws Exception {if (1 < v1._2){//更新一些黑名单的数据库表return false;} else { return true;} }});//filterClickedBatch.print();//写入数据库filterClickedBatch.foreachRDD(new Function<JavaPairRDD<String,Long>, Void>() {public Void call(JavaPairRDD<String, Long> rdd) throws Exception {rdd.foreachPartition(new VoidFunction<Iterator<Tuple2<String,Long>>>() {public void call(Iterator<Tuple2<String, Long>> partition) throws Exception {//使用数据库连接池的高效读写数据库的方式将数据写入数据库mysql//例如一次插入 1000条 records，使用insertBatch 或 updateBatch//插入的用户数据信息：userID,adID,clickedCount,time//这里面有一个问题，可能出现两条记录的key是一样的，此时需要更新累加操作List<UserAdClicked> userAdClickedList = new ArrayList<UserAdClicked>();while(partition.hasNext()) {Tuple2<String, Long> record = partition.next();String[] splited = record._1.split("\t");UserAdClicked userClicked = new UserAdClicked();userClicked.setTimestamp(splited[0]);userClicked.setIp(splited[1]);userClicked.setUserID(splited[2]);userClicked.setAdID(splited[3]);userClicked.setProvince(splited[4]);userClicked.setCity(splited[5]);userAdClickedList.add(userClicked);}final List<UserAdClicked> inserting = new ArrayList<UserAdClicked>();final List<UserAdClicked> updating = new ArrayList<UserAdClicked>();JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();//表的字段timestamp、ip、userID、adID、province、city、clickedCountfor(final UserAdClicked clicked : userAdClickedList) {jdbcWrapper.doQuery("SELECT clickedCount FROM adclicked WHERE"+ " timestamp =? AND userID = ? AND adID = ?",new Object[]{clicked.getTimestamp(), clicked.getUserID(),clicked.getAdID()}, new ExecuteCallBack() {public void resultCallBack(ResultSet result) throws Exception {// TODO Auto-generated method stubif(result.next()) {long count = result.getLong(1);clicked.setClickedCount(count);updating.add(clicked);} else {inserting.add(clicked);clicked.setClickedCount(1L);} }});}//表的字段timestamp、ip、userID、adID、province、city、clickedCountList<Object[]> insertParametersList = new ArrayList<Object[]>();for(UserAdClicked insertRecord : inserting) {insertParametersList.add(new Object[] {insertRecord.getTimestamp(),insertRecord.getIp(),insertRecord.getUserID(),insertRecord.getAdID(),insertRecord.getProvince(),insertRecord.getCity(),insertRecord.getClickedCount()});}jdbcWrapper.doBatch("INSERT INTO adclicked VALUES(?, ?, ?, ?, ?, ?, ?)", insertParametersList);//表的字段timestamp、ip、userID、adID、province、city、clickedCountList<Object[]> updateParametersList = new ArrayList<Object[]>();for(UserAdClicked updateRecord : updating) {updateParametersList.add(new Object[] {updateRecord.getTimestamp(),updateRecord.getIp(),updateRecord.getUserID(),updateRecord.getAdID(),updateRecord.getProvince(),updateRecord.getCity(),updateRecord.getClickedCount() + 1});}jdbcWrapper.doBatch("UPDATE adclicked SET clickedCount = ? WHERE"+ " timestamp =? AND ip = ? AND userID = ? AND adID = ? "+ "AND province = ? AND city = ?", updateParametersList);} });return null;} });//再次过滤，从数据库中读取数据过滤黑名单JavaPairDStream<String, Long> blackListBasedOnHistory = filterClickedBatch.filter(new Function<Tuple2<String,Long>, Boolean>() {public Boolean call(Tuple2<String, Long> v1) throws Exception {//广告点击的基本数据格式：timestamp,ip,userID,adID,province,cityString[] splited = v1._1.split("\t"); //提取key值String date =splited[0];String userID =splited[2];String adID =splited[3];//查询一下数据库同一个用户同一个广告id点击量超过50次列入黑名单//接下来根据date、userID、adID条件去查询用户点击广告的数据表，获得总的点击次数//这个时候基于点击次数判断是否属于黑名单点击int clickedCountTotalToday = 81 ;if (clickedCountTotalToday > 50) {return true;}else {return false ;} }});//map操作，找出用户的idJavaDStream<String> blackListuserIDBasedInBatchOnhistroy =blackListBasedOnHistory.map(new Function<Tuple2<String,Long>, String>() {public String call(Tuple2<String, Long> v1) throws Exception {// TODO Auto-generated method stubreturn v1._1.split("\t")[2];} });//有一个问题，数据可能重复，在一个partition里面重复，这个好办；//但多个partition不能保证一个用户重复，需要对黑名单的整个rdd进行去重操作。//rdd去重了，partition也就去重了，一石二鸟，一箭双雕// 找出了黑名单，下一步就写入黑名单数据库表中JavaDStream<String> blackListUniqueuserBasedInBatchOnhistroy = blackListuserIDBasedInBatchOnhistroy.transform(new Function<JavaRDD<String>, JavaRDD<String>>() {public JavaRDD<String> call(JavaRDD<String> rdd) throws Exception {// TODO Auto-generated method stubreturn rdd.distinct();} });// 下一步写入到数据表中blackListUniqueuserBasedInBatchOnhistroy.foreachRDD(new Function<JavaRDD<String>, Void>() {public Void call(JavaRDD<String> rdd) throws Exception {rdd.foreachPartition(new VoidFunction<Iterator<String>>() {public void call(Iterator<String> t) throws Exception {// TODO Auto-generated method stub//插入的用户信息可以只包含：useID//此时直接插入黑名单数据表即可。//写入数据库List<Object[]> blackList = new ArrayList<Object[]>();while(t.hasNext()) {blackList.add(new Object[]{t.next()});}JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();jdbcWrapper.doBatch("INSERT INTO blacklisttable values (?)", blackList);} });return null;} });/广告点击累计动态更新,每个updateStateByKey都会在Batch Duration的时间间隔的基础上进行广告点击次数的更新，更新之后我们一般都会持久化到外部存储设备上，在这里我们存储到MySQL数据库中/JavaPairDStream<String, Long> updateStateByKeyDSteam = filteredadClickedStreaming.mapToPair(new PairFunction<Tuple2<String,String>, String, Long>() {public Tuple2<String, Long> call(Tuple2<String, String> t)throws Exception {String[] splited=t._2.split("\t");String timestamp = splited[0]; //YYYY-MM-DDString ip = splited[1];String userID = splited[2];String adID = splited[3];String province = splited[4];String city = splited[5]; String clickedRecord = timestamp + "_" +ip + "_"+userID+"_"+adID+"_"+province +"_"+city;return new Tuple2<String, Long>(clickedRecord, 1L);} }).updateStateByKey(new Function2<List<Long>, Optional<Long>, Optional<Long>>() {public Optional<Long> call(List<Long> v1, Optional<Long> v2)throws Exception {// v1:当前的Key在当前的Batch Duration中出现的次数的集合，例如{1，1，1，。。。，1}// v2:当前的Key在以前的Batch Duration中积累下来的结果；Long clickedTotalHistory = 0L; if(v2.isPresent()){clickedTotalHistory = v2.get();}for(Long one : v1) {clickedTotalHistory += one;}return Optional.of(clickedTotalHistory);} });updateStateByKeyDSteam.foreachRDD(new Function<JavaPairRDD<String,Long>, Void>() {public Void call(JavaPairRDD<String, Long> rdd) throws Exception {rdd.foreachPartition(new VoidFunction<Iterator<Tuple2<String,Long>>>() {public void call(Iterator<Tuple2<String, Long>> partition) throws Exception {//使用数据库连接池的高效读写数据库的方式将数据写入数据库mysql//例如一次插入 1000条 records，使用insertBatch 或 updateBatch//插入的用户数据信息：timestamp、adID、province、city//这里面有一个问题，可能出现两条记录的key是一样的，此时需要更新累加操作List<AdClicked> AdClickedList = new ArrayList<AdClicked>();while(partition.hasNext()) {Tuple2<String, Long> record = partition.next();String[] splited = record._1.split("\t");AdClicked adClicked = new AdClicked();adClicked.setTimestamp(splited[0]);adClicked.setAdID(splited[1]);adClicked.setProvince(splited[2]);adClicked.setCity(splited[3]);adClicked.setClickedCount(record._2);AdClickedList.add(adClicked);}final List<AdClicked> inserting = new ArrayList<AdClicked>();final List<AdClicked> updating = new ArrayList<AdClicked>();JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();//表的字段timestamp、ip、userID、adID、province、city、clickedCountfor(final AdClicked clicked : AdClickedList) {jdbcWrapper.doQuery("SELECT clickedCount FROM adclickedcount WHERE"+ " timestamp = ? AND adID = ? AND province = ? AND city = ?",new Object[]{clicked.getTimestamp(), clicked.getAdID(),clicked.getProvince(), clicked.getCity()}, new ExecuteCallBack() {public void resultCallBack(ResultSet result) throws Exception {// TODO Auto-generated method stubif(result.next()) {long count = result.getLong(1);clicked.setClickedCount(count);updating.add(clicked);} else {inserting.add(clicked);clicked.setClickedCount(1L);} }});}//表的字段timestamp、ip、userID、adID、province、city、clickedCountList<Object[]> insertParametersList = new ArrayList<Object[]>();for(AdClicked insertRecord : inserting) {insertParametersList.add(new Object[] {insertRecord.getTimestamp(),insertRecord.getAdID(),insertRecord.getProvince(),insertRecord.getCity(),insertRecord.getClickedCount()});}jdbcWrapper.doBatch("INSERT INTO adclickedcount VALUES(?, ?, ?, ?, ?)", insertParametersList);//表的字段timestamp、ip、userID、adID、province、city、clickedCountList<Object[]> updateParametersList = new ArrayList<Object[]>();for(AdClicked updateRecord : updating) {updateParametersList.add(new Object[] {updateRecord.getClickedCount(),updateRecord.getTimestamp(),updateRecord.getAdID(),updateRecord.getProvince(),updateRecord.getCity()});}jdbcWrapper.doBatch("UPDATE adclickedcount SET clickedCount = ? WHERE"+ " timestamp =? AND adID = ? AND province = ? AND city = ?", updateParametersList);} });return null;} });/ 对广告点击进行TopN计算，计算出每天每个省份Top5排名的广告因为我们直接对RDD进行操作，所以使用了transfomr算子；/updateStateByKeyDSteam.transform(new Function<JavaPairRDD<String,Long>, JavaRDD<Row>>() {public JavaRDD<Row> call(JavaPairRDD<String, Long> rdd) throws Exception {JavaRDD<Row> rowRDD = rdd.mapToPair(new PairFunction<Tuple2<String,Long>, String, Long>() {public Tuple2<String, Long> call(Tuple2<String, Long> t)throws Exception {// TODO Auto-generated method stubString[] splited=t._1.split("_");String timestamp = splited[0]; //YYYY-MM-DDString adID = splited[3];String province = splited[4];String clickedRecord = timestamp + "_" + adID + "_" + province;return new Tuple2<String, Long>(clickedRecord, t._2);} }).reduceByKey(new Function2<Long, Long, Long>() {public Long call(Long v1, Long v2) throws Exception {// TODO Auto-generated method stubreturn v1 + v2;} }).map(new Function<Tuple2<String,Long>, Row>() {public Row call(Tuple2<String, Long> v1) throws Exception {// TODO Auto-generated method stubString[] splited=v1._1.split("_");String timestamp = splited[0]; //YYYY-MM-DDString adID = splited[3];String province = splited[4];return RowFactory.create(timestamp, adID, province, v1._2);} });StructType structType = DataTypes.createStructType(Arrays.asList(DataTypes.createStructField("timestamp", DataTypes.StringType, true),DataTypes.createStructField("adID", DataTypes.StringType, true),DataTypes.createStructField("province", DataTypes.StringType, true),DataTypes.createStructField("clickedCount", DataTypes.LongType, true)));HiveContext hiveContext = new HiveContext(rdd.context());DataFrame df = hiveContext.createDataFrame(rowRDD, structType);df.registerTempTable("topNTableSource");DataFrame result = hiveContext.sql("SELECT timestamp, adID, province, clickedCount, FROM"+ " (SELECT timestamp, adID, province,clickedCount, "+ "ROW_NUMBER() OVER(PARTITION BY province ORDER BY clickeCount DESC) rank "+ "FROM topNTableSource) subquery "+ "WHERE rank <= 5");return result.toJavaRDD();} }).foreachRDD(new Function<JavaRDD<Row>, Void>() {public Void call(JavaRDD<Row> rdd) throws Exception {// TODO Auto-generated method stubrdd.foreachPartition(new VoidFunction<Iterator<Row>>() {public void call(Iterator<Row> t) throws Exception {// TODO Auto-generated method stubList<AdProvinceTopN> adProvinceTopN = new ArrayList<AdProvinceTopN>();while(t.hasNext()) {Row row = t.next();AdProvinceTopN item = new AdProvinceTopN();item.setTimestamp(row.getString(0));item.setAdID(row.getString(1));item.setProvince(row.getString(2));item.setClickedCount(row.getLong(3));adProvinceTopN.add(item);}// final List<AdProvinceTopN> inserting = new ArrayList<AdProvinceTopN>();// final List<AdProvinceTopN> updating = new ArrayList<AdProvinceTopN>();JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();Set<String> set = new HashSet<String>();for(AdProvinceTopN item: adProvinceTopN){set.add(item.getTimestamp() + "_" + item.getProvince());}//表的字段timestamp、adID、province、clickedCountArrayList<Object[]> deleteParametersList = new ArrayList<Object[]>();for(String deleteRecord : set) {String[] splited = deleteRecord.split("_");deleteParametersList.add(new Object[]{splited[0],splited[1]});}jdbcWrapper.doBatch("DELETE FROM adprovincetopn WHERE timestamp = ? AND province = ?", deleteParametersList);//表的字段timestamp、ip、userID、adID、province、city、clickedCountList<Object[]> insertParametersList = new ArrayList<Object[]>();for(AdProvinceTopN insertRecord : adProvinceTopN) {insertParametersList.add(new Object[] {insertRecord.getClickedCount(),insertRecord.getTimestamp(),insertRecord.getAdID(),insertRecord.getProvince()});}jdbcWrapper.doBatch("INSERT INTO adprovincetopn VALUES (?, ?, ?, ?)", insertParametersList);} });return null;} });/ 计算过去半个小时内广告点击的趋势广告点击的基本数据格式：timestamp、ip、userID、adID、province、city/filteredadClickedStreaming.mapToPair(new PairFunction<Tuple2<String,String>, String, Long>() {public Tuple2<String, Long> call(Tuple2<String, String> t)throws Exception {String splited[] = t._2.split("\t");String adID = splited[3];String time = splited[0]; //Todo:后续需要重构代码实现时间戳和分钟的转换提取。此处需要提取出该广告的点击分钟单位return new Tuple2<String, Long>(time + "_" + adID, 1L);} }).reduceByKeyAndWindow(new Function2<Long, Long, Long>() {public Long call(Long v1, Long v2) throws Exception {// TODO Auto-generated method stubreturn v1 + v2;} }, new Function2<Long, Long, Long>() {public Long call(Long v1, Long v2) throws Exception {// TODO Auto-generated method stubreturn v1 - v2;} }, Durations.minutes(30), Durations.milliseconds(5)).foreachRDD(new Function<JavaPairRDD<String,Long>, Void>() {public Void call(JavaPairRDD<String, Long> rdd) throws Exception {// TODO Auto-generated method stubrdd.foreachPartition(new VoidFunction<Iterator<Tuple2<String,Long>>>() {public void call(Iterator<Tuple2<String, Long>> partition)throws Exception {List<AdTrendStat> adTrend = new ArrayList<AdTrendStat>();// TODO Auto-generated method stubwhile(partition.hasNext()) {Tuple2<String, Long> record = partition.next();String[] splited = record._1.split("_");String time = splited[0];String adID = splited[1];Long clickedCount = record._2;/ 在插入数据到数据库的时候具体需要哪些字段？time、adID、clickedCount; 而我们通过J2EE技术进行趋势绘图的时候肯定是需要年、月、日、时、分这个维度的，所以我们在这里需要年月日、小时、分钟这些时间维度；/AdTrendStat adTrendStat = new AdTrendStat();adTrendStat.setAdID(adID);adTrendStat.setClickedCount(clickedCount);adTrendStat.set_date(time); //Todo:获取年月日adTrendStat.set_hour(time); //Todo:获取小时adTrendStat.set_minute(time);//Todo:获取分钟adTrend.add(adTrendStat);}final List<AdTrendStat> inserting = new ArrayList<AdTrendStat>();final List<AdTrendStat> updating = new ArrayList<AdTrendStat>();JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();//表的字段timestamp、ip、userID、adID、province、city、clickedCountfor(final AdTrendStat trend : adTrend) {final AdTrendCountHistory adTrendhistory = new AdTrendCountHistory();jdbcWrapper.doQuery("SELECT clickedCount FROM adclickedtrend WHERE"+ " date =? AND hour = ? AND minute = ? AND AdID = ?",new Object[]{trend.get_date(), trend.get_hour(), trend.get_minute(),trend.getAdID()}, new ExecuteCallBack() {public void resultCallBack(ResultSet result) throws Exception {// TODO Auto-generated method stubif(result.next()) {long count = result.getLong(1);adTrendhistory.setClickedCountHistoryLong(count);updating.add(trend);} else { inserting.add(trend);} }});}//表的字段date、hour、minute、adID、clickedCountList<Object[]> insertParametersList = new ArrayList<Object[]>();for(AdTrendStat insertRecord : inserting) {insertParametersList.add(new Object[] {insertRecord.get_date(),insertRecord.get_hour(),insertRecord.get_minute(),insertRecord.getAdID(),insertRecord.getClickedCount()});}jdbcWrapper.doBatch("INSERT INTO adclickedtrend VALUES(?, ?, ?, ?, ?)", insertParametersList);//表的字段date、hour、minute、adID、clickedCountList<Object[]> updateParametersList = new ArrayList<Object[]>();for(AdTrendStat updateRecord : updating) {updateParametersList.add(new Object[] {updateRecord.getClickedCount(),updateRecord.get_date(),updateRecord.get_hour(),updateRecord.get_minute(),updateRecord.getAdID()});}jdbcWrapper.doBatch("UPDATE adclickedtrend SET clickedCount = ? WHERE"+ " date =? AND hour = ? AND minute = ? AND AdID = ?", updateParametersList);} });return null;} });;/ Spark Streaming 执行引擎也就是Driver开始运行，Driver启动的时候是位于一条新的线程中的，当然其内部有消息循环体，用于接收应用程序本身或者Executor中的消息，/javassc.start();javassc.awaitTermination();javassc.close();}private static JavaStreamingContext createContext(String checkpointDirectory, SparkConf conf) {// If you do not see this printed, that means the StreamingContext has been loaded// from the new checkpointSystem.out.println("Creating new context");// Create the context with a 5 second batch sizeJavaStreamingContext ssc = new JavaStreamingContext(conf, Durations.seconds(10));ssc.checkpoint(checkpointDirectory);return ssc;} }class JDBCWrapper {private static JDBCWrapper jdbcInstance = null;private static LinkedBlockingQueue<Connection> dbConnectionPool = new LinkedBlockingQueue<Connection>();static {try {Class.forName("com.mysql.jdbc.Driver");} catch (ClassNotFoundException e) {// TODO Auto-generated catch blocke.printStackTrace();} }public static JDBCWrapper getJDBCInstance() {if(jdbcInstance == null) {synchronized (JDBCWrapper.class) {if(jdbcInstance == null) {jdbcInstance = new JDBCWrapper();} }}return jdbcInstance; }private JDBCWrapper() {for(int i = 0; i < 10; i++){try {Connection conn = DriverManager.getConnection("jdbc:mysql://Master:3306/sparkstreaming","root", "root");dbConnectionPool.put(conn);} catch (Exception e) {// TODO Auto-generated catch blocke.printStackTrace();} } }public synchronized Connection getConnection() {while(0 == dbConnectionPool.size()){try {Thread.sleep(20);} catch (InterruptedException e) {// TODO Auto-generated catch blocke.printStackTrace();} }return dbConnectionPool.poll();}public int[] doBatch(String sqlText, List<Object[]> paramsList){Connection conn = getConnection();PreparedStatement preparedStatement = null;int[] result = null;try {conn.setAutoCommit(false);preparedStatement = conn.prepareStatement(sqlText);for(Object[] parameters: paramsList) {for(int i = 0; i < parameters.length; i++){preparedStatement.setObject(i + 1, parameters[i]);} preparedStatement.addBatch();}result = preparedStatement.executeBatch();conn.commit();} catch (SQLException e) {// TODO Auto-generated catch blocke.printStackTrace();} finally {if(preparedStatement != null) {try {preparedStatement.close();} catch (SQLException e) {// TODO Auto-generated catch blocke.printStackTrace();} }if(conn != null) {try {dbConnectionPool.put(conn);} catch (InterruptedException e) {// TODO Auto-generated catch blocke.printStackTrace();} }}return result; }public void doQuery(String sqlText, Object[] paramsList, ExecuteCallBack callback){Connection conn = getConnection();PreparedStatement preparedStatement = null;ResultSet result = null;try {preparedStatement = conn.prepareStatement(sqlText);for(int i = 0; i < paramsList.length; i++){preparedStatement.setObject(i + 1, paramsList[i]);} result = preparedStatement.executeQuery();try {callback.resultCallBack(result);} catch (Exception e) {// TODO Auto-generated catch blocke.printStackTrace();} } catch (SQLException e) {// TODO Auto-generated catch blocke.printStackTrace();} finally {if(preparedStatement != null) {try {preparedStatement.close();} catch (SQLException e) {// TODO Auto-generated catch blocke.printStackTrace();} }if(conn != null) {try {dbConnectionPool.put(conn);} catch (InterruptedException e) {// TODO Auto-generated catch blocke.printStackTrace();} }} }}interface ExecuteCallBack {void resultCallBack(ResultSet result) throws Exception;}class UserAdClicked {private String timestamp;private String ip;private String userID;private String adID;private String province;private String city;private Long clickedCount;public String getTimestamp() {return timestamp;}public void setTimestamp(String timestamp) {this.timestamp = timestamp;}public String getIp() {return ip;}public void setIp(String ip) {this.ip = ip;}public String getUserID() {return userID;}public void setUserID(String userID) {this.userID = userID;}public String getAdID() {return adID;}public void setAdID(String adID) {this.adID = adID;}public String getProvince() {return province;}public void setProvince(String province) {this.province = province;}public String getCity() {return city;}public void setCity(String city) {this.city = city;}public Long getClickedCount() {return clickedCount;}public void setClickedCount(Long clickedCount) {this.clickedCount = clickedCount;} }class AdClicked {private String timestamp;private String adID;private String province;private String city;private Long clickedCount;public String getTimestamp() {return timestamp;}public void setTimestamp(String timestamp) {this.timestamp = timestamp;}public String getAdID() {return adID;}public void setAdID(String adID) {this.adID = adID;}public String getProvince() {return province;}public void setProvince(String province) {this.province = province;}public String getCity() {return city;}public void setCity(String city) {this.city = city;}public Long getClickedCount() {return clickedCount;}public void setClickedCount(Long clickedCount) {this.clickedCount = clickedCount;} }class AdProvinceTopN {private String timestamp;private String adID;private String province;private Long clickedCount;public String getTimestamp() {return timestamp;}public void setTimestamp(String timestamp) {this.timestamp = timestamp;}public String getAdID() {return adID;}public void setAdID(String adID) {this.adID = adID;}public String getProvince() {return province;}public void setProvince(String province) {this.province = province;}public Long getClickedCount() {return clickedCount;}public void setClickedCount(Long clickedCount) {this.clickedCount = clickedCount;} }class AdTrendStat {private String _date;private String _hour;private String _minute;private String adID;private Long clickedCount;public String get_date() {return _date;}public void set_date(String _date) {this._date = _date;}public String get_hour() {return _hour;}public void set_hour(String _hour) {this._hour = _hour;}public String get_minute() {return _minute;}public void set_minute(String _minute) {this._minute = _minute;}public String getAdID() {return adID;}public void setAdID(String adID) {this.adID = adID;}public Long getClickedCount() {return clickedCount;}public void setClickedCount(Long clickedCount) {this.clickedCount = clickedCount;} }class AdTrendCountHistory{private Long clickedCountHistoryLong;public Long getClickedCountHistoryLong() {return clickedCountHistoryLong;}public void setClickedCountHistoryLong(Long clickedCountHistoryLong) {this.clickedCountHistoryLong = clickedCountHistoryLong;} } 本篇文章为转载内容。原文链接：https://blog.csdn.net/tom_8899_li/article/details/71194434。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-02-14 19:16:35

297

转载

Java

Java中join和yield

...线程控制方法。在实际应用中，Linux内核5.x版本对CPU调度器进行了一系列调整，如CFS（完全公平调度器）算法的升级，这些底层技术更新对Java线程的执行效率有着间接但重要的影响。同时，针对现代多核处理器环境下的并行计算需求，研究者和工程师们不断探索如何优化Java线程的性能表现。有文章专门探讨了在高并发场景下，合理结合使用join和yield等方法以及锁、信号量等并发工具，以减少上下文切换开销，提升系统整体吞吐量和响应速度。最后，对于异常处理机制如InterruptedException的研究也不容忽视。在复杂的多线程环境中，如何正确捕获和处理这类异常，确保程序健壮性和一致性，是每个Java开发者需要深入思考的问题。建议阅读相关教程或案例分析，掌握在实际编程中妥善应对中断请求的最佳实践。

2023-03-22 08:55:31

355

键盘勇士

Java

java中的jsd和cgb

...态分析，帮助开发者在程序运行之前发现潜在的编程错误、逻辑漏洞和性能问题。通过使用JSD，开发人员可以逐步执行代码，检查变量值，设置断点，以及深入理解代码的执行流程，从而提高代码质量，确保程序的稳定性和可靠性。 CGB (Code Generation and Bytecode Instrumentation) , CGB是指Java中的字节码生成与字节码插桩技术，主要用于对已编译成字节码的Java程序进行动态分析。在实际应用中，CGB允许开发人员或工具在运行时修改或增强Java类的行为，如监控方法调用次数、记录变量读写情况、插入额外的逻辑以实现性能分析或异常处理等。这种技术能够提供更详细的程序执行信息，有助于开发者深入了解程序内部机制并据此进行优化和调试。 JVMTI (Java Virtual Machine Tool Interface) , JVMTI是Java虚拟机工具接口的缩写，它是Java平台为第三方工具提供的一个低级别API，允许这些工具与Java虚拟机（JVM）进行交互，获取关于正在运行的应用程序的详细信息。JVMTI支持诸如线程控制、类加载监控、方法进入/退出事件通知等功能，使得诸如JDK Mission Control这样的动态分析工具得以实现对JVM内部状态的深度洞察和精细控制，进而扩展了CGB在动态分析方面的应用范围和能力。

2023-11-03 10:10:03

295

程序媛

Java

java中后台和前台怎么交互

...如Web页面、客户端应用界面等；服务器端则是处理数据，进行逻辑计算、存储数据等操作。要完成前服务器端交流，首先需要明确数据的传输方式。在Web编写中，普遍采用的通信方式是HTTPS协议。完成前服务器端交流的方式也非常多，以下是其中的一些: //客户端向服务器端发送指令 $.ajax({ type: "POST", url: "<服务器端URL>", data: {"<变量1>": "<数据1>", "<变量2>": "<数据2>", ... }, dataType: "json", success: function(data) { //响应数据处理 }, error: function(xhr, textStatus, errorThrown) { //异常处理 } }); //服务器端向客户端回应数据 HttpServletResponse response = null; PrintWriter out = null; try { response.setCharacterEncoding("UTF-8"); response.setContentType("application/json;charset=UTF-8"); out = response.getWriter(); out.print(jsonData.toString()); //回应数据 } catch (IOException e) { log.error("Response error", e); } finally { if (out != null) { out.close(); } } //以上代码中，客户端通过$.ajax()方法向服务器端发送指令并传递变量，而服务器端则通过HttpServletResponse对象回应数据到客户端。回应的数据可以是JSON数据格式，也可以是HTML文档或不同格式。除了上述方式以外，Java中还有许多框架和技术可以完成前服务器端交流。比如，Spring MVC框架能够非常方便地完成前服务器端数据交流，而Hibernate框架则能够方便地操作数据库。无论采用何种方式，完成前服务器端交流的关键在于理解前服务器端分离的概念，尽量保持前服务器端的解耦。这样，就能够让前服务器端各司其职，提高代码的可维护性和可扩展性。

2023-02-26 08:11:53

309

码农

.net

.NET Web服务中的异常处理：try-catch语句捕获托管与未托管异常及特定类型异常实践

... .NET是我们开发应用程序的重要工具之一，特别是在Web服务的开发过程中，我们需要对可能出现的异常进行适当的处理。这篇文章呢，咱们就从.Net这个大本营出发，来好好唠唠怎么对付Web服务这家伙抛回来的异常情况，讲得明明白白、清清楚楚哈！ 2. .NET中的异常类型 .NET中的异常分为两种主要类型：未托管异常和托管异常。未托管异常是由操作系统引发的，如访问无效内存地址等。托管异常这东西，其实是由.NET框架自个儿搞出来的，就比如说你试图访问数组的一个不存在的位置，或者稀里糊涂地拿着个空指针到处用，这些情况就会触发托管异常。对于这两种类型的异常，我们都需要进行相应的处理。 3. 使用try-catch语句捕获异常在.NET中，我们可以使用try-catch语句来捕获并处理异常。以下是一个简单的示例： csharp try { // 这里是可能会抛出异常的代码 } catch (Exception ex) { // 这里是处理异常的代码 Console.WriteLine("发生了一个错误: " + ex.Message); } 在这个示例中，如果try块中的代码抛出了异常，那么程序会立即跳转到对应的catch块中进行处理。 4. 捕获特定类型的异常如果我们只关心某种特定类型的异常，可以使用多个catch块来分别处理不同的异常。例如，如果我们只关心数组越界的异常，我们可以这样做： csharp try { // 这里是可能会抛出异常的代码 } catch (ArrayIndexOutOfRangeException ex) { // 处理数组越界的异常 Console.WriteLine("发生了数组越界的错误: " + ex.Message); } catch (Exception ex) { // 如果不是数组越界的异常，就在这里处理 Console.WriteLine("发生了一个错误: " + ex.Message); } 5. 在Web服务中处理异常在Web服务中，我们可能需要处理来自客户端的各种请求。这些请求可能会由于各种乱七八糟的原因出岔子，比如参数填得不对劲、数据库连接突然掉链子啦等等。我们需要对这些异常进行适当的处理，以保证Web服务的稳定运行。 6. 结论 .NET为我们提供了一套强大的异常处理机制，可以帮助我们在开发过程中有效地处理各种异常。甭管是系统自带的未托管异常，还是咱们自定义的托管异常，无论是那些基本常见的小错误，还是独具匠心的自定义异常，我们都能手到擒来，用try-catch大法或者其他招数，妥妥地把它们给有效处理喽！ 7. 问答环节你是否在.NET开发中遇到过异常处理的问题？你是如何解决这些问题的呢？欢迎留言分享你的经验和建议。

2023-03-10 23:09:25

492

夜色朦胧-t

.net

.NET环境下使用自定义基类封装并统一处理ADO.NET与Oracle数据库交互异常：关注ErrorNumber属性及代码维护性

...于构建Windows应用程序、Web服务以及网络设备等。这篇文章呢，咱主要唠唠在.NET环境里头对付ADO.NET Oracle异常的那些招儿，特别是通过自定义一个基础类（custom base class），让咱们能够有个统一的方式来收拾这些Oracle异常。一、概述 ADO.NET是.NET框架的一部分，用于提供对数据库的操作。它支持多种不同的数据库系统，包括Oracle。不过话说回来，Oracle自有一套错误模型和异常类型，这些家伙在.NET的地盘上，可能会有点“水土不服”，表现得不尽相同。为了搞定这个问题，我们可以自己动手设计一个基础类，把所有Oracle数据库可能会抛出的异常都一股脑儿装进这个基础类里。这样一来，当我们处理这些异常时，就只需要关注这个基础类，而无需对每个具体的异常类型都费心啦。二、创建自定义基类首先，我们需要创建一个新的类，作为所有Oracle异常的基类。以下是一个简单的例子： csharp public abstract class OracleExceptionBase : Exception { public string ErrorNumber { get; set; } protected OracleExceptionBase(string message) : base(message) { } } 在这个基类中，我们添加了一个新的属性ErrorNumber，用来存储Oracle的错误编号。这是因为Oracle的错误编号可以帮助我们更好地理解错误的原因。三、处理Oracle异常接下来，我们需要修改我们的代码，使其能够正确地处理Oracle异常。首先，咱们得瞧一瞧这个蹦出来的异常是不是咱们自定义的那个基类OracleExceptionBase的“后代”。如果是，那么我们就需要获取并显示该异常的ErrorNumber属性。以下是一个例子： csharp try { // 连接Oracle数据库 using (var connection = new OracleConnection(connectionString)) { // 打开连接 connection.Open(); // 创建命令对象 var command = new OracleCommand("SELECT FROM Employees", connection); // 执行查询 var reader = command.ExecuteReader(); } } catch (OracleException ex) { if (ex is OracleExceptionBase oracleEx) { Console.WriteLine($"Oracle Error Number: {oracleEx.ErrorNumber}"); throw; } else { Console.WriteLine($"Other type of exception: {ex.Message}"); throw; } } 在这个例子中，如果捕获到的是OracleExceptionBase类型的异常，那么我们就打印出它的ErrorNumber属性，并重新抛出该异常。否则，我们就打印出其他类型的异常消息，并重新抛出该异常。四、结论总的来说，通过创建一个自定义的基类，我们可以统一处理所有的Oracle异常，使我们的代码更加简洁和易于维护。同时，我们也能够更好地理解和解决这些问题，提高我们的编程效率。最后，我想说，编程不仅仅是解决问题的技术，更是一种艺术。写代码时，如果我们追求那种优雅简洁、一目了然的风格，就能让敲代码这件事变得超有乐趣，而且还能给我们的工作注入满满的意义感，让编程变得快乐而有价值。

2023-09-18 09:51:01

463

心灵驿站-t

.net

.NET 中字典操作避免 KeyNotFoundException：TryGetValue、ContainsKey 与 GetOrAdd 实践详解

...Exception”异常，让开发者们不得不多加留意。本文将围绕这个主题，通过实例代码和详细解析，帮助你深入理解这一问题，并提供有效的应对策略。 1. KeyNotFoundException 简介当我们尝试从字典中获取一个不存在的键对应的值时，.NET 运行时会抛出 System.Collections.Generic.KeyNotFoundException。这个异常其实就像是在跟咱们扯着嗓子喊：“嘿，老兄，我在这旮旯翻了个底朝天也没找见你要的那个键，八成是根本就没存在过这玩意儿。”” csharp Dictionary myDictionary = new Dictionary { {"apple", 1}, {"banana", 2} }; int value; try { // 尝试获取不存在的 key "orange" value = myDictionary["orange"]; } catch (KeyNotFoundException e) { Console.WriteLine($"Oops! 我们遇到了一个问题：{e.Message}"); } 在这个例子中，尝试访问键为 "orange" 的值会导致 KeyNotFoundException 异常。这是因为在初始化的字典里并未包含 "orange" 这个键。 2. 避免 KeyNotFoundException：TryGetValue 方法为了避免因未知键引发异常，我们可以采用字典提供的 TryGetValue 方法来安全地检查键是否存在： csharp if (myDictionary.TryGetValue("orange", out int orangeValue)) { Console.WriteLine($"找到了 'orange' 对应的值：{orangeValue}"); } else { Console.WriteLine("'orange' 在字典中不存在！"); } 此方法不仅能够避免异常的发生，还允许我们在找不到键的情况下优雅处理程序流程。 3. 使用 ContainsKey 方法进行预检查另一种预防 KeyNotFoundException 的方式是先使用 ContainsKey 方法检查键是否存在： csharp if (myDictionary.ContainsKey("orange")) { Console.WriteLine($"找到并返回 'orange' 对应的值：{myDictionary["orange"]}"); } else { Console.WriteLine("'orange' 在字典中未找到，无法获取其对应值"); } 尽管这种方式也能有效防止异常，但它需要两次对字典进行操作，相对效率较低。相比之下，TryGetValue 是更好的选择。 4. 解决 KeyNotFoundException：确保键存在或添加默认值在某些情况下，如果字典中没有找到键，我们可能希望为其添加一个默认值。.NET 提供了 GetOrAdd 方法实现这一需求： csharp // 如果 "cherry" 不存在，则添加一个默认值 0 int cherryValue = myDictionary.GetOrAdd("cherry", defaultValue: 0); Console.WriteLine($"'cherry' 对应的值（若不存在则添加）：{cherryValue}"); 此外，针对多线程环境下的并发安全性，可以考虑使用 ConcurrentDictionary 类型，并利用其提供的 GetOrAdd 方法。总结 KeyNotFoundException 在 .NET 开发中是一个常见且重要的异常，理解它的含义以及如何妥善处理显得尤为重要。在编写程序时，如果我们灵活运用诸如 TryGetValue、ContainsKey 和 GetOrAdd 这些小妙招，就能让代码变得更结实、更溜，进而打造出更高性能的应用程序。就像是给咱们的代码注入了强健的基因和迅捷的翅膀，让它跑得更快更稳。当遇到突发状况或者异常情况时，咱们不妨换个角度，尝试用更接地气、更有人情味的方式来琢磨、理解和处理问题。这样一来，我们的代码就能更好地模拟并符合现实生活中的逻辑规律，进而助力我们开发出更加卓越、高质量的软件产品。

2023-04-04 20:01:34

522

心灵驿站

SpringBoot

Spring Boot中HTTP请求鉴权失败处理：全局异常处理器与状态码、错误原因的自定义响应实践

...、引言在开发Web应用时，安全性是一个不容忽视的问题。在发送HTTP请求这个过程中，鉴权可是个顶顶重要的环节。它就相当于咱们的大门保安，能帮咱们认出哪个是自家用户，哪个是想浑水摸鱼的非法分子，从而把那些不安好心的家伙挡在外面，保障系统的安全。Spring Boot为我们提供了一套完整的框架，用于处理鉴权问题。但是，在实际应用中，可能会遇到一些问题。本文将详细介绍这些问题，并给出相应的解决方案。二、问题1 鉴权失败后的响应结果不一致当我们进行鉴权时，如果鉴权失败，服务器通常会返回一个错误的状态码（如401）并附带一个错误信息。不过，有时候啊，服务器这家伙可能会耍个小脾气，要么就给你个空荡荡的回复，要么干脆一声不吭，啥反应都没有。这就导致了客户端无法判断鉴权是否成功。三、解决方法在Spring Boot中，我们可以自定义一个全局异常处理器来处理这种情况。例如： java @ControllerAdvice public class GlobalExceptionHandler { @ResponseBody @ResponseStatus(HttpStatus.UNAUTHORIZED) public ResponseEntity handleAuthenticationException(HttpServletResponse response, AuthenticationException authException) { // 设置状态码和消息 response.setStatus(HttpStatus.UNAUTHORIZED.value()); response.setHeader("WWW-Authenticate", "Basic realm=\"myRealm\""); return new ResponseEntity<>(authException.getMessage(), HttpStatus.UNAUTHORIZED); } } 这样，当鉴权失败时，服务器就会返回一个包含错误信息的状态码和消息。四、问题2 无法获取到鉴权失败的具体原因在某些情况下，服务器可能会返回一个通用的错误信息，而没有具体的错误原因。这使得开发者很难找出问题所在。五、解决方法同样地，我们可以通过自定义一个全局异常处理器来解决这个问题。我们可以将具体的错误原因作为异常的信息，然后将其返回给客户端。例如： java @ControllerAdvice public class GlobalExceptionHandler { @ResponseBody @ResponseStatus(HttpStatus.UNAUTHORIZED) public ResponseEntity handleAuthenticationException(HttpServletResponse response, AuthenticationException authException) { // 获取具体的错误原因 String errorMessage = authException.getLocalizedMessage(); // 设置状态码和消息 response.setStatus(HttpStatus.UNAUTHORIZED.value()); response.setHeader("WWW-Authenticate", "Basic realm=\"myRealm\""); return new ResponseEntity<>(errorMessage, HttpStatus.UNAUTHORIZED); } } 这样，当鉴权失败时，服务器就会返回一个包含具体错误原因的状态码和消息。六、结论 Spring Boot提供了强大的工具来帮助我们处理HTTP请求的鉴权问题。然而，我们在实际应用中可能会遇到一些问题，需要我们自己去解决。当我们使用自定义的全局异常处理机制时，就等于给程序装上了一位机智灵活的小助手，一旦鉴权出现差错，它能迅速抓取到问题的具体原因，并且随我们心意去定制响应结果。这样一来，咱们的应用程序就能得到更加贴心、周全的保护啦。

2023-07-21 22:51:44

105

山涧溪流_t

C#编程中运行错误详解：异常错误、资源泄露与编译问题的排查与解决

...。尤其是当我们在运行程序时，总会遇到各种各样的错误。今天我们就来聊聊如何解决这些常见的错误。二、错误分析与解决首先我们要知道的是，任何错误都是可以通过分析找到解决办法的。所以，当我们遇到错误时，首先要做的就是找出错误的原因。而这就需要我们对代码有深入的理解和掌握。三、常见错误类型及解决方案 1. 异常错误这是最常见的错误类型，通常是由于代码中的逻辑错误或者数据异常引起的。例如： csharp int i = 10; int j = "hello"; int result = i + j; // 这里就会抛出一个异常，因为不能将字符串和整数相加为了解决这种类型的错误，我们需要仔细检查代码，确保所有的数据类型都正确无误。如果需要的话，我们还能给程序加个异常处理机制，这样一来，就算遇到点儿小差错，程序也能稳稳当当地运行下去，不至于突然崩掉。 2. 资源泄露错误这种错误通常发生在我们使用了某个资源（如文件、网络连接等）后忘记关闭的情况下。例如： csharp FileStream fs = new FileStream("test.txt", FileMode.Open); // ... 程序在这里做了一些操作 ... fs.Close(); // 忘记关闭流为了解决这个问题，我们需要养成良好的编程习惯，在使用完资源后立即关闭。同时，我们也可以使用using语句块来自动管理资源，如下所示： csharp using (FileStream fs = new FileStream("test.txt", FileMode.Open)) { // ... 程序在这里做了一些操作 ... } 3. 编译错误这种错误通常是由于语法错误或者编译器无法识别的语句引起的。例如： csharp public class MyClass { public void MyMethod() { System.out.println("Hello, World!"); // 这里就有一个编译错误，因为System.out.println是Java语言的语句，而不是C } } 为了解决这个问题，我们需要仔细检查我们的代码，并确保使用的语句是正确的。同时，我们还需要注意不同编程语言之间的差异。四、总结总的来说，解决编程错误并不是一件难事，只要我们有足够的耐心和细心，就一定能找到解决问题的方法。同时，我们也应该养成良好的编程习惯，避免出现不必要的错误。最后，我希望这篇文章能够帮助你解决你在使用C编程时遇到的问题。如果你有任何疑问，欢迎留言讨论，我会尽力为你解答。希望这篇文章对你有所帮助，也希望大家多多支持我！

2023-11-12 22:43:56

549

林中小径_t

PHP

PHP中SQLQueryException解决：查询语句错误排查、数据库连接验证与try-catch异常处理实践

...遇到各种各样的错误和异常。嘿，你知道吗？SQLQueryException就是我们在捣鼓数据库时经常会遇到的一种查询错误，算是个挺常见的小插曲。本文将详细介绍如何解决PHP中的SQLQueryException。二、什么是SQLQueryException？ SQLQueryException是PHP中的一个内置异常，它发生在执行SQL查询语句时出现问题。一般来说，这多半是因为语法有误、你搜的东西没找对或者是权限不够才出现这种情况的。三、SQLQueryException解决方法 1. 检查SQL查询语句是否正确这是最常见的SQLQueryException解决方案。首先，我们需要检查SQL查询语句是否有语法错误或者无效的操作。如果是，那么我们就需要修正这些问题，然后重新运行查询语句。例如，假设我们的SQL查询语句如下： sql SELECT FROM users WHERE username = 'admin' AND password = 'password' 如果我们在执行这段代码时遇到了SQLQueryException，那么我们可以尝试使用phpinfo()函数来查看MySQL服务器的状态，看看是否存在语法错误或者无效的操作。瞧这个例子，你会发现用户名那块儿应该是小写字母，可咱们的代码里却给写成了大写。因此，我们只需要将用户名字段改为小写即可解决问题： sql SELECT FROM users WHERE username = 'admin' AND password = 'password' 2. 检查数据库连接除了检查SQL查询语句之外，我们还需要检查数据库连接是否正常。如果数据库连接这环节出了岔子，就算你的SQL查询语句写得再完美无瑕，照样可能引发SQLQueryException这个小恶魔出来捣乱。例如，假设我们的数据库服务器无法访问，那么我们在执行SQL查询语句时就会遇到SQLQueryException。要搞定这个问题，我们可以试着重启一下数据库服务器，或者瞧瞧网络连接是否一切正常。就像电脑卡顿时咱们会先选择重启一样，数据库服务器有时候也需要“刷新”一下自己。另外，也别忘了看看是不是网络这家伙在关键时刻掉链子了~ bash sudo service mysql restart 3. 使用try-catch结构捕获异常如果我们不确定SQL查询语句是否有问题，或者不确定数据库连接是否正常，那么我们可以使用try-catch结构来捕获SQLQueryException。这样一来，当我们逮到异常情况时，就能做出相应的应对措施，而不是让程序“砰”地一下崩溃掉。例如，我们可以使用以下代码来捕获SQLQueryException： php try { $conn = new PDO("mysql:host=localhost;dbname=myDB;charset=utf8", "username", "password"); $stmt = $conn->prepare("SELECT FROM users WHERE username=:username AND password=:password"); $stmt->execute(array( ":username" => $username, ":password" => $password )); } catch (PDOException $e) { echo "Error!: " . $e->getMessage(); } 在这个例子中，如果我们在执行SQL查询语句时遇到了SQLQueryException，那么程序就会跳转到catch语句中，并打印出错误信息。这样，我们就可以及时发现并处理SQLQueryException了。四、总结通过以上介绍，我们可以看出SQLQueryException是一种比较常见的数据库查询错误。为了更顺溜地搞定这个问题，咱们得先瞧瞧SQL查询语句是不是敲对了，再瞅瞅数据库连接是否顺畅。还有啊，别忘了用try-catch这个小法宝来兜住可能出现的异常情况，这样就万无一失啦！只要咱们把这些小技巧都掌握熟练了，就能轻松搞掂SQLQueryException，让它再也不能困扰咱们啦！

2023-05-04 22:50:29

月影清风-t

Struts2

Struts2中Action方法返回null与空字符串时的视图跳转机制及默认结果映射处理

...讨Struts2框架处理Action方法返回null或空字符串的机制之前，让我们先建立起对Struts2基础架构的理解。Struts2，这可是Java Web MVC框架中的“大块头”，它的设计理念贼酷炫，就是把用户的各种请求找到对应的Action类的某个方法上，然后让这个方法来执行咱们需要的业务逻辑。就比如你点了个按钮，它就像个超级智能导航员，把你引到该去的地方，完成一系列操作后，再根据这个方法返回的结果，灵活地跳转到下一个页面或者进行其他相应的动作，一切就是这么顺滑自然！ 1. Struts2 Action的工作流程当用户发起一个HTTP请求时，Struts2会通过一系列拦截器组件解析请求，并将其转发至对应的Action类中指定的方法（通常称为execute方法）。这个方法跑完后，它会送你一个字符串作为“小礼物”，这个字符串就像个贴心的向导，告诉你下一步该跳转到哪个视图资源。 java public class SampleAction extends ActionSupport { public String execute() { // 执行业务逻辑... // 返回一个字符串，用于决定视图跳转 return "success"; // 或者 "error"、"input" 等 } } 2. 当Action方法返回null或空字符串时现在，我们正式进入主题：当Action方法返回null或空字符串时，Struts2将会如何反应呢？ - 情况一：返回null 假设我们的Action方法如下面所示： java public class NullReturnAction extends ActionSupport { public String execute() { // 这里没有明确返回任何字符串 // 实际上，默认会返回null } } 在这种情况下，Struts2框架并不会因为Action方法返回null而抛出异常。换个方式来说，实际上它有个默认的行动法则：一旦Action方法返回空值，Struts2这家伙就会觉得这是个不明类型的结果。于是乎，它会自然而然地去找“struts-default.xml”这个配置文件中的“default”结果，并触发它来应对这种情况。如果没有明确地给这个家伙设定一个默认的结果，那可就麻烦了，搞不好会让程序运行时出岔子，或者没法顺利地蹦跶到我们想要的那个页面视图上。 - 情况二：返回空字符串同样，如果我们让Action方法返回一个空字符串： java public class EmptyStringReturnAction extends ActionSupport { public String execute() { // 返回一个空字符串 return ""; } } 此时，Struts2对于空字符串的处理方式与null类似，也会尝试寻找并执行名为""（空字符串）的结果映射。若配置文件中未找到对应的结果映射，则同样可能导致运行时错误或无法正常完成视图跳转。 3. 结论与建议因此，在编写Struts2应用时，我们需要确保Action方法始终返回一个有意义的结果字符串，以便框架能够准确地定位和渲染对应的视图资源。为了提高代码可读性和降低潜在风险，强烈建议遵循以下原则： - 明确为每个Action方法设定合理的返回结果，例如："success"表示成功执行并跳转到成功页面，"error"则表示出现错误并跳转到错误页面等。 - 在struts.xml配置文件中，为所有可能的返回结果预先定义好结果映射，包括处理null或空字符串返回值的情况。总结起来，虽然Struts2可以容忍Action方法返回null或空字符串，但这并不意味着我们应该依赖这种默认行为来驱动应用流程。理解并熟练运用Struts2的返回结果机制，就像是给咱们打造的应用程序装上了一颗强劲稳定的“心脏”，让它不仅运行得更稳、更强壮，而且在日后维护升级时也能轻松应对，让我们的开发工作如虎添翼。

2023-10-30 09:31:04

清风徐来

c++

在C++编程中使用`__FUNCTION__`宏定义调试日志：记录函数名、行号与文件信息

预处理器宏（Preprocessor Macro） , 在C++编程中，预处理器宏是一种编译器指令，它允许程序员在编译阶段进行文本替换。例如__FUNCTION__就是由编译器提供的一个预处理器宏，会在编译时被替换为当前函数的名字，增强了代码的可读性和调试能力。动态跟踪工具（Dynamic Tracing Tools） , 如DTrace、SystemTap等，这类工具能够在程序运行时收集系统和应用程序的详细信息，无需修改源代码。它们可以追踪函数调用栈、系统调用、文件操作等各种事件，帮助开发者深入理解并分析软件内部行为，尤其是在复杂环境如分布式系统或性能瓶颈定位等方面具有重要作用。 C++11中的std::source_location , 这是C++11标准库引入的一个类，它能够提供当前源代码位置的信息，包括文件名、行号和函数名。相比于__FUNCTION__等预处理器宏，std::source_location与编译器无关，更具有标准化和移植性，使得开发者能以更为灵活和类型安全的方式在日志记录、异常处理或其他需要获取执行上下文信息的场景中使用。

2023-08-01 13:07:33

557

烟雨江南_

Struts2

Struts2中Action方法返回值错误：No result type defined的排查与配置修复实例

...开源Java Web应用程序框架，它用于创建企业级的Web应用程序。在Struts2中，模型（Model）负责处理业务逻辑和数据访问，视图（View）负责展示用户界面，控制器（Controller）则由一系列Action类组成，负责接收并处理用户的请求，以及将执行结果导向相应的视图。当Action方法返回一个字符串时，框架会根据配置寻找对应的结果类型处理器进行后续处理。结果类型（Result Type） , 在Struts2框架中，结果类型是指定Action方法执行后应如何响应客户端的一种策略或处理器。每个结果类型与特定的行为关联，例如重定向到另一个页面、渲染某个JSP页面、或者返回JSON数据等。在struts.xml配置文件中，开发人员需要为Action方法可能返回的每个字符串结果定义相应的结果类型。 ActionSupport , ActionSupport是Struts2框架提供的一个基础Action类，开发者通常扩展这个类来创建自定义的Action类。ActionSupport内置了一些常用的属性和方法，如默认的执行方法execute()，以及对各种验证和异常处理的支持。在本文中提到的示例代码中，SampleAction类就继承了ActionSupport，这意味着它可以利用ActionSupport预置的功能，并通过覆盖execute()方法实现具体的业务逻辑处理。

2023-07-16 19:18:49

星河万里

Beego

Beego框架下异常处理实践：中间件、Controller与OnError方法在HTTP状态码控制和服务稳定性保障中的应用

Beego中的异常处理艺术：让程序更健壮，让开发者更安心 1. 引言在我们日常的Go语言开发中，Beego作为一款优秀的MVC框架，以其高效、稳定和易用性深受开发者喜爱。但是亲，甭管你框架有多牛掰，一旦程序跑起来，总会可能遇到各种幺蛾子异常情况。这时候，就得有一套顶呱呱的异常处理机制来保驾护航，确保服务稳稳当当，业务流畅不卡壳。这篇东西，咱们就一块儿潜入Beego的奇妙天地，手把手教你如何帅气地应对那些“突如其来”的小插曲——异常处理。 2. Beego中的基本异常处理机制在Beego中，我们可以通过HTTP中间件或者Controller中的错误处理函数来捕获和处理异常。就像一位尽职的守门员，守护着我们的应用程序不受意外情况的冲击。 go // 示例1：使用中间件处理全局异常 func Recovery() gin.HandlerFunc { return func(c gin.Context) { defer func() { if err := recover(); err != nil { c.AbortWithStatus(http.StatusInternalServerError) log.Printf("Recovered from panic: %v", err) } }() c.Next() } } // 在Beego启动时注册该中间件 beego.InsertFilter("", beego.BeforeRouter, Recovery()) 上述代码展示了一个简单的全局恢复中间件，当发生panic时，它能捕获到并记录错误信息，同时向客户端返回500状态码。 3. Controller级别的异常处理对于特定的Controller或Action，我们可以自定义错误处理逻辑，以满足不同业务场景的需求。 go type MyController struct { beego.Controller } // 示例2：在Controller级别处理异常 func (c MyController) Post() { // 业务逻辑处理 err := someBusinessLogic() if err != nil { // 自定义错误处理 c.Data["json"] = map[string]string{"error": err.Error()} c.ServeJSON() c.StopRun() } else { // 正常流程执行 // ... } } 在这个例子中，我们针对某个POST请求进行了错误检查，一旦出现异常，就停止后续执行，并通过JSON格式返回错误信息给客户端。 4. 使用Beego的OnError方法进行异常处理 Beego还提供了OnError方法，允许我们在全局层面定制统一的错误处理逻辑。 go // 示例3：全局异常处理 func globalErrorHandler(ctx context.Context) { if err := ctx.GetError(); err != nil { log.Println("Global error caught:", err) ctx.ResponseWriter.WriteHeader(http.StatusInternalServerError) ctx.WriteString(err.Error()) } } func main() { beego.OnError(globalErrorHandler) beego.Run() } 这段代码展示了如何设置一个全局的错误处理函数，当任何Controller抛出错误时，都会调用这个函数进行处理。 5. 结语与思考面对异常，Beego提供了一系列灵活且强大的工具供我们选择。无论是搭建一个覆盖所有环节的“保护伞”中间件，还是针对个别Controller或Action灵活制定独特的错误处理方案，再或者是设置一个一视同仁、全局通用的OnError回调机制，这些都是我们打造坚固稳定系统的关键法宝。说白了，就像给系统穿上防弹衣，哪里薄弱就加固哪里，或者设立一个无论何时何地都能迅速响应并处理问题的守护神，让整个系统更强大、更健壮。理解并掌握这些异常处理技巧，就如同为你的应用程序穿上了一套防弹衣，使得它在面对各种突如其来的异常挑战时，能够保持冷静，沉稳应对，从而极大地提升了服务质量和用户体验。所以，让我们在实践中不断探索和完善我们的异常处理机制，让Beego驱动的应用更加稳健可靠！

2024-01-22 09:53:32

722

幽谷听泉

Kylin

Kylin与ZooKeeper通信异常问题解析及针对性解决方案：排查服务器故障、配置文件设置与网络因素影响

...供了在Hadoop/Spark环境下的低延迟OLAP（在线分析处理）能力。通过预计算技术，Kylin能够将复杂的查询转换为对预计算结果的快速检索，从而实现亚秒级的查询响应速度，特别适用于大数据时代海量数据的实时分析需求。 ZooKeeper , ZooKeeper是一个分布式的、开放源码的分布式应用程序协调服务，它提供了一种简单且强大的方式来管理大型分布式系统中的各种状态信息和元数据。在Apache Kylin中，ZooKeeper被用作集群管理和配置存储的角色，确保各个节点之间能够进行有效的通信和协调。 Service Mesh , Service Mesh是一种用于处理服务间通信的基础设施层，通常以轻量级网络代理的形式部署在每个服务实例旁边，负责服务发现、负载均衡、熔断限流、监控追踪等微服务治理功能。在云原生环境中，借助Istio等Service Mesh框架，可以更好地管理和优化Apache Kylin与ZooKeeper之间的交互，提升服务稳定性及通信效率。

2023-09-01 14:47:20

107

人生如戏-t

Scala

Scala类型安全：泛型与模式匹配的应用

...着Scala在大数据处理和机器学习领域的广泛应用，越来越多的开发者开始关注如何利用Scala的类型系统来提升代码的质量和性能。例如，最近Apache Spark框架的更新中，引入了一些新的API设计，这些设计充分利用了Scala的泛型和类型别名功能，从而使得Spark应用程序的开发变得更加安全和高效。这一改进不仅减少了运行时错误，还显著提升了代码的可读性和可维护性。另一个值得关注的例子是，Netflix公司在其内部项目中大量使用Scala，特别是在构建微服务架构时。Netflix工程师们发现，通过深度利用Scala的类型系统，他们能够更好地管理和维护大规模分布式系统。特别是在处理复杂的数据流和实时数据处理任务时，类型安全成为确保系统稳定性和可靠性的关键因素之一。此外，一些研究机构和开源社区也在不断探索Scala类型系统的新用法。例如，近期发布的一篇论文详细分析了如何结合Scala的类型系统和函数式编程范式，以优化大数据处理算法的性能。该论文指出，通过精确的类型定义和模式匹配，可以显著减少内存消耗和计算时间，这对于处理海量数据集尤为重要。这些实例不仅展示了Scala类型系统的强大功能，也为广大开发者提供了宝贵的实践经验。对于希望深入理解和应用Scala类型安全特性的开发者来说，持续关注这些前沿技术和实际案例将大有裨益。

2025-01-05 16:17:00

追梦人

Netty

Netty中UnexpectedMessageSizeException的触发原因与通过maxMessageSize和LengthFieldBasedFrameDecoder进行异常处理及消息边界控制的方法

...可能会遇到各种各样的异常情况，其中之一就是UnexpectedMessageSizeException。这个异常通常会在我们处理网络数据流的时候出现，就像是当你收到的消息包大得超出了预期或者超过了系统设定的最大限制，这时候程序就会像扔飞盘一样把这个异常给抛出来。那么，面对这种棘手问题，我们应该如何理解和解决呢？让我们一起探讨和揭秘吧！ 1. 异常理解解密UnexpectedMessageSizeException 在使用Netty进行通信时，尤其是在处理TCP协议的数据流时，由于TCP本身是无边界的，所以需要我们在应用层去判断消息的边界。Netty这家伙有个聪明的做法，就是给每个消息设定一个合适的“大小上限”——maxMessageSize，这样一来，任何消息都不能长得没边儿。要是有哪个消息过于“膨胀”，胆敢超过这个限制值，不好意思，Netty可不会客气，直接会给你抛出一个“意料之外的消息尺寸异常”——UnexpectedMessageSizeException，以此来表明它的原则性和纪律性。这个异常的背后，实际上是Netty对传输层安全性的保障措施，防止因恶意或错误的大数据包导致内存溢出等问题。 2. 溯源分析引发异常的原因下面是一个简单的代码示例，展示了未正确配置maxMessageSize可能引发此异常： java public class MyServerInitializer extends ChannelInitializer { @Override protected void initChannel(SocketChannel ch) throws Exception { ChannelPipeline pipeline = ch.pipeline(); // 假设我们没有设置任何限制 pipeline.addLast(new LengthFieldBasedFrameDecoder(Integer.MAX_VALUE, 0, 4, 0, 4)); pipeline.addLast(new StringDecoder(CharsetUtil.UTF_8)); pipeline.addLast(new ServerHandler()); } } 在上述代码中，我们未给LengthFieldBasedFrameDecoder设置最大帧长度，因此理论上它可以接受任意大小的消息，这就可能导致UnexpectedMessageSizeException。 3. 解决方案合理设置消息大小限制为了解决这个问题，我们需要在初始化解码器时，明确指定一个合理的maxMessageSize。例如： java public class MyServerInitializer extends ChannelInitializer { private static final int MAX_FRAME_LENGTH = 1024 1024; // 设置每条消息的最大长度为1MB @Override protected void initChannel(SocketChannel ch) throws Exception { ChannelPipeline pipeline = ch.pipeline(); // 正确设置最大帧长度 pipeline.addLast(new LengthFieldBasedFrameDecoder(MAX_FRAME_LENGTH, 0, 4, 0, 4)); pipeline.addLast(new StringDecoder(CharsetUtil.UTF_8)); pipeline.addLast(new ServerHandler()); } } 这样，如果收到的消息大小超过1MB，LengthFieldBasedFrameDecoder将不再尝试解码并会抛出异常，而不是消耗大量内存。 4. 进一步探讨异常处理与优化策略虽然我们已经设置了消息大小的限制，但仍然建议在实际业务场景中对接收到超大消息的情况进行适当的异常处理，比如记录日志、关闭连接等操作： java public class ServerHandler extends SimpleChannelInboundHandler { @Override public void exceptionCaught(ChannelHandlerContext ctx, Throwable cause) { if (cause instanceof TooLongFrameException || cause instanceof UnexpectedMessageSizeException) { System.out.println("Caught an oversized message, closing connection..."); ctx.close(); } else { // 其他异常处理逻辑... } } // ...其他处理器逻辑... } 最后，对于消息大小的设定，并非越大越好，而应根据具体应用场景和服务器资源状况进行权衡。另外，咱们也可以琢磨琢磨用些招儿来对付大消息这个难题，比如把消息分块传输，或者使使劲儿，用压缩算法给它“瘦身”一下。总的来说，处理Netty中的UnexpectedMessageSizeException关键在于提前预防，合理设置消息大小上限，以及妥善处理异常情况。只有把这些技巧摸得门儿清、运用自如，咱们的Netty应用程序才能真正变得身强力壮、高效无比。在这个过程中，不断地思考、实践与优化，才是编程乐趣之所在！

2023-11-27 15:28:29

151

林中小径

C#中安全关键操作引发的SecurityCriticalException：权限不足时的异常处理与最小权限原则实践

...安全关键操作及其失败处理 1. 引言在我们日常的C开发中，安全性是至关重要的考量因素。尤其当我们进行深度系统级编程时，会频繁接触到一个特定的异常类型——SecurityCriticalException。这个异常表示在执行需要安全关键处理的操作时遇到了问题。嘿，伙计们，这篇东西会手把手地带你们钻进这个话题的核心地带，咱们一边瞅瞅那些实实在在的代码实例，一边掰开揉碎了讲明白那个看似高深莫测的SecurityCriticalException，让它的庐山真面目暴露在大伙儿眼前！ 2. 安全关键性（Security Criticality）的概念在.NET框架的安全模型中，安全关键性是一种特性，用于标记那些对系统安全有重大影响的方法或类型。当一个方法被标记为SecurityCritical时，意味着只有完全受信任的代码才能调用它。这么做，主要是为了拦住那些不靠谱的代码，不让它们有机会碰到咱们的重要资料，或者偷偷摸摸干些可能引发安全问题的操作。 csharp [SecurityCritical] public static void CriticalMethod() { // 这里包含对敏感资源的访问或其他安全关键操作 } 3. SecurityCriticalException的发生场景当我们尝试从非安全关键代码或部分受信代码调用安全关键方法时，如果权限不足，就会抛出SecurityCriticalException异常。例如： csharp public void AttemptToCallCriticalMethod() { try { CriticalMethod(); // 如果当前上下文不满足安全要求，这里会抛出SecurityCriticalException } catch (SecurityCriticalException ex) { Console.WriteLine($"由于安全原因，调用安全关键方法失败: {ex.Message}"); } } 4. 如何处理SecurityCriticalException 面对SecurityCriticalException，开发者应当首先确保程序设计符合最小权限原则，即代码只请求完成其功能所需的最小权限。接着说啊，当逮到这个异常情况的时候，咱们得机智地给出应对错误的方案，比如记个日志、告诉用户出状况啦，或者采取其他能翻盘的办法。 csharp public void SecurelyCallCriticalMethod() { PermissionSet requiredPermissions = new PermissionSet(PermissionState.None); // 根据实际需求添加必要的权限，例如： requiredPermissions.AddPermission(new SecurityPermission(SecurityPermissionFlag.UnmanagedCode)); if (requiredPermissions.IsSubsetOf(AppDomain.CurrentDomain.PermissionSet)) { try { CriticalMethod(); } catch (SecurityCriticalException ex) { // 记录详细异常信息并采取相应行动 LogError(ex); NotifyUser("无法执行某项关键操作，请联系管理员以获取更高权限"); } } else { Console.WriteLine("当前运行环境缺乏必要的权限来执行此操作"); } } private void LogError(Exception ex) { // 实现具体的日志记录逻辑 } private void NotifyUser(string message) { // 实现具体的通知用户逻辑 } 5. 总结与思考在我们的编程实践中，遇到SecurityCriticalException是一个警示信号，提示我们检查代码是否遵循了安全编码的最佳实践，并确保正确管理了系统的安全策略。安全这事儿可马虎不得，每一个程序员兄弟都得时刻瞪大眼睛，把那些关乎安全的重要理念，像揉面团一样，实实在在地揉进咱们每天的编程工作中去。这样一来，我们开发的应用程序才能更硬气，更能抵挡住那些坏家伙们的恶意攻击。对于这类特殊情况的应对，咱们也得把用户体验放在心上，既要认真细致地记录下问题的来龙去脉，也要像朋友一样亲切地给用户提供反馈，让他们能明白问题所在，并且协助他们把问题妥妥解决掉。让我们一起，携手构建更安全、更可靠的软件世界吧！

2023-05-12 10:45:37

591

飞鸟与鱼

知识学习

实践的时候请根据实际情况谨慎操作。

随机学习一条linux命令：

free -m - 查看系统内存使用情况（单位MB）。