...无法正常运行？在大数据处理的世界里，Apache Spark作为一款高性能、通用的并行计算框架，凭借其对大规模数据处理的强大支持和优异性能赢得了广泛的赞誉。在实际操作Spark的过程中，咱们可能会碰上个让人头疼的问题。啥问题呢？就是由于关键的依赖库缺失了，导致Spark这个家伙没法正常启动或者执行任务，这确实挺让人挠头的。本文将深入探讨这一问题，并通过实例代码揭示它的重要性。 1. Spark与依赖库的关系 (1) 依赖库的重要性在Spark的工作机制中，它自身提供了一系列核心功能库，如spark-core负责基本的分布式任务调度，spark-sql实现SQL查询等。为了应对各种业务需求，Spark往往需要和其他好伙伴——第三方库一起携手工作。比如，如果你想和数据库打交道，就可能得请出JDBC驱动这位“翻译官”。再比如，当你需要进行机器学习这类高大上的任务时，MLlib或者其他的深度学习库就成了你必不可少的得力助手啦。这些“依赖库”，你就想象成是Spark引擎运行必需的“小帮手”或者说是“关键零部件”。没有它们，就好比一辆汽车缺了心脏般的重要零件，哪怕引擎再猛如虎，也只能干瞪眼没法跑起来。 (2) 依赖传递性在构建Spark应用时，我们需要通过构建工具（如Maven、Sbt）明确指定项目的依赖关系。这里说的依赖，可不是仅仅局限在Spark自己的核心组件里，还包括咱们应用“嗷嗷待哺”的其他第三方库。这些库之间，就好比是一群互相帮忙的朋友，关系错综复杂。如果其中任何一个朋友缺席了，那整个团队的工作可能就要乱套，咱们的应用也就没法正常运转啦。 2. 缺少依赖库引发的问题实例假设我们要用Spark读取MySQL数据库中的数据，首先需要引入JDBC驱动依赖： scala // 在build.sbt文件中添加依赖 libraryDependencies += "mysql" % "mysql-connector-java" % "8.0.23" // 或在pom.xml文件中添加依赖 mysql mysql-connector-java 8.0.23 然后在代码中尝试连接MySQL： scala import org.apache.spark.sql.SparkSession val spark = SparkSession.builder.appName("mysqlExample").getOrCreate() val jdbcDF = spark.read.format("jdbc") .option("url", "jdbc:mysql://localhost:3306/mydatabase") .option("driver", "com.mysql.jdbc.Driver") .option("dbtable", "mytable") .load() jdbcDF.show() 如果此时没有正确引入并配置MySQL JDBC驱动，上述代码在运行时就会抛出类似于NoClassDefFoundError: com/mysql/jdbc/Driver的异常，表明Spark找不到相应的类定义，这就是典型的因缺少依赖库而导致的运行错误。 3. 如何避免和解决依赖库缺失问题 (1) 全面且精确地声明依赖在项目初始化阶段，务必详细列出所有必需的依赖库及其版本信息，确保它们能在构建过程中被正确下载和打包。 (2) 利用构建工具管理依赖利用Maven、Gradle或Sbt等构建工具，可以自动解析和管理项目依赖关系，减少手动管理带来的疏漏。 (3) 检查和更新依赖定期检查和更新项目依赖库，以适应新版本API的变化以及修复潜在的安全漏洞。 (4) 理解依赖传递性深入理解各个库之间的依赖关系，防止因间接依赖导致的问题。当遇到问题时，可通过查看构建日志或使用mvn dependency:tree命令来排查依赖树结构。总结来说，依赖库对于Spark这类复杂的应用框架而言至关重要。只有妥善管理和维护好这些“零部件”，才能保证Spark引擎稳定高效地运转。所以，开发者们在尽情享受Spark带来的各种便捷时，也千万不能忽视对依赖库的管理和配置这项重要任务。只有这样，咱们的大数据探索之路才能走得更顺溜，一路绿灯，畅通无阻。

2023-04-22 20:19:25

灵动之光

MySQL

怎么检测你mysql是否安装程序

MySQL , MySQL是一种开源的关系型数据库管理系统，广泛应用于Web应用开发中，尤其在LAMP（Linux、Apache、MySQL、PHP/Perl/Python）架构中扮演核心角色。用户可以使用SQL语言对MySQL进行数据查询、更新、管理和控制。在本文中，MySQL是被检测和安装的目标程序，用于满足用户在工作中处理和存储数据的需求。 sudo apt-get , 这是基于Debian和Ubuntu等Linux操作系统的包管理器命令，用于自动从软件仓库获取、安装、升级或卸载软件包及其依赖项。在本文语境下，当需要在Ubuntu系统上安装MySQL时，用户会运行\ sudo apt-get update\ 来更新软件源列表信息，接着执行\ sudo apt-get install mysql-server\ 命令以下载并安装MySQL服务器。 Windows命令提示符/终端 , Windows命令提示符（对于Windows操作系统）和终端（对于macOS和Linux操作系统）是操作系统提供的命令行界面工具，允许用户通过输入文本指令与系统交互，执行各种任务，包括文件管理、系统配置以及软件安装与管理等。在本文中，用户需在命令提示符或终端中输入特定命令来检测MySQL是否已安装，以及在必要时安装MySQL。

2023-02-06 16:45:27

103

程序媛

MySQL

怎么把mysql的数据导出html

如何把MySQL的数据导出到HTML？下面是一些方法和代码例子。方法： 1.接入到MySQL服务端。 constmysql =require('mysql');constconnection = mysql.createConnection({ host:'localhost', user:'root', password:'password', database:'mydatabase'}); connection.connect(); 2.运行SQL查询并将结果保存在列表中。 letdata = []; connection.query('SELECT FROM mytable', (error, results, fields) =>{if(error) throw error; data = results; }); 3.采用样板工具生成HTML文件。 constejs =require('ejs');constfs =require('fs');consttemplate = fs.readFileSync('template.ejs','utf-8');consthtml = ejs.render(template, { data }); fs.writeFileSync('output.html', html); 在上面的代码例子中，我们采用ejs用作样板工具，将检索结果传送到样板中，并将其生成为HTML文件。

2023-12-22 18:05:58

编程狂人

MySQL

怎样查看电脑上是否安装了mysql

MySQL是现今最流行的关系型数据库管理系统之一，它频繁应用于Web应用程序和服务领域。那么我们要如何检查自己的电脑上是否已安装MySQL呢？以下就来介绍一下方式。 1. 启动终端或者命令行窗口首先，启动终端（macOS或者Linux）或者命令行窗口（Windows）。 2. 进行查找输入以下命令进行MySQL的查找： $ which mysql 如果你的电脑上已经已安装MySQL，这个命令会展示MySQL所在的地址。比如，如果你的MySQL位于/usr/bin/mysql，则展示： /usr/bin/mysql 3. 检查MySQL版本我们还可以通过以下命令检查MySQL的版本： $ mysql -V 如果你的电脑上已经已安装MySQL，这个命令会展示MySQL的版本信息。比如，如果你的MySQL版本是5.7.12，则展示： mysql Ver 14.14 Distrib 5.7.12, for osx10.11 (x86_64) using EditLine wrapper 4. 安装MySQL 如果你的电脑上没有安装MySQL，你可以按照以下的步骤进行安装：（1）访问MySQL官方网站： https://dev.mysql.com/downloads/mysql 。（2）下载MySQL Community Server。（3）按照安装向导进行安装。以上就是如何检查电脑上是否已安装MySQL的方式。如果你的电脑上没有安装MySQL，可以按照上述步骤进行安装。MySQL的安装过程比较简单，但对于初学者来说可能还是有些困难，因此还可参考MySQL官方网站上的安装教程。

2023-09-19 12:58:09

133

算法侠

VUE

vue和mysql

Vue和MySQL是两个普遍的前端结构和关系型数据库，它们分别用于前端页面的呈现和数据存储。Vue是目前最盛行的前端结构之一，它具有快速的双向数据绑定机制和组件化的设计思路，使得开发人员可以快速构建数据驱动的网页应用。MySQL则是一种快速、稳固的关系型数据库，它被广泛用于数据存储和管理，具有开放源代码、可定制和高度可靠性等特点。在使用Vue开发网页应用时，经常需要从MySQL数据库中读取数据，供前端页面进行呈现或者做其他处理。此时，我们可以通过Vue的组件导入mysql模块，完成与MySQL数据库的连接和数据读取。 import mysql from 'mysql'; export default { data() { return { users: [] } }, mounted() { const connection = mysql.createConnection({ host: 'localhost', user: 'root', password: '123456', database: 'test' }); connection.connect(); connection.query('SELECT FROM users', (error, results, fields) =>{ if (error) throw error; this.users = results; }); connection.end(); } } 在上面的代码中，我们通过npm安装了mysql模块，并在Vue组件中使用了它。首先，我们创建了一个数据库连接connection，并传入数据库的参数。接着，我们执行了一次数据查询，得到了结果results，并将其关联到Vue组件的data中。最后，我们关闭了数据库连接connection。这样就完成了从MySQL数据库中读取数据，并且将其关联至Vue组件中。总的来说，Vue和MySQL是两个非常重要的前端结构和关系型数据库，在实际开发中经常被使用。通过学习和掌握Vue和MySQL的使用方法，可以让我们更加快速地进行前端开发和数据存储。

2023-11-04 09:39:55

数据库专家

转载文章

[转载]linux基于Python3的flask服务器配置

...hon环境搭建和依赖管理不断进行优化升级。比如Anaconda等科学计算平台提供了预编译好的Python环境，简化了复杂环境下的安装配置流程。您可以查阅相关文章，如“利用Anaconda轻松管理和部署Python多版本环境”。再者，Flask作为轻量级Web服务框架，其应用场景和生态建设日益丰富。近期有报道显示，众多大型企业及项目正逐步采用或迁移至Flask以实现微服务架构，例如“Flask在现代Web开发中的实战应用与案例分析”。同时，Flask社区也发布了诸多插件与扩展，使开发者能够更便捷地构建功能全面的Web应用。此外，针对数据库支持方面，不妨关注SQLite和MySQL等数据库系统在Python环境下的性能优化方案，以及Python连接数据库时的安全性提升措施，例如阅读“Python数据库操作安全最佳实践：SQLite与MySQL篇”。综上所述，紧跟Python和Flask的技术更新步伐，探索更高效且安全的开发实践，是每个Python开发者持续提升技能的重要途径。通过以上延伸阅读，希望您能深入理解并熟练运用Python和Flask在实际项目中的能力。

2023-12-21 18:00:00

转载

SqlHelper类在C#开发中的安全数据插入实践：SQL注入防护与数据库连接管理优化

...Helper类并解决数据插入问题后，我们了解到参数化SQL、数据库连接管理和数据类型匹配对于保证数据库操作的安全与效率至关重要。针对这些关键点，近期的数据库开发领域也出现了诸多值得关注的研究成果和实践案例。首先，关于SQL注入防御，微软近期在其.NET 5框架中进一步强化了对参数化查询的支持，并引入了新的SqlRaw和SqlInterpolated方法，以帮助开发者更自然地编写安全的SQL语句。同时，业界也在提倡采用ORM（对象关系映射）工具如Entity Framework Core等，它们通过抽象数据库交互过程，能够有效避免SQL注入风险，提升开发效率。其次，在数据库连接管理方面，随着云数据库服务的发展，诸如Azure SQL Database等服务提供了智能连接复用机制，可以自动优化连接池资源，减轻开发者手动管理连接的压力。同时，一些开源数据库连接池组件，例如Pomelo.EntityFrameworkCore.MySql的连接池功能，也在持续优化性能，确保高并发场景下的稳定性和资源利用率。再者，关于数据类型的严格校验，很多现代数据库系统开始支持更强的数据验证特性，如PostgreSQL的check约束、MySQL 8.0的generated columns等功能，能够在数据库层面就对插入数据进行严格的格式和内容检查，从而减少因数据类型不匹配引发的问题。综上所述，紧跟技术发展潮流，关注数据库领域的最新研究动态与最佳实践，将有助于我们在日常开发工作中更好地运用SqlHelper类或其他数据库操作工具，实现更加安全高效的数据存储与访问。

2023-08-29 23:20:47

508

月影清风_

Golang

Golang高性能数据库访问：连接池与ORM优化

...olang进行高性能数据库访问和操作嗨，各位Gopher们！今天咱们聊聊如何使用Golang（简称Go）来高效地访问和操作数据库。这不仅关乎性能，更是我们作为开发者追求卓越编程体验的一部分。在这过程中，咱们会碰到一堆有趣的问题，还能挖出不少值得研究的技术点，挺好玩的！所以，让我们一起开始这段旅程吧！ 1. 理解Golang与数据库交互的基础首先，我们要明白Golang是如何与数据库进行交互的。Go语言以其简洁和高效著称，尤其是在处理并发任务时。说到聊数据库访问，咱们通常就是扯到SQL查询啊，还有怎么管事务，再有就是怎么用连接池这些事儿。 1.1 连接池的重要性连接池是数据库访问中非常关键的一环。它允许我们在不频繁建立新连接的情况下，重用已有的数据库连接，从而提高效率并减少资源消耗。想象一下，如果你每次执行SQL查询都要打开一个新的数据库连接，那效率该有多低啊！ 1.2 SQL查询与ORM 在进行数据库操作时，我们有两种主要的方法：直接编写SQL语句或者使用ORM（对象关系映射）。直接编写SQL语句虽然能够提供更多的控制权，但可能会增加出错的风险。而ORM则通过将数据库表映射到程序中的对象，使得数据操作更加直观。不过，选择哪种方式，还要根据具体的应用场景和个人偏好来决定。 2. 实践篇构建高性能数据库访问现在，让我们进入实践部分。咱们这就来点儿实战教学，用几个小例子带你看看怎么用Go语言搞定又快又稳的数据库操作。 2.1 使用标准库 database/sql Go语言的标准库提供了database/sql包，它是一个用于SQL数据库的通用接口。下面是一个简单的例子： go package main import ( "database/sql" _ "github.com/go-sql-driver/mysql" // 注意这里需要导入MySQL驱动 "fmt" ) func main() { db, err := sql.Open("mysql", "user:password@tcp(127.0.0.1:3306)/dbname") if err != nil { panic(err.Error()) } defer db.Close() // 执行一个简单的查询 rows, err := db.Query("SELECT id, name FROM users") if err != nil { panic(err.Error()) } defer rows.Close() for rows.Next() { var id int var name string err = rows.Scan(&id, &name) if err != nil { panic(err.Error()) } fmt.Println(id, name) } } 2.2 使用ORM工具：Gorm 对于更复杂的项目，使用ORM工具如Gorm可以极大地简化数据库操作。Gorm就像是给数据库操作加了个“翻译”，让我们可以用更贴近日常说话的方式来摆弄数据库里的数据，感觉就像是在玩弄对象一样轻松。下面是如何使用Gorm的一个简单示例： go package main import ( "gorm.io/driver/mysql" "gorm.io/gorm" "log" ) type User struct { ID uint Name string } func main() { dsn := "user:password@tcp(127.0.0.1:3306)/dbname?charset=utf8mb4&parseTime=True&loc=Local" db, err := gorm.Open(mysql.Open(dsn), &gorm.Config{}) if err != nil { log.Fatal(err) } // 创建用户 newUser := User{Name: "John Doe"} db.Create(&newUser) // 查询用户 var user User db.First(&user, newUser.ID) log.Printf("Found user: %s\n", user.Name) } 3. 性能优化技巧在实际开发中，除了基础的数据库操作外，我们还需要考虑如何进一步优化性能。这里有几个建议： - 索引：确保你的数据库表上有适当的索引，特别是对于那些频繁查询的字段。 - 缓存：利用缓存机制（如Redis）来存储常用的数据结果，可以显著减少数据库的负载。 - 批量操作：尽量减少与数据库的交互次数，比如批量插入或更新数据。 - 异步处理：对于耗时的操作，可以考虑使用异步处理方式，避免阻塞主线程。 4. 结语通过以上的内容，我们大致了解了如何使用Go语言进行高性能的数据库访问和操作。当然，这只是冰山一角，真正的高手之路还很长。希望能给你带来点儿灵感，让你在Go语言的路上越走越远，越走越顺！记住，编程是一场马拉松，不是短跑，保持耐心，不断学习和尝试新的东西吧！ --- 希望这篇文章能帮助你更好地理解和应用Golang在数据库访问方面的最佳实践。如果你有任何问题或想法，欢迎随时交流讨论！

2024-10-21 15:42:48

百转千回

Go Iris

Iris框架配置数据库锁应对并发一致性问题

Iris支持数据库锁类型策略配置 1. 简介大家好！今天我要和大家聊聊一个非常酷的主题——Iris框架中的数据库锁类型策略配置。我明白，这个话题可能不是人人都爱聊的，但请给我个机会，听我说说这个事儿真的挺关键的！想想看，在应对多个请求同时来的时候，要是数据乱了套，那得多麻烦啊。而且，我们作为开发者，总得不断学习新的东西，不是吗？ 2. 为什么要关心数据库锁？在开发过程中，我们经常会遇到多用户同时操作同一数据的情况。如果处理不当，可能会导致数据不一致或者丢失更新的问题。比如说，设想一下，两个小伙伴差不多在同一时间抢着去编辑同一个文件，要是不管它，搞不好就会撞车，出现混乱啦。这时候，我们就需要数据库锁来帮助我们解决问题。 3. Iris框架中的数据库锁类型 Iris框架提供了一些内置的支持，让我们可以轻松地配置数据库锁类型。目前，它支持以下几种锁类型： - 共享锁（Shared Lock）：允许多个事务同时读取数据，但不允许任何事务修改数据。 - 排他锁（Exclusive Lock）：只允许一个事务读取和修改数据，其他事务必须等待该锁释放后才能访问数据。 4. 配置数据库锁类型接下来，我们来看一下如何在Iris中配置这些锁类型。假设我们正在使用MySQL数据库，我们可以这样配置： go import ( "github.com/kataras/iris/v12" "github.com/go-sql-driver/mysql" ) func main() { app := iris.New() // 配置MySQL连接 config := mysql.NewConfig() config.User = "root" config.Passwd = "password" config.Net = "tcp" config.Addr = "localhost:3306" config.DBName = "testdb" // 设置锁类型 config.InterpolateParams = true config.Params = map[string]string{ "charset": "utf8mb4", "parseTime": "True", "loc": "Local", "sql_mode": "STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION", "tx_isolation": "READ-COMMITTED", // 这里设置为读提交，你可以根据需求调整 } // 创建数据库连接池 db, err := sql.Open("mysql", config.FormatDSN()) if err != nil { panic(err) } // 使用数据库连接池 app.Use(func(ctx iris.Context) { ctx.Values().Set("db", db) ctx.Next() }) // 定义路由 app.Get("/", func(ctx iris.Context) { db := ctx.Values().Get("db").(sql.DB) // 开始事务 tx, err := db.Begin() if err != nil { ctx.StatusCode(iris.StatusInternalServerError) ctx.WriteString("Error starting transaction") return } defer tx.Rollback() // 执行查询 stmt, err := tx.Prepare("SELECT FROM users WHERE id = ? FOR UPDATE") if err != nil { ctx.StatusCode(iris.StatusInternalServerError) ctx.WriteString("Error preparing statement") return } defer stmt.Close() var user User err = stmt.QueryRow(1).Scan(&user.ID, &user.Name, &user.Email) if err != nil { ctx.StatusCode(iris.StatusInternalServerError) ctx.WriteString("Error executing query") return } // 更新数据 _, err = tx.Exec("UPDATE users SET name = ? WHERE id = ?", "New Name", user.ID) if err != nil { ctx.StatusCode(iris.StatusInternalServerError) ctx.WriteString("Error updating data") return } // 提交事务 err = tx.Commit() if err != nil { ctx.StatusCode(iris.StatusInternalServerError) ctx.WriteString("Error committing transaction") return } ctx.WriteString("Data updated successfully!") }) // 启动服务器 app.Run(iris.Addr(":8080")) } 5. 实际应用中的考虑在实际应用中，我们需要根据具体的业务场景选择合适的锁类型。比如说，如果有好几个小伙伴得同时查看数据，又不想互相打扰，那我们就用共享锁来搞定。要是你想保证数据一致，防止同时有人乱改，那就得用排他锁了。另外，要注意的是，过度使用锁可能会导致性能问题，因为锁会阻塞其他事务的执行。因此，在设计系统时，我们需要权衡数据一致性和性能之间的关系。 6. 结语通过今天的讨论，希望大家对Iris框架中的数据库锁类型配置有了更深入的理解。虽然设置锁类型会让事情变得稍微复杂一点，但这样做真的能帮我们更好地应对多任务同时进行时可能出现的问题，确保系统稳稳当当的不掉链子。最后，我想说的是，技术的学习是一个不断积累的过程。有时候，我们会觉得某些概念很难理解，但这都是正常的。只要我们保持好奇心和探索精神，总有一天会豁然开朗。希望你们能够持续学习，不断进步！谢谢大家！

2025-02-23 16:37:04

追梦人

转载文章

[转载]任务三：指标计算

...和下单的总金额，存入MySQL数据库shtd_store的nationeverymonth表（表结构如下）中，然后在Linux的MySQL命令行中根据订单总数、消费总额、国家表主键三列均逆序排序的方式，查询出前5条，将SQL语句与执行结果截图粘贴至对应报告中; spark.sql("select nationkey,regexp_replace(nationname,'\'','') as nationname,regionkey,regexp_replace(regionname,'\'','') as regionname,sum(totalnum) as totalorder,sum(totalprice) as totalconsumption,year,month from nationeverymonth group by nationkey,regionkey,month,nationname,year,regionname;") 我为了方便查询和之后的操作,将上面的查询结果导入到新表nationeverymonths 查表接下来将hive中的数据导入mysql中 package com.atguigu.spark.sqlimport org.apache.spark.SparkConfimport org.apache.spark.sql.SparkSessionimport java.util.Propertiesobject DataHiveToMySQL {def main(args: Array[String]): Unit = {val sparkConf = new SparkConf().setMaster("local[]").setAppName("sparkSQL")val spark = SparkSession.builder().enableHiveSupport().config(sparkConf).getOrCreate()val result=spark.sql("select from ods.nationeverymonths")val props=new Properties()props.setProperty("user","root")props.setProperty("password","123456")props.setProperty("driver","com.mysql.jdbc.Driver")result.write.mode("overwrite").jdbc("jdbc:mysql://192.168.230.132:3306/user?serverTimezone=UTC&characterEncoding=UTF-8&useSSL=false", "nationeverymonth", props)println("导入成功")spark.stop()} } 运行可见导入成功进入MySQL中查看结果可见数据成功导入接下来按照要求查询: 2.请根据dwd层表计算出某年每个国家的平均消费额和所有国家平均消费额相比较结果（“高/低/相同”）,存入MySQL数据库shtd_store的nationavgcmp表（表结构如下）中，然后在Linux的MySQL命令行中根据订单总数、消费总额、国家表主键三列均逆序排序的方式，查询出前5条，将SQL语句与执行结果截图粘贴至对应报告中; 在解这道题的时候遇见一个问题,在求所有国家平均消费额的时候一直报错,由于没有数据这道题的题意还是有点没看明白,于是我就用了最简单的办法先新增一列,再单独将所有国家平均消费额求出来然后再插入,如果各位大佬有解决这个问题的办法希望能指导一下先将每个国家的平均消费额求出来 spark.sql("select nationkey,nationname,avg(totalconsumption) as nationavgconsumption from nationeverymonths group by nationkey,nationname") 再新增一列所有国家平均消费额 spark.sql("alter table nationeverymonths add columns(avg_allstring)") 再将查询到的所有国家平均消费额导入进去 spark.sql("insert overwrite table nationeverymonths1 select nationkey,nationname,avg_totalconsumpt,1500 from nationeverymonths1") 再次查表按照题意添加比较结果字段 spark.sql("select ,case when avg_totalconsumpt>avg_all then '高' when avg_totalconsumpt<avg_all then '低' when avg_totalconsumpt=avg_all then '相同' else 'null' end as comparison from nationeverymonths1").show 最后的排序语句和题一一样本篇文章为转载内容。原文链接：https://blog.csdn.net/guo_0423/article/details/126352162。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-09-01 10:55:33

319

转载

转载文章

[转载]聊聊如何从零开始自学编程

...数较高的方向。掌握数据库由于本人从事服务端开发，下面说说服务端开发学习的过程。服务端开发，需要学习的东西会很多，不过不用担心，我们一个个说。首先我们先说数据库。数据库对于服务端开发，一定要学会的技术，所以这个我们需要着重学习。首先按照网上教程，自己在电脑上搭建一个数据库，这里推荐 MySQL。搭建之后，再下载一个数据库客户端管理工具，如 Navicat，DataGrip。弄完这些基础设施之后，我们这里接着去学会 SQL 的语法。这里着重学习单表增删改查的语法，跨表的连接查询等。网上找一个例子，如可以自己构建一个学生课程信息表，做到可以用以上学习到的语法。学习完数据库，接着我们就需要学习Java JDBC 的知识。学习的 JDBC 就是让我们了解，如何使用 Java 操作数据库，运行 Mybatis的增删改查的语句。接着我们可以去学习相关 ORM 的框架，如 Hibernate 或 Mybatis，这里推荐 Mybatis。学习框架，我们要做到掌握框架的使用技巧就可以。这个过程你可能会发现，Mybatis 这类框架这么如此简化开发，为什么我们不直接学习 Mybatis ？学习 JDBC 的目的，其实就是让你了解这些 ORM 的基础。学完这个阶段，我们接下去就要进入 WEB 开发。 WEB 开发这个过程我们首先学习一些前端知识，如 HTML，CSS,JavaScript，然后再去 Jquery 等前端框架，做到能实现一些简单的功能。我们不需要跟你上面一样精通，我们只要了解一些概念即可。接下去我们学习 Servlet，做到能使用原生 Servlet + Jsp 能运行一个 WEB 程序。后面我们再去学习 Spring 框架，使用 SpringMVC 了解 MVC 的概念。最后用 SpringMVC+Spring+Mybatis+MySQL 完成一个简单的管理系统。其他学完以上内容，基本上已经学习完工作中学习到的技术栈。这个过程你还需要额外学习一些工作中用到其他知识。你需要去学习协同开发的工具，如 Git，SVN。做到了解如何新建分支，如何拉取代码，如何合并代码即可。你还需要去学习一些 Linux 的命令。总结学完上述内容，你实际就已经掌握初级开发所需要的技术，已经基本上可以从事一个初级开发的岗位。我们上面讲的都是使用技巧，但是面试的时候可能会问你一些原理性的内容，所以在我们去找工作之前我们还需要去了解一些原理性知识。这方面的内容通过搜索引擎搜索即可。这个过程你可能会碰到很多问题，这个过程一定善于使用搜索引擎。本篇文章为转载内容。原文链接：https://blog.csdn.net/qq_35006660/article/details/115610534。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-07-02 23:59:06

转载

转载文章

[转载]【持久化框架】SpringMVC+Spring4+Mybatis3 集成，开发简单Web项目+源码下载

...jar还不够，还需要MySQL数据库与驱动，log4j的jar等等。下面我们开始今天的旅行：第一步：创建数据库表在Navicat下执行如下sql命令创建数据库mybatis和表t_user [sql] view plaincopy print? CREATE DATABASE IF NOT EXISTS mybatis; [sql] view plaincopy print? USE mybatis; [sql] view plaincopy print? create table t_user ( user_id int(11) NOT NULL AUTO_INCREMENT, user_name varchar(20) not null, user_age varchar(20) not null, PRIMARY KEY (user_id) )ENGINE=InnoDB DEFAULT CHARSET=utf8; 我们先看一下项目的完整目录，再继续下面的内容第二步：添加jar包对于下面代码的内容，我们就不再一一贴出来，只是把最重要的内容贴出来，大家可以下载源码。第三步：创建model 创建一个model包并在其下创建一个User.Java文件。 [java] view plaincopy print? package com.tgb.model; / 用户 @author liang / public class User { private int id; private String age; private String userName; public User(){ super(); } public int getId() { return id; } public void setId(int id) { this.id = id; } public String getAge() { return age; } public void setAge(String age) { this.age = age; } public String getUserName() { return userName; } public void setUserName(String userName) { this.userName = userName; } public User(int id, String age, String userName) { super(); this.id = id; this.age = age; this.userName = userName; } } 第四步：创建DAO接口创建一个包mapper，并在其下创建一个UserMapper.java文件作为DAO接口。 [java] view plaincopy print? package com.tgb.mapper; import java.util.List; import com.tgb.model.User; public interface UserMapper { void save(User user); boolean update(User user); boolean delete(int id); User findById(int id); List<User> findAll(); } 第五步：实现DAO接口在dao包下创建一个UserMapper.xml文件作为上一步创建的DAO接口的实现。 [html] view plaincopy print? <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" "http://mybatis.org/dtd/mybatis-3-mapper.dtd">  <mapper namespace="com.tgb.mapper.UserMapper"> <insert id="save" parameterType="User"> insert into t_user(user_name,user_age) values({userName},{age}) </insert> <update id="update" parameterType="User"> update t_user set user_name={userName},user_age={age} where user_id={id} </update> <delete id="delete" parameterType="int"> delete from t_user where user_id={id} </delete>  <select id="findById" parameterType="int" resultType="User"> select user_id id,user_name userName,user_age age from t_user where user_id={id} </select> <select id="findAll" resultType="User"> select user_id id,user_name userName,user_age age from t_user </select> </mapper> 这里对这个xml文件作几点说明： 1、namespace必须与对应的接口全类名一致。 2、id必须与对应接口的某个对应的方法名一致即必须要和UserMapper.java接口中的方法同名。第六步：Mybatis和Spring的整合对于Mybatis和Spring的整合是这篇博文的重点，需要配置的内容在下面有详细的解释。 [html] view plaincopy print? <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:p="http://www.springframework.org/schema/p" xmlns:context="http://www.springframework.org/schema/context" xmlns:tx="http://www.springframework.org/schema/tx" xsi:schemaLocation=" http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans-4.0.xsd http://www.springframework.org/schema/context http://www.springframework.org/schema/context/spring-context-4.0.xsd http://www.springframework.org/schema/tx http://www.springframework.org/schema/tx/spring-tx-4.0.xsd">  <bean id="dataSource" class="org.springframework.jdbc.datasource.DriverManagerDataSource"> <property name="driverClassName" value="com.mysql.jdbc.Driver" /> <property name="url" value="jdbc:mysql://localhost:3306/mybatis" /> <property name="username" value="root" /> <property name="password" value="123456" /> </bean>  <bean id="sqlSessionFactory" class="org.mybatis.spring.SqlSessionFactoryBean"> <property name="dataSource" ref="dataSource"></property> <property name="configLocation" value="classpath:config/mybatis-config.xml" /> </bean>  <bean class="org.mybatis.spring.mapper.MapperScannerConfigurer"> <property name="basePackage" value="com.tgb.mapper"></property> <property name="sqlSessionFactory" ref="sqlSessionFactory"></property> </bean>  <bean id="txManager" class="org.springframework.jdbc.datasource.DataSourceTransactionManager"> <property name="dataSource" ref="dataSource"></property> </bean>  <tx:annotation-driven transaction-manager="txManager" /> </beans> 第七步：mybatis的配置文件 [html] view plaincopy print? <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE configuration PUBLIC "-//mybatis.org//DTD Config 3.0//EN" "http://mybatis.org/dtd/mybatis-3-config.dtd"> <configuration>  <typeAliases> <typeAlias alias="User" type="com.tgb.model.User" /> </typeAliases>   <mappers> <mapper resource="com/tgb/mapper/userMapper.xml" /> </mappers> </configuration> 总结 Mybatis和Spring的集成相对而言还是很简单的，祝你成功。源码下载：SpringMVC+Spring4+Mybatis3 下篇博文我们将Hibernate和Mybatis进行一下详细的对比。本篇文章为转载内容。原文链接：https://blog.csdn.net/konglongaa/article/details/51706991。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-09-05 11:56:25

111

转载

转载文章

[转载]deepin虚拟机安装常用软件

... git 7. 安装MySQL MySQL :: Download MySQL Community Server 下载Debian版DEB Bundle 解压进入目录,执行 sudo dpkg -i mysql-{common,community-client,client,community-server,server}_.deb 如果报错，执行 sudo apt-get -f install 中途设置root用户密码 8. 安装PostgreSQL 安装PostgreSQL sudo apt-get install -y postgresql-11 修改postgres用户密码 sudo -u postgres psql 进入后执行SQL ALTER USER postgres WITH PASSWORD 'postgres'; 退出 exit; 9. 安装Redis sudo apt-get install -y redis-server 修改配置文件 sudo vim /etc/redis/redis.conf 重启 sudo systemctl restart redis sudo systemctl enable redis-server 10. 安装Nginx sudo apt-get install -y nginx 修改配置文件 sudo vim /etc/nginx/nginx.conf 重启 sudo systemctl restart nginx sudo systemctl enable nginx 11. 安装VMWare Workstation 下载 https://www.vmware.com/go/getworkstation-linux 放到文件夹，进入，执行 sudo chmod +x VMware-Workstation-Full-17.0.0-20800274.x86_64.bundle sudo ./VMware-Workstation-Full-17.0.0-20800274.x86_64.bundle 安装gcc sudo apt-get install -y gcc 进入控制台，找到VMWare，开始安装，安装过程同Windows 如果如果遇到build environment error错误，执行下列命令后再重新在控制台打开图标 sudo apt-get install -y libcanberra 如果还不行，执行 sudo vmware-modconfig --console --install-all 看看还缺什么 12. 安装百度网盘官网下载Linux版本的软件：百度网盘客户端下载 deepin的软件包格式为deb。安装： sudo dpkg -i baidunetdisk_3.5.0_amd64.deb 最新版本 sudo dpkg -i baidunetdisk_4.17.7_amd64.deb 如果报错，执行 sudo apt-get -f install 13. 安装WPS 官网下载Linux版本的软件：WPS Office 2019 for Linux-支持多版本下载_WPS官方网站 deepin的软件包格式为deb。安装： sudo dpkg -i wps-office_11.1.0.10702_amd64.deb 最新版本 sudo dpkg -i wps-office_11.1.0.11691_amd64.deb 如果报错执行 sudo apt-get -f install wps有可能会报缺字体,缺的字体如下,双击安装百度网盘请输入提取码提取码:lexo 14. 安装VS Code 官网下载Linux版本的软件：Visual Studio Code - Code Editing. Redefined deepin的软件包格式为deb。安装： sudo dpkg -i code_1.61.1-1634175470_amd64.deb 最新版本 sudo dpkg -i code_1.76.0-1677667493_amd64.deb 如果报错执行 sudo apt-get -f install 15. 安装微信、QQ、迅雷微信 sudo apt-get install -y com.qq.weixin.deepin QQ sudo apt-get install -y com.qq.im.deepin 迅雷 sudo apt-get install -y com.xunlei.download 16. 安装视频播放器 sudo apt-get -y install smplayer sudo apt-get -y install vlc 17. 安装SSH工具electerm 下载electerm的deb版本 deepin的软件包格式为deb。安装： https://github.com/electerm/electerm/releases/download/v1.25.16/electerm-1.25.16-linux-amd64.deb sudo dpkg -i electerm-1.25.16-linux-amd64.deb 18.安装FTP/SFTP工具FileZilla sudo apt-get -y install filezilla 19. 安装edge浏览器下载edge浏览器 deepin的软件包格式为deb。安装：下载 Microsoft Edge sudo apt-get -y install fonts-liberation sudo apt-get -y install libu2f-udev sudo dpkg -i microsoft-edge-beta_95.0.1020.30-1_amd64.deb 最新版本 sudo dpkg -i microsoft-edge-stable_110.0.1587.63-1_amd64.deb 本篇文章为转载内容。原文链接：https://blog.csdn.net/weixin_42173947/article/details/119973703。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-11-15 19:14:44

转载

Docker

Docker+Portainer+Rancher+Traefik：服务器管理工具容器化与可视化管理实践

...el，还有哪些服务器管理工具推荐？ 1. 为什么我们需要服务器管理工具？嗨，朋友们！最近我在折腾服务器的时候，突然意识到一个问题——管理服务器真的太麻烦了！尤其是当你需要部署各种服务、配置环境、监控性能时，简直就像在玩拼图游戏，一不小心就可能把整个系统搞崩。我之前用过宝塔面板和1panel，它们确实简化了很多操作，但总觉得少了点什么。于是我就开始琢磨：难道就没有更酷炫、更灵活的工具了吗？经过一番研究，我发现了一些非常有趣的服务器管理工具，特别是结合Docker使用后，简直是如虎添翼！所以今天，咱们就来聊聊这些工具，看看它们能不能成为你心目中的“神器”。 --- 2. Docker 让一切都变得简单首先，我们得谈谈Docker。Docker是什么？简单来说，它是一种容器化技术，可以让你的应用程序及其依赖项打包成一个独立的“容器”，然后轻松地运行在任何支持Docker的环境中。举个例子吧，假如你想在一个全新的服务器上安装WordPress，传统方法可能是手动下载PHP、MySQL、Nginx等一堆软件，再逐一配置。而如果你用Docker，只需要一条命令就能搞定： bash docker run --name wordpress -d -p 80:80 \ -v /path/to/wordpress:/var/www/html \ -e WORDPRESS_DB_HOST=db \ -e WORDPRESS_DB_USER=root \ -e WORDPRESS_DB_PASSWORD=yourpassword \ wordpress 这段代码的意思是：启动一个名为wordpress的容器，并将本地目录/path/to/wordpress挂载到容器内的/var/www/html路径下，同时设置数据库连接信息。是不是比传统的安装方式简洁多了？不过，单独使用Docker虽然强大，但对于不熟悉命令行的人来说还是有点门槛。这时候就需要一些辅助工具来帮助我们更好地管理和调度容器了。 --- 3. Portainer 可视化管理Docker的好帮手 Portainer绝对是我最近发现的一颗“宝藏”。它的界面非常直观，几乎不需要学习成本。不管是想看看现有的容器啥情况，还是想启动新的容器，甚至连网络和卷的管理，都只需要动动鼠标拖一拖、点一点就行啦！比如，如果你想快速创建一个新的MySQL容器，只需要打开Portainer的Web界面，点击“Add Container”，然后填写几个基本信息即可： yaml image: mysql:5.7 name: my-mysql ports: - "3306:3306" volumes: - /data/mysql:/var/lib/mysql environment: MYSQL_ROOT_PASSWORD: rootpassword 这段YAML配置文件描述了一个MySQL容器的基本参数。Portainer会自动帮你解析并生成对应的Docker命令。是不是超方便？另外，Portainer还有一个特别棒的功能——实时监控。你打开页面就能看到每个“小房子”（就是容器）里用掉的CPU和内存情况，而且还能像穿越空间一样，去访问别的机器上跑着的那些“小房子”（Docker实例）。这种功能对于运维人员来说简直是福音！ --- 4. Rancher 企业级的容器编排利器如果你是一个团队协作的开发者，或者正在运营一个大规模的服务集群，那么Rancher可能是你的最佳选择。它不仅仅是一个Docker管理工具，更是一个完整的容器编排平台。 Rancher的核心优势在于它的“多集群管理”能力。想象一下，你的公司有好几台服务器，分别放在地球上的不同角落，有的在美国，有的在欧洲，还有的在中国。每台服务器上都跑着各种各样的服务，比如网站、数据库啥的。这时候，Rancher就派上用场了！它就像一个超级贴心的小管家，让你不用到处切换界面，在一个地方就能轻松搞定所有服务器和服务的管理工作，省时又省力！举个例子，如果你想在Rancher中添加一个新的节点，只需要几步操作即可完成： 1. 登录Rancher控制台。 2. 点击“Add Cluster”按钮。 3. 输入目标节点的信息（IP地址、SSH密钥等）。 4. 等待几分钟，Rancher会自动为你安装必要的组件。一旦节点加入成功，你就可以直接在这个界面上部署应用了。比如，用Kubernetes部署一个Redis集群： bash kubectl create deployment redis --image=redis:alpine kubectl expose deployment redis --type=LoadBalancer --port=6379 虽然这条命令看起来很简单，但它背后实际上涉及到了复杂的调度逻辑和网络配置。而Rancher把这些复杂的事情封装得很好，让我们可以专注于业务本身。 --- 5. Traefik 反向代理与负载均衡的最佳拍档最后要介绍的是Traefik，这是一个轻量级的反向代理工具，专门用来处理HTTP请求的转发和负载均衡。它最厉害的地方啊，就是能跟Docker完美地融为一体，还能根据容器上的标签，自动调整路由规则呢！比如说，你有两个服务分别监听在8080和8081端口，现在想通过一个域名访问它们。只需要给这两个容器加上相应的标签： yaml labels: - "traefik.enable=true" - "traefik.http.routers.service1.rule=Host(service1.example.com)" - "traefik.http.services.service1.loadbalancer.server.port=8080" - "traefik.http.routers.service2.rule=Host(service2.example.com)" - "traefik.http.services.service2.loadbalancer.server.port=8081" 这样一来，当用户访问service1.example.com时，Traefik会自动将请求转发到监听8080端口的容器；而访问service2.example.com则会指向8081端口。这种方式不仅高效，还极大地减少了配置的工作量。 --- 6. 总结找到最适合自己的工具好了，到这里咱们已经聊了不少关于服务器管理工具的话题。从Docker到Portainer，再到Rancher和Traefik，每一种工具都有其独特的优势和适用场景。我的建议是，先根据自己的需求确定重点。要是你只想弄个小玩意儿，图个省事儿快点搞起来，那用Docker配个Portainer就完全够用了。但要是你们团队一起干活儿，或者要做大范围的部署，那Rancher这种专业的“老司机工具”就得安排上啦！当然啦，技术的世界永远没有绝对的答案。其实啊，很多时候你会发现，最适合你的工具不一定是最火的那个，而是那个最合你心意、用起来最顺手的。就像穿鞋一样，别人觉得好看的根本不合脚，而那双不起眼的小众款却让你走得又稳又舒服！所以啊，在用这些工具的时候，别光顾着看，得多动手试试，边用边记下自己的感受和想法，这样你才能真的搞懂它们到底有啥门道！好了，今天的分享就到这里啦！如果你还有什么问题或者想法，欢迎随时留言交流哦～咱们下次再见啦！

2025-04-16 16:05:13

月影清风_

转载文章

[转载]同事拿下阿里菜鸟P6offer，程序员：没看两本书还真不敢去跳槽

...析出哪个对象上锁？ Mysql索引类型和区别，事务的隔离级别和事务原理 Spring scope 和设计模式 Sql优化三面 fullgc的时候会导致接口的响应速度特别慢，该如何排查和解决？项目内存或者CPU占用率过高如何排查？ ConcurrentHashmap原理数据库分库分表 MQ相关，为什么kafka这么快，什么是零拷贝？小算法题 http和https协议区别，具体原理四面(Leader) 手画自己项目的架构图，并且针对架构和中间件提问印象最深的一本技术书籍是什么？五面(HR) 没什么过多的问题，主要就是聊了一下自己今后的职业规划，告知了薪资组成体系等等。插播一条福利！！！最近整理了一套1000道面试题的文档(详细内容见文首推荐文章)，以及大厂面试真题，和最近看的几本书。需要刷题和跳槽的朋友，这些可以免费赠送给大家，帮忙转发文章，宣传一下，后台私信【面试】免费领取！小天：好像问了两次看书的情况诶？现在面试还问这个？程序员H：是啊，幸亏之前为了弄懂JVM还看了两本书，不然真不知道说啥了！小天：看来，我也要找几本书去看了，感情没看过两本书都不敢跳槽了！程序员H：对了，还有简历，告诉你一个捷径简历尽量写好一些，项目经验突出： 1、自己的知识广度和深度 2、自身的优势 3、项目的复杂性和难度以及指标 4、自己对于项目做的贡献或者优化程序员H：唉~这还不能走可怎么办呀！你说，我把主管打一顿，是不是马上就可以走了？小天：... 查看全文 http://www.taodudu.cc/news/show-3387369.html 相关文章：阿里菜鸟面经 Java后端开发社招三年已拿offer 阿里菜鸟网络(一面) 2021年阿里菜鸟网络春招实习岗面试分享，简历+面试+面经全套资料！阿里菜鸟国际Java研发面经(三面+总结):JVM+架构+MySQL+Redis等 2021年3月29日阿里菜鸟实习面试（一面）（含部分总结） mongodb 子文档排序_猫鼬101：基础知识，子文档和人口简介特征工程计算方法Gauss-Jordan消去法求线性方程组的解使用(VAE)生成建模,理解可变自动编码器背后的数学原理视觉SLAM入门 -- 学习笔记 - Part2 带你入门nodejs第一天——node基础语法及使用 python3数据结构_Python3-数据结构 debezium-connect-oracle使用相关数值分析多种算法代码 android iphone treeview,Android之IphoneTreeView带组指示器的ExpandableListView效果 nginx rewrite功能使用 3-3 OneHot编码 JavaWeb：shiro入门小案例 MySQL的定义、操作、控制、查询语言的用法 MongoDB入门学习(三)：MongoDB的增删查改赋值、浅复制和深复制解析以及get/set应用他是吴恩达导师，被马云聘为「达摩院」首座 Jordan 标准型定理列主元的Gauss-Jordan消元法-python实现 Jordan 块的几何若尔当型（The Jordan form）第七章其他神经网络类型解决迁移系统后无法配置启用WindowsRE环境的问题宝塔面板迁移系统盘/www到数据盘/home 使用vmware vconverter从物理机迁移系统到虚拟机P2V 本篇文章为转载内容。原文链接：https://blog.csdn.net/m0_62695120/article/details/124510157。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-03-08 20:01:49

转载

转载文章

[转载]大数据IMF传奇行动绝密课程第104-114课：Spark Streaming电商广告点击综合案例

...ket往后台发送日志数据，在这里我们是要做基于SparkStreaming做实时在线统计。那么数据就需要放进消息系统（Kafka）中，我们的Spark Streaming应用程序就会去Kafka中Pull数据过来进行计算和消费，并把计算后的数据放入到持久化系统中（MySQL）广告点击系统实时分析的意义：因为可以在线实时的看见广告的投放效果，就为广告的更大规模的投入和调整打下了坚实的基础，从而为公司带来最大化的经济回报。核心需求： 1、实时黑名单动态过滤出有效的用户广告点击行为：因为黑名单用户可能随时出现，所以需要动态更新； 2、在线计算广告点击流量； 3、Top3热门广告； 4、每个广告流量趋势； 5、广告点击用户的区域分布分析 6、最近一分钟的广告点击量； 7、整个广告点击Spark Streaming处理程序724小时运行；数据格式：时间、用户、广告、城市等技术细节：在线计算用户点击的次数分析，屏蔽IP等；使用updateStateByKey或者mapWithState进行不同地区广告点击排名的计算； Spark Streaming+Spark SQL+Spark Core等综合分析数据；使用Window类型的操作；高可用和性能调优等等；流量趋势，一般会结合DB等； Spark Core / /package com.tom.spark.SparkApps.sparkstreaming;import java.util.Date;import java.util.HashMap;import java.util.Map;import java.util.Properties;import java.util.Random;import kafka.javaapi.producer.Producer;import kafka.producer.KeyedMessage;import kafka.producer.ProducerConfig;/ 数据生成代码，Kafka Producer产生数据/public class MockAdClickedStat {/ @param args/public static void main(String[] args) {final Random random = new Random();final String[] provinces = new String[]{"Guangdong", "Zhejiang", "Jiangsu", "Fujian"};final Map<String, String[]> cities = new HashMap<String, String[]>();cities.put("Guangdong", new String[]{"Guangzhou", "Shenzhen", "Dongguan"});cities.put("Zhejiang", new String[]{"Hangzhou", "Wenzhou", "Ningbo"});cities.put("Jiangsu", new String[]{"Nanjing", "Suzhou", "Wuxi"});cities.put("Fujian", new String[]{"Fuzhou", "Xiamen", "Sanming"});final String[] ips = new String[] {"192.168.112.240","192.168.112.239","192.168.112.245","192.168.112.246","192.168.112.247","192.168.112.248","192.168.112.249","192.168.112.250","192.168.112.251","192.168.112.252","192.168.112.253","192.168.112.254",};/ Kafka相关的基本配置信息/Properties kafkaConf = new Properties();kafkaConf.put("serializer.class", "kafka.serializer.StringEncoder");kafkaConf.put("metadeta.broker.list", "Master:9092,Worker1:9092,Worker2:9092");ProducerConfig producerConfig = new ProducerConfig(kafkaConf);final Producer<Integer, String> producer = new Producer<Integer, String>(producerConfig);new Thread(new Runnable() {public void run() {while(true) {//在线处理广告点击流的基本数据格式：timestamp、ip、userID、adID、province、cityLong timestamp = new Date().getTime();String ip = ips[random.nextInt(12)]; //可以采用网络上免费提供的ip库int userID = random.nextInt(10000);int adID = random.nextInt(100);String province = provinces[random.nextInt(4)];String city = cities.get(province)[random.nextInt(3)];String clickedAd = timestamp + "\t" + ip + "\t" + userID + "\t" + adID + "\t" + province + "\t" + city;producer.send(new KeyedMessage<Integer, String>("AdClicked", clickedAd));try {Thread.sleep(50);} catch (InterruptedException e) {// TODO Auto-generated catch blocke.printStackTrace();} }} }).start();} } package com.tom.spark.SparkApps.sparkstreaming;import java.sql.Connection;import java.sql.DriverManager;import java.sql.PreparedStatement;import java.sql.ResultSet;import java.sql.SQLException;import java.util.ArrayList;import java.util.Arrays;import java.util.HashMap;import java.util.HashSet;import java.util.Iterator;import java.util.List;import java.util.Map;import java.util.Set;import java.util.concurrent.LinkedBlockingQueue;import kafka.serializer.StringDecoder;import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaPairRDD;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.api.java.function.Function;import org.apache.spark.api.java.function.Function2;import org.apache.spark.api.java.function.PairFunction;import org.apache.spark.api.java.function.VoidFunction;import org.apache.spark.sql.DataFrame;import org.apache.spark.sql.Row;import org.apache.spark.sql.RowFactory;import org.apache.spark.sql.hive.HiveContext;import org.apache.spark.sql.types.DataTypes;import org.apache.spark.sql.types.StructType;import org.apache.spark.streaming.Durations;import org.apache.spark.streaming.api.java.JavaDStream;import org.apache.spark.streaming.api.java.JavaPairDStream;import org.apache.spark.streaming.api.java.JavaPairInputDStream;import org.apache.spark.streaming.api.java.JavaStreamingContext;import org.apache.spark.streaming.api.java.JavaStreamingContextFactory;import org.apache.spark.streaming.kafka.KafkaUtils;import com.google.common.base.Optional;import scala.Tuple2;/ 数据处理，Kafka消费者/public class AdClickedStreamingStats {/ @param args/public static void main(String[] args) {// TODO Auto-generated method stub//好处：1、checkpoint 2、工厂final SparkConf conf = new SparkConf().setAppName("SparkStreamingOnKafkaDirect").setMaster("hdfs://Master:7077/");final String checkpointDirectory = "hdfs://Master:9000/library/SparkStreaming/CheckPoint_Data";JavaStreamingContextFactory factory = new JavaStreamingContextFactory() {public JavaStreamingContext create() {// TODO Auto-generated method stubreturn createContext(checkpointDirectory, conf);} };/ 可以从失败中恢复Driver，不过还需要指定Driver这个进程运行在Cluster，并且在提交应用程序的时候制定--supervise;/JavaStreamingContext javassc = JavaStreamingContext.getOrCreate(checkpointDirectory, factory);/ 第三步：创建Spark Streaming输入数据来源input Stream: 1、数据输入来源可以基于File、HDFS、Flume、Kafka、Socket等 2、在这里我们指定数据来源于网络Socket端口，Spark Streaming连接上该端口并在运行的时候一直监听该端口的数据 (当然该端口服务首先必须存在），并且在后续会根据业务需要不断有数据产生（当然对于Spark Streaming 应用程序的运行而言，有无数据其处理流程都是一样的） 3、如果经常在每间隔5秒钟没有数据的话不断启动空的Job其实会造成调度资源的浪费，因为并没有数据需要发生计算；所以实际的企业级生成环境的代码在具体提交Job前会判断是否有数据，如果没有的话就不再提交Job；///创建Kafka元数据来让Spark Streaming这个Kafka Consumer利用Map<String, String> kafkaParameters = new HashMap<String, String>();kafkaParameters.put("metadata.broker.list", "Master:9092,Worker1:9092,Worker2:9092");Set<String> topics = new HashSet<String>();topics.add("SparkStreamingDirected");JavaPairInputDStream<String, String> adClickedStreaming = KafkaUtils.createDirectStream(javassc, String.class, String.class, StringDecoder.class, StringDecoder.class,kafkaParameters, topics);/因为要对黑名单进行过滤，而数据是在RDD中的，所以必然使用transform这个函数；但是在这里我们必须使用transformToPair，原因是读取进来的Kafka的数据是Pair<String,String>类型, 另一个原因是过滤后的数据要进行进一步处理，所以必须是读进的Kafka数据的原始类型在此再次说明，每个Batch Duration中实际上讲输入的数据就是被一个且仅被一个RDD封装的，你可以有多个 InputDStream，但其实在产生job的时候，这些不同的InputDStream在Batch Duration中就相当于Spark基于HDFS 数据操作的不同文件来源而已罢了。/JavaPairDStream<String, String> filteredadClickedStreaming = adClickedStreaming.transformToPair(new Function<JavaPairRDD<String,String>, JavaPairRDD<String,String>>() {public JavaPairRDD<String, String> call(JavaPairRDD<String, String> rdd) throws Exception {/ 在线黑名单过滤思路步骤： 1、从数据库中获取黑名单转换成RDD，即新的RDD实例封装黑名单数据； 2、然后把代表黑名单的RDD的实例和Batch Duration产生的RDD进行Join操作，准确的说是进行leftOuterJoin操作，也就是说使用Batch Duration产生的RDD和代表黑名单的RDD实例进行 leftOuterJoin操作，如果两者都有内容的话，就会是true，否则的话就是false 我们要留下的是leftOuterJoin结果为false； /final List<String> blackListNames = new ArrayList<String>();JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();jdbcWrapper.doQuery("SELECT FROM blacklisttable", null, new ExecuteCallBack() {public void resultCallBack(ResultSet result) throws Exception {while(result.next()){blackListNames.add(result.getString(1));} }});List<Tuple2<String, Boolean>> blackListTuple = new ArrayList<Tuple2<String,Boolean>>();for(String name : blackListNames) {blackListTuple.add(new Tuple2<String, Boolean>(name, true));}List<Tuple2<String, Boolean>> blacklistFromListDB = blackListTuple; //数据来自于查询的黑名单表并且映射成为<String, Boolean>JavaSparkContext jsc = new JavaSparkContext(rdd.context());/ 黑名单的表中只有userID，但是如果要进行join操作的话就必须是Key-Value，所以在这里我们需要基于数据表中的数据产生Key-Value类型的数据集合/JavaPairRDD<String, Boolean> blackListRDD = jsc.parallelizePairs(blacklistFromListDB);/ 进行操作的时候肯定是基于userID进行join，所以必须把传入的rdd进行mapToPair操作转化成为符合格式的RDD/JavaPairRDD<String, Tuple2<String, String>> rdd2Pair = rdd.mapToPair(new PairFunction<Tuple2<String,String>, String, Tuple2<String, String>>() {public Tuple2<String, Tuple2<String, String>> call(Tuple2<String, String> t) throws Exception {// TODO Auto-generated method stubString userID = t._2.split("\t")[2];return new Tuple2<String, Tuple2<String,String>>(userID, t);} });JavaPairRDD<String, Tuple2<Tuple2<String, String>, Optional<Boolean>>> joined = rdd2Pair.leftOuterJoin(blackListRDD);JavaPairRDD<String, String> result = joined.filter(new Function<Tuple2<String,Tuple2<Tuple2<String,String>,Optional<Boolean>>>, Boolean>() {public Boolean call(Tuple2<String, Tuple2<Tuple2<String, String>, Optional<Boolean>>> tuple)throws Exception {// TODO Auto-generated method stubOptional<Boolean> optional = tuple._2._2;if(optional.isPresent() && optional.get()){return false;} else {return true;} }}).mapToPair(new PairFunction<Tuple2<String,Tuple2<Tuple2<String,String>,Optional<Boolean>>>, String, String>() {public Tuple2<String, String> call(Tuple2<String, Tuple2<Tuple2<String, String>, Optional<Boolean>>> t)throws Exception {// TODO Auto-generated method stubreturn t._2._1;} });return result;} });//广告点击的基本数据格式：timestamp、ip、userID、adID、province、cityJavaPairDStream<String, Long> pairs = filteredadClickedStreaming.mapToPair(new PairFunction<Tuple2<String,String>, String, Long>() {public Tuple2<String, Long> call(Tuple2<String, String> t) throws Exception {String[] splited=t._2.split("\t");String timestamp = splited[0]; //YYYY-MM-DDString ip = splited[1];String userID = splited[2];String adID = splited[3];String province = splited[4];String city = splited[5]; String clickedRecord = timestamp + "_" +ip + "_"+userID+"_"+adID+"_"+province +"_"+city;return new Tuple2<String, Long>(clickedRecord, 1L);} });/ 第4.3步：在单词实例计数为1基础上，统计每个单词在文件中出现的总次数/JavaPairDStream<String, Long> adClickedUsers= pairs.reduceByKey(new Function2<Long, Long, Long>() {public Long call(Long i1, Long i2) throws Exception{return i1 + i2;} });/判断有效的点击，复杂化的采用机器学习训练模型进行在线过滤简单的根据ip判断1天不超过100次；也可以通过一个batch duration的点击次数判断是否非法广告点击，通过一个batch来判断是不完整的，还需要一天的数据也可以每一个小时来判断。/JavaPairDStream<String, Long> filterClickedBatch = adClickedUsers.filter(new Function<Tuple2<String,Long>, Boolean>() {public Boolean call(Tuple2<String, Long> v1) throws Exception {if (1 < v1._2){//更新一些黑名单的数据库表return false;} else { return true;} }});//filterClickedBatch.print();//写入数据库filterClickedBatch.foreachRDD(new Function<JavaPairRDD<String,Long>, Void>() {public Void call(JavaPairRDD<String, Long> rdd) throws Exception {rdd.foreachPartition(new VoidFunction<Iterator<Tuple2<String,Long>>>() {public void call(Iterator<Tuple2<String, Long>> partition) throws Exception {//使用数据库连接池的高效读写数据库的方式将数据写入数据库mysql//例如一次插入 1000条 records，使用insertBatch 或 updateBatch//插入的用户数据信息：userID,adID,clickedCount,time//这里面有一个问题，可能出现两条记录的key是一样的，此时需要更新累加操作List<UserAdClicked> userAdClickedList = new ArrayList<UserAdClicked>();while(partition.hasNext()) {Tuple2<String, Long> record = partition.next();String[] splited = record._1.split("\t");UserAdClicked userClicked = new UserAdClicked();userClicked.setTimestamp(splited[0]);userClicked.setIp(splited[1]);userClicked.setUserID(splited[2]);userClicked.setAdID(splited[3]);userClicked.setProvince(splited[4]);userClicked.setCity(splited[5]);userAdClickedList.add(userClicked);}final List<UserAdClicked> inserting = new ArrayList<UserAdClicked>();final List<UserAdClicked> updating = new ArrayList<UserAdClicked>();JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();//表的字段timestamp、ip、userID、adID、province、city、clickedCountfor(final UserAdClicked clicked : userAdClickedList) {jdbcWrapper.doQuery("SELECT clickedCount FROM adclicked WHERE"+ " timestamp =? AND userID = ? AND adID = ?",new Object[]{clicked.getTimestamp(), clicked.getUserID(),clicked.getAdID()}, new ExecuteCallBack() {public void resultCallBack(ResultSet result) throws Exception {// TODO Auto-generated method stubif(result.next()) {long count = result.getLong(1);clicked.setClickedCount(count);updating.add(clicked);} else {inserting.add(clicked);clicked.setClickedCount(1L);} }});}//表的字段timestamp、ip、userID、adID、province、city、clickedCountList<Object[]> insertParametersList = new ArrayList<Object[]>();for(UserAdClicked insertRecord : inserting) {insertParametersList.add(new Object[] {insertRecord.getTimestamp(),insertRecord.getIp(),insertRecord.getUserID(),insertRecord.getAdID(),insertRecord.getProvince(),insertRecord.getCity(),insertRecord.getClickedCount()});}jdbcWrapper.doBatch("INSERT INTO adclicked VALUES(?, ?, ?, ?, ?, ?, ?)", insertParametersList);//表的字段timestamp、ip、userID、adID、province、city、clickedCountList<Object[]> updateParametersList = new ArrayList<Object[]>();for(UserAdClicked updateRecord : updating) {updateParametersList.add(new Object[] {updateRecord.getTimestamp(),updateRecord.getIp(),updateRecord.getUserID(),updateRecord.getAdID(),updateRecord.getProvince(),updateRecord.getCity(),updateRecord.getClickedCount() + 1});}jdbcWrapper.doBatch("UPDATE adclicked SET clickedCount = ? WHERE"+ " timestamp =? AND ip = ? AND userID = ? AND adID = ? "+ "AND province = ? AND city = ?", updateParametersList);} });return null;} });//再次过滤，从数据库中读取数据过滤黑名单JavaPairDStream<String, Long> blackListBasedOnHistory = filterClickedBatch.filter(new Function<Tuple2<String,Long>, Boolean>() {public Boolean call(Tuple2<String, Long> v1) throws Exception {//广告点击的基本数据格式：timestamp,ip,userID,adID,province,cityString[] splited = v1._1.split("\t"); //提取key值String date =splited[0];String userID =splited[2];String adID =splited[3];//查询一下数据库同一个用户同一个广告id点击量超过50次列入黑名单//接下来根据date、userID、adID条件去查询用户点击广告的数据表，获得总的点击次数//这个时候基于点击次数判断是否属于黑名单点击int clickedCountTotalToday = 81 ;if (clickedCountTotalToday > 50) {return true;}else {return false ;} }});//map操作，找出用户的idJavaDStream<String> blackListuserIDBasedInBatchOnhistroy =blackListBasedOnHistory.map(new Function<Tuple2<String,Long>, String>() {public String call(Tuple2<String, Long> v1) throws Exception {// TODO Auto-generated method stubreturn v1._1.split("\t")[2];} });//有一个问题，数据可能重复，在一个partition里面重复，这个好办；//但多个partition不能保证一个用户重复，需要对黑名单的整个rdd进行去重操作。//rdd去重了，partition也就去重了，一石二鸟，一箭双雕// 找出了黑名单，下一步就写入黑名单数据库表中JavaDStream<String> blackListUniqueuserBasedInBatchOnhistroy = blackListuserIDBasedInBatchOnhistroy.transform(new Function<JavaRDD<String>, JavaRDD<String>>() {public JavaRDD<String> call(JavaRDD<String> rdd) throws Exception {// TODO Auto-generated method stubreturn rdd.distinct();} });// 下一步写入到数据表中blackListUniqueuserBasedInBatchOnhistroy.foreachRDD(new Function<JavaRDD<String>, Void>() {public Void call(JavaRDD<String> rdd) throws Exception {rdd.foreachPartition(new VoidFunction<Iterator<String>>() {public void call(Iterator<String> t) throws Exception {// TODO Auto-generated method stub//插入的用户信息可以只包含：useID//此时直接插入黑名单数据表即可。//写入数据库List<Object[]> blackList = new ArrayList<Object[]>();while(t.hasNext()) {blackList.add(new Object[]{t.next()});}JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();jdbcWrapper.doBatch("INSERT INTO blacklisttable values (?)", blackList);} });return null;} });/广告点击累计动态更新,每个updateStateByKey都会在Batch Duration的时间间隔的基础上进行广告点击次数的更新，更新之后我们一般都会持久化到外部存储设备上，在这里我们存储到MySQL数据库中/JavaPairDStream<String, Long> updateStateByKeyDSteam = filteredadClickedStreaming.mapToPair(new PairFunction<Tuple2<String,String>, String, Long>() {public Tuple2<String, Long> call(Tuple2<String, String> t)throws Exception {String[] splited=t._2.split("\t");String timestamp = splited[0]; //YYYY-MM-DDString ip = splited[1];String userID = splited[2];String adID = splited[3];String province = splited[4];String city = splited[5]; String clickedRecord = timestamp + "_" +ip + "_"+userID+"_"+adID+"_"+province +"_"+city;return new Tuple2<String, Long>(clickedRecord, 1L);} }).updateStateByKey(new Function2<List<Long>, Optional<Long>, Optional<Long>>() {public Optional<Long> call(List<Long> v1, Optional<Long> v2)throws Exception {// v1:当前的Key在当前的Batch Duration中出现的次数的集合，例如{1，1，1，。。。，1}// v2:当前的Key在以前的Batch Duration中积累下来的结果；Long clickedTotalHistory = 0L; if(v2.isPresent()){clickedTotalHistory = v2.get();}for(Long one : v1) {clickedTotalHistory += one;}return Optional.of(clickedTotalHistory);} });updateStateByKeyDSteam.foreachRDD(new Function<JavaPairRDD<String,Long>, Void>() {public Void call(JavaPairRDD<String, Long> rdd) throws Exception {rdd.foreachPartition(new VoidFunction<Iterator<Tuple2<String,Long>>>() {public void call(Iterator<Tuple2<String, Long>> partition) throws Exception {//使用数据库连接池的高效读写数据库的方式将数据写入数据库mysql//例如一次插入 1000条 records，使用insertBatch 或 updateBatch//插入的用户数据信息：timestamp、adID、province、city//这里面有一个问题，可能出现两条记录的key是一样的，此时需要更新累加操作List<AdClicked> AdClickedList = new ArrayList<AdClicked>();while(partition.hasNext()) {Tuple2<String, Long> record = partition.next();String[] splited = record._1.split("\t");AdClicked adClicked = new AdClicked();adClicked.setTimestamp(splited[0]);adClicked.setAdID(splited[1]);adClicked.setProvince(splited[2]);adClicked.setCity(splited[3]);adClicked.setClickedCount(record._2);AdClickedList.add(adClicked);}final List<AdClicked> inserting = new ArrayList<AdClicked>();final List<AdClicked> updating = new ArrayList<AdClicked>();JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();//表的字段timestamp、ip、userID、adID、province、city、clickedCountfor(final AdClicked clicked : AdClickedList) {jdbcWrapper.doQuery("SELECT clickedCount FROM adclickedcount WHERE"+ " timestamp = ? AND adID = ? AND province = ? AND city = ?",new Object[]{clicked.getTimestamp(), clicked.getAdID(),clicked.getProvince(), clicked.getCity()}, new ExecuteCallBack() {public void resultCallBack(ResultSet result) throws Exception {// TODO Auto-generated method stubif(result.next()) {long count = result.getLong(1);clicked.setClickedCount(count);updating.add(clicked);} else {inserting.add(clicked);clicked.setClickedCount(1L);} }});}//表的字段timestamp、ip、userID、adID、province、city、clickedCountList<Object[]> insertParametersList = new ArrayList<Object[]>();for(AdClicked insertRecord : inserting) {insertParametersList.add(new Object[] {insertRecord.getTimestamp(),insertRecord.getAdID(),insertRecord.getProvince(),insertRecord.getCity(),insertRecord.getClickedCount()});}jdbcWrapper.doBatch("INSERT INTO adclickedcount VALUES(?, ?, ?, ?, ?)", insertParametersList);//表的字段timestamp、ip、userID、adID、province、city、clickedCountList<Object[]> updateParametersList = new ArrayList<Object[]>();for(AdClicked updateRecord : updating) {updateParametersList.add(new Object[] {updateRecord.getClickedCount(),updateRecord.getTimestamp(),updateRecord.getAdID(),updateRecord.getProvince(),updateRecord.getCity()});}jdbcWrapper.doBatch("UPDATE adclickedcount SET clickedCount = ? WHERE"+ " timestamp =? AND adID = ? AND province = ? AND city = ?", updateParametersList);} });return null;} });/ 对广告点击进行TopN计算，计算出每天每个省份Top5排名的广告因为我们直接对RDD进行操作，所以使用了transfomr算子；/updateStateByKeyDSteam.transform(new Function<JavaPairRDD<String,Long>, JavaRDD<Row>>() {public JavaRDD<Row> call(JavaPairRDD<String, Long> rdd) throws Exception {JavaRDD<Row> rowRDD = rdd.mapToPair(new PairFunction<Tuple2<String,Long>, String, Long>() {public Tuple2<String, Long> call(Tuple2<String, Long> t)throws Exception {// TODO Auto-generated method stubString[] splited=t._1.split("_");String timestamp = splited[0]; //YYYY-MM-DDString adID = splited[3];String province = splited[4];String clickedRecord = timestamp + "_" + adID + "_" + province;return new Tuple2<String, Long>(clickedRecord, t._2);} }).reduceByKey(new Function2<Long, Long, Long>() {public Long call(Long v1, Long v2) throws Exception {// TODO Auto-generated method stubreturn v1 + v2;} }).map(new Function<Tuple2<String,Long>, Row>() {public Row call(Tuple2<String, Long> v1) throws Exception {// TODO Auto-generated method stubString[] splited=v1._1.split("_");String timestamp = splited[0]; //YYYY-MM-DDString adID = splited[3];String province = splited[4];return RowFactory.create(timestamp, adID, province, v1._2);} });StructType structType = DataTypes.createStructType(Arrays.asList(DataTypes.createStructField("timestamp", DataTypes.StringType, true),DataTypes.createStructField("adID", DataTypes.StringType, true),DataTypes.createStructField("province", DataTypes.StringType, true),DataTypes.createStructField("clickedCount", DataTypes.LongType, true)));HiveContext hiveContext = new HiveContext(rdd.context());DataFrame df = hiveContext.createDataFrame(rowRDD, structType);df.registerTempTable("topNTableSource");DataFrame result = hiveContext.sql("SELECT timestamp, adID, province, clickedCount, FROM"+ " (SELECT timestamp, adID, province,clickedCount, "+ "ROW_NUMBER() OVER(PARTITION BY province ORDER BY clickeCount DESC) rank "+ "FROM topNTableSource) subquery "+ "WHERE rank <= 5");return result.toJavaRDD();} }).foreachRDD(new Function<JavaRDD<Row>, Void>() {public Void call(JavaRDD<Row> rdd) throws Exception {// TODO Auto-generated method stubrdd.foreachPartition(new VoidFunction<Iterator<Row>>() {public void call(Iterator<Row> t) throws Exception {// TODO Auto-generated method stubList<AdProvinceTopN> adProvinceTopN = new ArrayList<AdProvinceTopN>();while(t.hasNext()) {Row row = t.next();AdProvinceTopN item = new AdProvinceTopN();item.setTimestamp(row.getString(0));item.setAdID(row.getString(1));item.setProvince(row.getString(2));item.setClickedCount(row.getLong(3));adProvinceTopN.add(item);}// final List<AdProvinceTopN> inserting = new ArrayList<AdProvinceTopN>();// final List<AdProvinceTopN> updating = new ArrayList<AdProvinceTopN>();JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();Set<String> set = new HashSet<String>();for(AdProvinceTopN item: adProvinceTopN){set.add(item.getTimestamp() + "_" + item.getProvince());}//表的字段timestamp、adID、province、clickedCountArrayList<Object[]> deleteParametersList = new ArrayList<Object[]>();for(String deleteRecord : set) {String[] splited = deleteRecord.split("_");deleteParametersList.add(new Object[]{splited[0],splited[1]});}jdbcWrapper.doBatch("DELETE FROM adprovincetopn WHERE timestamp = ? AND province = ?", deleteParametersList);//表的字段timestamp、ip、userID、adID、province、city、clickedCountList<Object[]> insertParametersList = new ArrayList<Object[]>();for(AdProvinceTopN insertRecord : adProvinceTopN) {insertParametersList.add(new Object[] {insertRecord.getClickedCount(),insertRecord.getTimestamp(),insertRecord.getAdID(),insertRecord.getProvince()});}jdbcWrapper.doBatch("INSERT INTO adprovincetopn VALUES (?, ?, ?, ?)", insertParametersList);} });return null;} });/ 计算过去半个小时内广告点击的趋势广告点击的基本数据格式：timestamp、ip、userID、adID、province、city/filteredadClickedStreaming.mapToPair(new PairFunction<Tuple2<String,String>, String, Long>() {public Tuple2<String, Long> call(Tuple2<String, String> t)throws Exception {String splited[] = t._2.split("\t");String adID = splited[3];String time = splited[0]; //Todo:后续需要重构代码实现时间戳和分钟的转换提取。此处需要提取出该广告的点击分钟单位return new Tuple2<String, Long>(time + "_" + adID, 1L);} }).reduceByKeyAndWindow(new Function2<Long, Long, Long>() {public Long call(Long v1, Long v2) throws Exception {// TODO Auto-generated method stubreturn v1 + v2;} }, new Function2<Long, Long, Long>() {public Long call(Long v1, Long v2) throws Exception {// TODO Auto-generated method stubreturn v1 - v2;} }, Durations.minutes(30), Durations.milliseconds(5)).foreachRDD(new Function<JavaPairRDD<String,Long>, Void>() {public Void call(JavaPairRDD<String, Long> rdd) throws Exception {// TODO Auto-generated method stubrdd.foreachPartition(new VoidFunction<Iterator<Tuple2<String,Long>>>() {public void call(Iterator<Tuple2<String, Long>> partition)throws Exception {List<AdTrendStat> adTrend = new ArrayList<AdTrendStat>();// TODO Auto-generated method stubwhile(partition.hasNext()) {Tuple2<String, Long> record = partition.next();String[] splited = record._1.split("_");String time = splited[0];String adID = splited[1];Long clickedCount = record._2;/ 在插入数据到数据库的时候具体需要哪些字段？time、adID、clickedCount; 而我们通过J2EE技术进行趋势绘图的时候肯定是需要年、月、日、时、分这个维度的，所以我们在这里需要年月日、小时、分钟这些时间维度；/AdTrendStat adTrendStat = new AdTrendStat();adTrendStat.setAdID(adID);adTrendStat.setClickedCount(clickedCount);adTrendStat.set_date(time); //Todo:获取年月日adTrendStat.set_hour(time); //Todo:获取小时adTrendStat.set_minute(time);//Todo:获取分钟adTrend.add(adTrendStat);}final List<AdTrendStat> inserting = new ArrayList<AdTrendStat>();final List<AdTrendStat> updating = new ArrayList<AdTrendStat>();JDBCWrapper jdbcWrapper = JDBCWrapper.getJDBCInstance();//表的字段timestamp、ip、userID、adID、province、city、clickedCountfor(final AdTrendStat trend : adTrend) {final AdTrendCountHistory adTrendhistory = new AdTrendCountHistory();jdbcWrapper.doQuery("SELECT clickedCount FROM adclickedtrend WHERE"+ " date =? AND hour = ? AND minute = ? AND AdID = ?",new Object[]{trend.get_date(), trend.get_hour(), trend.get_minute(),trend.getAdID()}, new ExecuteCallBack() {public void resultCallBack(ResultSet result) throws Exception {// TODO Auto-generated method stubif(result.next()) {long count = result.getLong(1);adTrendhistory.setClickedCountHistoryLong(count);updating.add(trend);} else { inserting.add(trend);} }});}//表的字段date、hour、minute、adID、clickedCountList<Object[]> insertParametersList = new ArrayList<Object[]>();for(AdTrendStat insertRecord : inserting) {insertParametersList.add(new Object[] {insertRecord.get_date(),insertRecord.get_hour(),insertRecord.get_minute(),insertRecord.getAdID(),insertRecord.getClickedCount()});}jdbcWrapper.doBatch("INSERT INTO adclickedtrend VALUES(?, ?, ?, ?, ?)", insertParametersList);//表的字段date、hour、minute、adID、clickedCountList<Object[]> updateParametersList = new ArrayList<Object[]>();for(AdTrendStat updateRecord : updating) {updateParametersList.add(new Object[] {updateRecord.getClickedCount(),updateRecord.get_date(),updateRecord.get_hour(),updateRecord.get_minute(),updateRecord.getAdID()});}jdbcWrapper.doBatch("UPDATE adclickedtrend SET clickedCount = ? WHERE"+ " date =? AND hour = ? AND minute = ? AND AdID = ?", updateParametersList);} });return null;} });;/ Spark Streaming 执行引擎也就是Driver开始运行，Driver启动的时候是位于一条新的线程中的，当然其内部有消息循环体，用于接收应用程序本身或者Executor中的消息，/javassc.start();javassc.awaitTermination();javassc.close();}private static JavaStreamingContext createContext(String checkpointDirectory, SparkConf conf) {// If you do not see this printed, that means the StreamingContext has been loaded// from the new checkpointSystem.out.println("Creating new context");// Create the context with a 5 second batch sizeJavaStreamingContext ssc = new JavaStreamingContext(conf, Durations.seconds(10));ssc.checkpoint(checkpointDirectory);return ssc;} }class JDBCWrapper {private static JDBCWrapper jdbcInstance = null;private static LinkedBlockingQueue<Connection> dbConnectionPool = new LinkedBlockingQueue<Connection>();static {try {Class.forName("com.mysql.jdbc.Driver");} catch (ClassNotFoundException e) {// TODO Auto-generated catch blocke.printStackTrace();} }public static JDBCWrapper getJDBCInstance() {if(jdbcInstance == null) {synchronized (JDBCWrapper.class) {if(jdbcInstance == null) {jdbcInstance = new JDBCWrapper();} }}return jdbcInstance; }private JDBCWrapper() {for(int i = 0; i < 10; i++){try {Connection conn = DriverManager.getConnection("jdbc:mysql://Master:3306/sparkstreaming","root", "root");dbConnectionPool.put(conn);} catch (Exception e) {// TODO Auto-generated catch blocke.printStackTrace();} } }public synchronized Connection getConnection() {while(0 == dbConnectionPool.size()){try {Thread.sleep(20);} catch (InterruptedException e) {// TODO Auto-generated catch blocke.printStackTrace();} }return dbConnectionPool.poll();}public int[] doBatch(String sqlText, List<Object[]> paramsList){Connection conn = getConnection();PreparedStatement preparedStatement = null;int[] result = null;try {conn.setAutoCommit(false);preparedStatement = conn.prepareStatement(sqlText);for(Object[] parameters: paramsList) {for(int i = 0; i < parameters.length; i++){preparedStatement.setObject(i + 1, parameters[i]);} preparedStatement.addBatch();}result = preparedStatement.executeBatch();conn.commit();} catch (SQLException e) {// TODO Auto-generated catch blocke.printStackTrace();} finally {if(preparedStatement != null) {try {preparedStatement.close();} catch (SQLException e) {// TODO Auto-generated catch blocke.printStackTrace();} }if(conn != null) {try {dbConnectionPool.put(conn);} catch (InterruptedException e) {// TODO Auto-generated catch blocke.printStackTrace();} }}return result; }public void doQuery(String sqlText, Object[] paramsList, ExecuteCallBack callback){Connection conn = getConnection();PreparedStatement preparedStatement = null;ResultSet result = null;try {preparedStatement = conn.prepareStatement(sqlText);for(int i = 0; i < paramsList.length; i++){preparedStatement.setObject(i + 1, paramsList[i]);} result = preparedStatement.executeQuery();try {callback.resultCallBack(result);} catch (Exception e) {// TODO Auto-generated catch blocke.printStackTrace();} } catch (SQLException e) {// TODO Auto-generated catch blocke.printStackTrace();} finally {if(preparedStatement != null) {try {preparedStatement.close();} catch (SQLException e) {// TODO Auto-generated catch blocke.printStackTrace();} }if(conn != null) {try {dbConnectionPool.put(conn);} catch (InterruptedException e) {// TODO Auto-generated catch blocke.printStackTrace();} }} }}interface ExecuteCallBack {void resultCallBack(ResultSet result) throws Exception;}class UserAdClicked {private String timestamp;private String ip;private String userID;private String adID;private String province;private String city;private Long clickedCount;public String getTimestamp() {return timestamp;}public void setTimestamp(String timestamp) {this.timestamp = timestamp;}public String getIp() {return ip;}public void setIp(String ip) {this.ip = ip;}public String getUserID() {return userID;}public void setUserID(String userID) {this.userID = userID;}public String getAdID() {return adID;}public void setAdID(String adID) {this.adID = adID;}public String getProvince() {return province;}public void setProvince(String province) {this.province = province;}public String getCity() {return city;}public void setCity(String city) {this.city = city;}public Long getClickedCount() {return clickedCount;}public void setClickedCount(Long clickedCount) {this.clickedCount = clickedCount;} }class AdClicked {private String timestamp;private String adID;private String province;private String city;private Long clickedCount;public String getTimestamp() {return timestamp;}public void setTimestamp(String timestamp) {this.timestamp = timestamp;}public String getAdID() {return adID;}public void setAdID(String adID) {this.adID = adID;}public String getProvince() {return province;}public void setProvince(String province) {this.province = province;}public String getCity() {return city;}public void setCity(String city) {this.city = city;}public Long getClickedCount() {return clickedCount;}public void setClickedCount(Long clickedCount) {this.clickedCount = clickedCount;} }class AdProvinceTopN {private String timestamp;private String adID;private String province;private Long clickedCount;public String getTimestamp() {return timestamp;}public void setTimestamp(String timestamp) {this.timestamp = timestamp;}public String getAdID() {return adID;}public void setAdID(String adID) {this.adID = adID;}public String getProvince() {return province;}public void setProvince(String province) {this.province = province;}public Long getClickedCount() {return clickedCount;}public void setClickedCount(Long clickedCount) {this.clickedCount = clickedCount;} }class AdTrendStat {private String _date;private String _hour;private String _minute;private String adID;private Long clickedCount;public String get_date() {return _date;}public void set_date(String _date) {this._date = _date;}public String get_hour() {return _hour;}public void set_hour(String _hour) {this._hour = _hour;}public String get_minute() {return _minute;}public void set_minute(String _minute) {this._minute = _minute;}public String getAdID() {return adID;}public void setAdID(String adID) {this.adID = adID;}public Long getClickedCount() {return clickedCount;}public void setClickedCount(Long clickedCount) {this.clickedCount = clickedCount;} }class AdTrendCountHistory{private Long clickedCountHistoryLong;public Long getClickedCountHistoryLong() {return clickedCountHistoryLong;}public void setClickedCountHistoryLong(Long clickedCountHistoryLong) {this.clickedCountHistoryLong = clickedCountHistoryLong;} } 本篇文章为转载内容。原文链接：https://blog.csdn.net/tom_8899_li/article/details/71194434。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-02-14 19:16:35

297

转载

MySQL

怎样将mysql数据导入mysql

在进行MySQL数据迁移或导入导出操作时，除了上述基本步骤外，了解一些进阶技巧和最新动态将有助于提升工作效率和确保数据安全。近期，MySQL 8.0版本推出了一系列改进，例如增强的并行复制功能，能够显著加快大规模数据迁移的速度。同时，MySQL团队也优化了mysqldump工具，支持更多参数选项以适应不同场景需求，如--single-transaction参数可在保证数据一致性的同时进行在线备份。此外，在处理敏感信息时，MySQL企业版提供了加密功能，可以对导出的数据文件进行加密处理，保障数据在传输过程中的安全性。而对于数据库表结构复杂、数据量庞大的情况，采用分批次导入或者利用中间过渡表的方式可有效避免内存溢出等问题。值得注意的是，随着云服务的普及，许多云服务商（如AWS RDS、阿里云RDS等）提供了便捷的数据迁移服务，用户可以直接通过控制台界面完成MySQL数据库之间的迁移任务，极大简化了操作流程，并具备良好的容灾备份能力。深入解读方面，对于那些需要频繁进行数据库同步的企业来说，熟悉并掌握Percona Toolkit、pt-online-schema-change等第三方工具也是必不可少的，它们能够在不影响业务的情况下实现在线修改表结构和数据迁移。综上所述，MySQL数据导入导出是一个涉及广泛且不断演进的话题，结合最新技术发展与最佳实践，不仅可以提高日常运维效率，还能更好地应对各类复杂的数据库管理挑战。

2023-02-12 10:44:09

数据库专家

MySQL

怎样用mysql打开文件

在深入了解MySQL打开文件的功能和操作后，进一步探索数据库与文件系统的交互实践以及最新的安全策略显得尤为重要。近日，随着数据隐私保护法规的不断强化，如欧盟的GDPR，企业在进行大量数据导入导出时必须更加注重数据的安全性和合规性。MySQL 8.0版本对LOAD DATA INFILE和SELECT INTO OUTFILE命令的安全选项进行了增强，用户可精细控制文件访问权限并支持SSL加密传输，有效防止数据在传输过程中的泄露风险。此外，针对大数据场景下的批量数据处理效率问题，MySQL也提供了优化策略。例如，通过合理设置FIELDS TERMINATED BY、LINES TERMINATED BY等参数，可以显著提升大规模CSV或TXT文件的导入速度。同时，结合使用索引、预处理脚本等方式，能在保证数据完整性的前提下，大大缩短数据加载时间。深入研究MySQL文档，会发现其对文件格式的支持也在不断拓展。除了传统的文本文件外，还支持JSON、XML等多种数据格式的读写功能，为复杂的数据交换和存储需求提供了更多可能。因此，在实际应用中，掌握MySQL与文件系统交互的最新技术和最佳实践，对于提高网站运营效能、保障数据安全具有深远意义。

2023-01-09 12:22:04

139

逻辑鬼才

Java

java中的p和v

...如何在生产者消费者、数据库连接池等常见场景中合理运用Semaphore进行线程同步控制，从而避免死锁并优化系统性能。此外，对于更复杂的同步问题，读者还可以进一步了解和研究其他Java并发工具类，例如ReentrantLock、CountDownLatch、CyclicBarrier等。这些工具通过灵活的设计和API，能够更好地适应不同场景下的同步需求，并帮助开发者编写出更加健壮、高效的多线程程序。同时，值得注意的是，虽然诸如Semaphore这样的工具能有效解决同步问题，但过度依赖或不恰当使用也可能导致新的问题产生。因此，在实际开发过程中，理解并发编程的本质，遵循“最小权限原则”来设计线程间的交互，始终是提高程序并发能力的关键所在。在最新的Java版本更新中，也不断有针对并发特性的改进和完善，持续关注并跟进学习最新技术动态，将有助于开发者更好地应对高并发环境下的挑战。

2023-07-08 19:38:20

352

键盘勇士

MySQL

怎么看mysql基础表

MySQL 是一款普遍的关联型DBMS，我们可以通过一些基础操作来看 MySQL 中的表格基本信息。首先，我们需要登陆到 MySQL 数据库中。下面是用命令行方式登陆 MySQL 的示例脚本： mysql -h host -u user -p 其中， host 表示 MySQL 数据库服务器 IP 地址或服务器名称， user 是接入 MySQL 数据库所使用的账户名， -p 是要求输入口令，用于校验登陆。接着，我们可以查看 MySQL 中当前所有的数据库，使用的命令为： SHOW DATABASES; 然后，我们需要选择一个数据库进行操作，使用的命令为： USE database; 其中， database 表示需要操作的数据库名称。现在，我们已经成功进入到了 MySQL 数据库中，可以看到库中的表格基本信息，使用命令如下： SHOW TABLES; 执行该命令后，MySQL 将会显示该库中所有的表名称。最后，我们可以查看特定表中的所有信息，使用的命令如下： DESCRIBE table; 其中， table 表示需要查看的表名称。通过上述基础操作，我们可以轻松地了解 MySQL 数据库中的基础表信息。

2023-08-18 09:15:20

算法侠

HTML

个人博客纯html代码

...来构建博客。它们基于数据库驱动，拥有丰富的主题模板和插件生态系统，使不具备专业编程技能的博主也能轻松管理内容和设计样式。同时，随着Web技术的发展，响应式设计和无障碍访问已成为现代网页的标准配置。在创建个人博客时，确保你的HTML结构遵循语义化原则，配合CSS Flexbox或Grid布局，以及恰当运用ARIA属性提升辅助技术用户的体验，也是不容忽视的重要环节。总之，在掌握了基础HTML编码后，持续关注并学习Web开发领域的最新趋势和技术，将有助于我们打造更专业、更具吸引力的个人博客空间。

2023-04-28 09:03:31

417

电脑达人

MySQL

想mysql中插入数据语句

何为MySQL？ MySQL是一种关系型DBMS，通常用来构建网络应用。与其他关系型DBMS不同，MySQL在在使用过程中可以选择开源免费或者商业授权版本。何为插入记录命令？插入记录命令是用来将数据插入MySQL数据库表格内的命令。使用这个命令，可以在MySQL数据库表格内创建一个新增行，这个记录可以包含一行或者多行数据。 MySQL中插入记录命令的格式以下是MySQL中插入记录命令的基础格式： INSERT 进入 table_name (column1, column2, column3,...columnN)VALUES (value1, value2, value3,...valueN); 其中，table_name是要插入数据的数据库表的名称，column1, column2,...是要插入的字段名，value1, value2,...是要插入到相应数据字段中的数据。 MySQL中插入记录命令的例子以下是一个MySQL中插入记录命令的示例，将新的客户记录插入到名为“customers”的数据库表格内： INSERT 进入 customers (customer_name, contact_name, country)VALUES ('John Doe', 'Jane Smith', 'USA'); 使用这个语句，可以将客户姓名为“John Doe”，联系人为“Jane Smith”，国家为“USA”的数据插入到名为“customers”的数据表格内。总结 MySQL中插入记录命令是一个非常有用的工具，在构建网络应用时经常需要使用到。熟练掌握它的格式和使用方法，可以帮助构建人员更高效地管理和使用MySQL数据库。

2023-09-26 10:25:10

编程狂人

知识学习

实践的时候请根据实际情况谨慎操作。

随机学习一条linux命令：

hostnamectl - 查看和修改系统主机名及相关配置。