如何更新Hessian服务端后保证客户端与新版本服务的无缝对接？在分布式系统开发中，HessianRPC作为一种轻量级、高效的远程调用协议，广泛应用于跨语言的服务通信。在实际做项目，特别是迭代的时候，服务端接口更新优化什么的，简直就是家常便饭。这样一来，就牵扯出一个大问题：当咱们把Hessian服务端改头换面升级之后，怎么才能确保客户端能跟这个新版本的服务端无缝衔接、配合得溜溜的呢？这篇文咱就打算把这个事儿掰开了揉碎了讲讲，并且还会附上一些实实在在的实例代码，让大家一看就懂，一用就会。 1. 版本控制策略首先，为了保证服务端更新时对客户端的影响降到最低，我们需要建立一套严格的版本控制策略。在设计Hessian服务接口的时候，我们可以像给小宝贝添加成长标签一样，为每个接口或者整个服务设置一个版本号。这样，当服务端内部有了什么新变化、更新迭代时，就像孩子长大了一岁，我们就通过升级这个版本号来区分新旧接口。而客户端呢，就像个聪明的玩家，会根据自己手里的“说明书”（支持的版本）去选择调用哪个合适的接口。 java // 定义带有版本号的Hessian服务接口 public interface MyService { // v1版本的接口 String oldMethod(int arg) throws RemoteException; // v2版本的接口，增加了新的参数 String newMethod(int arg, String newParam) throws RemoteException; } 2. 向后兼容性设计当服务端新增接口或修改已有接口时，应尽可能保持向后兼容性，避免破坏现有客户端调用。比如，当你添加新的参数时，可以给它预先设定一个默认值。而如果你想删掉或者修改某个参数，只要不影响业务正常运作的那个“筋骨”，就可以保留原来的接口，让老版本的客户端继续舒舒服服地用着，不用着急升级换代。 java // 新版本接口考虑向后兼容 public String newMethod(int arg, String newParam = "default_value") { //... } 3. 双重部署和灰度发布在实际更新过程中，我们可以通过双重部署及灰度发布的方式来平滑过渡。先部署新版本服务，并让部分用户或流量切换至新版本进行验证测试，确认无误后再逐步扩大范围直至全量替换。 4. 客户端适配升级对于客户端来说，应对服务端接口变化的主要方式是对自身进行相应的更新和适配： - 动态加载服务接口：客户端可以通过动态加载机制，根据服务端返回的版本信息加载对应的接口实现类，从而实现自动适配新版本服务。 java // 动态加载示例（伪代码） String serviceUrl = "http://server:port/myService"; HessianProxyFactory factory = new HessianProxyFactory(); MyService myService; try { // 获取服务端版本信息 VersionInfo versionInfo = getVersionFromServer(serviceUrl); // 根据版本创建代理对象 if (versionInfo.isV1()) { myService = (MyService) factory.create(MyService.class, serviceUrl + "?version=v1"); } else if (versionInfo.isV2()) { myService = (MyService) factory.create(MyService.class, serviceUrl + "?version=v2"); } } catch (Exception e) { // 错误处理 } // 调用对应版本的方法 String result = myService.newMethod(1, "newParam"); - 客户端版本迭代：对于无法通过兼容性设计解决的重大变更，客户端也需要同步更新以适应新接口。这时候，咱们得好好策划一个详尽的升级计划和方案出来，并且要赶紧给所有客户端开发的大哥们发个消息，让他们麻溜地进行更新工作。总结起来，要保证Hessian服务端更新后与客户端的无缝对接，关键在于合理的设计和服务管理策略，包括但不限于版本控制、接口向后兼容性设计、双重部署及灰度发布以及客户端的灵活适配升级。在整个过程中，不断沟通、思考和实践，才能确保每一次迭代都平稳顺利地完成。

2023-10-30 17:17:18

495

翡翠梦境

转载文章

[转载]微服务[学成在线] day15：媒资管理系统集成

...，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。 😎 知识点概览为了方便后续回顾该项目时能够清晰的知道本章节讲了哪些内容，并且能够从该章节的笔记中得到一些帮助，所以在完成本章节的学习后在此对本章节所涉及到的知识点进行总结概述。本章节为【学成在线】项目的 day15 的内容根据课程ID 搜索该课程已发布的课程信息，并返回该课程的所有课程计划信息。将指定课程发布时所的课程计划的媒资信息保存到 teachplan_media_publish 表中，根据课程计划id 搜索该课程计划所对应的媒资信息，需要用到的是该课程计划对应的 m3u8 地址，用于在线播放视频，该接口在课程管理服务中开发，供学习服务进行远程调用。在学习服务中远程调用课程计划媒资信息查询接口，获取该课程计划的视频播放的 m3u8 url地址，并返回给前端，前端使用该 url 进行视频的在线播放。在线学习完整的测试流程：媒资信息的上传、选择、发布到前端门户、搜索门户测试，在线学习的播放视频。目录内容会比较多，小伙伴门可以根据目录进行按需查阅。文章目录 😎 知识点概览目录一、学习页面：查询课程计划 0x01 需求分析 0x02 Api接口 0x03 服务端开发 Controller Service 测试 0x04 前端开发配置NGINX虚拟主机前端 API 方法前端 API 方法调用测试二、学习页面：获取视频播放地址 0x01 需求分析 0x02 课程发布：储存媒资信息需求分析数据模型 Dao Service 测试 0x03 Logstash：扫描课程计划媒资创建索引创建模板文件配置 mysql.conf 启动 logstash.bat Logstash多实例运行 0x04 搜素服务：查询课程媒资接口需求分析 Api接口定义 Service Controller 测试三、在线学习：接口开发 0x01 需求分析 0x02 搭建开发环境 0x03 Api接口 0x04 服务端开发需求分析搜索服务注册Eureka 搜索服务客户端自定义错误代码 Service Controller 测试 0x05 前端开发需求分析 api方法配置代理视频播放页面简单的测试完整的测试 1、上传文件一些问题 ~~方案1：删除本地分块文件重新尝试上传~~ 方案2：检查前端提交的MD5值是否正确 2、为课程计划选择媒资信息 3、前端门户测试四、待完善的一些功能 😁 认识作者一、学习页面：查询课程计划 0x01 需求分析到目前为止，我们已可以编辑课程计划信息并上传课程视频，下一步我们要实现在线学习页面动态读取章节对应的视频并进行播放。在线学习页面所需要的信息有两类：课程计划信息课程学习信息（视频地址、学习进度等）如下图：在线学习集成媒资管理的需求如下： 1、在线学习页面显示课程计划 2、点击课程计划播放该课程计划对应的视频本章节实现学习页面动态显示课程计划，进入不同课程的学习页面右侧动态显示当前课程的课程计划。 0x02 Api接口课程计划信息从哪里获取？在课程发布完成后会自动发布到一个 course_pub 的表中，logstash 会自动将课程发布后的信息自动采集到 ES 索引库中，这些信息也包含课程计划信息。所以考虑性能要求，课程发布后对课程的查询统一从 ES 索引库中查询。前端通过请求搜索服务获取课程信息，需要单独在搜索服务中定义课程信息查询接口。本接口接收课程id，查询课程所有信息返回给前端。我们在搜素服务 API 下添加以下方法 @ApiOperation("根据id搜索课程发布信息")public Map<String,CoursePub> getdetail(String id); 返回的课程信息为 json 结构：key 为课程id，value 为课程内容。 0x03 服务端开发在搜索服务中开发查询课程信息接口。 Controller 在搜素服务下添加以下方法 / 根据id搜索课程发布信息 @param id 课程id @return JSON数据/@Override@GetMapping("/getdetail/{id}")public Map<String, CoursePub> getdetail(@PathVariable("id")String id) {return esCourseService.getdetail(id);} Service / 根据id搜索课程发布信息 @param id 课程id @return JSON数据/public Map<String, CoursePub> getdetail(String id) {//设置索引SearchRequest searchRequest = new SearchRequest(es_index);//设置类型searchRequest.types(es_type);//创建搜索源对象SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();//设置查询条件,根据id进行查询searchSourceBuilder.query(QueryBuilders.termQuery("id",id));//这里不使用source的原字段过滤,查询所有字段// searchSourceBuilder.fetchSource(new String[]{"name", "grade", "charge","pic"}, newString[]{});//设置搜索源对象searchRequest.source(searchSourceBuilder);//执行搜索SearchResponse searchResponse = null;try {searchResponse = restHighLevelClient.search(searchRequest);} catch (IOException e) {e.printStackTrace();}//获取搜索结果SearchHits hits = searchResponse.getHits();SearchHit[] searchHits = hits.getHits(); //获取最优结果Map<String,CoursePub> map = new HashMap<>();for (SearchHit hit: searchHits) {//从搜索结果中取值并添加到coursePub对象Map<String, Object> sourceAsMap = hit.getSourceAsMap();String courseId = (String) sourceAsMap.get("id");String name = (String) sourceAsMap.get("name");String grade = (String) sourceAsMap.get("grade");String charge = (String) sourceAsMap.get("charge");String pic = (String) sourceAsMap.get("pic");String description = (String) sourceAsMap.get("description");String teachplan = (String) sourceAsMap.get("teachplan");CoursePub coursePub = new CoursePub();coursePub.setId(courseId);coursePub.setName(name);coursePub.setPic(pic);coursePub.setGrade(grade);coursePub.setTeachplan(teachplan);coursePub.setDescription(description);//设置map对象map.put(courseId,coursePub);}return map;} 测试使用 swagger-ui 或 postman 测试查询课程信息接口。 0x04 前端开发配置NGINX虚拟主机学习中心的二级域名为 ucenter.xuecheng.com ，我们在 nginx 中配置 ucenter 虚拟主机。学成网用户中心server {listen 80;server_name ucenter.xuecheng.com;个人中心location / {proxy_pass http://ucenter_server_pool;} } 前端ucenterupstream ucenter_server_pool{server 127.0.0.1:7081 weight=10;server 127.0.0.1:13000 weight=10;} 在学习中心要调用搜索的 API，使用 Nginx 解决代理，如下图：在 ucenter 虚拟主机下配置搜索 Api 代理路径后台搜索（公开api）upstream search_server_pool{server 127.0.0.1:40100 weight=10;} 学成网用户中心server {listen 80;server_name ucenter.xuecheng.com;个人中心location / {proxy_pass http://ucenter_server_pool;}后端搜索服务location /openapi/search/ {proxy_pass http://search_server_pool/search/;} } 前端 API 方法在学习中心 xc-ui-pc-leanring 对课程信息的查询属于基础常用功能，所以我们将课程查询的 api 方法定义在base 模块下，如下图：在system.js 中定义课程查询方法： import http from './public'export const course_view = id => {return http.requestGet('/openapi/search/course/getdetail/'+id);} 前端 API 方法调用在 learning_video.vue 页面中调用课程信息查询接口得到课程计划，将课程计划json 串转成对象。 xc-ui-pc-leanring/src/module/course/page/learning_video.vue 1、定义视图课程计划 <div class="navCont"><div class="course-weeklist"><div class="nav nav-stacked" v-for="(teachplan_first, index) in teachplanList"><div class="tit nav-justified text-center"><i class="pull-left glyphicon glyphicon-th-list"></i>{ {teachplan_first.pname} }<i class="pull-right"></i></div><li v-if="teachplan_first.children!=null" v-for="(teachplan_second, index) in teachplan_first.children"><i class="glyphicon glyphicon-check"></i><a :href="url" @click="study(teachplan_second.id)">{ {teachplan_second.pname} }</a></li></div></div></div> 课程名称 <div class="top text-center">{ {coursename} }</div> 定义数据对象 data() {return {url:'',//当前urlcourseId:'',//课程idchapter:'',//章节Idcoursename:'',//课程名称coursepic:'',//课程图片teachplanList:[],//课程计划playerOptions: {//播放参数autoplay: false,controls: true,sources: [{type: "application/x-mpegURL",src: ''}]},} } 在 created 钩子方法中获取课程信息 created(){//当前请求的urlthis.url = window.location//课程idthis.courseId = this.$route.params.courseId//章节idthis.chapter = this.$route.params.chapter//查询课程信息systemApi.course_view(this.courseId).then((view_course)=>{if(!view_course || !view_course[this.courseId]){this.$message.error("获取课程信息失败，请重新进入此页面！")return ;} let courseInfo = view_course[this.courseId]console.log(courseInfo)this.coursename = courseInfo.nameif(courseInfo.teachplan){let teachplan = JSON.parse(courseInfo.teachplan);this.teachplanList = teachplan.children;} })}, 测试在浏览器请求：http://ucenter.xuecheng.com//learning/4028e581617f945f01617f9dabc40000/0 4028e581617f945f01617f9dabc40000：第一个参数为课程 id，测试时从 ES索引库找一个课程 id 0：第二个参数为课程计划 id，此参数用于点击课程计划播放视频。如果出现跨域问题，但是确定已经配置了跨域，请尝试结束所以 nginx.exe 的进程和清空浏览器缓存。如果还没有解决？重启电脑试试。二、学习页面：获取视频播放地址 0x01 需求分析用户进入在线学习页面，点击课程计划将播放该课程计划对应的教学视频。业务流程如下：业务流程说明： 1、用户进入在线学习页面，页面请求搜索服务获取课程信息（包括课程计划信息）并且在页面展示。 2、在线学习请求学习服务获取视频播放地址。 3、学习服务校验当前用户是否有权限学习，如果没有权限学习则提示用户。 4、学习服务校验通过，请求搜索服务获取课程媒资信息。 5、搜索服务请求ElasticSearch获取课程媒资信息。为什么要请求 ElasticSearch 查询课程媒资信息？出于性能的考虑，公开查询课程信息从搜索服务查询，分摊 mysql 数据库的访问压力。什么时候将课程媒资信息存储到 ElasticSearch 中？课程媒资信息是在课程发布的时候存入 ElasticSearch，因为课程发布后课程信息将基本不再修改。 0x02 课程发布：储存媒资信息需求分析课程媒资信息是在课程发布的时候存入 ElasticSearch 索引库，因为课程发布后课程信息将基本不再修改，具体的业务流程如下。 1、课程发布，向课程媒资信息表写入数据。 1）根据课程 id 删除 teachplanMediaPub 中的数据 2）根据课程 id 查询 teachplanMedia 数据 3）将查询到的 teachplanMedia 数据插入到 teachplanMediaPub 中 2、Logstash 定时扫描课程媒资信息表，并将课程媒资信息写入索引库。数据模型在 xc_course 数据库创建课程计划媒资发布表： CREATE TABLE teachplan_media_pub (teachplan_id varchar(32) NOT NULL COMMENT '课程计划id',media_id varchar(32) NOT NULL COMMENT '媒资文件id',media_fileoriginalname varchar(128) NOT NULL COMMENT '媒资文件的原始名称',media_url varchar(256) NOT NULL COMMENT '媒资文件访问地址',courseid varchar(32) NOT NULL COMMENT '课程Id',timestamp timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT'logstash使用',PRIMARY KEY (teachplan_id)) ENGINE=InnoDB DEFAULT CHARSET=utf8 数据模型类如下： package com.xuecheng.framework.domain.course;import lombok.Data;import lombok.ToString;import org.hibernate.annotations.GenericGenerator;import javax.persistence.;import java.io.Serializable;import java.util.Date;@Data@ToString@Entity@Table(name="teachplan_media_pub")@GenericGenerator(name = "jpa-assigned", strategy = "assigned")public class TeachplanMediaPub implements Serializable {private static final long serialVersionUID = -916357110051689485L;@Id@GeneratedValue(generator = "jpa-assigned")@Column(name="teachplan_id")private String teachplanId;@Column(name="media_id")private String mediaId;@Column(name="media_fileoriginalname")private String mediaFileOriginalName;@Column(name="media_url")private String mediaUrl;@Column(name="courseid")private String courseId;@Column(name="timestamp")private Date timestamp;//时间戳} Dao 创建 TeachplanMediaPub 表的 Dao，向 TeachplanMediaPub 存储信息采用先删除该课程的媒资信息，再添加该课程的媒资信息，所以这里定义根据课程 id 删除课程计划媒资方法： public interface TeachplanMediaPubRepository extends JpaRepository<TeachplanMediaPub, String> {//根据课程id删除课程计划媒资信息long deleteByCourseId(String courseId);} 从TeachplanMedia查询课程计划媒资信息 //从TeachplanMedia查询课程计划媒资信息public interface TeachplanMediaRepository extends JpaRepository<TeachplanMedia, String> {List<TeachplanMedia> findByCourseId(String courseId);} Service 编写保存课程计划媒资信息方法，并在课程发布时调用此方法。 1、保存课程计划媒资信息方法本方法采用先删除该课程的媒资信息，再添加该课程的媒资信息，在 CourseService 下定义该方法 //保存课程计划媒资信息private void saveTeachplanMediaPub(String courseId){//查询课程媒资信息List<TeachplanMedia> byCourseId = teachplanMediaRepository.findByCourseId(courseId);if(byCourseId == null) return; //没有查询到媒资数据则直接结束该方法//将课程计划媒资信息储存到待索引表//删除原有的索引信息teachplanMediaPubRepository.deleteByCourseId(courseId);//一个课程可能会有多个媒资信息,遍历并使用list进行储存List<TeachplanMediaPub> teachplanMediaPubList = new ArrayList<>();for (TeachplanMedia teachplanMedia: byCourseId) {TeachplanMediaPub teachplanMediaPub = new TeachplanMediaPub();BeanUtils.copyProperties(teachplanMedia, teachplanMediaPub);teachplanMediaPubList.add(teachplanMediaPub);}//保存所有信息teachplanMediaPubRepository.saveAll(teachplanMediaPubList);} 2、课程发布时调用此方法修改课程发布的 coursePublish 方法： ....//保存课程计划媒资信息到待索引表saveTeachplanMediaPub(courseId);//页面urlString pageUrl = cmsPostPageResult.getPageUrl();return new CoursePublishResult(CommonCode.SUCCESS,pageUrl);..... 测试测试课程发布后是否成功将课程媒资信息存储到 teachplan_media_pub 中，测试流程如下： 1、指定一个课程 2、为课程计划添加课程媒资 3、执行课程发布 4、观察课程计划媒资信息是否存储至 teachplan_media_pub 中注意：由于此测试仅用于测试发布课程计划媒资信息的功能，可暂时将 cms页面发布的功能暂时屏蔽，提高测试效率。测试结果如下 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Vrzs5589-1595567273126)(https://qnoss.codeyee.com/20200704_15/image7)] 0x03 Logstash：扫描课程计划媒资 Logstash 定时扫描课程媒资信息表，并将课程媒资信息写入索引库。创建索引 1、创建 xc_course_media 索引 2、并向此索引创建如下映射 POST: http://localhost:9200/xc_course_media/doc/_mapping {"properties" : {"courseid" : {"type" : "keyword"},"teachplan_id" : {"type" : "keyword"},"media_id" : {"type" : "keyword"},"media_url" : {"index" : false,"type" : "text"},"media_fileoriginalname" : {"index" : false,"type" : "text"} }} 索引创建成功创建模板文件在 logstach 的 config 目录文件 xc_course_media_template.json 文件路径为 %ES_ROOT_DIR%/logstash6.8.8/config/xc_course_media_template.json %ES_ROOT_DIR% 为 ElasticSearch 和 logstash 的安装目录内容如下： {"mappings" : {"doc" : {"properties" : {"courseid" : {"type" : "keyword"},"teachplan_id" : {"type" : "keyword"},"media_id" : {"type" : "keyword"},"media_url" : {"index" : false,"type" : "text"},"media_fileoriginalname" : {"index" : false,"type" : "text"} }},"template" : "xc_course_media"} } 配置 mysql.conf 在logstash的 config 目录下配置 mysql_course_media.conf 文件供 logstash 使用，logstash 会根据 mysql_course_media.conf 文件的配置的地址从 MySQL 中读取数据向 ES 中写入索引。参考https://www.elastic.co/guide/en/logstash/current/plugins-inputs-jdbc.html 配置输入数据源和输出数据源。 input {stdin {} jdbc {jdbc_connection_string => "jdbc:mysql://localhost:3306/xc_course?useUnicode=true&characterEncoding=utf-8&useSSL=true&serverTimezone=UTC" 数据库信息jdbc_user => "root"jdbc_password => "123123" MYSQL 驱动地址,修改为maven仓库对应的位置jdbc_driver_library => "D:/soft/apache-maven-3.5.4/repository/mysql/mysql-connector-java/5.1.40/mysql-connector-java-5.1.40.jar" the name of the driver class for mysqljdbc_driver_class => "com.mysql.jdbc.Driver"jdbc_paging_enabled => "true"jdbc_page_size => "50000"要执行的sql文件statement_filepath => "/conf/course.sql"statement => "select from teachplan_media_pub where timestamp > date_add(:sql_last_value,INTERVAL 8 HOUR)"定时配置schedule => " "record_last_run => truelast_run_metadata_path => "D:/soft/elasticsearch/logstash-6.8.8/config/xc_course_media_metadata"} } output {elasticsearch {ES的ip地址和端口hosts => "localhost:9200"hosts => ["localhost:9200","localhost:9202","localhost:9203"]ES索引库名称index => "xc_course_media"document_id => "%{teachplan_id}"document_type => "doc"template => "D:/soft/elasticsearch/logstash-6.8.8/config/xc_course_media_template.json"template_name =>"xc_course_media"template_overwrite =>"true"} stdout {日志输出codec => json_lines} } 启动 logstash.bat 启动 logstash.bat 采集 teachplan_media_pub 中的数据，向 ES 写入索引。 logstash.bat -f ../config/mysql_course_media.conf 课程发布成功后，Logstash 会自动参加 teachplan_media_pub 表中新增的数据，效果如下 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ILPBxfXi-1595567273134)(https://qnoss.codeyee.com/20200704_15/image10)] Logstash多实例运行由于之前我们还启动了一个 Logstash 对课程的发布信息进行采集，所以如果想两个 logstash 实例同时运行，因为每个实例都有一个.lock文件，所以不能使用同一个目录来存放数据，所以我们需要使用 --path.data= 为每个实例指定单独的数据目录，具体的代码如下：该配置是在windows下进行的课程发布实例 logstash_start_course_pub.bat @title logstash in course_publogstash.bat -f ..\config\mysql.conf --path.data=../data/course_pub 课程计划媒体发布实例 logstash_start_teachplan_media.bat @title logstash i n teachplan_media_publogstash.bat -f ../config/mysql_course_media.conf --path.data=../data/teachplan_media/ 同时运行效果如下 0x04 搜素服务：查询课程媒资接口需求分析搜索服务提供查询课程媒资接口，此接口供学习服务调用。 Api接口定义 @ApiOperation("根据课程计划查询媒资信息")public TeachplanMediaPub getmedia(String teachplanId); Service 1、配置课程计划媒资索引库等信息在 application.yml 中配置 xuecheng:elasticsearch:hostlist: ${eshostlist:127.0.0.1:9200} 多个结点中间用逗号分隔course:index: xc_coursetype: docsource_field: id,name,grade,mt,st,charge,valid,pic,qq,price,price_old,status,studymodel,teachmode,expires,pub_time,start_time,end_timemedia:index: xc_course_mediatype: docsource_field: courseid,media_id,media_url,teachplan_id,media_fileoriginalname 2、service 方法开发在课程搜索服务中定义课程媒资查询接口，为了适应后续需求，service 参数定义为数组，可一次查询多个课程计划的媒资信息。 / 根据一个或者多个课程计划id查询媒资信息 @param teachplanIds 课程id @return QueryResponseResult/public QueryResponseResult<TeachplanMediaPub> getmedia(String [] teachplanIds){//设置索引SearchRequest searchRequest = new SearchRequest(media_index);//设置类型searchRequest.types(media_type);//创建搜索源对象SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();//源字段过滤String[] media_index_arr = media_field.split(",");searchSourceBuilder.fetchSource(media_index_arr, new String[]{});//查询条件,根据课程计划id查询(可以传入多个课程计划id)searchSourceBuilder.query(QueryBuilders.termsQuery("teachplan_id", teachplanIds));searchRequest.source(searchSourceBuilder);SearchResponse searchResponse = null;try {searchResponse = restHighLevelClient.search(searchRequest);} catch (IOException e) {e.printStackTrace();}//获取结果SearchHits hits = searchResponse.getHits();long totalHits = hits.getTotalHits();SearchHit[] searchHits = hits.getHits();//数据列表List<TeachplanMediaPub> teachplanMediaPubList = new ArrayList<>();for(SearchHit hit:searchHits){TeachplanMediaPub teachplanMediaPub =new TeachplanMediaPub();Map<String, Object> sourceAsMap = hit.getSourceAsMap();//取出课程计划媒资信息String courseid = (String) sourceAsMap.get("courseid");String media_id = (String) sourceAsMap.get("media_id");String media_url = (String) sourceAsMap.get("media_url");String teachplan_id = (String) sourceAsMap.get("teachplan_id");String media_fileoriginalname = (String) sourceAsMap.get("media_fileoriginalname");teachplanMediaPub.setCourseId(courseid);teachplanMediaPub.setMediaUrl(media_url);teachplanMediaPub.setMediaFileOriginalName(media_fileoriginalname);teachplanMediaPub.setMediaId(media_id);teachplanMediaPub.setTeachplanId(teachplan_id);//将对象加入到列表中teachplanMediaPubList.add(teachplanMediaPub);}//构建返回课程媒资信息对象QueryResult<TeachplanMediaPub> queryResult = new QueryResult<>();queryResult.setList(teachplanMediaPubList);queryResult.setTotal(totalHits);return new QueryResponseResult<TeachplanMediaPub>(CommonCode.SUCCESS,queryResult);} Controller / 根据课程计划id搜索发布后的媒资信息 @param teachplanId @return/@GetMapping(value="/getmedia/{teachplanId}")@Overridepublic TeachplanMediaPub getmedia(@PathVariable("teachplanId") String teachplanId) {//为了service的拓展性,所以我们service接收的是数组作为参数,以便后续开发查询多个ID的接口String[] teachplanIds = new String[]{teachplanId};//通过service查询ES获取课程媒资信息QueryResponseResult<TeachplanMediaPub> mediaPubQueryResponseResult = esCourseService.getmedia(teachplanIds);QueryResult<TeachplanMediaPub> queryResult = mediaPubQueryResponseResult.getQueryResult();if(queryResult!=null&& queryResult.getList()!=null&& queryResult.getList().size()>0){//返回课程计划对应课程媒资return queryResult.getList().get(0);} return new TeachplanMediaPub();} 测试使用 swagger-ui 和 postman 测试课程媒资查询接口。三、在线学习：接口开发 0x01 需求分析根据下边的业务流程，本章节完成前端学习页面请求学习服务获取课程视频地址，并自动播放视频。 0x02 搭建开发环境 1、创建数据库创建 xc_learning 数据库，学习数据库将记录学生的选课信息、学习信息。导入：资料/xc_learning.sql 2、创建学习服务工程参考课程管理服务工程结构，创建学习服务工程：导入：资料/xc-service-learning.zip 项目工程结构如下 0x03 Api接口此 api 接口是课程学习页面请求学习服务获取课程学习地址。定义返回值类型： package com.xuecheng.framework.domain.learning.response;import com.xuecheng.framework.model.response.ResponseResult;import com.xuecheng.framework.model.response.ResultCode;import lombok.Data;import lombok.NoArgsConstructor;import lombok.ToString;@Data@ToString@NoArgsConstructorpublic class GetMediaResult extends ResponseResult {public GetMediaResult(ResultCode resultCode, String fileUrl) {super(resultCode);this.fileUrl = fileUrl;}//媒资文件播放地址private String fileUrl;} 定义接口，学习服务根据传入课程 ID、章节 Id(课程计划 ID)来取学习地址。 @Api(value = "录播课程学习管理",description = "录播课程学习管理")public interface CourseLearningControllerApi {@ApiOperation("获取课程学习地址")public GetMediaResult getMediaPlayUrl(String courseId,String teachplanId);} 0x04 服务端开发需求分析学习服务根据传入课程ID、章节Id(课程计划ID)请求搜索服务获取学习地址。搜索服务注册Eureka 学习服务要调用搜索服务查询课程媒资信息，所以需要将搜索服务注册到 eureka 中。 1、查看服务名称是否为 xc-service-search 注意修改application.xml中的服务名称：spring:application:name: xc‐service‐search 2、配置搜索服务的配置文件 application.yml，加入 Eureka 配置如下： eureka:client:registerWithEureka: true 服务注册开关fetchRegistry: true 服务发现开关serviceUrl: Eureka客户端与Eureka服务端进行交互的地址，多个中间用逗号分隔defaultZone: ${EUREKA_SERVER:http://localhost:50101/eureka/,http://localhost:50102/eureka/}instance:prefer-ip-address: true 将自己的ip地址注册到Eureka服务中ip-address: ${IP_ADDRESS:127.0.0.1}instance-id: ${spring.application.name}:${server.port} 指定实例idribbon:MaxAutoRetries: 2 最大重试次数，当Eureka中可以找到服务，但是服务连不上时将会重试，如果eureka中找不到服务则直接走断路器MaxAutoRetriesNextServer: 3 切换实例的重试次数OkToRetryOnAllOperations: false 对所有操作请求都进行重试，如果是get则可以，如果是post，put等操作没有实现幂等的情况下是很危险的,所以设置为falseConnectTimeout: 5000 请求连接的超时时间ReadTimeout: 6000 请求处理的超时时间 3、添加 eureka 依赖 <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring‐cloud‐starter‐netflix‐eureka‐client</artifactId></dependency> 4、修改启动类，在class上添加如下注解： @EnableDiscoveryClient 搜索服务客户端在学习服务创建搜索服务的客户端接口，此接口会生成代理对象，调用搜索服务： package com.xuecheng.learning.client;import com.xuecheng.framework.domain.course.TeachplanMediaPub;import org.springframework.cloud.openfeign.FeignClient;import org.springframework.web.bind.annotation.GetMapping;import org.springframework.web.bind.annotation.PathVariable;@FeignClient(value = "xc‐service‐search")public interface CourseSearchClient {@GetMapping(value="/getmedia/{teachplanId}")public TeachplanMediaPub getmedia(@PathVariable("teachplanId") String teachplanId);} 自定义错误代码我们在 com.xuecheng.framework.domain.learning.response 包下自定义一个错误消息模型 package com.xuecheng.framework.domain.learning.response;import com.xuecheng.framework.model.response.ResultCode;import lombok.ToString;@ToStringpublic enum LearningCode implements ResultCode {LEARNING_GET_MEDIA_ERROR(false,23001,"学习中心获取媒资信息错误！");//操作代码boolean success;//操作代码int code;//提示信息String message;private LearningCode(boolean success, int code, String message){this.success = success;this.code = code;this.message = message;}@Overridepublic boolean success() {return success;}@Overridepublic int code() {return code;}@Overridepublic String message() {return message;} } 该消息模型基于 ResultCode 来实现，代码如下 package com.xuecheng.framework.model.response;/ Created by mrt on 2018/3/5. 10000-- 通用错误代码 22000-- 媒资错误代码 23000-- 用户中心错误代码 24000-- cms错误代码 25000-- 文件系统/public interface ResultCode {//操作是否成功,true为成功，false操作失败boolean success();//操作代码int code();//提示信息String message(); 从 ResultCode 中我们可以看出，我们约定了用户中心的错误代码使用 23000，所以我们定义的一些错误信息的代码就从 23000 开始计数。 Service 在学习服务中定义 service 方法，此方法远程请求课程管理服务、媒资管理服务获取课程学习地址。 package com.xuecheng.learning.service.impl;import com.netflix.discovery.converters.Auto;import com.xuecheng.framework.domain.course.TeachplanMediaPub;import com.xuecheng.framework.domain.learning.response.GetMediaResult;import com.xuecheng.framework.exception.ExceptionCast;import com.xuecheng.framework.model.response.CommonCode;import com.xuecheng.learning.client.CourseSearchClient;import com.xuecheng.learning.service.LearningService;import org.springframework.beans.factory.annotation.Autowired;import org.springframework.stereotype.Service;@Servicepublic class LearningServiceImpl implements LearningService {@AutowiredCourseSearchClient courseSearchClient;/ 远程调用搜索服务获取已发布媒体信息中的url @param courseId 课程id @param teachplanId 媒体信息id @return/@Overridepublic GetMediaResult getMediaPlayUrl(String courseId, String teachplanId) {//校验学生权限,是否已付费等//远程调用搜索服务进行查询媒体信息TeachplanMediaPub mediaPub = courseSearchClient.getmedia(teachplanId);if(mediaPub == null) ExceptionCast.cast(CommonCode.FAIL);return new GetMediaResult(CommonCode.SUCCESS, mediaPub.getMediaUrl());} } Controller 调用 service 根据课程计划 id 查询视频播放地址： @RestController@RequestMapping("/learning/course")public class CourseLearningController implements CourseLearningControllerApi {@AutowiredLearningService learningService;@Override@GetMapping("/getmedia/{courseId}/{teachplanId}")public GetMediaResult getMediaPlayUrl(@PathVariable String courseId, @PathVariable String teachplanId) {//获取课程学习地址return learningService.getMedia(courseId, teachplanId);} } 测试使用 swagger-ui 或postman 测试学习服务查询课程视频地址接口。 0x05 前端开发需求分析需要在学习中心前端页面需要完成如下功能： 1、进入课程学习页面需要带上课程 Id参数及课程计划Id的参数，其中课程 Id 参数必带，课程计划 Id 可以为空。 2、进入页面根据课程 Id 取出该课程的课程计划显示在右侧。 3、进入页面后判断如果请求参数中有课程计划 Id 则播放该章节的视频。 4、进入页面后判断如果课程计划id 为0则需要取出本课程第一个课程计划的Id，并播放第一个课程计划的视频。进入到模块 xc-ui-pc-leanring/src/module/course api方法 let sysConfig = require('@/../config/sysConfig')let apiUrl = sysConfig.xcApiUrlPre;/获取播放地址/export const get_media = (courseId,chapter) => {return http.requestGet(apiUrl+'/api/learning/course/getmedia/'+courseId+'/'+chapter);} 配置代理在 Nginx 中的 ucenter.xuecheng.com 虚拟主机中配置 /api/learning/ 的路径转发，此url 请转发到学习服务。学习服务upstream learning_server_pool{server 127.0.0.1:40600 weight=10;}学成网用户中心server {listen 80;server_name ucenter.xuecheng.com;个人中心location / {proxy_pass http://ucenter_server_pool;}后端搜索服务location /openapi/search/ {proxy_pass http://search_server_pool/search/; }学习服务location ^~ /api/learning/ {proxy_pass http://learning_server_pool/learning/;} } 视频播放页面 1、如果传入的课程计划id为0则取出第一个课程计划id 在 created 钩子方法中完成 created(){//当前请求的urlthis.url = window.location//课程idthis.courseId = this.$route.params.courseId//章节idthis.chapter = this.$route.params.chapter//查询课程信息systemApi.course_view(this.courseId).then((view_course)=>{if(!view_course || !view_course[this.courseId]){this.$message.error("获取课程信息失败，请重新进入此页面！")return ;}let courseInfo = view_course[this.courseId]console.log(courseInfo)this.coursename = courseInfo.nameif(courseInfo.teachplan){console.log("准备开始播放视频")let teachplan = JSON.parse(courseInfo.teachplan);this.teachplanList = teachplan.children;//开始学习if(this.chapter == "0" || !this.chapter){//取出第一个教学计划this.chapter = this.getFirstTeachplan();console.log("第一个教学计划id为 ",this.chapter);this.study(this.chapter);}else{this.study(this.chapter);} }})}, 取出第一个章节 id，用户未输入课程计划 id 或者输入为 0 时，播放第一个。 //取出第一个章节getFirstTeachplan(){for(var i=0;i<this.teachplanList.length;i++){let firstTeachplan = this.teachplanList[i];//如果当前children存在，则取出第一个返回if(firstTeachplan.children && firstTeachplan.children.length>0){let secondTeachplan = firstTeachplan.children[0];return secondTeachplan.id;} }return ;}, 开始学习： //开始学习study(chapter){// 获取播放地址courseApi.get_media(this.courseId,chapter).then((res)=>{if(res.success){let fileUrl = sysConfig.videoUrl + res.fileUrl//播放视频this.playvideo(fileUrl)}else if(res.message){this.$message.error(res.message)}else{this.$message.error("播放视频失败，请刷新页面重试")} }).catch(res=>{this.$message.error("播放视频失败，请刷新页面重试")});}, 2、点击右侧课程章节切换播放在原有代码基础上添加 click 事件，点击调用开始学习方法（study）。 <li v‐if="teachplan_first.children!=null" v‐for="(teachplan_second, index) inteachplan_first.children"><i class="glyphicon glyphicon‐check"></i><a :href="url" @click="study(teachplan_second.id)">{ {teachplan_second.pname} }</a></li> 3、地址栏路由url变更这里需要注意一个问题，在用户点击课程章节切换播放时，地址栏的 url 也应该同步改变为当前所选择的课程计划 id 4、在线学习按钮将 learnstatus 默认更改为 1，这样就能显示出马上学习的按钮，方便我们后续的集成测试。文件路径为 xc-ui-pc-static-portal/include/course_detail_dynamic.html 部分代码块如下 <script>var body= new Vue({ //创建一个Vue的实例el: "body", //挂载点是id="app"的地方data: {editLoading: false,title:'测试',courseId:'',charge:'',//203001免费,203002收费learnstatus: 1 ,//课程状态，1：马上学习，2：立即报名、3：立即购买course:{},companyId:'template',company_stat:[],course_stat:{"s601001":"","s601002":"","s601003":""} }, 简单的测试访问在线学习页面：http://ucenter.xuecheng.com//learning/课程id/课程计划id 通过 url 传入两个参数：课程id 和课程计划id 如果没有课程计划则传入0 测试项目如下： 1、传入正确的课程id、课程计划id，自动播放本章节的视频 2、传入正确的课程id、课程计划id传入0，自动播放第一个视频 3、传入错误的课程id 或课程计划id，提示错误信息。 4、通过右侧章节目录切换章节及播放视频。访问： http://ucenter.xuecheng.com//learning/4028e58161bcf7f40161bcf8b77c0000/4028e58161bd18ea0161bd1f73190008 传入正确的课程id、课程计划id，自动播放本章节的视频 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ef0xxym7-1595567273153)(https://qnoss.codeyee.com/20200704_15/image17)] 传入正确的课程id、课程计划id传入0，自动播放第一个视频访问 http://ucenter.xuecheng.com//learning/4028e58161bcf7f40161bcf8b77c0000/0 识别出第一个课程计划的 id 需要注意的是这里的 chapter 参数是我自己在 study 函数里加上去的，可以忽略。传入错误的课程id或课程计划id，提示错误信息。通过右侧章节目录切换章节及播放视频。点击章节即可播放，但是点击制定章节后 url 没有发生改变，这个问题暂时还没有解决，关注笔记后面的内容。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TOGdxwb4-1595567273158)(https://qnoss.codeyee.com/20200704_15/image20)] 完整的测试准备工作启动 RabbitMQ，启动 Logstash、ElasticSearch 建议把所有后端服务都开起来启动前端静态门户、启动 nginx 、启动课程管理前端我们整理一下测试的流程上传两个媒资视频文件，用于测试进入到课程管理，为课程计划选择媒资信息发布课程，等待 logstash 将数据采集到 ElasticSearch 的索引库中进入学成网主页，点击课程，进入到搜索门户页面搜索课程，进入到课程详情页面点击开始学习，进入到课程学习页面，选择课程计划中的一个章节进行学习。 1、上传文件首先我们使用之前开发的媒资管理模块，上传两个视频文件用于测试。第一个文件上传成功一些问题在上传第二个文件时，发生了错误，我们来检查一下问题出在了哪里在媒体服务的控制台中可以看到，在 mergeChunks 方法在校验文件 md5 时候抛出了异常我们在 MD5 校验这里打个断点，重新上传文件，分析一下问题所在。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OpEMZGI8-1595567273166)(https://qnoss.codeyee.com/20200704_15/image23)] 单步调试后发现，合并文件后的MD5值与用户上传的源文件值不相等方案1：删除本地分块文件重新尝试上传考虑到可能是在用户上传完视频的分块文件时发生了一些问题，导致合并文件后与源文件的大小不等，导致MD5也不相同，这里我们把这个视频上传到本地的文件全部删除，在媒资上传页面重新上传文件。对比所有分块文件的字节大小和本地源文件的大小，完全是相等的删除所有文件后重新上传，md5值还是不等，考虑从调试一下文件合并的代码。方案2：检查前端提交的MD5值是否正确在查阅是否有其他的MD5值获取方案时，发现了一个使用 windows 本地命令获取文件MD5值的方法 certutil -hashfile .\19-在线学习接口-集成测试.avi md5 惊奇的发现，TM的原来是前端那边转换的MD5值不正确，后端这边是没有问题的。从前面的图可以看出，本地和后端转换的都是以一个 f6f0 开头的MD5值那么问题就出现在前端了，还需要花一些时间去分析一下，这里暂时就先告一段落，因为上传了几个文件测试中只有这一个文件出现了问题。 2、为课程计划选择媒资信息进入到一个课程的管理页面 http://localhost:12000//course/manage/baseinfo/4028e58161bcf7f40161bcf8b77c0000 将刚才我们上传的媒资文件的信息和课程计划绑定选择效果如下 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-epKaqzCD-1595567273178)(https://qnoss.codeyee.com/20200704_15/image29)] 2、发布课程，等待 logstash 从 course_pub 以及 teachplan_media_pub 表中采集数据到 ElasticSearch 当中发布成功后，我们可以从 teachplan_media_pub 表中看到刚才我们发布的媒资信息再观察 Logstash 的控制台，发现两个 Logstash 的实例都对更新的课程发布信息进行了采集 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hTUve2ik-1595567273183)(https://qnoss.codeyee.com/20200704_15/image32)] 3、前端门户测试打开我们的门户主站 http://www.xuecheng.com/ [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4wZe9R84-1595567273185)(https://qnoss.codeyee.com/20200704_15/image33)] 点击导航栏的课程，进入到我们的搜索门户页面如果无法进入到搜索门户，请检查你的 xc-ui-pc-portal 前端工程是否已经启动进入到搜索门户后，可以看到一些初始化时搜索的课程数据，默认是搜索第一页的数据，每页2个课程。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BJ1AKoJb-1595567273187)(https://qnoss.codeyee.com/20200704_15/image34)] 我们可以测试搜索一下前面我们选择媒资信息时所用的课程点击课程，进入到课程详情页面，然后再点击开始学习。点击马上学习后，会进入到该课程的在线学习页面，默认自动播放我们第一个课程计划中的视频。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tcuLWnf2-1595567273193)(https://qnoss.codeyee.com/20200704_15/image37)] 我们可以在右侧的目录中选择第二个课程计划，会自动播放所选的课程计划所对应的媒资视频播放地址，该播放地址正是我们刚才通过 Logstash 自动采集到 ElasticSearch 的索引信息，效果图如下 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Cvi9Dr0Y-1595567273195)(https://qnoss.codeyee.com/20200704_15/image38)] 四、待完善的一些功能课程发布前，校验课程计划里面是否包含二级课程计划课程发布前，校验课程计划信息里面是否全部包含媒资信息删除媒资信息，并且同步删除ES中的索引在获取该课程的播放地址时校验用户的合法、在线学习页面，点击右侧目录中的课程计划同时改变url中的课程计划地址视频文件 19-在线学习接口-集成测试.avi 前端上传时提交的MD5值不正确 😁 认识作者作者：👦 LCyee ，全干型代码🐕 自建博客：https://www.codeyee.com 记录学习以及项目开发过程中的笔记与心得，记录认知迭代的过程，分享想法与观点。 CSDN 博客：https://blog.csdn.net/codeyee 记录和分享一些开发过程中遇到的问题以及解决的思路。欢迎加入微服务练习生的队伍，一起交流项目学习过程中的一些问题、分享学习心得等，不定期组织一起刷题、刷项目，共同见证成长。本篇文章为转载内容。原文链接：https://blog.csdn.net/codeyee/article/details/107558901。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-12-16 12:41:01

转载

Etcd

etcd集群加入Kubernetes中的网络与防火墙问题排查：节点间通信与端口配置详解

...的键值存储系统，用于服务发现、配置共享及分布式锁等场景。然而，在实际操作中，我们可能会遇到“Failed to join etcd cluster because of network issues or firewall restrictions”这样的问题，本文将深入探讨这个问题及其解决之道，并通过实例代码来帮助大家理解和处理此类故障。 1. 网络问题导致Etcd集群加入失败 1.1 网络连通性问题在尝试将一个新的节点加入到etcd集群时，首要条件是各个节点间必须保持良好的网络连接。如果由于网络延迟、丢包或者完全断开等问题，新节点无法与已有集群建立稳定通信，就会出现“Failed to join”的错误。例如，假设有两个已经形成集群的etcd节点（node1和node2），我们尝试将node3加入： bash ETCDCTL_API=3 etcdctl --endpoints=https://node1:2379,https://node2:2379 member add node3 \ --peer-urls=https://node3:2380 如果因网络原因node3无法访问node1或node2，上述命令将失败。 1.2 解决策略 - 检查并修复基础网络设施，确保所有节点间的网络连通性。 - 验证端口开放情况，etcd通常使用2379（客户端接口）和2380（成员间通信）这两个端口，确保它们在所有节点上都是开放的。 2. 防火墙限制导致的加入失败 2.1 防火墙规则影响防火墙可能会阻止必要的端口通信，从而导致新的节点无法成功加入etcd集群。比如，想象一下我们的防火墙没给2380端口“放行”，就算网络本身一路绿灯，畅通无阻，节点也照样无法通过这个端口和其他集群的伙伴们进行交流沟通。 2.2 解决策略示例：临时开启防火墙端口（以Ubuntu系统为例） bash sudo ufw allow 2379/tcp sudo ufw allow 2380/tcp sudo ufw reload 以上命令分别允许了2379和2380端口的TCP流量，并重新加载了防火墙规则。对于生产环境，请务必根据实际情况持久化这些防火墙规则，以免重启后失效。 3. 探讨与思考在处理这类问题时，我们需要像侦探一样层层剥茧，从最基础的网络连通性检查开始，逐步排查至更具体的问题点。在这个过程中，我们要善于运用各种工具进行测试验证，比如ping、telnet、nc等，甚至可以直接查看防火墙日志以获取更精确的错误信息。同时，我们也应认识到，任何分布式系统的稳定性都离不开对基础设施的精细化管理和维护。特别是在大规模安装部署像etcd这种关键组件的时候，咱们可得把网络环境搞得结结实实、稳稳当当的，确保它表现得既强壮又靠谱，这样才能防止一不留神的小差错引发一连串的大麻烦。总结来说，面对"Failed to join etcd cluster because of network issues or firewall restrictions"这样的问题，我们首先要理解其背后的根本原因，然后采取相应的策略去解决。其实这一切的背后，咱们这些技术人员就像是在解谜探险一样，对那些错综复杂的系统紧追不舍，不断摸索、持续优化。我们可都是“细节控”，对每一丁点儿的环节都精打细算，用专业的素养和严谨的态度把关着每一个微小的部分。

2023-08-29 20:26:10

711

寂静森林

HessianRPC

HessianRPC中IllegalArgumentException异常解析：方法签名与参数类型匹配在分布式系统中的实践误区与解决方案

HessianRPC：深入理解与解决“IllegalArgumentException：传入参数不合法”的问题在分布式系统开发中，HessianRPC作为一种轻量级的远程过程调用协议被广泛应用。然而，在实际动手开发的时候，我们免不了会撞上一个常见的小插曲：“IllegalArgumentException”这个家伙，它跑出来告诉你：喂喂，你传的参数不达标，比如说，方法签名跟我期待的样子对不上号。这篇东西会手把手地，用详尽的步骤解析和实实在在的例子演示，让大家都能更接地气地理解，更能轻松上手解决这个问题。 1. HessianRPC简介首先，让我们回顾一下HessianRPC的基本概念。Hessian是一种高效、紧凑的二进制RPC协议，由Caucho公司开发，特别适合于互联网传输。这个东西超级实用，它能够让Java和其他一些好兄弟语言（比如.NET、Python这些）毫无障碍地远程互相调用对方的方法，就跟在本地调用一样方便。你只需要稍微捣鼓一下配置，写点简单的代码，就能轻松实现服务端和客户端的顺畅交流啦！ 2. 方法签名的重要性在HessianRPC中，每个远程方法都有其独特的“方法签名”，它包括方法名以及参数类型列表。当客户端调用服务器端的方法时，Hessian会根据这个签名来匹配和校验参数。如果客户端传过来的参数“不按套路出牌”，跟服务器端方法要求的参数类型或数量对不上号，那可就得闹脾气了，会直接抛出一个“IllegalArgumentException”异常。 java // 服务器端接口示例 public interface MyService { String process(String input, int num); } // 客户端错误调用示例 MyService service = (MyService) hessianProxyFactory.create(MyService.class, serverUrl); String result = service.process("Hello", "World"); // 这里第二个参数应该是int类型，而非String类型，会导致IllegalArgumentException 3. “IllegalArgumentException：传入参数不合法”问题解析上述代码中的客户端尝试以一个字符串参数代替整型参数去调用process方法，这就导致了"IllegalArgumentException"。在进行序列化和反序列化的时候，Hessian这家伙发现传过来的参数类型跟预先给定的方法签名对不上号儿，于是它就毫不客气地抛出了一个异常。 4. 解决方案及预防措施面对这种问题，我们需要从以下几个方面着手： 4.1 检查并确保参数类型正确在编写客户端调用代码时，应仔细核对每个参数是否符合服务端方法签名的要求。比如上例中，我们需要将第二个参数修改为整型数值： java String result = service.process("Hello", 123); // 正确的调用方式 4.2 强化代码审查与测试在项目开发过程中，建议采用自动化测试工具和单元测试，覆盖所有RPC方法调用，确保参数类型的准确无误。同时，代码审查也是防止此类问题的有效手段。 4.3 提供清晰的API文档对于对外提供的服务接口，应该编写详尽且易于理解的API文档，明确指出每个方法的签名，包括方法名、参数类型和返回值类型，以便开发者在调用时有据可依。 4.4 利用IDE的智能提示现代集成开发环境（IDE）如IntelliJ IDEA或Eclipse都具有强大的智能提示功能，能自动识别和匹配方法签名，利用好这些特性也能有效避免参数类型不匹配的问题。总结起来，遭遇HessianRPC的“IllegalArgumentException：传入参数不合法”异常，本质上是对方法签名的理解和使用不到位的结果。在编程实战中，只要我们足够细心、步步为营，像侦探破案那样运用各种工具和策略，完全可以把这些潜在问题扼杀在摇篮里，让系统的运行稳如磐石。记住了啊，解决任何技术难题都得像咱们看侦探小说那样，得瞪大眼睛仔仔细细地观察，用脑子冷静地分析推理，动手实践去验证猜想，最后才能拨开层层迷雾，看到那片晴朗的蓝天。

2024-01-16 09:18:32

542

风轻云淡

Apache Atlas

Apache Atlas应对网络不稳定性的实战策略：重试机制、RESTful API调用与服务器通信优化，结合缓存策略和心跳检测保障元数据管理的连续性

...ache Atlas客户端和服务器在网络抽风或者掉线时如何应对的代码实例。为啥呢？原因在于，这些情况通常是由那些藏在底层、默默无闻的通信协议（比如HTTP啊、RESTful API之类的）或者更基础的网络编程工具包在背后自动处理的，不是我们直接能写的。但是，我可以帮助你构建一篇以“在面对网络不稳定时，Apache Atlas使用者如何优化系统设计和使用策略”为主题的文章，虽然不包含具体的Apache Atlas客户端连接代码，但会尽量满足你的其他要求。 1. 引言在大数据时代，Apache Atlas作为一款强大的元数据管理系统，在企业级数据湖架构中扮演着至关重要的角色。不过，在实际动手部署和运维的过程中，我们免不了会碰到这样那样的小插曲，就比如说客户端和服务器之间的网络连接时好时坏，甚至有时候还会突然玩个“消失”。这不仅可能导致数据同步延迟，还可能引发一系列的数据一致性问题。在这篇文章里，咱们要实实在在地掰扯一下，在这个特定场景下，咱们该如何正确理解和有效应对，并且在使用Apache Atlas时，有哪些妙招能用上，让整个系统的健壮性和稳定性噌噌噌往上涨。 2. Apache Atlas的服务端与客户端通信机制 Apache Atlas主要通过RESTful API进行服务端与客户端的通信，这意味着任何与Atlas服务器的交互都将以HTTP请求的形式发生。当网络出现波动时，这些请求可能会超时、重试甚至失败。例如，当你尝试执行以下Atlas客户端调用操作（尽管这不是真正的代码，但在真实环境中，它会表现为一个HTTP请求）： python 假设的Atlas客户端API调用示例（非真实代码） from atlas_client import AtlasClient client = AtlasClient(base_url="http://atlas-server:21000") entity_result = client.get_entity(guid='your-entity-guid') 3. 应对网络不稳定策略与实践 (a) 重试机制在面对网络不稳定时，首要的策略就是实施合理的重试机制。对于HTTP客户端库（如Python的requests库），我们可以设定自动重试策略： python import requests from requests.adapters import HTTPAdapter from urllib3.util.retry import Retry session = requests.Session() retries = Retry(total=5, backoff_factor=0.1, status_forcelist=[ 500, 502, 503, 504 ]) session.mount('http://', HTTPAdapter(max_retries=retries)) session.mount('https://', HTTPAdapter(max_retries=retries)) response = session.get('http://atlas-server:21000/api/atlas/v2/entity/guid/your-entity-guid') 这段伪代码展示了如何配置一个具有重试机制的HTTP客户端，以便在网络状况不佳时仍能尽力获取所需数据。 (b) 缓存策略在短暂的网络中断期间，可以利用本地缓存存储近期获取的元数据信息，以此降低对实时连接的依赖。一旦网络恢复，再进行必要的数据同步更新。 (c) 心跳检测与故障转移针对集群环境，可以通过定期心跳检测判断与Atlas服务器的连接状态，及时切换至备份服务器，确保服务的连续性。 4. 结论与思考面对Apache Atlas客户端与服务器间网络连接不稳定或中断的情况，我们需要从系统设计层面出发，采用合适的容错策略和技术手段提高系统的鲁棒性。同时呢，咱们得摸清楚底层通信机制那些个特性，再结合实际的使用场景，不断打磨、优化咱们的解决方案。这样一来，才能真正让基于Apache Atlas搭建的大数据平台坚如磐石，稳定运行起来。以上讨论并未给出Apache Atlas本身的代码实现，而是围绕其使用场景和策略给出了建议。实际上，每个项目都有其独特性，具体策略需要根据实际情况灵活调整和实施。

2024-01-10 17:08:06

410

冬日暖阳

HessianRPC

分布式系统中HessianRPC自动化安全检测：关键考量与实践

HessianRPC：自动化安全检测的潜力与局限一、引言 HessianRPC的简介与地位在构建分布式系统时，高效且可靠的远程过程调用（RPC）机制是不可或缺的一部分。哎呀，HessianRPC，这玩意儿可是个了不得的家伙！它啊，用的是Java这门语言，但你别小瞧了它，它轻巧得很，功能可是一点都不马虎。性能那叫一个棒，无论是大企业的小团队，都对它赞不绝口。为啥？因为它能跨语言通信，这就意味着，不管你是用Python、C++还是别的啥语言，它都能无缝对接，方便得很！所以，你要是想在项目里搞点大动作，用上HessianRPC，绝对能让你的团队如虎添翼，效率翻倍！哎呀，随着黑客们越来越聪明，他们的攻击方式也是层出不穷，这就让咱们开发人员得时刻绷紧神经，保证系统的安全了。这可真不是件轻松活儿，每天都在跟这些看不见的敌人斗智斗勇呢！哎呀，你知道不？这篇大作啊，它要深挖HessianRPC在服务级别的自动化安全检查上能干啥，还有这个本事能怎么改变游戏规则。就像是在说，咱们得好好研究研究，HessianRPC这玩意儿在保护咱们的服务不受坏人侵扰上能起多大作用，以及它一出手，咱们的安全策略会有多大的变化。是不是感觉更接地气了？二、HessianRPC的安全考量在评估HessianRPC的安全性时，我们首先需要了解其基础设计和潜在的风险点。Hessian RPC这个东西，就像是个超级快递员，它能把各种复杂难懂的数据结构，比如大包小包的货物，都转化成容易邮寄的格式。这样一来，信息传递的速度大大提升了，但这也带来了一个问题——得保证这些包裹在运输过程中不被拆开或者丢失，还得防止别人偷看里面的东西。这就需要我们好好设计一套系统，确保数据的安全和完整性，就像给每个包裹贴上专属标签和密码一样。例如，恶意用户可以通过构造特定的输入数据来触发异常或执行未授权操作。三、服务级别的自动化安全检测服务级别的自动化安全检测旨在通过自动化工具和策略，定期对服务进行安全评估，从而及时发现并修复潜在的安全漏洞。对于HessianRPC而言，实现这一目标的关键在于： - 输入验证：确保所有传入的Hessian对象都经过严格的类型检查和边界值检查，防止任意构造的输入导致的错误行为。 - 异常处理：合理设置异常处理机制，确保异常信息不会泄露敏感信息，并提供足够的日志记录，以便后续分析和审计。 - 权限控制：通过API层面的权限校验，确保只有被授权的客户端能够调用特定的服务方法。四、HessianRPC实例代码示例下面是一个简单的HessianRPC服务端实现，用于展示如何在服务层实现基本的安全措施： java import org.apache.hessian.io.HessianInput; import org.apache.hessian.io.HessianOutput; import org.apache.hessian.message.MessageFactory; public class SimpleService { public String echo(String message) throws Exception { // 基本的输入验证 if (message == null || message.isEmpty()) { throw new IllegalArgumentException("Message cannot be null or empty"); } return message; } public void run() { try (ServerFactory sf = ServerFactory.createServerFactory(8080)) { sf.addService(new SimpleServiceImpl()); sf.start(); } catch (Exception e) { e.printStackTrace(); } } } class SimpleServiceImpl implements SimpleService { @Override public String echo(String message) { return "Echo: " + message; } } 这段代码展示了如何通过简单的异常处理和输入验证来增强服务的安全性。尽管这是一个简化的示例，但它为理解如何在实际应用中集成安全措施提供了基础。五、结论与展望 HessianRPC虽然在自动化安全检测方面存在一定的支持，但其核心依赖于开发者对安全实践的深入理解和实施。通过采用现代的编程模式、遵循最佳实践、利用现有的安全工具和技术，开发者可以显著提升HessianRPC服务的安全性。哎呀，未来啊，软件工程的那些事儿和安全技术就像开挂了一样突飞猛进。想象一下，HessianRPC这些好东西，还有它的好伙伴们，它们会变得超级厉害，能自动帮我们检查代码有没有啥安全隐患，就像个超级安全小卫士。这样一来，咱们开发分布式系统的时候，就不用那么担心安全问题了，可以更轻松地搞出既安全又高效的系统，爽歪歪！ --- 通过上述内容，我们不仅深入探讨了HessianRPC在自动化安全检测方面的支持情况，还通过具体的代码示例展示了如何在实践中应用这些安全措施。嘿，小伙伴们！这篇小文的目的是要咱们一起嗨起来，共同关注分布式系统的安全性。咱们得动动脑筋，别让那些不怀好意的小家伙有机可乘。怎么样，是不是觉得有点热血沸腾？咱们要团结起来，探索更多新鲜有趣的安全策略和技术，让我们的代码更安全，世界更美好！一起加油吧，开发者们！

2024-09-08 16:12:35

102

岁月静好

HessianRPC

服务异常恢复失败？从配置优化到线程池，再到内存泄漏与异常处理

服务异常恢复失败：与HessianRPC的一次深度对话 --- 1. 背景服务崩溃，用户不开心嘿，大家好！今天咱们聊聊一个让人头疼的问题——服务异常恢复失败。这个问题啊，说起来真是让人又气又无奈。嘿，作为一个整天跟代码打交道的程序员，我最近真是摊上事儿了。有个用HessianRPC搞的服务突然罢工了，死活不干活。我各种捣鼓、重启、排查，忙活了好几天，可它就像个倔强的小破孩儿一样，愣是不给我恢复正常，气得我都想给它来顿“代码大餐”了！先简单介绍一下背景吧。HessianRPC是一个轻量级的远程调用框架，主要用于Java项目之间的通信。它用二进制的方式传数据，速度快得飞起，特别适合微服务里那些小家伙们互相聊天儿用！唉，说真的，再厉害的工具也有它的短板啊。就像这次我的服务莫名其妙挂掉了，想让它重新站起来吧，那过程简直跟做噩梦一样，折腾得我头都大了。 --- 2. 症状服务异常的表象服务崩溃的表现其实挺明显的。首先，客户端请求一直超时，没有任何响应。然后，服务器日志里开始出现各种错误信息，比如： java.net.SocketTimeoutException: Read timed out 或者更糟糕的： java.lang.NullPointerException 看到这些错误，我心里咯噔一下：“坏了，这可能是服务端出现了问题。”于是赶紧登录服务器查看情况。果然，服务进程已经停止运行了。更让我抓狂的是，重启服务后问题并没有解决，反而越搞越复杂。 --- 3. 原因分析为什么恢复失败？接下来，我们来聊聊为什么会发生这种状况。经过一番排查，我发现问题可能出在以下几个方面： 3.1 配置问题第一个怀疑对象是配置文件。HessianRPC的配置其实很简单，但有时候细节决定成败。比如说啊，在配置文件里我给超时时间设成了5秒，结果一到高并发那场面，这时间简直不够塞牙缝的，分分钟就崩了。修改配置后，虽然有一定的改善，但问题依然存在。 java // 修改HessianRPC的超时时间 Properties properties = new Properties(); properties.setProperty("hessian.read.timeout", "10000"); // 设置为10秒 3.2 线程池耗尽第二个怀疑对象是线程池。HessianRPC默认使用线程池来处理请求，但如果线程池配置不当，可能会导致线程耗尽，进而引发服务不可用。我检查了一下线程池参数，发现最大线程数设置得太低了。 java // 修改线程池配置 ExecutorService executor = Executors.newFixedThreadPool(50); // 将线程数增加到50 3.3 内存泄漏第三个怀疑对象是内存泄漏。有时候服务崩溃并不是因为CPU或网络的问题，而是内存不足导致的。我用JProfiler这个工具去给服务做了一次内存“体检”，结果一查，嘿，还真揪出了几个“大块头”对象，愣是赖在那儿没走，该回收的内存也没释放掉。 java // 使用WeakReference避免内存泄漏 WeakReference weakRef = new WeakReference<>(new Object()); --- 4. 解决方案一步步修复服务好了，找到了问题所在，接下来就是动手解决问题了。这里分享一些具体的解决方案，希望能帮到大家。 4.1 优化配置首先，优化配置是最直接的方式。我调整了HessianRPC的超时时间和线程池大小，让服务能够更好地应对高并发场景。 java // 配置HessianRPC客户端 HessianProxyFactory factory = new HessianProxyFactory(); factory.setOverloadEnabled(true); // 开启方法重载 factory.setConnectTimeout(5000); // 设置连接超时时间为5秒 factory.setReadTimeout(10000); // 设置读取超时时间为10秒 4.2 异常处理其次，完善异常处理机制也很重要。我给这个服务加了不少“兜底”的代码，就像在每个关键步骤都放了个小垫子，这样就算某个地方突然“摔跤”了，整个服务也不至于直接“趴下”，还能继续撑着运行。 java try { // 执行业务逻辑 } catch (Exception e) { log.error("服务执行失败", e); } 4.3 日志监控最后，加强日志监控也是必不可少的。嘿，我装了个ELK日志系统，就是那个 Elasticsearch、Logstash 和 Kibana 的组合拳，专门用来实时盯着服务的日志输出。只要一出问题，我马上就能找到是哪里卡住了，超方便！ java // 使用Logback记录日志 logs/service.log %d{yyyy-MM-dd HH:mm:ss} [%thread] %-5level %logger{36} - %msg%n --- 5. 总结从失败中成长经过这次折腾，我对HessianRPC有了更深的理解，也明白了一个道理：技术不是一蹴而就的，需要不断学习和实践。虽然这次服务异常恢复失败的经历让我很沮丧，但也让我积累了宝贵的经验。如果你也有类似的问题，不妨按照以下步骤去排查： 1. 检查配置文件，确保所有参数都合理。 2. 监控线程池状态，避免线程耗尽。 3. 使用工具检测内存泄漏，及时清理无用资源。 4. 完善异常处理机制，增强服务的健壮性。希望这篇文章能对你有所帮助！如果还有其他问题，欢迎随时交流。我们一起进步，一起成长！ --- PS：记住，技术之路虽难，但每一步都是值得的！

2025-05-05 15:38:48

风轻云淡

JSON

json 文件后缀名

...器解析和生成，常用于服务端向网页、应用程序等客户端传输结构化数据，或者在不同系统之间交换数据。 fs模块 , 在Node.js（一个服务器端JavaScript运行环境）中，fs是内置的标准文件系统模块，全称为File System。该模块提供了与文件系统交互的各种方法，如读取、写入、同步或异步操作文件内容等。例如，在文章中提到的readFileSync方法就是fs模块提供的用于同步读取文件内容的功能。 JSON.parse() , 这是一个JavaScript内置全局对象JSON的方法，用于将符合JSON格式的字符串转换为JavaScript原生值（通常是对象或数组）。当从文件或其他来源读取到JSON格式的字符串数据时，可以调用此方法将其转换为可以在JavaScript程序中直接使用的对象，便于进一步处理和操作这些数据。例如，在读取JSON文件后，需要使用JSON.parse(data)将读取到的字符串内容解析成JavaScript对象。

2023-05-29 11:53:15

526

程序媛

JSON

json 数组加上

...领域，JSON常用于服务端与客户端之间交换数据，由于其简洁且通用性高，被广泛应用于API接口、配置文件、缓存数据等多种场景。 JavaScript对象 , 在JavaScript编程语言中，对象是一种复杂的数据类型，它由零个或多个无序的名/值对组成，这些名/值对也称为属性。属性可以是任何JavaScript数据类型，包括基本类型如字符串、数字、布尔值以及引用类型如其他对象和函数。在JSON中，JavaScript对象通过键（字符串）和对应的值进行表示，且遵循特定的语法规则。 JSON.parse()方法 , 这是JavaScript内置的一个全局函数，用于将一个JSON格式的字符串转换为等效的JavaScript值或对象。例如，当接收到从服务器返回的JSON格式的数据时，可以通过调用JSON.parse()方法将其解析成JavaScript对象，以便进一步操作和处理数据。 JSON.stringify()方法 , 同为JavaScript内置的方法，它的功能与JSON.parse()相反，用于将JavaScript对象或值转换为JSON格式的字符串。开发者通常在需要将JavaScript对象发送到服务器或其他环境，或者保存为本地存储时使用此方法。JSON.stringify()还可以接受可选参数，用于控制序列化过程中如何处理对象属性及函数等内容。

2023-06-02 13:33:53

291

数据库专家

Java

java中异步和同步的问题

...下，一个对象（通常是客户端）注册一个方法给另一个对象（服务端），当服务端完成特定的操作或事件发生时，会调用预先注册的方法（即回调函数）通知客户端，并将相关结果作为参数传递。在Java中，可以通过接口实现回调逻辑，使得异步任务完成后能够以非阻塞的方式通知并处理结果。例如，在网络请求、I/O操作等场景中广泛应用回调模式进行异步处理。

2023-05-04 14:50:34

409

码农

转载文章

[转载]《Android开发从零开始》——31.模拟Http请求

...va生态中的HTTP客户端库也在不断演进。例如，Square公司推出的OkHttp框架以其高效的性能和易用性受到了广泛的关注。OkHttp不仅支持同步和异步请求，还对HTTP/2、SPDY协议有良好支持，提供了连接池、自动重试等高级特性，是进行网络编程时值得研究的现代工具（参考阅读：“OkHttp：一个现代、快速且灵活的HTTP客户端”）。 2. 安全实践：在网络通信中，数据的安全性和隐私保护至关重要。在使用HttpClient或HttpURLConnection发送HTTP请求时，如何配置SSL/TLS加密以保证传输过程的安全是一个重要课题。可以关注最新的HTTPS最佳实践指南以及Java中相关API的更新（参见：“Java 11+ 中如何正确实现HTTPS连接与证书验证”）。 3. 性能优化：针对不同的应用场景，合理选择并优化HTTP客户端能显著提升应用性能。对比分析HttpURLConnection、HttpClient和OkHttp在实际项目中的表现，并结合响应速度、内存占用、并发处理能力等方面进行深入探讨（推荐文章：“Java HTTP客户端性能大比拼：HttpURLConnection vs HttpClient vs OkHttp”）。 4. 实战案例解析：通过剖析真实项目的源码，理解如何在复杂业务场景下运用这些HTTP客户端完成登录认证、文件上传下载、服务端推送通知等功能（“基于Java的大型Web系统中HTTP请求实战案例详解”）。综上所述，在掌握基础HTTP请求操作的基础上，紧跟行业发展趋势，关注安全策略和性能优化手段，并通过实战演练深化理论知识，将有助于我们更好地应对各种网络通信挑战。

2023-05-22 10:11:18

302

转载

ZooKeeper

ZooKeeper在分布式系统中实现节点变化通知与数据实时同步：利用Watcher接口和事件监听器构建发布订阅模型

...一个分布式的、开源的服务框架，主要用于解决分布式环境下的配置维护、命名服务、分布式同步等问题。它提供了一致性保证，使得分布式应用程序能够实现协调与管理。在ZooKeeper中，各个节点（或称为参与者）可以通过客户端连接至ZooKeeper集群，对存储在其中的数据节点进行读写操作，并通过监听器机制来实现数据变化的通知和响应。事件监听器 , 在ZooKeeper的上下文中，事件监听器是一种接口实现，如本文中的MyWatcher类。开发者可以自定义监听器，以响应ZooKeeper服务端触发的各种事件，例如节点创建、删除、数据变更等。当指定节点发生变动时，ZooKeeper会自动调用监听器的process方法，将事件信息发送给客户端，从而实现对ZooKeeper数据节点变化的实时监控和处理。

2023-10-24 09:38:57

星河万里-t

ZooKeeper

ZooKeeper在分布式系统中应对网络不稳定性的数据一致性和可用性策略：重试机制与负载均衡器（Netflix Ribbon）实践

...的分布式应用程序协调服务，由Apache软件基金会开发。它提供了一种简单易用的接口，让分布式系统中的各个组件能够实现数据的共享、同步和管理。在本文语境中，ZooKeeper作为分布式系统的基石，负责维护和协调多个节点间的一致性状态，通过复制-选举机制确保高可用性和数据一致性。复制-选举方法 , 在分布式系统中，复制-选举是一种常见的数据管理和故障恢复策略。在ZooKeeper中，每个服务器都会维护一份相同的数据副本，并通过选举机制确定一个主节点（Leader）进行写操作，其他从节点（Follower）进行数据同步。当主节点出现故障时，从节点会重新发起选举，选出新的主节点以继续提供服务，从而保证系统的高可用性和数据一致性。负载均衡器 , 负载均衡器是一种网络服务设备或软件，用于在多台服务器之间分配网络流量，旨在优化资源利用率，避免单点过载导致的服务性能下降或不可用。在本文中，使用Netflix Ribbon作为负载均衡器的例子，其可以根据预定义的策略将客户端请求均匀地分发到ZooKeeper集群中的各个服务器上，从而在网络不稳定环境下改善连接质量并提升整体系统的稳定性。

2023-08-15 22:00:39

柳暗花明又一村-t

Dubbo

利用Dubbo在微服务架构中实现高性能、高吞吐量服务调用：集群模式、负载均衡与容错机制实践

一、引言在微服务架构中，服务间的通信是非常重要的一环。不过呢，随着服务项目越来越多，复杂度蹭蹭往上涨，各服务之间沟通交流的性能和稳定性问题也变得越来越明显，越来越突出啦。Dubbo这款开源服务框架，就像个超能小助手，因为它的功能强大又灵活多变，在企业级应用的大舞台上那可是大显身手，得到了无数的青睐和广泛应用呢！本文将通过实例讲解如何利用Dubbo进行高性能、高吞吐量的服务调用。二、Dubbo简介 Dubbo是一个高性能、轻量级的Java企业级远程服务调用框架，它提供了一套简单的接口定义、协议编解码、序列化、动态配置等设施，使得开发者可以更专注于业务逻辑，而无需关心服务间通信的问题。三、Dubbo架构图 Dubbo的主要组成部分包括注册中心、客户端和服务端。客户端就像个精明的小侦探，它通过服务的大名（名称）、版本号、参数类型这些线索，再加上服务的具体地址这个关键坐标，就能找到对应的服务提供者。然后，它就会像我们平时向朋友发起请求那样，自信满满地向服务提供者抛出自己的需求。当服务提供者收到请求时，它会立马开始执行那些相应的业务操作步骤，就像是在玩一个“处理请求”的游戏一样。完成后，他们会像快递小哥一样，迅速地把结果打包好，然后妥妥地送回到客户端手中。注册中心用于存储服务提供者的元数据信息，方便客户端查找。四、Dubbo的优点 Dubbo具有以下优点： 1. 高效 Dubbo支持多种协议（HTTP、TCP等），并且提供了本地和远程两种调用方式，可以根据实际情况选择最优的调用方式。 2. 灵活 Dubbo支持多种序列化方式（Hessian、Java对象、Protobuf等），可以根据服务的特性选择最合适的序列化方式。 3. 可靠 Dubbo提供了多种调用策略（轮询、随机、权重、优先等），可以根据服务的负载情况选择最适合的调用策略。 4. 容错 Dubbo提供了多种容错机制（超时重试、熔断器等），可以在保证系统稳定性的前提下提高系统的可用性和健壮性。五、如何利用Dubbo进行高性能、高吞吐量的服务调用？ 1. 使用Dubbo的本地调用模式当服务之间可以直接通信时，可以选择本地调用模式，避免网络延迟带来的影响。 java dubbo://127.0.0.1:8080/com.example.MyService?anyhost=true&application=consumer&check=false&default.impl=com.example.MyServiceImpl&default.version=1.0.0&interface=com.example.MyService 2. 使用Dubbo的多线程模型通过配置Dubbo的多线程模型，可以充分利用多核CPU的优势，提高服务的处理能力。 java 3. 使用Dubbo的集群模式通过配置Dubbo的集群模式，可以将一个服务部署在多个节点上，当某个节点出现问题时，可以通过其他节点提供服务，从而提高服务的可用性。 xml 4. 使用Dubbo的负载均衡模式通过配置Dubbo的负载均衡模式，可以将请求均匀地分发到多个节点上，从而提高服务的处理能力。 xml 六、结论 Dubbo是一款非常优秀的服务框架，它提供了丰富的功能和灵活的配置选项，可以帮助我们轻松构建高效、稳定的分布式系统。然而，别误会，Dubbo虽然强大，但可不是什么都能解决的神器。在实际操作中，我们得根据实际情况灵活应对，适当做出调整和优化，这样才能让它更好地服务于我们的需求。只有这样，才能充分发挥出Dubbo的优势，满足我们的需求。

2023-03-29 22:17:36

449

晚秋落叶-t

Consul

Consul服务版本更新中的兼容性问题与逐步升级、灰度发布应对策略实操解析

Consul服务的版本更新：兼容性问题与应对策略 1. 引言在分布式系统的世界里，Consul作为一款由HashiCorp公司开发的服务发现与配置管理工具，其稳定性和可靠性对很多企业级应用至关重要。不过呢，随着科技的不断进步和功能的一轮轮升级，Consul服务的版本更新有时候也会闹点小脾气，带来一些兼容性的小麻烦。这篇文咱们要大干一场，深入聊聊Consul版本升级背后可能遇到的兼容性难题，而且我还会手把手地带你瞧瞧实例代码，让你看清这些难题的真面目，掌握识别、理解和搞定它们的独门秘籍！ 2. Consul版本更新引发的兼容性问题 2.1 功能变更 Consul新版本可能会引入新的API接口，修改或废弃旧的接口。比如在 Consul 从版本 v1.0 升级到 v1.5 的时候，它可能对那个键值对存储的API做了些调整。原来好使的 /kv/v1 这个路径，现在人家给换成了 /kv/v2，这就意味着那些依赖于老版 API 的应用很可能就闹罢工不干活啦。 go // Consul v1.0 中获取KV存储数据 resp, _, err := client.KV().Get("key", nil) // Consul v1.5 及以上版本需要使用新版API _, entries, err := client.KV().List("key", nil) 2.2 数据格式变化 Consul的新版本还可能改变返回的数据结构，使得旧版客户端无法正确解析。比如，在某个更新版本里，服务健康检查信息的输出样式变了样，要是应用程序没及时跟上这波更新步伐，那就很可能出现数据解析出岔子的情况。 2.3 性能优化与行为差异 Consul在性能优化过程中，可能会改变内部的行为逻辑，比如缓存机制、网络通信模型等，这些改变虽然提升了整体性能，但也可能影响部分依赖特定行为的应用程序。 3. 面对兼容性问题的应对策略 3.1 版本迁移规划在决定升级Consul版本前，应详细阅读官方发布的Release Notes和Upgrade Guide，了解新版本特性、变动以及可能存在的兼容性风险。制定详尽的版本迁移计划，包括评估现有系统的依赖关系、进行必要的测试验证等。 3.2 逐步升级与灰度发布采用分阶段逐步升级的方式，首先在非生产环境进行测试，确保关键业务不受影响。然后，咱们可以尝试用个灰度发布的方法，就像画画时先淡淡地铺个底色那样，挑一部分流量或者节点先进行小范围的升级试试水。在这个过程中，咱们得瞪大眼睛紧盯着各项指标和日志记录，一旦发现有啥不对劲的地方，就立马“一键返回”，把升级先撤回来，确保万无一失。 3.3 客户端同步更新确保Consul客户端库与服务端版本匹配，对于因API变更导致的问题，应及时升级客户端代码以适应新版本API。例如： go // 更新Consul Go客户端至对应版本 import "github.com/hashicorp/consul/api/v2" client, _ := api.NewClient(api.Config{Address: "localhost:8500"}) 3.4 兼容性封装与适配层构建对于重大变更且短期内难以全部更新的应用，可考虑编写一个兼容性封装层或者适配器，让旧版客户端能够继续与新版本Consul服务交互。 4. 结语面对Consul版本更新带来的兼容性问题，我们既要有预见性的规划和严谨的执行步骤，也要具备灵活应对和快速修复的能力。每一次版本更新，其实就像是给系统做一次全面的健身锻炼，让它的稳定性和健壮性更上一层楼。而在这一整个“健身计划”中，解决好兼容性问题，就像确保各个肌肉群协调运作一样关键！在探索和实践中，我们不断积累经验，使我们的分布式架构更加稳健可靠。

2023-02-25 21:57:19

544

人生如戏

HessianRPC

精准定位HessianRPC中的HessianURLException：URL格式错误引发的远程调用异常及其解决方案

HessianRPC：深入解析HessianURLException及其解决方案 1. 引言在分布式系统开发中，高效的远程过程调用（RPC）框架是构建高性能、高扩展性服务的关键一环。HessianRPC，这可真是个轻巧灵活的RPC框架小能手。它巧妙地借助了Hessian协议的大招，玩转序列化和反序列化的游戏，让Java和其他各种编程语言能够无缝对接、高效沟通，就像一个随叫随到、传递消息的小信使一样。然而，在实际操作时，我们可能时不时会遇到个头疼的问题——“HessianURLException：在捣鼓或者构建URL时出了岔子。”嘿，老铁们，这次咱要聊的这个主题可有点意思了。这篇东西呢，就是专门针对这种“诡异现象”，打算手把手地带大家伙儿通过一些实实在在的代码实例，抽丝剥茧地探寻这异常背后的秘密原因，并且一起琢磨琢磨怎么才能把它给妥妥地解决掉。 2. HessianRPC基础与工作原理 HessianRPC的核心在于对HTTP协议的运用以及Hessian二进制序列化机制。开发者只需要这么干，先定义一个接口，然后在这接口上，客户端和服务端两边各自整上实现，这样一来，远程方法调用就轻松搞定了。就像是你在家画好一张购物清单，然后分别让家人和超市那边按照清单准备东西，最后就能完成“远程”的物资调配啦。例如： java // 定义服务接口 public interface HelloService { String sayHello(String name); } // 服务端实现 @Service("helloService") public class HelloServiceImpl implements HelloService { @Override public String sayHello(String name) { return "Hello, " + name; } } // 客户端调用示例 HessianProxyFactory factory = new HessianProxyFactory(); HelloService service = (HelloService) factory.create(HelloService.class, "http://localhost:8080/hello"); String greeting = service.sayHello("World"); 3. HessianURLException详解当我们在使用HessianRPC进行远程调用时，如果出现"HessianURLException: 创建或处理URL时发生错误。"异常，这通常意味着在创建或解析目标服务的URL地址时出现了问题。比如URL格式不正确、网络不可达或者其他相关的I/O异常。 java try { // 错误的URL格式导致HessianURLException HelloService wrongService = (HelloService) factory.create(HelloService.class, "localhost:8080/hello"); } catch (MalformedURLException e) { System.out.println("HessianURLException: 创建或处理URL时发生错误。"); // 抛出异常 } 在这个例子中，由于我们没有提供完整的URL（缺少协议部分"http://"），所以HessianRPC无法正确解析并创建到服务端的连接，从而抛出了HessianURLException。 4. 解决方案与预防措施面对HessianURLException，我们需要从以下几个方面着手解决问题： 4.1 检查URL格式确保提供的URL是完整且有效的，包括协议（如"http://"或"https://"）、主机名、端口号及资源路径等必要组成部分。 java // 正确的URL格式 HelloService correctService = (HelloService) factory.create(HelloService.class, "http://localhost:8080/hello"); 4.2 确保网络可达性检查客户端和服务端之间的网络连接是否畅通无阻。如果服务端未启动或者防火墙阻止了连接请求，也可能引发此异常。 4.3 异常捕获与处理在代码中合理地处理此类异常，给用户提供明确的错误信息提示。 java try { HelloService service = (HelloService) factory.create(HelloService.class, "http://localhost:8080/hello"); } catch (HessianConnectionException | MalformedURLException e) { System.err.println("无法连接到远程服务，请检查URL和网络状况：" + e.getMessage()); } 5. 总结在我们的编程旅程中，理解并妥善处理像"HessianURLException: 创建或处理URL时发生错误"这样的异常，有助于提升系统的稳定性和健壮性。对于HessianRPC来说，每一个细节都可能影响到远程调用的成功与否。所以呢，真要解决这类问题，归根结底就俩大法宝：一个是牢牢掌握的基础知识，那叫一个扎实；另一个就是严谨到家的编码习惯了，这两样可真是缺一不可的关键所在啊！伙计们，让我们一起瞪大眼睛，鼓起勇气，把HessianRPC变成我们手里的神兵利器，让它在开发分布式应用时，帮我们飞速提升效率，让开发过程更轻松、更给力！

2023-10-16 10:44:02

531

柳暗花明又一村

Netty

Netty中的并发资源分配：线程池与即时通讯应用高负载性能瓶颈应对

...用的高手，用它来搭建服务器端的应用，又快又稳，简直不要太爽！不过嘛，要是我们在同时处理多个任务时搞砸了资源分配，就算有Netty这样的强力帮手也可能会束手无策。 2. 资源分配的误区为什么我们会犯错？在开始之前，让我们先思考一下：为什么我们会选择错误的资源分配算法呢？很多时候，这个问题可能源自于对系统需求的理解不足，或者是对现有技术栈的过度依赖。比如说，如果我们没意识到自己的应用得应对海量的同时请求，然后就随便选了个简单的线程池方案，那到了高峰期，系统卡成狗基本上是躲不掉的。 2.1 案例分析：一个失败的案例假设我们正在开发一款即时通讯应用，目标是支持数千用户同时在线聊天。一开始，我们可能觉得用个固定大小的线程池挺省事儿，以为这样能简化开发流程，结果发现事情没那么简单。不过嘛，在真正的战场里，一旦用户蜂拥而至，这种方法就露馅了：线程池里的线程忙得团团转，新的请求不是被直接拒之门外，就是得乖乖排队，等老半天才轮到自己。这不仅影响了用户体验，也限制了系统的扩展能力。 3. Netty中的并发资源分配寻找正确的路径既然提到了Netty，那么我们就来看看如何利用Netty来解决并发资源分配的问题。Netty提供了多种机制来管理并发访问，其中最常用的莫过于EventLoopGroup和ChannelPipeline。 3.1 EventLoopGroup：并发管理的核心 EventLoopGroup是Netty中用于处理并发请求的核心组件之一。这家伙专门管理一帮EventLoop小弟，每个小弟都负责处理一类特定的活儿，比如读数据啦，写数据啦，干得可带劲了！合理地设置EventLoopGroup，就能更好地分配和管理资源，避免大家抢来抢去的尴尬局面啦。示例代码： java // 创建两个不同的EventLoopGroup，分别用于客户端和服务端 EventLoopGroup bossGroup = new NioEventLoopGroup(1); EventLoopGroup workerGroup = new NioEventLoopGroup(); try { // 创建服务器启动器 ServerBootstrap b = new ServerBootstrap(); b.group(bossGroup, workerGroup) .channel(NioServerSocketChannel.class) .childHandler(new ChannelInitializer() { @Override public void initChannel(SocketChannel ch) throws Exception { ch.pipeline().addLast(new TimeServerHandler()); } }); // 绑定端口，同步等待成功 ChannelFuture f = b.bind(port).sync(); // 等待服务端监听端口关闭 f.channel().closeFuture().sync(); } finally { // 优雅地关闭所有线程组 bossGroup.shutdownGracefully(); workerGroup.shutdownGracefully(); } 在这个例子中，我们创建了两个EventLoopGroup：bossGroup和workerGroup。前者用于接收新的连接请求，后者则负责处理这些连接上的I/O操作。这样的设计不仅提高了并发处理能力，还使得代码结构更加清晰。 3.2 ChannelPipeline：灵活的请求处理管道除了EventLoopGroup之外，Netty还提供了一个非常强大的功能——ChannelPipeline。这简直就是个超级灵活的请求处理流水线，我们可以把一堆处理器像串糖葫芦一样串起来，然后一个个按顺序来处理网络上的请求，简直不要太爽！这种方式非常适合那些需要执行复杂业务逻辑的应用场景。示例代码： java public class TimeServerHandler extends ChannelInboundHandlerAdapter { @Override public void channelRead(ChannelHandlerContext ctx, Object msg) { ByteBuf buf = (ByteBuf) msg; try { byte[] req = new byte[buf.readableBytes()]; buf.readBytes(req); String body = new String(req, "UTF-8"); System.out.println("The time server receive order : " + body); String currentTime = "QUERY TIME ORDER".equalsIgnoreCase(body) ? new Date( System.currentTimeMillis()).toString() : "BAD ORDER"; currentTime = currentTime + System.getProperty("line.separator"); ByteBuf resp = Unpooled.copiedBuffer(currentTime.getBytes()); ctx.write(resp); } finally { buf.release(); } } @Override public void channelReadComplete(ChannelHandlerContext ctx) { ctx.flush(); } @Override public void exceptionCaught(ChannelHandlerContext ctx, Throwable cause) { // 当出现异常时，关闭Channel cause.printStackTrace(); ctx.close(); } } 在这个例子中，我们定义了一个TimeServerHandler类，继承自ChannelInboundHandlerAdapter。这个处理器的主要职责是从客户端接收请求，并返回当前时间作为响应。加个这样的处理器到ChannelPipeline里，我们就能轻轻松松地扩展或者修改请求处理的逻辑，完全不用去动那些复杂的底层网络通信代码。这样一来，调整起来就方便多了！ 4. 结论拥抱变化，不断进化通过上述讨论，我们已经看到了正确选择并发资源分配算法的重要性，以及Netty在这方面的强大支持。当然啦，这只是个开始嘛，真正的考验在于你得根据自己实际用到的地方，不断地调整和优化这些方法。记住，优秀的软件工程师总是愿意拥抱变化，勇于尝试新的技术和方法，以求达到最佳的性能表现和用户体验。希望这篇文章能给大家带来一些启示，让我们一起在技术的海洋里继续探索吧！ --- 这篇技术文章希望能够以一种更贴近实际开发的方式，让大家了解并发资源分配的重要性，并通过Netty提供的强大工具，找到适合自己的解决方案。如果有任何疑问或建议，欢迎随时留言交流！

2024-12-05 15:57:43

102

晚秋落叶

转载文章

[转载]libnids分析（9）---nids.h注释

...，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。 ifndef _NIDS_NIDS_H define _NIDS_NIDS_H define NIDS_MAJOR 1 / 主版本号 / define NIDS_MINOR 20 / 次版本号 / include <sys/types.h> enum { NIDS_WARN_IP = 1, / 表示 IP 数据包异常 / NIDS_WARN_TCP, / 表示 TCP 数据包异常 / NIDS_WARN_UDP, / 表示 UDP 数据包异常 / NIDS_WARN_SCAN / 表示有扫描攻击发生 / }; enum { NIDS_WARN_UNDEFINED = 0, / 表示未定义 / NIDS_WARN_IP_OVERSIZED, / 表示 IP 数据包超长 / NIDS_WARN_IP_INVLIST, / 表示无效的碎片队列 / NIDS_WARN_IP_OVERLAP, / 表示发生重叠 / NIDS_WARN_IP_HDR, / 表示无效 IP首部 ,IP 数据包发生异常 / NIDS_WARN_IP_SRR, / 表示源路由 IP数据包 / NIDS_WARN_TCP_TOOMUCH, / 表示 TCP 数据个数太多 , 因为在Libnids 中在同一时刻捕获的TCP 个数最大值为 TCP 连接参数的哈西表长度的 3/4/ NIDS_WARN_TCP_HDR, / 表示无效 TCP首部 ,TCP 数据包发生异常 / NIDS_WARN_TCP_BIGQUEUE, / 表示 TCP 接受的队列数据过多 / NIDS_WARN_TCP_BADFLAGS / 表示错误标记 / }; /Libnids 状态描述的是连接的逻辑状态, 真正的 TCP 连接状态有 11种 . TCP_ESTABLISHED TCP 连接建立 , 开始传输数据 TCP_SYN_SEND 主动打开 TCP_SYN_RECV 接受 SYN TCP_FIN_WAIT1 TCP_FIN_WAIT2 TCP_TIME_WAIT TCP_CLOSE TCP_CLOSE_WAIT TCP_LAST_ACK TCP_LISTEN TCP_CLOSING / define NIDS_JUST_EST 1 / 表示 TCP 连接建立 , 在此状态下就可以决定是否对此TCP 连接进行数据分析 , 可以决定是否捕获 TCP客户端接收的数据 ,TCP 服务端接收的数据 ,TCP 客户端接收的紧急数据或者TCP 客户端接收的紧急数据 / define NIDS_DATA 2 / 表示接收数据的状态 ,在这个状态可以判断是否有新的数据到达 ,如果有就可以把数据存储起来 , 可以在这个状态之中来分析 TCP 传输的数据 , 此数据就存储在half_stream 数据接口的缓存之中/ define NIDS_CLOSE 3 / 表示 TCP 连接正常关闭 / define NIDS_RESET 4 / 表是 TCP 连接被重置关闭 / define NIDS_TIMED_OUT 5 / 表示由于超时 TCP连接被关闭 / define NIDS_EXITING 6 / 表示 Libnids正在退出 , 在这个状态下可以最后一次使用存储在 half_stream 数据结构中的缓存数据 / / 校验和 / define NIDS_DO_CHKSUM 0 / 表示告诉 Libnids要计算校验和 / define NIDS_DONT_CHKSUM 1 / 表示告诉 Libnids不要计算校验和 / struct tuple4 / 描述一个地址端口对 , 它表示发送发IP 和端口以及接收方 IP 和端口 , 适用 TCP,UDP/ { u_short source; / 源 IP 地址的端口号/ u_short dest; / 目的 IP 地址的端口号/ u_int saddr; / 源 IP 地址 / u_int daddr; / 目的 IP 地址 / }; struct half_stream / 描述在 TCP 连接中一端的所有信息, 可以是客户端 , 也可以是服务端 / { char state; / 表示套接字的状态 , 也就是TCP 的状态 / char collect; / 可以表示有数据到达 , 此数据存放在data 成员中 , 也可以表示不存储此数据到 data中 , 此数据忽略 . 如果大于0 就存储 , 否则就忽略 / char collect_urg; / 可以表示有紧急数据到达 , 此数据就存放在urgdata 中 , 也可以表示不存储此数据到 urgdata中 , 此速数据忽略 . 如果大于0 就存储 , 否则就忽略 / char data; / 用户存储正常接受到的数据 / int offset; / 表示存储在 data 中数据的第一个字节的偏移量/ int count; / 表示从 TCP 连接开始已经存储到data 中的数据的字节数 / int count_new; / 有多少新的数据存储到 data 中, 如果为 0, 则表示没有新的数据到达 / int bufsize; int rmem_alloc; int urg_count; / 用来存储紧急数据 / u_int acked; u_int seq; u_int ack_seq; u_int first_data_seq; u_char urgdata; //存储紧急数据 u_char count_new_urg; / 表示有新的紧急数据到达 , 如果为0 表示没有新的紧急数据 / u_char urg_seen; //新的urg数据，不是以前重复的数据 u_int urg_ptr;/指向urg在流中的位置/ u_short window; u_char ts_on; u_char wscale_on; u_int curr_ts; u_int wscale; struct skbuff list; struct skbuff listtail; }; struct tcp_stream / 描述一个 TCP 连接的所有信息/ { struct tuple4 addr; char nids_state; struct lurker_node listeners; struct half_stream client; / 表示客户端信息 / struct half_stream server; / 表示服务端信息 / struct tcp_stream next_node; struct tcp_stream prev_node; int hash_index; struct tcp_stream next_time; struct tcp_stream prev_time; int read; struct tcp_stream next_free; }; struct nids_prm / 描述了 Libnids 的一些全局参数信息/ { int n_tcp_streams; / 表示哈西表大小 , 此哈西表用来存放tcp_stream 数据结构 , 默认值 1040.在同一时刻 Libnids 捕获的 TCP 数据包的最大个数必须是此参数值的3/4/ int n_hosts; / 表示哈西表的大小 , 此哈西表用来存储IP 碎片信息的 , 默认值为 256/ char device; / 表示网络接口 ,Libnids 将在此网络接口上捕获数据, 默认值为 NULL. 这样 Libnids将使用 pcap_lookupdev来查找可以用的网络接口 . 如果其值为 all, 表示捕获所有网络接口的数据/ char filename; / 表示用来存储网络数据的捕获文件 , 此文件的类型必须与 Libpcap 类型一致 , 如果设置了文件, 与此同时就应该设置 device 为 NULL,默认值为 NULL/ int sk_buff_size; / 表示的是数据接口 sk_buff 的大小 .sk_buff 是Linux 内核中一个重要的数据结构, 是用来进行数据包排队操作的 , 默认值为 168/ int dev_addon; / 表示在数据结构 sk_buff 中用于网络接口上信息的字节数. 如果是 -1( 默认值 ),那么 Libnids 会根据不同的网络接口进行修正 / void (syslog) (); / 是一个函数指针 , 默认值为nids_syslog() 函数 . 在 syslog函数中可以检测入侵攻击 , 如网络扫描攻击 , 也可以检测一些异常情况, 如无效 TCP 标记 / int syslog_level; / 表示日志等级 , 默认值是LOG_ALERT/ int scan_num_hosts; / 表示一个哈西表的大小 ,( 此哈西表用来存储端口扫描信息) 表示 Libnids 将要检测的同时扫描的端口数据 . 如果其值为 0,Libnids将不提供端口扫描功能 . 默认值 256/ int scan_delay; / 表示在扫描检测中 , 俩端口扫描的间隔时间, 以毫秒来计算 , 缺省值为 3000/ int scan_num_ports; / 表示相同源地址必须扫描的 TCP 端口数目 , 默认值为10/ void (no_mem) (char ); / 是一个函数指针 , 当Libnids 发生内存溢出时被调用/ int (ip_filter) (); / 是一个函数指针 , 此函数可以用来分析IP 数据包 , 当有 IP 数据包到达时 , 此函数就被调用. 如果此函数返回非零值 , 此数据包就被处理 ;如果返回零 , 此 IP 数据包就被丢弃. 默认值为 nids_ip_filter 函数 , 总是返回 1./ char pcap_filter; / 表示过滤规则 , 即Libpcap 的过滤规则 , 默认值为 NULL,表示捕获所有数据包 . 可以在此设置过滤规则 , 只捕获感兴趣的开发包/ int promisc; / 表示网卡模式 , 如果是非零, 就把此网卡设置为混杂模式 ; 否则 , 设为非混杂模式 . 默认值为1/ int one_loop_less; / 初始值为 0/ int pcap_timeout; / 表示捕获数据返回的时间 , 以毫秒计算. 实际上它表示的就是 Libpcap 函数中的 pcap_open_live函数的 timeout 参数 , 默认值 1024/ }; / 返回值 : 调用成功返回 1,失败返回 0 参数 : 无功能 : 对 Libnids 初始化, 这是所有设计基于 Libnids 的程序最开始调用的函数 . 它的主要内容包括打开网络接口 , 打开文件 , 编译过滤规则 , 判断网络链路层类型, 进行必要的初始化工作 / int nids_init (void); / 返回值 : 无参数 : 回调函数名字功能 : 注册一个能够检测所有 IP 数据包的回调函数, 包括 IP 碎片 .e.g nids_register_ip_frag(ip_frag_function); void ip_frag_function(struct ip a_packet,int len) a_packet 表示接收的IP 数据包 len 表示接收的数据包长度此回调函数可以检测所有的IP 数据包 , 包括 IP 碎片 / void nids_register_ip_frag (void ()); // / 返回值 : 无参数 : 回调函数名字功能 : 注册一个回调函数 , 此回调函数可以接收正常的IP 数据包 .e.g nids_register_ip_frag(ip_frag_function); void ip_frag_function(struct ip a_packet) a_packet 表示接收的IP 数据包此回调函数可以接收正常的IP 数据包 , 并在此函数中对捕获数到的 IP数据包进行分析 . / void nids_register_ip (void ()); // / 返回值 : 无参数 : 回调函数功能 : 注册一个 TCP 连接的回调函数. 回调函数的类型定义如下 : void tcp_callback(struct tcp_stream ns,void param) ns 表示一个TCP 连接的所有信息 , param 表示要传递的参数信息 , 可以指向一个 TCP连接的私有数据此回调函数接收的TCP 数据存放在 half_stream 的缓存中 , 应该马上取出来 ,一旦此回调函数返回 , 此数据缓存中存储的数据就不存在了 .half_stream 成员 offset描述了被丢弃的数据字节数 . 如果不想马上取出来 , 而是等到存储一定数量的数据之后再取出来, 那么可以使用函数nids_discard(struct tcp_stream ns, int num_bytes)来处理 . 这样回调函数返回时 ,Libnids 将丢弃缓存数据之前的 num_bytes 字节的数据 .如果不调用 nids_discard()函数 , 那么缓存数据的字节应该为 count_new 字节 . 一般情况下, 缓存中的数据应该是count-offset 字节 / void nids_register_tcp (void ()); / 返回值 : 无参数 : 回调函数功能 : 注册一个分析 UDP 协议的回调函数, 回调函数的类型定义如下 : void udp_callback(struct tuple4 addr,char buf,int len,struct ip iph) addr 表示地址端口信息buf 表示 UDP 协议负载的数据内容 len表是 UDP 负载数据的长度 iph 表示一个IP 数据包 , 包括 IP 首部 ,UDP 首部以及UDP 负载内容 / void nids_register_udp (void ()); / 返回值 : 无参数 : 表示一个 TCP 连接功能 : 终止 TCP 连接 . 它实际上是调用 Libnet的函数进行构造数据包 , 然后发送出去 / void nids_killtcp (struct tcp_stream ); / 返回值 : 无参数 : 参数 1 一个 TCP 连接参数 2 个数功能 : 丢弃参数 2 字节 TCP 数据 , 用于存储更多的数据 / void nids_discard (struct tcp_stream , int); / 返回值 : 无参数 : 无功能 : 运行 Libnids, 进入循环捕获数据包状态. 它实际上是调用 Libpcap 函数 pcap_loop()来循环捕获数据包 / void nids_run (void); / 返回值 : 调用成功返回文件描述符 ,失败返回 -1 参数 : 无功能 : 获得文件描述符号 / int nids_getfd (void); / 返回值 : 调用成功返回个数 ,失败返回负数参数 : 表示捕获数据包的个数功能 : 调用 Libpcap 中的捕获数据包函数pcap_dispatch() / int nids_dispatch (int); / 返回值 : 调用成功返回 1,失败返回 0 参数 : 无功能 : 调用 Libpcap 中的捕获数据包函数pcap_next() / int nids_next (void); extern struct nids_prm nids_params; /libnids.c定以了一个全部变量 , 其定义和初始值在 nids_params/ extern char nids_warnings[]; extern char nids_errbuf[]; extern struct pcap_pkthdr nids_last_pcap_header; struct nids_chksum_ctl { / 描述的是计算校验和 , 用于决定是否计算校验和/ u_int netaddr; / 表示地址 / u_int mask; / 表示掩码 / u_int action; / 表示动作 , 如果是NIDS_DO_CHKSUM, 表示计算校验和; 如果是 NIDS_DONT_CHKSUM, 表示不计算校验和 / u_int reserved; / 保留未用 / }; / 返回值 : 无参数 : 参数 1 表示 nids_chksum_ctl 列表参数 2 表示列表中的个数功能 : 决定是否计算校验和 . 它是根据数据结构nids_chksum_ctl 中的action 进行决定的 , 如果所要计算的对象不在列表中 , 则必须都要计算校验和 / extern void nids_register_chksum_ctl(struct nids_chksum_ctl , int); endif / _NIDS_NIDS_H / 本篇文章为转载内容。原文链接：https://blog.csdn.net/xieqb/article/details/7681968。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-02-08 17:36:31

306

转载

转载文章

[转载]史上最通俗，彻底搞懂字符乱码问题的本质

...，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。 1、引言 IM等社交应用的开发工作中，乱码问题也很常见，比如: 1）IM聊天消息中的Emoji表情为什么发给后端后MySQL数据库里会乱码； 2）文件名中带有中文的大文件聊天消息发送后，对方看到的文名是乱码； 3）Http rest接口调用时，后端读取到APP端传过来的参数有中文乱码问题； ... ... 那么，对于乱码这个看似不起眼，但并不是一两话能讲清楚的问题，是很有必要从根源了解字符集和编码原理，知其然知其所以然显然是一个优秀码农的基本素养，所以，便有了本文，希望能帮助到你。推荐阅读：关于字符编码知识的详细讲解请见《字符编码那点事：快速理解ASCII、Unicode、GBK和UTF-8》。学习交流： - 即时通讯/推送技术开发交流5群：215477170 [推荐] - 移动端IM开发入门文章：《新手入门一篇就够：从零开发移动端IM》（本文同步发布于：http://www.52im.net/thread-2868-1-1.html） 2、关于作者卢钧轶：爱捣腾Linux的DBA。曾任职于大众点评网DBA团队，主要关注MySQL、Memcache、MMM等产品的高性能和高可用架构。个人微博：米雪儿侬好的cenalulu Github地址：https://github.com/cenalulu 3、系列文章本文是IM开发干货系列文章中的第21篇，总目录如下：《IM消息送达保证机制实现(一)：保证在线实时消息的可靠投递》《IM消息送达保证机制实现(二)：保证离线消息的可靠投递》《如何保证IM实时消息的“时序性”与“一致性”？》《IM单聊和群聊中的在线状态同步应该用“推”还是“拉”？》《IM群聊消息如此复杂，如何保证不丢不重？》《一种Android端IM智能心跳算法的设计与实现探讨（含样例代码）》《移动端IM登录时拉取数据如何作到省流量？》《通俗易懂：基于集群的移动端IM接入层负载均衡方案分享》《浅谈移动端IM的多点登陆和消息漫游原理》《IM开发基础知识补课(一)：正确理解前置HTTP SSO单点登陆接口的原理》《IM开发基础知识补课(二)：如何设计大量图片文件的服务端存储架构？》《IM开发基础知识补课(三)：快速理解服务端数据库读写分离原理及实践建议》《IM开发基础知识补课(四)：正确理解HTTP短连接中的Cookie、Session和Token》《IM群聊消息的已读回执功能该怎么实现？》《IM群聊消息究竟是存1份(即扩散读)还是存多份(即扩散写)？》《IM开发基础知识补课(五)：通俗易懂，正确理解并用好MQ消息队列》《一个低成本确保IM消息时序的方法探讨》《IM开发基础知识补课(六)：数据库用NoSQL还是SQL？读这篇就够了！》《IM里“附近的人”功能实现原理是什么？如何高效率地实现它？》《IM开发基础知识补课(七)：主流移动端账号登录方式的原理及设计思路》《IM开发基础知识补课(八)：史上最通俗，彻底搞懂字符乱码问题的本质》（本文） 4、正文概述字符集和编码无疑是IT菜鸟甚至是各种大神的头痛问题。当遇到纷繁复杂的字符集，各种火星文和乱码时，问题的定位往往变得非常困难。本文内容就将会从原理方面对字符集和编码做个简单的科普介绍，同时也会介绍一些通用的乱码故障定位的方法以方便读者以后能够更从容的定位相关问题。在正式介绍之前，先做个小申明：如果你希望非常精确的理解各个名词的解释，那么可以详细阅读这篇《字符编码那点事：快速理解ASCII、Unicode、GBK和UTF-8》。本文是博主通过自己理解消化后并转化成易懂浅显的表述后的介绍，会尽量以简单明了的文字来从要源讲解字符集、字符编码的概念，以及在遭遇乱码时的一些常用诊断技巧，希望能助你对于“乱码”问题有更深地理解。 5、什么是字符集在介绍字符集之前，我们先了解下为什么要有字符集。我们在计算机屏幕上看到的是实体化的文字，而在计算机存储介质中存放的实际是二进制的比特流。那么在这两者之间的转换规则就需要一个统一的标准，否则把我们的U盘插到老板的电脑上，文档就乱码了；小伙伴QQ上传过来的文件，在我们本地打开又乱码了。于是为了实现转换标准，各种字符集标准就出现了。简单的说：字符集就规定了某个文字对应的二进制数字存放方式（编码）和某串二进制数值代表了哪个文字（解码）的转换关系。那么为什么会有那么多字符集标准呢？这个问题实际非常容易回答。问问自己为什么我们的插头拿到英国就不能用了呢？为什么显示器同时有DVI、VGA、HDMI、DP这么多接口呢？很多规范和标准在最初制定时并不会意识到这将会是以后全球普适的准则，或者处于组织本身利益就想从本质上区别于现有标准。于是，就产生了那么多具有相同效果但又不相互兼容的标准了。说了那么多我们来看一个实际例子，下面就是“屌”这个字在各种编码下的十六进制和二进制编码结果，怎么样有没有一种很屌的感觉？ 6、什么是字符编码字符集只是一个规则集合的名字，对应到真实生活中，字符集就是对某种语言的称呼。例如：英语，汉语，日语。对于一个字符集来说要正确编码转码一个字符需要三个关键元素： 1）字库表（character repertoire）：是一个相当于所有可读或者可显示字符的数据库，字库表决定了整个字符集能够展现表示的所有字符的范围； 2）编码字符集（coded character set）：即用一个编码值code point来表示一个字符在字库中的位置； 3）字符编码（character encoding form）：将编码字符集和实际存储数值之间的转换关系。一般来说都会直接将code point的值作为编码后的值直接存储。例如在ASCII中“A”在表中排第65位，而编码后A的数值是 0100 0001 也即十进制的65的二进制转换结果。看到这里，可能很多读者都会有和我当初一样的疑问：字库表和编码字符集看来是必不可少的，那既然字库表中的每一个字符都有一个自己的序号，直接把序号作为存储内容就好了。为什么还要多此一举通过字符编码把序号转换成另外一种存储格式呢？其实原因也比较容易理解：统一字库表的目的是为了能够涵盖世界上所有的字符，但实际使用过程中会发现真正用的上的字符相对整个字库表来说比例非常低。例如中文地区的程序几乎不会需要日语字符，而一些英语国家甚至简单的ASCII字库表就能满足基本需求。而如果把每个字符都用字库表中的序号来存储的话，每个字符就需要3个字节（这里以Unicode字库为例），这样对于原本用仅占一个字符的ASCII编码的英语地区国家显然是一个额外成本（存储体积是原来的三倍）。算的直接一些，同样一块硬盘，用ASCII可以存1500篇文章，而用3字节Unicode序号存储只能存500篇。于是就出现了UTF-8这样的变长编码。在UTF-8编码中原本只需要一个字节的ASCII字符，仍然只占一个字节。而像中文及日语这样的复杂字符就需要2个到3个字节来存储。关于字符编码知识的详细讲解请见：《字符编码那点事：快速理解ASCII、Unicode、GBK和UTF-8》。 7、UTF-8和Unicode的关系看完上面两个概念解释，那么解释UTF-8和Unicode的关系就比较简单了。 Unicode就是上文中提到的编码字符集，而UTF-8就是字符编码，即Unicode规则字库的一种实现形式。随着互联网的发展，对同一字库集的要求越来越迫切，Unicode标准也就自然而然的出现。它几乎涵盖了各个国家语言可能出现的符号和文字，并将为他们编号。详见：Unicode百科介绍。 Unicode的编号从 0000 开始一直到10FFFF 共分为17个Plane，每个Plane中有65536个字符。而UTF-8则只实现了第一个Plane，可见UTF-8虽然是一个当今接受度最广的字符集编码，但是它并没有涵盖整个Unicode的字库，这也造成了它在某些场景下对于特殊字符的处理困难（下文会有提到）。 8、UTF-8编码简介为了更好的理解后面的实际应用，我们这里简单的介绍下UTF-8的编码实现方法。即UTF-8的物理存储和Unicode序号的转换关系。 UTF-8编码为变长编码，最小编码单位（code unit）为一个字节。一个字节的前1-3个bit为描述性部分，后面为实际序号部分： 1）如果一个字节的第一位为0，那么代表当前字符为单字节字符，占用一个字节的空间。0之后的所有部分（7个bit）代表在Unicode中的序号； 2）如果一个字节以110开头，那么代表当前字符为双字节字符，占用2个字节的空间。110之后的所有部分（5个bit）加上后一个字节的除10外的部分（6个bit）代表在Unicode中的序号。且第二个字节以10开头； 3）如果一个字节以1110开头，那么代表当前字符为三字节字符，占用3个字节的空间。110之后的所有部分（5个bit）加上后两个字节的除10外的部分（12个bit）代表在Unicode中的序号。且第二、第三个字节以10开头； 4）如果一个字节以10开头，那么代表当前字节为多字节字符的第二个字节。10之后的所有部分（6个bit）和之前的部分一同组成在Unicode中的序号。具体每个字节的特征可见下表，其中“x”代表序号部分，把各个字节中的所有x部分拼接在一起就组成了在Unicode字库中的序号。如下图所示。我们分别看三个从一个字节到三个字节的UTF-8编码例子：细心的读者不难从以上的简单介绍中得出以下规律： 1）3个字节的UTF-8十六进制编码一定是以E开头的； 2）2个字节的UTF-8十六进制编码一定是以C或D开头的； 3）1个字节的UTF-8十六进制编码一定是以比8小的数字开头的。 9、为什么会出现乱码乱码也就是英文常说的mojibake（由日语的文字化け音译）。简单的说乱码的出现是因为：编码和解码时用了不同或者不兼容的字符集。对应到真实生活中：就好比是一个英国人为了表示祝福在纸上写了bless（编码过程）。而一个法国人拿到了这张纸，由于在法语中bless表示受伤的意思，所以认为他想表达的是受伤（解码过程）。这个就是一个现实生活中的乱码情况。在计算机科学中一样：一个用UTF-8编码后的字符，用GBK去解码。由于两个字符集的字库表不一样，同一个汉字在两个字符表的位置也不同，最终就会出现乱码。我们来看一个例子，假设我们用UTF-8编码存储“很屌”两个字，会有如下转换：于是我们得到了E5BE88E5B18C这么一串数值，而显示时我们用GBK解码进行展示，通过查表我们获得以下信息：解码后我们就得到了“寰堝睂”这么一个错误的结果，更要命的是连字符个数都变了。 10、如何识别乱码的本来想要表达的文字要从乱码字符中反解出原来的正确文字需要对各个字符集编码规则有较为深刻的掌握。但是原理很简单，这里用以MySQL数据库中的数据操纵中最常见的UTF-8被错误用GBK展示时的乱码为例，来说明具体反解和识别过程。 10.1 第1步：编码假设我们在页面上看到“寰堝睂”这样的乱码，而又得知我们的浏览器当前使用GBK编码。那么第一步我们就能先通过GBK把乱码编码成二进制表达式。当然查表编码效率很低，我们也可以用以下SQL语句直接通过MySQL客户端来做编码工作： mysql [localhost] {msandbox} > selecthex(convert('寰堝睂'using gbk)); +-------------------------------------+ | hex(convert('寰堝睂'using gbk)) | +-------------------------------------+ | E5BE88E5B18C | +-------------------------------------+ 1 row inset(0.01 sec) 10.2 第2步：识别现在我们得到了解码后的二进制字符串E5BE88E5B18C。然后我们将它按字节拆开。然后套用之前UTF-8编码介绍章节中总结出的规律，就不难发现这6个字节的数据符合UTF-8编码规则。如果整个数据流都符合这个规则的话，我们就能大胆假设乱码之前的编码字符集是UTF-8。 10.3 第3步：解码然后我们就能拿着 E5BE88E5B18C 用UTF-8解码，查看乱码前的文字了。当然我们可以不查表直接通过SQL获得结果： mysql [localhost] {msandbox} ((none)) > selectconvert(0xE5BE88E5B18C using utf8); +------------------------------------+ | convert(0xE5BE88E5B18C using utf8) | +------------------------------------+ | 很屌 | +------------------------------------+ 1 row inset(0.00 sec) 11、常见的IM乱码问题处理之MySQL中的Emoji字符所谓Emoji就是一种在Unicode位于 \u1F601-\u1F64F 区段的字符。这个显然超过了目前常用的UTF-8字符集的编码范围 \u0000-\uFFFF。Emoji表情随着IOS的普及和微信的支持越来越常见。下面就是几个常见的Emoji（IM聊天软件中经常会被用到）：那么Emoji字符表情会对我们平时的开发运维带来什么影响呢？最常见的问题就在于将他存入MySQL数据库的时候。一般来说MySQL数据库的默认字符集都会配置成UTF-8（三字节），而utf8mb4在5.5以后才被支持，也很少会有DBA主动将系统默认字符集改成utf8mb4。那么问题就来了，当我们把一个需要4字节UTF-8编码才能表示的字符存入数据库的时候就会报错：ERROR 1366: Incorrect string value: '\xF0\x9D\x8C\x86' for column 。如果认真阅读了上面的解释，那么这个报错也就不难看懂了：我们试图将一串Bytes插入到一列中，而这串Bytes的第一个字节是 \xF0 意味着这是一个四字节的UTF-8编码。但是当MySQL表和列字符集配置为UTF-8的时候是无法存储这样的字符的，所以报了错。那么遇到这种情况我们如何解决呢？有两种方式： 1）升级MySQL到5.6或更高版本，并且将表字符集切换至utf8mb4； 2）在把内容存入到数据库之前做一次过滤，将Emoji字符替换成一段特殊的文字编码，然后再存入数据库中。之后从数据库获取或者前端展示时再将这段特殊文字编码转换成Emoji显示。第二种方法我们假设用 --1F601-- 来替代4字节的Emoji，那么具体实现python代码可以参见Stackoverflow上的回答。 12、参考文献 [1] 如何配置Python默认字符集 [2] 字符编码那点事：快速理解ASCII、Unicode、GBK和UTF-8 [3] Unicode中文编码表 [4] Emoji Unicode Table [5] Every Developer Should Know About The Encoding 附录：更多IM开发方面的文章 [1] IM开发综合文章：《新手入门一篇就够：从零开发移动端IM》《移动端IM开发者必读(一)：通俗易懂，理解移动网络的“弱”和“慢”》《移动端IM开发者必读(二)：史上最全移动弱网络优化方法总结》《从客户端的角度来谈谈移动端IM的消息可靠性和送达机制》《现代移动端网络短连接的优化手段总结：请求速度、弱网适应、安全保障》《腾讯技术分享：社交网络图片的带宽压缩技术演进之路》《小白必读：闲话HTTP短连接中的Session和Token》《IM开发基础知识补课：正确理解前置HTTP SSO单点登陆接口的原理》《移动端IM开发需要面对的技术问题》《开发IM是自己设计协议用字节流好还是字符流好？》《请问有人知道语音留言聊天的主流实现方式吗？》《一个低成本确保IM消息时序的方法探讨》《完全自已开发的IM该如何设计“失败重试”机制？》《通俗易懂：基于集群的移动端IM接入层负载均衡方案分享》《微信对网络影响的技术试验及分析（论文全文）》《即时通讯系统的原理、技术和应用（技术论文）》《开源IM工程“蘑菇街TeamTalk”的现状：一场有始无终的开源秀》《QQ音乐团队分享：Android中的图片压缩技术详解（上篇）》《QQ音乐团队分享：Android中的图片压缩技术详解（下篇）》《腾讯原创分享(一)：如何大幅提升移动网络下手机QQ的图片传输速度和成功率》《腾讯原创分享(二)：如何大幅压缩移动网络下APP的流量消耗（上篇）》《腾讯原创分享(三)：如何大幅压缩移动网络下APP的流量消耗（下篇）》《如约而至：微信自用的移动端IM网络层跨平台组件库Mars已正式开源》《基于社交网络的Yelp是如何实现海量用户图片的无损压缩的？》《腾讯技术分享：腾讯是如何大幅降低带宽和网络流量的(图片压缩篇)》《腾讯技术分享：腾讯是如何大幅降低带宽和网络流量的(音视频技术篇)》《字符编码那点事：快速理解ASCII、Unicode、GBK和UTF-8》《全面掌握移动端主流图片格式的特点、性能、调优等》《子弹短信光鲜的背后：网易云信首席架构师分享亿级IM平台的技术实践》《微信技术分享：微信的海量IM聊天消息序列号生成实践（算法原理篇）》《自已开发IM有那么难吗？手把手教你自撸一个Andriod版简易IM (有源码)》《融云技术分享：解密融云IM产品的聊天消息ID生成策略》《适合新手：从零开发一个IM服务端（基于Netty，有完整源码）》《拿起键盘就是干：跟我一起徒手开发一套分布式IM系统》 >> 更多同类文章 …… [2] 有关IM架构设计的文章：《浅谈IM系统的架构设计》《简述移动端IM开发的那些坑：架构设计、通信协议和客户端》《一套海量在线用户的移动端IM架构设计实践分享(含详细图文)》《一套原创分布式即时通讯(IM)系统理论架构方案》《从零到卓越：京东客服即时通讯系统的技术架构演进历程》《蘑菇街即时通讯/IM服务器开发之架构选择》《腾讯QQ1.4亿在线用户的技术挑战和架构演进之路PPT》《微信后台基于时间序的海量数据冷热分级架构设计实践》《微信技术总监谈架构：微信之道——大道至简(演讲全文)》《如何解读《微信技术总监谈架构：微信之道——大道至简》》《快速裂变：见证微信强大后台架构从0到1的演进历程（一）》《17年的实践：腾讯海量产品的技术方法论》《移动端IM中大规模群消息的推送如何保证效率、实时性？》《现代IM系统中聊天消息的同步和存储方案探讨》《IM开发基础知识补课(二)：如何设计大量图片文件的服务端存储架构？》《IM开发基础知识补课(三)：快速理解服务端数据库读写分离原理及实践建议》《IM开发基础知识补课(四)：正确理解HTTP短连接中的Cookie、Session和Token》《WhatsApp技术实践分享：32人工程团队创造的技术神话》《微信朋友圈千亿访问量背后的技术挑战和实践总结》《王者荣耀2亿用户量的背后：产品定位、技术架构、网络方案等》《IM系统的MQ消息中间件选型：Kafka还是RabbitMQ？》《腾讯资深架构师干货总结：一文读懂大型分布式系统设计的方方面面》《以微博类应用场景为例，总结海量社交系统的架构设计步骤》《快速理解高性能HTTP服务端的负载均衡技术原理》《子弹短信光鲜的背后：网易云信首席架构师分享亿级IM平台的技术实践》《知乎技术分享：从单机到2000万QPS并发的Redis高性能缓存实践之路》《IM开发基础知识补课(五)：通俗易懂，正确理解并用好MQ消息队列》《微信技术分享：微信的海量IM聊天消息序列号生成实践（算法原理篇）》《微信技术分享：微信的海量IM聊天消息序列号生成实践（容灾方案篇）》《新手入门：零基础理解大型分布式架构的演进历史、技术原理、最佳实践》《一套高可用、易伸缩、高并发的IM群聊、单聊架构方案设计实践》《阿里技术分享：深度揭秘阿里数据库技术方案的10年变迁史》《阿里技术分享：阿里自研金融级数据库OceanBase的艰辛成长之路》《社交软件红包技术解密(一)：全面解密QQ红包技术方案——架构、技术实现等》《社交软件红包技术解密(二)：解密微信摇一摇红包从0到1的技术演进》《社交软件红包技术解密(三)：微信摇一摇红包雨背后的技术细节》《社交软件红包技术解密(四)：微信红包系统是如何应对高并发的》《社交软件红包技术解密(五)：微信红包系统是如何实现高可用性的》《社交软件红包技术解密(六)：微信红包系统的存储层架构演进实践》《社交软件红包技术解密(七)：支付宝红包的海量高并发技术实践》《社交软件红包技术解密(八)：全面解密微博红包技术方案》《社交软件红包技术解密(九)：谈谈手Q红包的功能逻辑、容灾、运维、架构等》《即时通讯新手入门：一文读懂什么是Nginx？它能否实现IM的负载均衡？》《即时通讯新手入门：快速理解RPC技术——基本概念、原理和用途》《多维度对比5款主流分布式MQ消息队列，妈妈再也不担心我的技术选型了》《从游击队到正规军(一)：马蜂窝旅游网的IM系统架构演进之路》《从游击队到正规军(二)：马蜂窝旅游网的IM客户端架构演进和实践总结》《IM开发基础知识补课(六)：数据库用NoSQL还是SQL？读这篇就够了！》《瓜子IM智能客服系统的数据架构设计（整理自现场演讲，有配套PPT）》《阿里钉钉技术分享：企业级IM王者——钉钉在后端架构上的过人之处》 >> 更多同类文章 …… （本文同步发布于：http://www.52im.net/thread-2868-1-1.html）本篇文章为转载内容。原文链接：https://blog.csdn.net/hellojackjiang2011/article/details/103586305。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2024-04-29 12:29:21

522

转载

转载文章

[转载]Redis 原理

...，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。 1、发布订阅模式 1.1 列表的局限通过队列的 rpush 和 lpop 可以实现消息队列(队尾进队头出)，但是消费者需要不停地调用 lpop 查看 List 中是否有等待处理的消息(比如写一个 while 循环)。为了减少通信的消耗，可以 sleep()一段时间再消费，但是会有两个问题: 1、如果生产者生产消息的速度远大于消费者消费消息的速度，List 会占用大量的内存。 2、消息的实时性降低。 list 还提供了一个阻塞的命令:blpop，没有任何元素可以弹出的时候，连接会被阻塞。基于 list 实现的消息队列，不支持一对多的消息分发。 1.2 发布订阅模式除了通过 list 实现消息队列之外，Redis 还提供了一组命令实现发布/订阅模式。这种方式，发送者和接收者没有直接关联(实现了解耦)，接收者也不需要持续尝试获取消息。 1.2.1 订阅频道首先，我们有很多的频道(channel)，我们也可以把这个频道理解成 queue。订阅者可以订阅一个或者多个频道。消息的发布者(生产者)可以给指定的频道发布消息。只要有消息到达了频道，所有订阅了这个频道的订阅者都会收到这条消息。需要注意的注意是，发出去的消息不会被持久化，因为它已经从队列里面移除了，所以消费者只能收到它开始订阅这个频道之后发布的消息。下面我们来看一下发布订阅命令的使用方法。订阅者订阅频道：可以一次订阅多个，比如这个客户端订阅了 3 个频道。 subscribe channel-1 channel-2 channel-3 发布者可以向指定频道发布消息(并不支持一次向多个频道发送消息): publish channel-1 2673 取消订阅(不能在订阅状态下使用): unsubscribe channel-1 1.2.2 按规则(Pattern)订阅频道支持 ?和占位符。? 代表一个字符，代表 0 个或者多个字符。消费端 1，关注运动信息: psubscribe sport 消费端 2，关注所有新闻: psubscribe news 消费端 3，关注天气新闻: psubscribe news-weather 生产者，发布 3 条信息 publish news-sport yaoming publish news-music jaychou publish news-weather rain 2、Redis 事务 2.1 为什么要用事务我们知道 Redis 的单个命令是原子性的(比如 get set mget mset)，如果涉及到多个命令的时候，需要把多个命令作为一个不可分割的处理序列，就需要用到事务。例如我们之前说的用 setnx 实现分布式锁，我们先 set，然后设置对 key 设置 expire，防止 del 发生异常的时候锁不会被释放，业务处理完了以后再 del，这三个动作我们就希望它们作为一组命令执行。 Redis 的事务有两个特点: 1、按进入队列的顺序执行。 2、不会受到其他客户端的请求的影响。 Redis 的事务涉及到四个命令:multi(开启事务)，exec(执行事务)，discard (取消事务)，watch(监视) 2.2 事务的用法案例场景:tom 和 mic 各有 1000 元，tom 需要向 mic 转账 100 元。tom 的账户余额减少 100 元，mic 的账户余额增加 100 元。通过 multi 的命令开启事务。事务不能嵌套，多个 multi 命令效果一样。 multi 执行后，客户端可以继续向服务器发送任意多条命令，这些命令不会立即被执行，而是被放到一个队列中，当 exec 命令被调用时，所有队列中的命令才会被执行。通过 exec 的命令执行事务。如果没有执行 exec，所有的命令都不会被执行。如果中途不想执行事务了，怎么办? 可以调用 discard 可以清空事务队列，放弃执行。 2.3 watch命令在 Redis 中还提供了一个 watch 命令。它可以为 Redis 事务提供 CAS 乐观锁行为(Check and Set / Compare and Swap)，也就是多个线程更新变量的时候，会跟原值做比较，只有它没有被其他线程修改的情况下，才更新成新的值。我们可以用 watch 监视一个或者多个 key，如果开启事务之后，至少有一个被监视 key 键在 exec 执行之前被修改了，那么整个事务都会被取消(key 提前过期除外)。可以用 unwatch 取消。 2.4 事务可能遇到的问题我们把事务执行遇到的问题分成两种，一种是在执行 exec 之前发生错误，一种是在执行 exec 之后发生错误。 2.4.1 在执行 exec 之前发生错误比如：入队的命令存在语法错误，包括参数数量，参数名等等(编译器错误)。在这种情况下事务会被拒绝执行，也就是队列中所有的命令都不会得到执行。 2.4.2 在执行 exec 之后发生错误比如，类型错误，比如对 String 使用了 Hash 的命令，这是一种运行时错误。最后我们发现 set k1 1 的命令是成功的，也就是在这种发生了运行时异常的情况下，只有错误的命令没有被执行，但是其他命令没有受到影响。这个显然不符合我们对原子性的定义，也就是我们没办法用 Redis 的这种事务机制来实现原子性，保证数据的一致。 3、Lua脚本 Lua/ˈluə/是一种轻量级脚本语言，它是用 C 语言编写的，跟数据的存储过程有点类似。使用 Lua 脚本来执行 Redis 命令的好处: 1、一次发送多个命令，减少网络开销。 2、Redis 会将整个脚本作为一个整体执行，不会被其他请求打断，保持原子性。 3、对于复杂的组合命令，我们可以放在文件中，可以实现程序之间的命令集复用。 3.1 在Redis中调用Lua脚本使用 eval /ɪ’væl/ 方法，语法格式: redis> eval lua-script key-num [key1 key2 key3 ....] [value1 value2 value3 ....] eval代表执行Lua语言的命令。 lua-script代表Lua语言脚本内容。 key-num表示参数中有多少个key，需要注意的是Redis中key是从1开始的，如果没有key的参数，那么写0。 [key1key2key3…]是key作为参数传递给Lua语言，也可以不填，但是需要和key-num的个数对应起来。 [value1 value2 value3 …]这些参数传递给 Lua 语言，它们是可填可不填的。示例，返回一个字符串，0 个参数: redis> eval "return 'Hello World'" 0 3.2 在Lua脚本中调用Redis命令使用 redis.call(command, key [param1, param2…])进行操作。语法格式: redis> eval "redis.call('set',KEYS[1],ARGV[1])" 1 lua-key lua-value command是命令，包括set、get、del等。 key是被操作的键。 param1,param2…代表给key的参数。注意跟 Java 不一样，定义只有形参，调用只有实参。 Lua 是在调用时用 key 表示形参，argv 表示参数值(实参)。 3.2.1 设置键值对在 Redis 中调用 Lua 脚本执行 Redis 命令 redis> eval "return redis.call('set',KEYS[1],ARGV[1])" 1 gupao 2673 redis> get gupao 以上命令等价于 set gupao 2673。在 redis-cli 中直接写 Lua 脚本不够方便，也不能实现编辑和复用，通常我们会把脚本放在文件里面，然后执行这个文件。 3.2.2 在 Redis 中调用 Lua 脚本文件中的命令，操作 Redis 创建 Lua 脚本文件: cd /usr/local/soft/redis5.0.5/src vim gupao.lua Lua 脚本内容，先设置，再取值: cd /usr/local/soft/redis5.0.5/src redis-cli --eval gupao.lua 0 得到返回值: root@localhost src] redis-cli --eval gupao.lua 0 "lua666" 3.2.3 案例:对 IP 进行限流需求：在 X 秒内只能访问 Y 次。设计思路：用 key 记录 IP，用 value 记录访问次数。拿到 IP 以后，对 IP+1。如果是第一次访问，对 key 设置过期时间(参数 1)。否则判断次数，超过限定的次数(参数 2)，返回 0。如果没有超过次数则返回 1。超过时间， key 过期之后，可以再次访问。 KEY[1]是 IP， ARGV[1]是过期时间 X，ARGV[2]是限制访问的次数 Y。 -- ip_limit.lua-- IP 限流，对某个 IP 频率进行限制，6 秒钟访问 10 次 local num=redis.call('incr',KEYS[1])if tonumber(num)==1 thenredis.call('expire',KEYS[1],ARGV[1])return 1elseif tonumber(num)>tonumber(ARGV[2]) thenreturn 0 elsereturn 1 end 6 秒钟内限制访问 10 次，调用测试(连续调用 10 次): ./redis-cli --eval "ip_limit.lua" app:ip:limit:192.168.8.111 , 6 10 app:ip:limit:192.168.8.111 是 key 值，后面是参数值，中间要加上一个空格和一个逗号，再加上一个空格。即:./redis-cli –eval [lua 脚本] [key…]空格,空格[args…] 多个参数之间用一个空格分割。代码:LuaTest.java 3.2.4 缓存 Lua 脚本为什么要缓存在脚本比较长的情况下，如果每次调用脚本都需要把整个脚本传给 Redis 服务端，会产生比较大的网络开销。为了解决这个问题，Redis 提供了 EVALSHA 命令，允许开发者通过脚本内容的 SHA1 摘要来执行脚本。如何缓存 Redis 在执行 script load 命令时会计算脚本的 SHA1 摘要并记录在脚本缓存中，执行 EVALSHA 命令时 Redis 会根据提供的摘要从脚本缓存中查找对应的脚本内容，如果找到了则执行脚本，否则会返回错误:“NOSCRIPT No matching script. Please use EVAL.” 127.0.0.1:6379> script load "return 'Hello World'" "470877a599ac74fbfda41caa908de682c5fc7d4b"127.0.0.1:6379> evalsha "470877a599ac74fbfda41caa908de682c5fc7d4b" 0 "Hello World" 3.2.5 自乘案例 Redis 有 incrby 这样的自增命令，但是没有自乘，比如乘以 3，乘以 5。我们可以写一个自乘的运算，让它乘以后面的参数： local curVal = redis.call("get", KEYS[1]) if curVal == false thencurVal = 0 elsecurVal = tonumber(curVal)endcurVal = curVal tonumber(ARGV[1]) redis.call("set", KEYS[1], curVal) return curVal 把这个脚本变成单行，语句之间使用分号隔开 local curVal = redis.call("get", KEYS[1]); if curVal == false then curVal = 0 else curVal = tonumber(curVal) end; curVal = curVal tonumber(ARGV[1]); redis.call("set", KEYS[1], curVal); return curVal script load ‘命令’ 127.0.0.1:6379> script load 'local curVal = redis.call("get", KEYS[1]); if curVal == false then curVal = 0 else curVal = tonumber(curVal) end; curVal = curVal tonumber(ARGV[1]); redis.call("set", KEYS[1], curVal); return curVal' "be4f93d8a5379e5e5b768a74e77c8a4eb0434441" 调用: 127.0.0.1:6379> set num 2OK127.0.0.1:6379> evalsha be4f93d8a5379e5e5b768a74e77c8a4eb0434441 1 num 6 (integer) 12 3.2.6 脚本超时 Redis 的指令执行本身是单线程的，这个线程还要执行客户端的 Lua 脚本，如果 Lua 脚本执行超时或者陷入了死循环，是不是没有办法为客户端提供服务了呢? eval 'while(true) do end' 0 为了防止某个脚本执行时间过长导致 Redis 无法提供服务，Redis 提供了 lua-time-limit 参数限制脚本的最长运行时间，默认为 5 秒钟。 lua-time-limit 5000(redis.conf 配置文件中) 当脚本运行时间超过这一限制后，Redis 将开始接受其他命令但不会执行(以确保脚本的原子性，因为此时脚本并没有被终止)，而是会返回“BUSY”错误。 Redis 提供了一个 script kill 的命令来中止脚本的执行。新开一个客户端: script kill 如果当前执行的 Lua 脚本对 Redis 的数据进行了修改(SET、DEL 等)，那么通过 script kill 命令是不能终止脚本运行的。 127.0.0.1:6379> eval "redis.call('set','gupao','666') while true do end" 0 因为要保证脚本运行的原子性，如果脚本执行了一部分终止，那就违背了脚本原子性的要求。最终要保证脚本要么都执行，要么都不执行。 127.0.0.1:6379> script kill(error) UNKILLABLE Sorry the script already executed write commands against the dataset. You can either wait the scripttermination or kill the server in a hard way using the SHUTDOWN NOSAVE command. 遇到这种情况，只能通过 shutdown nosave 命令来强行终止 redis。 shutdown nosave 和 shutdown 的区别在于 shutdown nosave 不会进行持久化操作，意味着发生在上一次快照后的数据库修改都会丢失。 4、Redis 为什么这么快? 4.1 Redis到底有多快？根据官方的数据，Redis 的 QPS 可以达到 10 万左右(每秒请求数)。 4.2 Redis为什么这么快? 总结:1)纯内存结构、2)单线程、3)多路复用 4.2.1 内存 KV 结构的内存数据库，时间复杂度 O(1)。第二个，要实现这么高的并发性能，是不是要创建非常多的线程? 恰恰相反，Redis 是单线程的。 4.2.2 单线程单线程有什么好处呢? 1、没有创建线程、销毁线程带来的消耗 2、避免了上线文切换导致的 CPU 消耗 3、避免了线程之间带来的竞争问题，例如加锁释放锁死锁等等 4.2.3 异步非阻塞异步非阻塞 I/O，多路复用处理并发连接。 4.3 Redis为什么是单线程的? 不是白白浪费了 CPU 的资源吗? 因为单线程已经够用了，CPU 不是 redis 的瓶颈。Redis 的瓶颈最有可能是机器内存或者网络带宽。既然单线程容易实现，而且 CPU 不会成为瓶颈，那就顺理成章地采用单线程的方案了。 4.4 单线程为什么这么快? 因为 Redis 是基于内存的操作，我们先从内存开始说起。 4.4.1 虚拟存储器(虚拟内存 Vitual Memory) 名词解释:主存:内存;辅存:磁盘(硬盘) 计算机主存(内存)可看作一个由 M 个连续的字节大小的单元组成的数组，每个字节有一个唯一的地址，这个地址叫做物理地址(PA)。早期的计算机中，如果 CPU 需要内存，使用物理寻址，直接访问主存储器。这种方式有几个弊端: 1、在多用户多任务操作系统中，所有的进程共享主存，如果每个进程都独占一块物理地址空间，主存很快就会被用完。我们希望在不同的时刻，不同的进程可以共用同一块物理地址空间。 2、如果所有进程都是直接访问物理内存，那么一个进程就可以修改其他进程的内存数据，导致物理地址空间被破坏，程序运行就会出现异常。为了解决这些问题，我们就想了一个办法，在 CPU 和主存之间增加一个中间层。CPU 不再使用物理地址访问，而是访问一个虚拟地址，由这个中间层把地址转换成物理地址，最终获得数据。这个中间层就叫做虚拟存储器(Virtual Memory)。具体的操作如下所示: 在每一个进程开始创建的时候，都会分配一段虚拟地址，然后通过虚拟地址和物理地址的映射来获取真实数据，这样进程就不会直接接触到物理地址，甚至不知道自己调用的哪块物理地址的数据。目前，大多数操作系统都使用了虚拟内存，如 Windows 系统的虚拟内存、Linux 系统的交换空间等等。Windows 的虚拟内存(pagefile.sys)是磁盘空间的一部分。在 32 位的系统上，虚拟地址空间大小是 2^32bit=4G。在 64 位系统上，最大虚拟地址空间大小是多少? 是不是 2^64bit=10241014TB=1024PB=16EB?实际上没有用到 64 位，因为用不到这么大的空间，而且会造成很大的系统开销。Linux 一般用低 48 位来表示虚拟地址空间，也就是 2^48bit=256T。 cat /proc/cpuinfo address sizes : 40 bits physical, 48 bits virtual 实际的物理内存可能远远小于虚拟内存的大小。总结：引入虚拟内存，可以提供更大的地址空间，并且地址空间是连续的，使得程序编写、链接更加简单。并且可以对物理内存进行隔离，不同的进程操作互不影响。还可以通过把同一块物理内存映射到不同的虚拟地址空间实现内存共享。 4.4.2 用户空间和内核空间为了避免用户进程直接操作内核，保证内核安全，操作系统将虚拟内存划分为两部分，一部分是内核空间(Kernel-space)/ˈkɜːnl /，一部分是用户空间(User-space)。内核是操作系统的核心，独立于普通的应用程序，可以访问受保护的内存空间，也有访问底层硬件设备的权限。内核空间中存放的是内核代码和数据，而进程的用户空间中存放的是用户程序的代码和数据。不管是内核空间还是用户空间，它们都处于虚拟空间中，都是对物理地址的映射。在 Linux 系统中, 内核进程和用户进程所占的虚拟内存比例是 1:3。当进程运行在内核空间时就处于内核态，而进程运行在用户空间时则处于用户态。进程在内核空间以执行任意命令，调用系统的一切资源;在用户空间只能执行简单的运算，不能直接调用系统资源，必须通过系统接口(又称 system call)，才能向内核发出指令。 top 命令: us 代表 CPU 消耗在 User space 的时间百分比; sy 代表 CPU 消耗在 Kernel space 的时间百分比。 4.4.3 进程切换(上下文切换) 多任务操作系统是怎么实现运行远大于 CPU 数量的任务个数的? 当然，这些任务实际上并不是真的在同时运行，而是因为系统通过时间片分片算法，在很短的时间内，将 CPU 轮流分配给它们，造成多任务同时运行的错觉。为了控制进程的执行，内核必须有能力挂起正在 CPU 上运行的进程，并恢复以前挂起的某个进程的执行。这种行为被称为进程切换。什么叫上下文? 在每个任务运行前，CPU 都需要知道任务从哪里加载、又从哪里开始运行，也就是说，需要系统事先帮它设置好 CPU 寄存器和程序计数器(ProgramCounter)，这个叫做 CPU 的上下文。而这些保存下来的上下文，会存储在系统内核中，并在任务重新调度执行时再次加载进来。这样就能保证任务原来的状态不受影响，让任务看起来还是连续运行。在切换上下文的时候，需要完成一系列的工作，这是一个很消耗资源的操作。 4.4.4 进程的阻塞正在运行的进程由于提出系统服务请求(如 I/O 操作)，但因为某种原因未得到操作系统的立即响应，该进程只能把自己变成阻塞状态，等待相应的事件出现后才被唤醒。进程在阻塞状态不占用 CPU 资源。 4.4.5 文件描述符 FD Linux 系统将所有设备都当作文件来处理，而 Linux 用文件描述符来标识每个文件对象。文件描述符(File Descriptor)是内核为了高效管理已被打开的文件所创建的索引，用于指向被打开的文件，所有执行 I/O 操作的系统调用都通过文件描述符;文件描述符是一个简单的非负整数，用以表明每个被进程打开的文件。 Linux 系统里面有三个标准文件描述符。 0:标准输入(键盘); 1:标准输出(显示器); 2:标准错误输出(显示器)。 4.4.6 传统 I/O 数据拷贝以读操作为例: 当应用程序执行 read 系统调用读取文件描述符(FD)的时候，如果这块数据已经存在于用户进程的页内存中，就直接从内存中读取数据。如果数据不存在，则先将数据从磁盘加载数据到内核缓冲区中，再从内核缓冲区拷贝到用户进程的页内存中。(两次拷贝，两次 user 和 kernel 的上下文切换)。 I/O 的阻塞到底阻塞在哪里? 4.4.7 Blocking I/O 当使用 read 或 write 对某个文件描述符进行过读写时，如果当前 FD 不可读，系统就不会对其他的操作做出响应。从设备复制数据到内核缓冲区是阻塞的，从内核缓冲区拷贝到用户空间，也是阻塞的，直到 copy complete，内核返回结果，用户进程才解除 block 的状态。为了解决阻塞的问题，我们有几个思路。 1、在服务端创建多个线程或者使用线程池，但是在高并发的情况下需要的线程会很多，系统无法承受，而且创建和释放线程都需要消耗资源。 2、由请求方定期轮询，在数据准备完毕后再从内核缓存缓冲区复制数据到用户空间 (非阻塞式 I/O)，这种方式会存在一定的延迟。能不能用一个线程处理多个客户端请求? 4.4.8 I/O 多路复用(I/O Multiplexing) I/O 指的是网络 I/O。多路指的是多个 TCP 连接(Socket 或 Channel)。复用指的是复用一个或多个线程。它的基本原理就是不再由应用程序自己监视连接，而是由内核替应用程序监视文件描述符。客户端在操作的时候，会产生具有不同事件类型的 socket。在服务端，I/O 多路复用程序(I/O Multiplexing Module)会把消息放入队列中，然后通过文件事件分派器(File event Dispatcher)，转发到不同的事件处理器中。多路复用有很多的实现，以 select 为例，当用户进程调用了多路复用器，进程会被阻塞。内核会监视多路复用器负责的所有 socket，当任何一个 socket 的数据准备好了，多路复用器就会返回。这时候用户进程再调用 read 操作，把数据从内核缓冲区拷贝到用户空间。所以，I/O 多路复用的特点是通过一种机制一个进程能同时等待多个文件描述符，而这些文件描述符(套接字描述符)其中的任意一个进入读就绪(readable)状态，select() 函数就可以返回。 Redis 的多路复用，提供了 select, epoll, evport, kqueue 几种选择，在编译的时候来选择一种。 evport 是 Solaris 系统内核提供支持的; epoll 是 LINUX 系统内核提供支持的; kqueue 是 Mac 系统提供支持的; select 是 POSIX 提供的，一般的操作系统都有支撑(保底方案); 源码 ae_epoll.c、ae_select.c、ae_kqueue.c、ae_evport.c 5、内存回收 Reids 所有的数据都是存储在内存中的，在某些情况下需要对占用的内存空间进行回收。内存回收主要分为两类，一类是 key 过期，一类是内存使用达到上限(max_memory) 触发内存淘汰。 5.1 过期策略要实现 key 过期，我们有几种思路。 5.1.1 定时过期(主动淘汰) 每个设置过期时间的 key 都需要创建一个定时器，到过期时间就会立即清除。该策略可以立即清除过期的数据，对内存很友好;但是会占用大量的 CPU 资源去处理过期的数据，从而影响缓存的响应时间和吞吐量。 5.1.2 惰性过期(被动淘汰) 只有当访问一个 key 时，才会判断该 key 是否已过期，过期则清除。该策略可以最大化地节省 CPU 资源，却对内存非常不友好。极端情况可能出现大量的过期 key 没有再次被访问，从而不会被清除，占用大量内存。例如 String，在 getCommand 里面会调用 expireIfNeeded server.c expireIfNeeded(redisDb db, robj key) 第二种情况，每次写入 key 时，发现内存不够，调用 activeExpireCycle 释放一部分内存。 expire.c activeExpireCycle(int type) 5.1.3 定期过期源码:server.h typedef struct redisDb { dict dict; / 所有的键值对 /dict expires; / 设置了过期时间的键值对 /dict blocking_keys; dict ready_keys; dict watched_keys; int id;long long avg_ttl;list defrag_later; } redisDb; 每隔一定的时间，会扫描一定数量的数据库的 expires 字典中一定数量的 key，并清除其中已过期的 key。该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时，可以在不同情况下使得 CPU 和内存资源达到最优的平衡效果。 Redis 中同时使用了惰性过期和定期过期两种过期策略。 5.2 淘汰策略 Redis 的内存淘汰策略，是指当内存使用达到最大内存极限时，需要使用淘汰算法来决定清理掉哪些数据，以保证新数据的存入。 5.2.1 最大内存设置 redis.conf 参数配置: maxmemory <bytes> 如果不设置 maxmemory 或者设置为 0，64 位系统不限制内存，32 位系统最多使用 3GB 内存。动态修改: redis> config set maxmemory 2GB 到达最大内存以后怎么办? 5.2.2 淘汰策略 https://redis.io/topics/lru-cache redis.conf maxmemory-policy noeviction 先从算法来看: LRU，Least Recently Used:最近最少使用。判断最近被使用的时间，目前最远的数据优先被淘汰。 LFU，Least Frequently Used，最不常用，4.0 版本新增。 random，随机删除。如果没有符合前提条件的 key 被淘汰，那么 volatile-lru、volatile-random、 volatile-ttl 相当于 noeviction(不做内存回收)。动态修改淘汰策略: redis> config set maxmemory-policy volatile-lru 建议使用 volatile-lru，在保证正常服务的情况下，优先删除最近最少使用的 key。 5.2.3 LRU 淘汰原理问题：如果基于传统 LRU 算法实现 Redis LRU 会有什么问题? 需要额外的数据结构存储，消耗内存。 Redis LRU 对传统的 LRU 算法进行了改良，通过随机采样来调整算法的精度。如果淘汰策略是 LRU，则根据配置的采样值 maxmemory_samples(默认是 5 个), 随机从数据库中选择 m 个 key, 淘汰其中热度最低的 key 对应的缓存数据。所以采样参数m配置的数值越大, 就越能精确的查找到待淘汰的缓存数据,但是也消耗更多的CPU计算,执行效率降低。问题：如何找出热度最低的数据? Redis 中所有对象结构都有一个 lru 字段, 且使用了 unsigned 的低 24 位，这个字段用来记录对象的热度。对象被创建时会记录 lru 值。在被访问的时候也会更新 lru 的值。但是不是获取系统当前的时间戳，而是设置为全局变量 server.lruclock 的值。源码：server.h typedef struct redisObject {unsigned type:4;unsigned encoding:4;unsigned lru:LRU_BITS;int refcount;void ptr; } robj; server.lruclock 的值怎么来的? Redis 中有个定时处理的函数 serverCron，默认每 100 毫秒调用函数 updateCachedTime 更新一次全局变量的 server.lruclock 的值，它记录的是当前 unix 时间戳。源码:server.c void updateCachedTime(void) { time_t unixtime = time(NULL); atomicSet(server.unixtime,unixtime); server.mstime = mstime();struct tm tm; localtime_r(&server.unixtime,&tm);server.daylight_active = tm.tm_isdst; } 问题:为什么不获取精确的时间而是放在全局变量中?不会有延迟的问题吗? 这样函数 lookupKey 中更新数据的 lru 热度值时,就不用每次调用系统函数 time，可以提高执行效率。 OK，当对象里面已经有了 LRU 字段的值，就可以评估对象的热度了。函数 estimateObjectIdleTime 评估指定对象的 lru 热度，思想就是对象的 lru 值和全局的 server.lruclock 的差值越大(越久没有得到更新)，该对象热度越低。源码 evict.c / Given an object returns the min number of milliseconds the object was never requested, using an approximated LRU algorithm. /unsigned long long estimateObjectIdleTime(robj o) {unsigned long long lruclock = LRU_CLOCK(); if (lruclock >= o->lru) {return (lruclock - o->lru) LRU_CLOCK_RESOLUTION; } else {return (lruclock + (LRU_CLOCK_MAX - o->lru)) LRU_CLOCK_RESOLUTION;} } server.lruclock 只有 24 位，按秒为单位来表示才能存储 194 天。当超过 24bit 能表示的最大时间的时候，它会从头开始计算。 server.h define LRU_CLOCK_MAX ((1<<LRU_BITS)-1) / Max value of obj->lru / 在这种情况下，可能会出现对象的 lru 大于 server.lruclock 的情况，如果这种情况出现那么就两个相加而不是相减来求最久的 key。为什么不用常规的哈希表+双向链表的方式实现?需要额外的数据结构，消耗资源。而 Redis LRU 算法在 sample 为 10 的情况下，已经能接近传统 LRU 算法了。问题:除了消耗资源之外，传统 LRU 还有什么问题? 如图，假设 A 在 10 秒内被访问了 5 次，而 B 在 10 秒内被访问了 3 次。因为 B 最后一次被访问的时间比 A 要晚，在同等的情况下，A 反而先被回收。问题:要实现基于访问频率的淘汰机制，怎么做? 5.2.4 LFU server.h typedef struct redisObject {unsigned type:4;unsigned encoding:4;unsigned lru:LRU_BITS;int refcount;void ptr; } robj; 当这 24 bits 用作 LFU 时，其被分为两部分: 高 16 位用来记录访问时间(单位为分钟，ldt，last decrement time) 低 8 位用来记录访问频率，简称 counter(logc，logistic counter) counter 是用基于概率的对数计数器实现的，8 位可以表示百万次的访问频率。对象被读写的时候，lfu 的值会被更新。 db.c——lookupKey void updateLFU(robj val) {unsigned long counter = LFUDecrAndReturn(val); counter = LFULogIncr(counter);val->lru = (LFUGetTimeInMinutes()<<8) | counter;} 增长的速率由，lfu-log-factor 越大，counter 增长的越慢 redis.conf 配置文件。 lfu-log-factor 10 如果计数器只会递增不会递减，也不能体现对象的热度。没有被访问的时候，计数器怎么递减呢? 减少的值由衰减因子 lfu-decay-time(分钟)来控制，如果值是 1 的话，N 分钟没有访问就要减少 N。 redis.conf 配置文件 lfu-decay-time 1 6、持久化机制 https://redis.io/topics/persistence Redis 速度快，很大一部分原因是因为它所有的数据都存储在内存中。如果断电或者宕机，都会导致内存中的数据丢失。为了实现重启后数据不丢失，Redis 提供了两种持久化的方案，一种是 RDB 快照(Redis DataBase)，一种是 AOF(Append Only File)。 6.1 RDB RDB 是 Redis 默认的持久化方案。当满足一定条件的时候，会把当前内存中的数据写入磁盘，生成一个快照文件 dump.rdb。Redis 重启会通过加载 dump.rdb 文件恢复数据。什么时候写入 rdb 文件? 6.1.1 RDB 触发 1、自动触发 a)配置规则触发。 redis.conf， SNAPSHOTTING，其中定义了触发把数据保存到磁盘的触发频率。如果不需要 RDB 方案，注释 save 或者配置成空字符串""。 save 900 1 900 秒内至少有一个 key 被修改(包括添加) save 300 10 400 秒内至少有 10 个 key 被修改save 60 10000 60 秒内至少有 10000 个 key 被修改注意上面的配置是不冲突的，只要满足任意一个都会触发。 RDB 文件位置和目录: 文件路径，dir ./ 文件名称dbfilename dump.rdb 是否是LZF压缩rdb文件 rdbcompression yes 开启数据校验 rdbchecksum yes 问题：为什么停止 Redis 服务的时候没有 save，重启数据还在? RDB 还有两种触发方式: b)shutdown 触发，保证服务器正常关闭。 c)flushall，RDB 文件是空的，没什么意义(删掉 dump.rdb 演示一下)。 2、手动触发如果我们需要重启服务或者迁移数据，这个时候就需要手动触 RDB 快照保存。Redis 提供了两条命令: a)save save 在生成快照的时候会阻塞当前 Redis 服务器， Redis 不能处理其他命令。如果内存中的数据比较多，会造成 Redis 长时间的阻塞。生产环境不建议使用这个命令。为了解决这个问题，Redis 提供了第二种方式。执行 bgsave 时，Redis 会在后台异步进行快照操作，快照同时还可以响应客户端请求。具体操作是 Redis 进程执行 fork 操作创建子进程(copy-on-write)，RDB 持久化过程由子进程负责，完成后自动结束。它不会记录 fork 之后后续的命令。阻塞只发生在 fork 阶段，一般时间很短。用 lastsave 命令可以查看最近一次成功生成快照的时间。 6.1.2 RDB 数据的恢复(演示) 1、shutdown 持久化添加键值添加键值 redis> set k1 1 redis> set k2 2 redis> set k3 3 redis> set k4 4 redis> set k5 5 停服务器，触发 save redis> shutdown 备份 dump.rdb 文件 cp dump.rdb dump.rdb.bak 启动服务器 /usr/local/soft/redis-5.0.5/src/redis-server /usr/local/soft/redis-5.0.5/redis.conf 啥都没有: redis> keys 3、通过备份文件恢复数据停服务器 redis> shutdown 重命名备份文件 mv dump.rdb.bak dump.rdb 启动服务器 /usr/local/soft/redis-5.0.5/src/redis-server /usr/local/soft/redis-5.0.5/redis.conf 查看数据 redis> keys 6.1.3 RDB 文件的优势和劣势一、优势 1.RDB 是一个非常紧凑(compact)的文件，它保存了 redis 在某个时间点上的数据集。这种文件非常适合用于进行备份和灾难恢复。 2.生成 RDB 文件的时候，redis 主进程会 fork()一个子进程来处理所有保存工作，主进程不需要进行任何磁盘 IO 操作。 3.RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。二、劣势 1、RDB 方式数据没办法做到实时持久化/秒级持久化。因为 bgsave 每次运行都要执行 fork 操作创建子进程，频繁执行成本过高。 2、在一定间隔时间做一次备份，所以如果 redis 意外 down 掉的话，就会丢失最后一次快照之后的所有修改(数据有丢失)。如果数据相对来说比较重要，希望将损失降到最小，则可以使用 AOF 方式进行持久化。 6.2 AOF Append Only File AOF:Redis 默认不开启。AOF 采用日志的形式来记录每个写操作，并追加到文件中。开启后，执行更改 Redis 数据的命令时，就会把命令写入到 AOF 文件中。 Redis 重启时会根据日志文件的内容把写指令从前到后执行一次以完成数据的恢复工作。 6.2.1 AOF 配置配置文件 redis.conf 开关appendonly no 文件名appendfilename "appendonly.aof" AOF 文件的内容(vim 查看): 问题：数据都是实时持久化到磁盘吗? 由于操作系统的缓存机制，AOF 数据并没有真正地写入硬盘，而是进入了系统的硬盘缓存。什么时候把缓冲区的内容写入到 AOF 文件? 问题:文件越来越大，怎么办? 由于 AOF 持久化是 Redis 不断将写命令记录到 AOF 文件中，随着 Redis 不断的进行，AOF 的文件会越来越大，文件越大，占用服务器内存越大以及 AOF 恢复要求时间越长。例如 set xxx 666，执行 1000 次，结果都是 xxx=666。为了解决这个问题，Redis 新增了重写机制，当 AOF 文件的大小超过所设定的阈值时，Redis 就会启动 AOF 文件的内容压缩，只保留可以恢复数据的最小指令集。可以使用命令 bgrewriteaof 来重写。 AOF 文件重写并不是对原文件进行重新整理，而是直接读取服务器现有的键值对，然后用一条命令去代替之前记录这个键值对的多条命令，生成一个新的文件后去替换原来的 AOF 文件。重写触发机制 auto-aof-rewrite-percentage 100 auto-aof-rewrite-min-size 64mb 问题:重写过程中，AOF 文件被更改了怎么办? 另外有两个与 AOF 相关的参数: 6.2.2 AOF 数据恢复重启 Redis 之后就会进行 AOF 文件的恢复。 6.2.3 AOF 优势与劣势优点: 1、AOF 持久化的方法提供了多种的同步频率，即使使用默认的同步频率每秒同步一次，Redis 最多也就丢失 1 秒的数据而已。缺点: 1、对于具有相同数据的的 Redis，AOF 文件通常会比 RDB 文件体积更大(RDB 存的是数据快照)。 2、虽然 AOF 提供了多种同步的频率，默认情况下，每秒同步一次的频率也具有较高的性能。在高并发的情况下，RDB 比 AOF 具好更好的性能保证。 6.3 两种方案比较那么对于 AOF 和 RDB 两种持久化方式，我们应该如何选择呢? 如果可以忍受一小段时间内数据的丢失，毫无疑问使用 RDB 是最好的，定时生成 RDB 快照(snapshot)非常便于进行数据库备份，并且 RDB 恢复数据集的速度也要比 AOF 恢复的速度要快。否则就使用 AOF 重写。但是一般情况下建议不要单独使用某一种持久化机制，而是应该两种一起用，在这种情况下,当 redis 重启的时候会优先载入 AOF 文件来恢复原始的数据，因为在通常情况下 AOF 文件保存的数据集要比 RDB 文件保存的数据集要完整。本篇文章为转载内容。原文链接：https://blog.csdn.net/zhoutaochun/article/details/120075092。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2024-03-18 12:25:04

541

转载

HessianRPC

Hessian RPC协议启用二进制格式：提升数据传输效率、降低网络延迟及优化分布式系统性能

...应运而生。你知道吗，Hessian RPC协议这个家伙可厉害了！它那轻巧灵活的身段、飞一般的速度表现，还有那跨平台无缝切换的能力，在咱们行业中可是火得不得了，被大家伙广泛应用着呢！然而，对于Hessian来说，其默认使用的文本格式在数据传输时可能存在性能瓶颈。这个时候，我们可以选择开启Hessian RPC协议这个小功能，让它用二进制的方式帮我们交换数据。这样一来，Hessian的性能就能蹭蹭地往上提升不少！二、Hessian RPC协议的基本原理 Hessian是一种Java语言编写的高性能二进制序列化协议，主要用于对象的远程调用和数据交换。它就像个神奇的小帮手，能将Java对象瞬间变成二进制的小溪流，然后嗖地一下穿越网络，让数据交换变得更迅捷、更高效。 Hessian RPC协议是在Hessian协议的基础上扩展出来的，它提供了完整的RPC框架，包括请求/响应模型、错误处理机制、缓存管理等功能。跟普通的Hessian相比，Hessian RPC协议就像个升级版的小能手，它的可扩展性和易用性简直不要太赞，让你在捣鼓分布式系统设计和开发时，感觉轻松愉快、如虎添翼。三、启用Hessian RPC协议在Hessian中，我们可以通过设置hessian.config.useBinaryProtocol属性为true，来启用Hessian RPC协议的二进制模式。具体代码如下： java // 设置Hessian配置 HessianConfig config = new HessianConfig(); config.setUseBinaryProtocol(true); // 创建Hessian服务端对象 HessianService service = new HessianService(config); service.export(new EchoServiceImpl()); 上述代码首先创建了一个Hessian配置对象，并将其useBinaryProtocol属性设置为true，表示启用二进制模式。接着，我们捣鼓出一个Hessian服务端的小家伙，把它帅气地挂到网上，这样一来客户端的伙伴们就能随时来调用它了。四、使用Hessian RPC协议进行数据交换在启用Hessian RPC协议后，我们就可以使用二进制格式进行数据交换了。下面是一个简单的示例： java // 创建Hessian客户端对象 HessianClient client = new HessianClient("http://localhost:8080/hessian"); // 调用服务端方法并获取结果 EchoResponse response = (EchoResponse) client.invoke("echo", "Hello, Hessian!"); System.out.println(response.getMessage()); // 输出：Hello, Hessian! 上述代码首先创建了一个Hessian客户端对象，并连接到了运行在本地主机上的Hessian服务端。然后，我们调用了服务端的echo方法，并传入了一个字符串参数。最后，我们将服务端返回的结果打印出来。五、结论总的来说，通过启用Hessian RPC协议，我们可以将Hessian的默认文本格式转换为高效的二进制格式，从而显著提高Hessian的性能。另外，Hessian RPC协议还带了一整套超给力的功能，这对我们更顺溜地设计和搭建分布式系统可是大有裨益！在未来的工作中，我们将继续探索Hessian和Hessian RPC协议的更多特性，以及它们在实际应用中的最佳实践。不久的将来，我可以肯定地跟你说，会有越来越多的企业开始拥抱Hessian和Hessian RPC协议，为啥呢？因为它们能让网络应用跑得更快、更稳、更靠谱。这样一来，构建出的网络服务就更加顶呱呱了！

2023-01-11 23:44:57

444

雪落无痕-t

Docker

docker映射ip(docker映射容器目录到宿主机)

...的某个端口与容器内部服务监听的端口进行关联绑定。通过端口映射，外部客户端可以通过访问主机的 IP 地址及指定端口号，间接访问到容器内运行的服务，实现了容器内外网络通信的桥梁作用。 docker run , docker run 是 Docker 容器生命周期管理中的一个重要命令，用于启动一个新的容器实例。该命令可以一次性完成拉取镜像、创建容器并启动容器等一系列操作。在本文中，docker run -p 参数组合被用来执行端口映射，即将主机端口与容器端口对应起来，使得外部可以直接访问主机IP和指定端口来连接到容器内部的服务。 NetworkSettings.Networks , 在 Docker 容器的 inspect 输出信息中，NetworkSettings.Networks 表示容器在网络配置方面的详细信息，包括容器加入的所有网络及其对应的网络接口设置。在本文中，通过 docker inspect 命令结合 --format 参数和特定模板语法查询容器的 IPAddress，获取的是当前容器在某一网络下的内部 IP 地址，这对于需要直接基于容器内部 IP 访问其服务的场景尤为关键。

2023-09-21 17:15:59

837

电脑达人

知识学习

实践的时候请根据实际情况谨慎操作。

随机学习一条linux命令：

sort -nr file.txt - 按数值逆序对文件内容进行排序。