前端技术
HTML
CSS
Javascript
前端框架和UI库
VUE
ReactJS
AngularJS
JQuery
NodeJS
JSON
Element-UI
Bootstrap
Material UI
服务端和客户端
Java
Python
PHP
Golang
Scala
Kotlin
Groovy
Ruby
Lua
.net
c#
c++
后端WEB和工程框架
SpringBoot
SpringCloud
Struts2
MyBatis
Hibernate
Tornado
Beego
Go-Spring
Go Gin
Go Iris
Dubbo
HessianRPC
Maven
Gradle
数据库
MySQL
Oracle
Mongo
中间件与web容器
Redis
MemCache
Etcd
Cassandra
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Nacos
Consul
Tomcat
Nginx
Netty
大数据技术
Hive
Impala
ClickHouse
DorisDB
Greenplum
PostgreSQL
HBase
Kylin
Hadoop
Apache Pig
ZooKeeper
SeaTunnel
Sqoop
Datax
Flink
Spark
Mahout
数据搜索与日志
ElasticSearch
Apache Lucene
Apache Solr
Kibana
Logstash
数据可视化与OLAP
Apache Atlas
Superset
Saiku
Tesseract
系统与容器
Linux
Shell
Docker
Kubernetes
[沟通成本与任务分配的关系]的搜索结果
这里是文章列表。热门标签的颜色随机变换,标签颜色没有特殊含义。
点击某个标签可搜索标签相关的文章。
点击某个标签可搜索标签相关的文章。
转载文章
...上印像较深的应该就是任务的划分,专业一点就是WBS的分解,如何分解得好,不同的分解都能把任务分解下来,而且表面上也是满足要求的,但是可以说不同的分解在时间或者理解或者沟通成本等方面都会有影响。 做为程序员,我们先看看下面代码 一 for(int i=0;i<1000;i++){for(int j=0;j<10;j++){//do something } } 二 for(int j=0;j<10;j++){for(int i=0;i<1000;i++){//do something } } 针对这两段代码 都是以 i,j为参数做一些事情,但是两个的效果是否一样呢?没有区别,对在程序上面什么区别,结果也基本上没有什么区别。但是我今天的文章中是认为这个是有区别的。你现在要把10000箱东西搬上1楼,现在有两种方案,第一种是 每次搬10箱,搬1000次,第二种是 每次搬1000箱,搬10次。所以这里看出来就是有区别的了,这个我们就要看什么成本高,比如一次搬10箱 成本为X,每增加一箱会增加小x的成本,但是上一次楼的成本是Y,那么两种方案会得到如下成本公式。 第一种:成本=X+1000Y 第二种:成本=X+990x+10Y 最后通过计算是能选出来个成本最低的方案来执行的。 回到工作分解结构上来的。比如3个功能要分解,每个功能有3部分,1.接收数据,2.处理数据,3.写入数据库,当然三个功能是不同的内容,只是大体结构相同。我目前见得最多的是这样分,直接按3个功能分成3个任务,一种是一个功能的一部分分成一个任务,也就是分下来有6个任务。 这里我有点微微的吐嘲一下分成6个任务的坏处。我们先说一下好处。 1.3个人每个人拿3个小任务,任务显得小,对他们压力小一些。 2.每个人处理自己的3个任务类似,可能处理整速度快,而且分配时按善长哪一块分配哪一块的方式,较为合理。 下面说一下坏处,我认为还是弊大于利,下面列一些坏处(因为目前公司就是很多这样分配的任务) 1.3部分功能,3个文档,如果分给3个人来做,那么每个人都要求很精确的理解文档的意思,然后找出自己要做的部分来处理。 2.3个人看3个文档,假设每个文档由一个设计人员设计,那么这3个设计人员都要与3个开发人员产生沟通(所以沟通成本约为第一种方安的3倍,可能小于3倍) 3.开发人员在这种做多个相似(我们假设相似,其实这些问题因该由一个好的架构设计来处理)的编码情况下容易厌倦,产生复制修改代码的情况。 4.还有一部分成本前面3点都没有说到,也是沟通的成本,也就是一个功能里面的三个部分的衔接问题,也就是每个功能模块多了2个开发人员的沟通,也就是多出6个单位沟通成本。 先就说这么几点吧。但是我觉得已经很致命了,公司经常出现重复的沟通,就是上面所说的一个设计人员要同多个开发说明一件事情,而且不是在一起说,是开发在参与到开发过程中时,反馈回去,然后只有同这个开发沟通,可能与每个开发沟通的内容有一部分不是重复的,但是他们的设计内容都是一个模块当中的。而且公司经常出来开发与开发的衔接部分的沟通,有分歧时也会叫设计人员参与进来。所以这样分配的最大的成本就是沟通上面的成本,或者是变更方面的成本最大,比如一个功能模块有要变动,那么可能要通知3个开发人员。要是第一种方案可能就通知一个开发人员就行了。这里也不是说其他的人员不通知,我这里的意思是通知的力度是不一样的,如果是一个责任矩阵(Responsibility Matrix)来看的话,可能这种一点的方案会3个开发人员A,一个组长R,其它人员I。如果是上面一种方案那么可能是1个开发人员A,一个组长R,其它人员I.这里我也就是想说明他们的力度是不一样的。当然成本肯定也不一样。 插入:(我打算在以后的文章中加入插入系列,主要用于解释一些我认为比较有趣,或者有用,或者对我对大家来说可能陌生,但是有印像,本人也是通过查询总结出来的一些东西,多数为一些名词解释) 插入: 责任矩阵 责任矩阵是以表格形式表示完成工作分解结构中工作细目的个人责任方法。这是在项目管理中一个十分重要的工具,因为他强调每一项工作细目由谁负责,并表明每个人的角色在整个项目中的地位。制定责任色(RACI)(R=Responsible,A=Accountable,C=Consulted,I=Informed)。 插入后面继续说,刚才已经吐槽了一下一种方案的坏处,所以我认为对于分解还是逃不过模块,一个人做不下来的大模块,分解成小模块,每个模块主要就是IPO,输入什么,做什么事,出输什么,模块接口要设计好,这样一个一个的装配上就是一个大的系统,而不是把一个模块的类似部分或者说一个独立的功能模块再来分开。最小的模块我们就是函数,或者现在面向对象可以说类,但是细化下来的思想面向过程还是有用处的。这里我就强调一点,现代的设计中多用接口这个东西吧,你慢慢会发现他有很大的用处的。 总结:从昨天下午开始写这个,今天才完成中间有断开,所以可能思路不太清析,但是主要说的一点就是工作分解结构里面的一小部分内容,说了说两种分解方式的优劣。建议大家以接口设计,功能模块,类等去处理分解任务。 转载于:https://www.cnblogs.com/gw2010/p/3781447.html 本篇文章为转载内容。原文链接:https://blog.csdn.net/weixin_34253126/article/details/94304775。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-07-29 21:22:45
111
转载
Spark
...呈指数级增长,传统的关系型数据库已经无法满足数据处理的需求。Apache Spark这款大数据处理框架,就像个内存里的超级加速器,凭借它那超凡的处理速度和一身强大的功能,早就已经火遍大江南北,被各行各业的大佬们热烈追捧和广泛应用啦!在Spark 2.0版本中,Tungsten项目更是带来了内存管理和执行优化的重大革新。 二、Tungsten项目的介绍 Tungsten是Apache Spark 2.0引入的一个重要特性,它的目标是通过优化Spark的数据处理引擎来提高其性能。Tungsten这家伙最牛的地方就在于它对内存管理做了大刀阔斧的优化,以前慢悠悠地从磁盘读取数据的操作,现在全都被搬到了内存里头进行。这样一来,数据访问速度嗖嗖地往上飙,简直快得飞起! 三、Tungsten项目的内存管理 在传统的Spark中,数据是以序列化的形式存储在磁盘上的。每次需要获取数据的时候,都得从磁盘上把这个家伙拽出来,再让它从“冬眠”中恢复到正常状态(也就是解序列化),这个过程可真是消耗了不少精力和时间呢。在Tungsten这里啊,数据可是直接蹦跶到内存里头去的,而且人家管理起来贼高效,那可是一套相当厉害的法子! 例如,在Spark SQL中,我们可以这样创建一个DataFrame: java val df = spark.read.format("csv").option("header", "true").load("/path/to/data") 在Tungsten之前,这个操作需要将数据从磁盘上读取并解析为RDD。在Tungsten之后,这个操作就能直接把数据一股脑儿地拽进内存里,然后像变魔术一样,它就变成了一个全新的DataFrame。 四、Tungsten项目的执行优化 除了内存管理方面的优化外,Tungsten还对Spark的执行进行了优化。在传统的Spark中,任务的调度是由master节点完成的。在Tungsten这个系统里,它把任务的分配和执行这些活儿都撒手扔给了每一个worker节点去干,这样一来,数据处理的速度蹭蹭地往上飙,效果那是相当显著。 例如,我们可以这样运行一个简单的Spark程序: java val rdd = sc.parallelize(1 to 1000) rdd.foreach { x => println(s"Processing element $x") } 在Tungsten之前,这个程序需要将所有的元素都传输到master节点进行处理,然后再返回结果。在Tungsten之后,这个程序就像个超级小能手,它会把任务像分糖果一样均匀地分给每一个worker节点去处理,然后麻溜儿地直接给你返回结果。 五、结论 总的来说,Tungsten项目是Spark在内存管理和执行优化方面的一次重大突破。Tungsten这个家伙,可真是让Spark处理数据的能力噌噌往上涨!它干了两件大事情:一是麻利地把数据从磁盘搬到内存里头,这样一来,数据的读取速度嗖嗖提升;二是巧妙地把任务分配给每一个worker节点,让他们各自领活儿干,这样一来,任务的调度和执行效率蹭蹭翻倍。这两手操作下来,Spark的数据处理速度那可是大幅提升,跟坐火箭似的!虽然Tungsten项目还有一些待解决的问题,但无疑它是Spark向前发展的一大步。我们期待未来Spark能为我们带来更多的惊喜。
2023-03-05 12:17:18
103
彩虹之上-t
RocketMQ
...据中心进行集中管理和分配。在现代技术趋势中,云计算提供了一种灵活、高效、低成本的解决方案,支持企业快速部署应用和服务,同时能够根据需求动态扩展资源。这种模式特别适合微服务架构,因为它允许各个服务独立运行,同时共享基础设施资源,提高了系统的弹性、可靠性和资源利用率。 名词 , 微服务架构。 解释 , 微服务架构是一种将大型应用程序拆分为多个独立、可独立部署的小型服务的方法。每个服务负责处理特定的业务功能,通过轻量级通信机制(如APIs)进行交互。在云计算的支持下,微服务架构使得应用程序能够更易于管理、测试、部署和扩展。它有助于实现高度的解耦和模块化,使得团队能够并行开发和维护不同的服务,从而加速创新过程,同时提高了系统的可靠性和灵活性。 名词 , 大数据处理。 解释 , 大数据处理是指收集、存储、分析和可视化大规模数据集的过程。在现代技术趋势中,随着数据量的急剧增长,企业需要借助大数据处理技术来挖掘数据中的价值,支持决策制定、市场洞察和个性化服务。大数据处理通常涉及分布式计算框架(如Apache Hadoop和Apache Spark),这些框架能够处理PB级别的数据,支持实时数据分析和机器学习模型训练。在消息队列的支持下,大数据处理流程可以实现数据的实时传输和处理,提高数据处理的效率和响应速度。
2024-10-02 15:46:59
573
蝶舞花间
Impala
...搞定那些海量数据的大任务。别看数据量大得能装满好几座山(PB级别),Impala一上阵,立马就能飞快地帮我们查询到需要的信息,而且还是那种边聊天边玩手机也能随时翻阅数据的那种速度,简直不要太爽!所以,如果你想找一个既能快速响应又能处理大数据的小伙伴,Impala绝对是你的菜!嘿,你知道吗?Impala的厉害之处在于它有个超酷的设计理念!那就是不让那些中间的数据白白地躺在那儿不动,而是尽可能地让所有的任务一起并肩作战。这样一来,不管你的数据有多大,Impala都能像小菜一碟一样,高效地完成查询,让你的数据分析快人一步!是不是超级牛逼啊?然而,要充分发挥Impala的潜力,硬件配置的选择与优化至关重要。嘿,兄弟!这篇大作就是要好好扒一扒 Impala 这个家伙的查询速度和咱们硬件设备之间的那点事儿。咱们要拿真实的代码例子来说明,怎么才能把这事儿给整得既高效又顺溜。咱们得聊聊,怎么根据你的硬件配置,调整 Impala 的设置,让它跑起来更快,效率更高。别担心,咱们不会用一堆干巴巴的术语让你头疼,而是用一些接地气的语言,让你一看就懂,一学就会的那种。准备好了吗?咱们这就开始,探索这个神秘的关系,找出最佳的优化策略,让你的查询快如闪电,流畅如丝! 1. Impala查询性能的关键因素 Impala的性能受到多种因素的影响,包括但不限于硬件资源、数据库架构、查询优化策略等。硬件配置作为基础,直接影响着查询的响应时间和效率。 - 内存:Impala需要足够的内存来缓存查询计划和执行状态,同时存储中间结果。内存的大小直接影响到并行度和缓存效果,进而影响查询性能。 - CPU:CPU的计算能力决定了查询执行的速度,尤其是在多线程环境下。合理的CPU分配可以显著提升查询速度。 - 网络:数据存储和计算之间的网络延迟也会影响查询性能,尤其是在分布式环境中。优化网络配置可以减少数据传输时间。 2. 实例代码 配置与优化 接下来,我们通过一段简单的代码实例,展示如何通过配置和优化来提升Impala的查询性能。 示例代码:查询性能调优配置 python 假设我们正在使用Cloudera Manager进行配置管理 调整Impala节点的内存配置 cloudera_manager.set_impala_config('memory', { 'query_mem_limit': '2GB', 根据实际需求调整查询内存限制 'coordinator_memory_limit': '16GB', 协调器的最大内存限制 'executor_memory_limit': '16GB' 执行器的最大内存限制 }) 调整CPU配额 cloudera_manager.set_impala_config('cpu', { 'max_threads_per_node': 8, 每个节点允许的最大线程数 'max_threads_per_core': 2 每个核心允许的最大线程数 }) 开启并行查询功能 cloudera_manager.set_impala_config('parallelism', { 'default_parallelism': 'auto' 自动选择最佳并行度 }) 运行查询前,确保表数据更新已同步到Impala cloudera_manager.refresh_table('your_table_name') cloudera_manager.compute_stats('your_table_name') print("配置已更新,查询性能调优已完成。") 这段代码展示了如何通过Cloudera Manager调整Impala节点的内存限制、CPU配额以及开启自动并行查询功能。通过这样的配置,我们可以针对特定的查询场景和数据集进行优化,提高查询性能。 3. 性能监控与诊断 为了确保硬件配置达到最佳状态,持续的性能监控和诊断至关重要。利用Impala自带的诊断工具,如Explain Plan和Profile,可以帮助我们深入了解查询执行的详细信息,包括但不限于执行计划、CPU和内存使用情况、I/O操作等。 Examine Plan 示例 bash 使用Explain Plan分析查询执行计划 impala-shell> EXPLAIN SELECT FROM your_table WHERE column = 'value'; 输出的结果将展示查询的执行计划,帮助识别瓶颈所在,为后续的优化提供依据。 4. 结语 Impala的查询性能与硬件配置息息相关,合理的配置不仅能提升查询效率,还能优化资源利用,降低运行成本。通过本文的探讨和示例代码的展示,希望能够激发读者对Impala性能优化的兴趣,并鼓励大家在实践中不断探索和尝试,以实现大数据分析的最佳效能。嘿,兄弟!你得明白,真正的硬仗可不只在找答案,而是在于找到那个对特定工作环境最合适的平衡点。这事儿啊,一半靠的是技巧,另一半还得靠点智慧。就像调鸡尾酒一样,你得知道加多少冰,放什么酒,才能调出那个完美的味道。所以,别急着去死记硬背那些公式和规则,多琢磨琢磨,多试试错,慢慢你会发现,找到那个平衡点,其实挺像在创作一首诗,又像是在解一道谜题。
2024-08-19 16:08:50
71
晚秋落叶
转载文章
...成(zhuan)一个任务。 此阶段大概要经历3年,程序员的职责如下: 1、对项目经理负责,负责软件项目的详细设计、编码和内部测试的组织实施。 2、协助项目经理和相关人员同客户进行沟通,保持良好的客户关系。 3、参与需求调研、项目可行性分析、技术可行性分析和需求分析。 4、熟悉并熟练掌握交付软件部开发的软件项目的相关软件技术。 5、负责向项目经理及时反馈软件开发中的情况,并根据实际情况提出改进建议。 6、负责对业务领域内的技术发展动态进行分析研究。 高级程序员 高级程序员学名,工程师。 到了这个level,英文名可改叫做 engineer 或 developer。此时你的功力开始增强,这与你平时的积累努力是分不开的,祝贺你~ 此时的你不仅可以完成任务,开始注重代码的质量,能够写出工业级的代码。你的经验可胜任模块级的系统设计,承担完成较为复杂的技术,能有效的自我管理,有帮助别人快速解决问题(trouble shooting)的能力。 此阶段你需要经历到7、8年左右的体验,中间要经历一段深刻自我历练的过程。 有时给人致命一击其实是心里的小蟊贼。一般人在5年前后遇到一个门槛,碰到天花板+彷徨期,或者你打心眼里不在喜欢编程,可尝试转为其它角色,如产品经理,售前售后支持等岗位,也不失为好选择。 当我们熬过这段儿,就会“山随平野尽,江入大荒流“,渐入佳境矣。 高级程序员定义软件功能、做开发计划推进和管理。可以带几个个帮手把产品规划的功能实现,你是团队中的”大手“,遇到难题也是你亲自攻艰克难。 所以,一个高级程序员,他的职责很清晰: 1、负责产品核心复杂功能的方案设计、编码实现 2、负责疑难BUG分析诊断、攻关解决 架构师 到了架构师级别,想必你已经学会降龙十八掌,可登堂入世,成为一位准(lao)专(you)家(tiao)。 我们大喊声:“单打独斗,老衲谁也不惧!“,遂开始领导一众技术高手,指点武功,来设计和完成一个系统,大多是分布式,高并发的系统架构平台。 架构师的任务是为公司产品的业务问题提供高质量技术解决方案,主要着眼于系统的"技术实现" 。 架构师的主要分类: 可能每条产品线都设置了架构师,也可能多条生产品线的的后端是由一个架构师设计的平台提供,所以架构师也是有所不同的,其分类如下: 软件架构师 信息架构师 网站架构师 其主要职责如下: 1、需求分析:“知彼”有时比“知已”还重要。管理市场,产品等的需求,确立关键需求。坚持技术上的优秀与需求的愿景统一,提升技术负债意识,提供技术选项,风险预判,工期等解决方案。 2、架构设计:在产品功能中抽取中非功能的需求,由关键需求变成概念型架构。列出功能树,分层治之,如用户界面层、系统交互层,数据管理层。达成高扩展,高可用,高性能,高安全,易运维,易部署,易接入等能力。 3、功能设计与实现:对架构设计的底层代码级别实现。如公共核心类,接口实现,应用发现规则、接口变更等。 技术经理 人生就是不断上升的过程,你已经到达经理的层次了。如今的你,需要不断提高领导力,需要定期召开团队会议讨论问题。 首先我们要更加自信,在工作中显示自己的功力,给讲话增添力量。如:“本次项目虽然有很大的困难,我们也需苦战到底。当然示先垂范,身先士卒,方能成功!” 技术经理有时候也可能叫系统分析员,一些小公司可能会整个公司或者部门有一个技术经理。技术经理承担的角色主要是系统分析、架构搭建、系统构建、代 码走查等工作,如果说项目经理是总统,那么技术经理就是总理。当然不是所有公司都是这样的,有些公司项目经理是不管技术团队的,只做需求、进度和同客户沟 通,那么这个时候的项目经理就好像工厂里的跟单人员了,这种情况在外包公司比较多。对于技术经理来说,着重于技术方面,你需要知道某种功能用哪些技术合 适,需要知道某项功能需要多长的开发时间等。同时,技术经理也应该承担提高团队整体技术水平的工作。 你需要和大家站在一起,因为人们也都有解决问题的能力,更需要有以下的能力与责任: 1、任务管理:开发工作量评估、定立开发流程、分配和追踪开发任务 2、质量管理:代码review、开发风险判断/报告/协调解决 3、效率提升:代码底层研发和培训、最佳代码实践规范总结与推广、自动化生产工具、自动化部署工具 4、技术能力提升:招聘面试、试题主拟、新人指导、项目复盘与改进 技术总监 如果一个研发团队超过20人,有多条产品线或业务量很大,这时已经有多个技术经理在负责每个业务,这时需要一位技术总监。 主要职责: 1、组建平台研发部,与架构师共建软件公共平台,方便各条产品业务线研发。 2、通过技术平台、通过高一层的职权,管理和协调公司各个部门与本部门各条线。现在每个产品线都应该有合格的技术经理和高级程序员。 结语:我们相信,每个人都能成为IT大神。现在开始,找个师兄带你入门,让你的学习之路不再迷茫。 这里推荐我们的前端学习交流圈:784783012,里面都是学习前端的从最基础的HTML+CSS+JS【炫酷特效,游戏,插件封装,设计模式】到移动端HTML5的项目实战的学习资料都有整理,送给每一位前端小伙伴。 最新技术,与企业需求同步。好友都在里面学习交流,每天都会有大牛定时讲解前端技术! 点击:前端技术分享 本篇文章为转载内容。原文链接:https://blog.csdn.net/webDk/article/details/88917912。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2024-05-10 13:13:48
755
转载
Kafka
...,系统就会帮他们自动分配任务(也就是主题的分区),这样大家就不会抢来抢去,重复干同样的活儿啦!而且呢,要是有个消费者挂掉了或者出问题了,其他的消费者就会顶上来,接手它负责的那些分区,接着干活儿,完全不受影响。 --- 3. 组织结构 Kafka的大脑与四肢 3.1 集群(Cluster):Kafka的心脏 Kafka集群是由多个Broker组成的,Broker是Kafka的核心组件,负责存储和转发消息。一个Broker就是一个节点,多个Broker协同工作,形成一个分布式的系统。 java // 启动Kafka Broker nohup kafka-server-start.sh config/server.properties & Broker的数量决定了系统的容错能力和性能。其实啊,通常咱们都会建议弄三个Broker,为啥呢?就怕万一有个家伙“罢工”了,比如突然挂掉或者出问题,别的还能顶上,整个系统就不耽误干活啦!不过,Broker的数量也不能太多,否则会增加管理和维护的成本。 3.2 Zookeeper:Kafka的大脑 Zookeeper是Kafka的协调器,它负责管理集群的状态和配置。没有Zookeeper,Kafka就无法正常运作。比如说啊,新添了个Broker(也就是那个消息中转站),Zookeeper就会赶紧告诉其他Broker:“嘿,快看看这位新伙伴,更新一下你们的状态吧!”还有呢,要是某个分区的老大换了(Leader切换了),Zookeeper也会在一旁默默记好这笔账,生怕漏掉啥重要信息似的。 java // 启动Zookeeper nohup zookeeper-server-start.sh config/zookeeper.properties & 虽然Zookeeper很重要,但它也有一定的局限性。比如,它可能会成为单点故障,影响整个系统的稳定性。因此,近年来Kafka也在尝试去掉对Zookeeper的依赖,开发了自己的内部协调机制。 3.3 日志(Log):Kafka的四肢 日志是Kafka存储消息的地方,每个分区对应一个日志文件。嘿,这个日志设计可太聪明了!它用的是顺序写入的方法,就像一条直线往前跑,根本不用左顾右盼,写起来那叫一个快,效率直接拉满! java // 查看日志路径 cat config/server.properties | grep log.dirs 日志的大小可以通过参数log.segment.bytes来控制。默认值是1GB,你可以根据实际情况调整。要是日志文件太大了,查个东西就像在大海捞针一样慢吞吞的;但要是弄得太小吧,又老得换新的日志文件,麻烦得很,还费劲。 --- 4. 实战演练 从零搭建一个Kafka环境 说了这么多理论,咱们来实际操作一下吧!假设我们要搭建一个简单的Kafka环境,用来收集用户的登录日志。 4.1 安装Kafka和Zookeeper 首先,我们需要安装Kafka和Zookeeper。可以从官网下载最新的二进制包,解压后按照文档配置即可。 bash 下载Kafka wget https://downloads.apache.org/kafka/3.4.0/kafka_2.13-3.4.0.tgz 解压 tar -xzf kafka_2.13-3.4.0.tgz 4.2 创建主题和消费者 接下来,我们创建一个名为login_logs的主题,并启动一个消费者来监听消息。 bash 创建主题 bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 3 --topic login_logs 启动消费者 bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic login_logs --from-beginning 4.3 生产消息 最后,我们可以编写一个简单的Java程序来生产消息。 java import org.apache.kafka.clients.producer.KafkaProducer; import org.apache.kafka.clients.producer.ProducerRecord; import java.util.Properties; public class KafkaProducerExample { public static void main(String[] args) { Properties props = new Properties(); props.put("bootstrap.servers", "localhost:9092"); props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer"); props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer"); KafkaProducer producer = new KafkaProducer<>(props); for (int i = 0; i < 10; i++) { producer.send(new ProducerRecord<>("login_logs", "key" + i, "value" + i)); } producer.close(); } } 这段代码会向login_logs主题发送10条消息,每条消息都有一个唯一的键和值。 --- 5. 总结 Kafka的魅力在于细节 好了,到这里咱们的Kafka之旅就告一段落了。通过这篇文章,我希望大家能更好地理解Kafka的命名规范和组织结构。Kafka为啥这么牛?因为它在设计的时候真是把每个小细节都琢磨得特别透。就像给主题起名字吧,分个区啦,还有消费者组怎么配合干活儿,这些地方都能看出人家确实是下了一番功夫的,真不是随便凑合出来的! 当然,Kafka的学习之路还有很多内容需要探索,比如监控、调优、安全等等。其实我觉得啊,只要你把命名的规矩弄明白了,东西该怎么放也心里有数了,那你就算是走上正轨啦,成功嘛,它就已经在向你招手啦!加油吧,朋友们! --- 希望这篇文章对你有所帮助,如果有任何疑问,欢迎随时交流哦!
2025-04-05 15:38:52
95
彩虹之上
转载文章
...式,也就是每个请求都分配一个进程或者线程。 请求数只有 100 个时,这种方式自然没问题,但增加到 10000 个请求时,10000 个进程或线程的调度、上下文切换乃至它们占用的内存,都会成为瓶颈。 每个请求分配一个线程的方式不合适,为了支持 10000 个并发请求,有两个问题需要我们解决 第一,怎样在一个线程内处理多个请求,也就是要在一个线程内响应多个网络 I/O。以前的同步阻塞方式下,一个线程只能处理一个请求,到这里不再适用,是不是可以用非阻塞 I/O 或者异步 I/O 来处理多个网络请求呢? 第二,怎么更节省资源地处理客户请求,也就是要用更少的线程来服务这些请求。是不是可以继续用原来的 100 个或者更少的线程,来服务现在的 10000 个请求呢? I/O 模型优化 异步、非阻塞 I/O 的解决思路是我们在网络编程中经常用到的 I/O 多路复用(I/O Multiplexing) 两种 I/O 事件通知的方式:水平触发和边缘触发,它们常用在套接字接口的文件描述符中。 水平触发:只要文件描述符可以非阻塞地执行 I/O ,就会触发通知。也就是说,应用程序可以随时检查文件描述符的状态,然后再根据状态,进行 I/O 操作。 边缘触发:只有在文件描述符的状态发生改变(也就是 I/O 请求达到)时,才发送一次通知。这时候,应用程序需要尽可能多地执行 I/O,直到无法继续读写,才可以停止。如果 I/O 没执行完,或者因为某种原因没来得及处理,那么这次通知也就丢失了。 I/O 多路复用的方法有很多实现方法,我带你来逐个分析一下。 第一种,使用非阻塞 I/O 和水平触发通知,比如使用 select 或者 poll。 根据刚才水平触发的原理,select 和 poll 需要从文件描述符列表中,找出哪些可以执行 I/O ,然后进行真正的网络 I/O 读写。由于 I/O 是非阻塞的,一个线程中就可以同时监控一批套接字的文件描述符,这样就达到了单线程处理多请求的目的。所以,这种方式的最大优点,是对应用程序比较友好,它的 API 非常简单。 但是,应用软件使用 select 和 poll 时,需要对这些文件描述符列表进行轮询,这样,请求数多的时候就会比较耗时。并且,select 和 poll 还有一些其他的限制。 select 使用固定长度的位相量,表示文件描述符的集合,因此会有最大描述符数量的限制。比如,在 32 位系统中,默认限制是 1024。并且,在 select 内部,检查套接字状态是用轮询的方法,再加上应用软件使用时的轮询,就变成了一个 O(n^2) 的关系。 而 poll 改进了 select 的表示方法,换成了一个没有固定长度的数组,这样就没有了最大描述符数量的限制(当然还会受到系统文件描述符限制)。但应用程序在使用 poll 时,同样需要对文件描述符列表进行轮询,这样,处理耗时跟描述符数量就是 O(N) 的关系。 除此之外,应用程序每次调用 select 和 poll 时,还需要把文件描述符的集合,从用户空间传入内核空间,由内核修改后,再传出到用户空间中。这一来一回的内核空间与用户空间切换,也增加了处理成本。 有没有什么更好的方式来处理呢?答案自然是肯定的。 第二种,使用非阻塞 I/O 和边缘触发通知,比如 epoll。既然 select 和 poll 有那么多的问题,就需要继续对其进行优化,而 epoll 就很好地解决了这些问题。 epoll 使用红黑树,在内核中管理文件描述符的集合,这样,就不需要应用程序在每次操作时都传入、传出这个集合。 epoll 使用事件驱动的机制,只关注有 I/O 事件发生的文件描述符,不需要轮询扫描整个集合。 不过要注意,epoll 是在 Linux 2.6 中才新增的功能(2.4 虽然也有,但功能不完善)。由于边缘触发只在文件描述符可读或可写事件发生时才通知,那么应用程序就需要尽可能多地执行 I/O,并要处理更多的异常事件。 第三种,使用异步 I/O(Asynchronous I/O,简称为 AIO)。 在前面文件系统原理的内容中,我曾介绍过异步 I/O 与同步 I/O 的区别。异步 I/O 允许应用程序同时发起很多 I/O 操作,而不用等待这些操作完成。而在 I/O 完成后,系统会用事件通知(比如信号或者回调函数)的方式,告诉应用程序。这时,应用程序才会去查询 I/O 操作的结果。 异步 I/O 也是到了 Linux 2.6 才支持的功能,并且在很长时间里都处于不完善的状态,比如 glibc 提供的异步 I/O 库,就一直被社区诟病。同时,由于异步 I/O 跟我们的直观逻辑不太一样,想要使用的话,一定要小心设计,其使用难度比较高。 工作模型优化 了解了 I/O 模型后,请求处理的优化就比较直观了。 使用 I/O 多路复用后,就可以在一个进程或线程中处理多个请求,其中,又有下面两种不同的工作模型。 第一种,主进程 + 多个 worker 子进程,这也是最常用的一种模型。这种方法的一个通用工作模式就是:主进程执行 bind() + listen() 后,创建多个子进程;然后,在每个子进程中,都通过 accept() 或 epoll_wait() ,来处理相同的套接字。 比如,最常用的反向代理服务器 Nginx 就是这么工作的。它也是由主进程和多个 worker 进程组成。主进程主要用来初始化套接字,并管理子进程的生命周期;而 worker 进程,则负责实际的请求处理。我画了一张图来表示这个关系。 这里要注意,accept() 和 epoll_wait() 调用,还存在一个惊群的问题。换句话说,当网络 I/O 事件发生时,多个进程被同时唤醒,但实际上只有一个进程来响应这个事件,其他被唤醒的进程都会重新休眠。 其中,accept() 的惊群问题,已经在 Linux 2.6 中解决了; 而 epoll 的问题,到了 Linux 4.5 ,才通过 EPOLLEXCLUSIVE 解决。 为了避免惊群问题, Nginx 在每个 worker 进程中,都增加一个了全局锁(accept_mutex)。这些 worker 进程需要首先竞争到锁,只有竞争到锁的进程,才会加入到 epoll 中,这样就确保只有一个 worker 子进程被唤醒。 不过,根据前面 CPU 模块的学习,你应该还记得,进程的管理、调度、上下文切换的成本非常高。那为什么使用多进程模式的 Nginx ,却具有非常好的性能呢? 这里最主要的一个原因就是,这些 worker 进程,实际上并不需要经常创建和销毁,而是在没任务时休眠,有任务时唤醒。只有在 worker 由于某些异常退出时,主进程才需要创建新的进程来代替它。 当然,你也可以用线程代替进程:主线程负责套接字初始化和子线程状态的管理,而子线程则负责实际的请求处理。由于线程的调度和切换成本比较低,实际上你可以进一步把 epoll_wait() 都放到主线程中,保证每次事件都只唤醒主线程,而子线程只需要负责后续的请求处理。 第二种,监听到相同端口的多进程模型。在这种方式下,所有的进程都监听相同的接口,并且开启 SO_REUSEPORT 选项,由内核负责将请求负载均衡到这些监听进程中去。这一过程如下图所示。 由于内核确保了只有一个进程被唤醒,就不会出现惊群问题了。比如,Nginx 在 1.9.1 中就已经支持了这种模式。 不过要注意,想要使用 SO_REUSEPORT 选项,需要用 Linux 3.9 以上的版本才可以。 C1000K 基于 I/O 多路复用和请求处理的优化,C10K 问题很容易就可以解决。不过,随着摩尔定律带来的服务器性能提升,以及互联网的普及,你并不难想到,新兴服务会对性能提出更高的要求。 很快,原来的 C10K 已经不能满足需求,所以又有了 C100K 和 C1000K,也就是并发从原来的 1 万增加到 10 万、乃至 100 万。从 1 万到 10 万,其实还是基于 C10K 的这些理论,epoll 配合线程池,再加上 CPU、内存和网络接口的性能和容量提升。大部分情况下,C100K 很自然就可以达到。 那么,再进一步,C1000K 是不是也可以很容易就实现呢?这其实没有那么简单了。 首先从物理资源使用上来说,100 万个请求需要大量的系统资源。比如, 假设每个请求需要 16KB 内存的话,那么总共就需要大约 15 GB 内存。 而从带宽上来说,假设只有 20% 活跃连接,即使每个连接只需要 1KB/s 的吞吐量,总共也需要 1.6 Gb/s 的吞吐量。千兆网卡显然满足不了这么大的吞吐量,所以还需要配置万兆网卡,或者基于多网卡 Bonding 承载更大的吞吐量。 其次,从软件资源上来说,大量的连接也会占用大量的软件资源,比如文件描述符的数量、连接状态的跟踪(CONNTRACK)、网络协议栈的缓存大小(比如套接字读写缓存、TCP 读写缓存)等等。 最后,大量请求带来的中断处理,也会带来非常高的处理成本。这样,就需要多队列网卡、中断负载均衡、CPU 绑定、RPS/RFS(软中断负载均衡到多个 CPU 核上),以及将网络包的处理卸载(Offload)到网络设备(如 TSO/GSO、LRO/GRO、VXLAN OFFLOAD)等各种硬件和软件的优化。 C1000K 的解决方法,本质上还是构建在 epoll 的非阻塞 I/O 模型上。只不过,除了 I/O 模型之外,还需要从应用程序到 Linux 内核、再到 CPU、内存和网络等各个层次的深度优化,特别是需要借助硬件,来卸载那些原来通过软件处理的大量功能。 C10M 显然,人们对于性能的要求是无止境的。再进一步,有没有可能在单机中,同时处理 1000 万的请求呢?这也就是 C10M 问题。 实际上,在 C1000K 问题中,各种软件、硬件的优化很可能都已经做到头了。特别是当升级完硬件(比如足够多的内存、带宽足够大的网卡、更多的网络功能卸载等)后,你可能会发现,无论你怎么优化应用程序和内核中的各种网络参数,想实现 1000 万请求的并发,都是极其困难的。 究其根本,还是 Linux 内核协议栈做了太多太繁重的工作。从网卡中断带来的硬中断处理程序开始,到软中断中的各层网络协议处理,最后再到应用程序,这个路径实在是太长了,就会导致网络包的处理优化,到了一定程度后,就无法更进一步了。 要解决这个问题,最重要就是跳过内核协议栈的冗长路径,把网络包直接送到要处理的应用程序那里去。这里有两种常见的机制,DPDK 和 XDP。 第一种机制,DPDK,是用户态网络的标准。它跳过内核协议栈,直接由用户态进程通过轮询的方式,来处理网络接收。 说起轮询,你肯定会下意识认为它是低效的象征,但是进一步反问下自己,它的低效主要体现在哪里呢?是查询时间明显多于实际工作时间的情况下吧!那么,换个角度来想,如果每时每刻都有新的网络包需要处理,轮询的优势就很明显了。比如: 在 PPS 非常高的场景中,查询时间比实际工作时间少了很多,绝大部分时间都在处理网络包; 而跳过内核协议栈后,就省去了繁杂的硬中断、软中断再到 Linux 网络协议栈逐层处理的过程,应用程序可以针对应用的实际场景,有针对性地优化网络包的处理逻辑,而不需要关注所有的细节。 此外,DPDK 还通过大页、CPU 绑定、内存对齐、流水线并发等多种机制,优化网络包的处理效率。 第二种机制,XDP(eXpress Data Path),则是 Linux 内核提供的一种高性能网络数据路径。它允许网络包,在进入内核协议栈之前,就进行处理,也可以带来更高的性能。XDP 底层跟我们之前用到的 bcc-tools 一样,都是基于 Linux 内核的 eBPF 机制实现的。 XDP 的原理如下图所示: 你可以看到,XDP 对内核的要求比较高,需要的是 Linux 4.8 以上版本,并且它也不提供缓存队列。基于 XDP 的应用程序通常是专用的网络应用,常见的有 IDS(入侵检测系统)、DDoS 防御、 cilium 容器网络插件等。 总结 C10K 问题的根源,一方面在于系统有限的资源;另一方面,也是更重要的因素,是同步阻塞的 I/O 模型以及轮询的套接字接口,限制了网络事件的处理效率。Linux 2.6 中引入的 epoll ,完美解决了 C10K 的问题,现在的高性能网络方案都基于 epoll。 从 C10K 到 C100K ,可能只需要增加系统的物理资源就可以满足;但从 C100K 到 C1000K ,就不仅仅是增加物理资源就能解决的问题了。这时,就需要多方面的优化工作了,从硬件的中断处理和网络功能卸载、到网络协议栈的文件描述符数量、连接状态跟踪、缓存队列等内核的优化,再到应用程序的工作模型优化,都是考虑的重点。 再进一步,要实现 C10M ,就不只是增加物理资源,或者优化内核和应用程序可以解决的问题了。这时候,就需要用 XDP 的方式,在内核协议栈之前处理网络包;或者用 DPDK 直接跳过网络协议栈,在用户空间通过轮询的方式直接处理网络包。 当然了,实际上,在大多数场景中,我们并不需要单机并发 1000 万的请求。通过调整系统架构,把这些请求分发到多台服务器中来处理,通常是更简单和更容易扩展的方案。 本篇文章为转载内容。原文链接:https://blog.csdn.net/qq_23864697/article/details/114626793。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-04-11 18:25:52
260
转载
转载文章
...的挑战,不能担此翻译任务颇为遗憾。 不久以后听说Milo Yip(叶劲峰)已开始着手翻译,甚为欣喜。翻译此巨著,他一定是比我更合适的人选。我和Milo虽未曾蒙面,但神交已久。在网络上读过一些他的成长经历,和我颇为相似,心有戚戚。他对游戏3D实时渲染技术研究精深为我所不及,我们曾通过Google Talk讨论过许多技术问题,他都有独到的见解。翻译工作开始后,Milo是香港人,英文技术术语在香港的中文译法和大陆的有许多不同。但此书由大陆出版社出版,考虑到面对的读者主要是大陆程序员,Milo希望能更符合大陆程序员的用词习惯,所以在翻译一开始就通过Google Docs创建了协作页面,邀请大家共同探讨书中技术名词的中译名。从中我们可以一窥他作为译者的慎重。 三年之后,有幸在出版之前就拿到了完整的译本。这是一本用LaTeX精心排版的800页的电子书,我只花了一周时间,几乎是一口气读完。流畅的阅读享受,绝对不仅仅是因为原著精彩的内容,精美的版面和翔实的译注也加了不少分。 在阅读本书的过程中,我不只一次地获得共鸣。例如在第5章的内存管理系统的介绍中,作者介绍的几种游戏特有的内存管理方法我都曾在项目中用过,而这是第一次有书籍专门将这些方法详尽记录;又如第11章动画系统的介绍,我们也同样在3D引擎开发过程中改进原有动画片段混合方法的经历。虽然书中介绍的每个技术点,都可能可以在某篇论文,某本其他的书的章节,某篇网络blog上见过,但之前却无一本书可以把这些东西放在一起相互参照。对于从事游戏引擎开发的程序员来说,了解各种引擎在处理每个具体问题时的方案是相当重要的。而每种方案又各有利弊,即使不做引擎开发工作而是在某一特定游戏引擎上做游戏开发,从中也可以理解引擎的局限性以及可能的改进方法。尤其是第14章介绍的对游戏性相关系统的设计,各个开发人员几乎都是凭经验设计,很少见有书籍对这些做总结。对于基于渲染引擎做开发的游戏程序员,这是必须面对的工作,这一章会有很大的借鉴意义。 本书作者是业内资深的游戏引擎开发人,他所参于的《神秘海域》和《最后生还者》都是我的个人最爱。在玩游戏的过程中,作为游戏程序员的天性,自然会不断地猜想各个技术点是如何实现的,背后需要怎样的工具支持。能在书中一一得到印证是件特别开心的事情。作者反复强调代码实践的重要性,在书中遍布着C++代码。我不认为这些代码有直接取来使用的价值,但它们极大地帮助了读者理解书中的技术点。书中列出的顽皮狗工作室用lisp方言作为游戏配置脚本的范例也给我很大的启发,有了这些具体的代码示例以及作者本身的一线工程师背景,也让我确信书中那些关于主机游戏开发相关等,我所没有接触过的内容都也绝非泛泛而谈。 国内的游戏开发社区的壮大,主要是随最近十年的MMO风潮而生。而就在大型网络游戏在中国有些畸形发展,让这类游戏偏离电子游戏游戏性的趋势时,我们有幸迎来了为移动设备开发游戏的大潮。游戏开发的重心重新回到游戏性本身。我们更需要去借鉴单机游戏是如何为玩家带来更纯粹的游戏体验,我相信书中记录的各种技术点会变的更有帮助。 资深游戏开发及创业者 云风 @简悦云风 推荐序2 在我认识的许多游戏业开发同仁中,只有少数香港同胞,Milo Yip(叶劲峰)却正是这样一位给我印象非常深刻的优秀香港游戏开发者。我俩认识,是在Milo加入腾讯互动娱乐研发部引擎技术中心后,说来到现在也只是两年多时间。其间,他为人的谦逊务实,对待技术问题的严谨求真态度,对算法设计和性能优化的娴熟技术,都为人所称道。Milo一丝不苟的工作风格,甚至表现在对待技术文档排版这类事情上(Milo常执著地用LaTeX将技术文档排到完美),我想这一定是他在香港读大学、硕士及在香港理工大学的多媒体创新中心从事研究员,一贯沿袭至今的好作风。 我很高兴腾讯游戏有实力吸引到这样优秀的技术专家;即使在其已从上海迁回香港家中,依然选择到深圳腾讯互动娱乐总部工作。叶兄从此工作日每天早晚过关,来往香港和深圳两地,虽有舟车劳顿,但是兼顾了对家庭的照顾和在游戏引擎方面的专业研究,希望这样的状况是令他满意的。 认识叶兄当时,我便知道他在进行Jason Gregory所著《游戏引擎架构》一书的中译工作。因为自己从前也有业余翻译游戏开发有关书籍的经历,所以我能理解其中的辛苦和责任重大,对叶兄也更多一分钦佩。我以为,本书以及本书的中文读者最大的幸运便是,遇到叶兄这位对游戏有着如同对家对国般强烈责任感,犹如“游戏科学工作者”般的专业译者! 现在(2013年年末)无疑是游戏史上对独立游戏制作者最友好的年代。开发设备方便获得(相对过往仅由主机厂商授权才能获得专利开发设备,现在有一台智能手机和一台个人电脑就可以开发)、技术工具友好、调试过程简单方便,且互联网上有丰富的例程和开源代码参考,也有网上社区便于交流。很多爱好者能够很快地制作出可运行的游戏原型,其中一些也能发布到应用商店。 但是不全面掌握各方面知识,尤其是游戏引擎架构知识,往往只能停留在勉强修改、凑合重用别人提供的资源的应用程度上,难以做极限的性能改进,更妄谈革命式的架构创新。这样的程度是很难在成千上万的游戏中脱颖而出的。我们所认可的真正的游戏大作,必定是在某方面大幅超越用户期待的产品。为了打造这样的产品,游戏内容创作者(策划、美术等)需要“戴着镣铐跳舞”(在当前的机能下争取更多的创作自由度),而引擎架构合理的游戏可以经得起──也值得进行──反复优化,最终可以提供更多的自由度,这是大作出现的技术前提。 书的作者、译者、出版社的编者,加上读者,大家是因书而结缘的有缘人。因叶兄这本《游戏引擎架构》译著而在线上线下相识的读者们,你们是不是因“了解游戏引擎架构,从而制作/优化好游戏”这样的理想而结了缘呢? 亲爱的读者,愿你的游戏有一天因谜题巧妙绝伦、趣味超凡、虚拟世界气势磅礴、视觉效果逼真精美等专业因素取得业界褒奖,并得到玩家真诚的赞美。希望届时曾读叶兄这本《游戏引擎架构》译作的你,也可以回馈社会,回馈游戏开发的学习社区,帮助新人。希望你也可以建立微信公众号、博客等,或翻译游戏开发书籍,造福外语不好的读者,所以如果你的外语(英语、日语、韩语之于游戏行业比较重要)水平仍需精进,现在也可以同步加油了! 腾讯《天天爱消除》游戏团队Leader 沙鹰 @也是沙鹰 译序 数千年以来,艺术家们通过文学、绘画、雕塑、建筑、音乐、舞蹈、戏剧等传统艺术形式充实人类的精神层面。自20世纪中叶,计算机的普及派生出另一种艺术形式──电子游戏。游戏结合了上述传统艺术以及近代科技派生的其他艺术(如摄影、电影、动画),并且完全脱离了艺术欣赏这种单向传递的方式──游戏必然是互动的,“玩家”并不是“读者”、“观众”或“听众”,而是进入游戏世界、感知并对世界做出反应的参与者。 基于游戏的互动本质,游戏的制作通常比其他大众艺术复杂。商业游戏的制作通常需要各种人才的参与,而他们则需要依赖各种工具及科技。游戏引擎便是专门为游戏而设计的工具及科技集成。之所以称为引擎,如同交通工具中的引擎,提供了最核心的技术部分。因为复杂,研发成本高,人们不希望制作每款游戏(或车款)时都重新设计引擎,重用性是游戏引擎的一个重要设计目标。 然而,各游戏本身的性质以及平台的差异,使研发完全通用的游戏引擎变得极困难,甚至不可能。市面上出售的游戏引擎,有一些虽然已经达到很高的技术水平,但在商业应用中,很多时候还是需要因应个别游戏项目对引擎改造、整合、扩展及优化。因此,即使能使用市面上最好的商用引擎或自研引擎,我们仍需要理解当中的架构、各种机制和技术,并且分析及解决在制作中遇到的问题。这些也是译者曾任于上海两家工作室时的主要工作范畴。 选择翻译此著作,主要原因是在阅读中得到共鸣,并且能知悉一些知名游戏作品实际上所采用的方案。有感坊间大部分游戏开发书籍并不是由业内人士执笔,内容只足够应付一些最简单的游戏开发,欠缺宏观比较各种方案,技术与当今实际情况也有很大差距。而一些Gems类丛书虽然偶有好文章,但受形式所限欠缺系统性、全面性。难得本书原作者身为世界一流游戏工作室的资深游戏开发者(注1),在繁重的游戏开发工作外,还在大学教授游戏开发课程以至编写本著作。此外,从与内地同事的交流中,了解到许多从业者不愿意阅读外文书籍。为了普及知识及反馈业界社会,希望能尽绵力。 或许有些人以为本著作是针对单机/游戏机游戏的,并不适合国内以网游为主的环境。但译者认为这是一种误解,许多游戏本身所涉及的技术是具通用性的。例如游戏性相关的游戏性系统、场景管理、人工智能、物理模拟等部分,许多时候也会同时用于网游的前台和后台。现时,一些动作为主、非MMO的国内端游甚至会直接在后台运行传统意义上的游戏引擎。至于前台相关的技术,单机和端游的区别更少。此外,随着近年移动终端的兴起,其硬件性能已超越传统掌上游戏机,开发手游所需的技术与传统掌上游戏机并无太大差异。还可预料,现时单机/游戏机的一些较高级的架构及技术,将在不远的未来着陆移动终端平台。 译者认为,本书涵括游戏开发技术的方方面面,同时适合入门及经验丰富的游戏程序员。书名中的架构二字,并不单是给出一个系统结构图,而是描述每个子系统的需求、相关技术及与其他子系统的关系。对译者本人而言,本书的第11章(动画系统)及第14章(运行时游戏性基础系统)是本书特別精彩之处,含有许多少见于其他书籍的内容。而第10章(渲染引擎)由于是游戏引擎中的一个极大的部分,有限的篇幅可能未能覆盖广度及深度,推荐读者参考[1](注2),人工智能方面也需参考其他专著。 本译作采用LaTeX排版(注3),以Inkscape编译矢量图片。为了令阅读更流畅,内文中的网址都统一改以脚注标示。另外,由于现时游戏开发相关的文献以英文为主,而且游戏开发涉及的知识面很广,本译作尽量以括号形式保留英文术语。为了方便读者查找内容,在附录中增设中英文双向索引(索引条目与原著的不同)。 本人在香港成长学习及工作,至2008年才赴内地游戏工作室工作,不黯内地的中文写作及用字习惯,翻译中曾遇到不少困难。有幸得到出版社人员以及良师益友的帮助,才能完成本译作。特别感谢周筠老师支持本作的提案,并耐心地给予协助及鼓励。编辑张春雨老师和卢鸫翔老师,以及好友余晟给予了大量翻译上的知识及指导。也感谢游戏业界专家云风、大宝和Dave给予了许多宝贵意见。此书的翻译及排版工作比预期更花时间,感谢妻子及儿女们的体谅。此次翻译工作历时三年半,因工作及家庭事宜导致严重延误,唯有在翻译及排版工作上更尽心尽力,希望求得等待此译作的读者们谅解。无论是批评或建议,诚希阁下通过电邮miloyip@gmail.com、新浪微博、豆瓣等渠道不吝赐教。 叶劲峰(Milo Yip) 2013年10月 原作者是顽皮狗(Naughty Dog)《神秘海域(Uncharted)》系列的通才程序员、《最后生还者(The Last of Us)》的首席程序员,之前还曾在EA和Midway工作。 中括号表示引用附录中的参考文献。一些参考条目加入了其中译本的信息。 具体是使用CTEX套装,它是在MiKTeX的基础上增加中文的支持。 前言 最早的电子游戏完全由硬件构成,但微处理器(microprocessor)的高速发展完全改变了游戏的面貌。现在的游戏是在多用途的PC和专门的电子游戏主机(video game console)上玩的,凭借软件带来绝妙的游戏体验。从最初的游戏诞生至今已有半个世纪,但很多人仍然认为游戏是一个未成熟的产业。即使游戏可能是个年轻的产业,若仔细观察,也会发现它正在高速发展。 现时游戏已成为一个上百亿美元的产业,覆盖不同年龄、性别的广泛受众。 千变万化的游戏,可以分为从纸牌游戏到大型多人在线游戏(massively multiplayer online game,MMOG)等多个种类(category)和“类型(genre)”(注1),也可以运行在任何装有微芯片(microchip)的设备上 。你现在可以在PC、手机及多种特别为游戏而设计的手持/电视游戏主机上玩游戏。家用电视游戏通常代表最尖端的游戏科技,又由于它们是周期性地推出新版本,因此有游戏机“世代”(generation)的说法。最新一代(注2)的游戏机包括微软的Xbox 360和索尼的PlayStation 3,但一定不可忽视长盛不衰的PC,以及最近非常流行的任天堂Wii。 最近,剧增的下载式休闲游戏,使这个多样化的商业游戏世界变得更复杂。虽然如此,大型游戏仍然是一门大生意。今天的游戏平台非常复杂,有难以置信的运算能力,这使软件的复杂度得以进一步提升。所有这些先进的软件都需要由人创造出来,这导致团队人数增加,开发成本上涨。随着产业变得成熟,开发团队要寻求更好、更高效的方式去制作产品,可复用软件(reusable software)和中间件(middleware)便应运而生,以补偿软件复杂度的提升。 由于有这么多风格迥异的游戏及多种游戏平台,因此不可能存在单一理想的软件方案。然而,业界已经发展出一些模式 ,也有大量的潜在方案可供选择。现今的问题是如何找到一个合适的方案去迎合某个项目的需要。再进一步,开发团队必须考虑项目的方方面面,以及如何把各方面集成。对于一个崭新的游戏设计,鲜有可能找到一个完美搭配游戏设计各方面的软件包。 现时业界内的老手,入行时都是“开荒牛”。我们这代人很少是计算机科学专业出身(Matt的专业是航空工程、Jason的专业是系统设计工程),但现时很多学院已设有游戏开发的课程和学位。时至今日,为了获取有用的游戏开发信息,学生和开发者必须找到好的途径。对于高端的图形技术,从研究到实践都有大量高质量的信息。可是,这些信息经常不能直接应用到游戏的生产环境,或者没有一个生产级质量的实现。对于图形以外的游戏开发技术,市面上有一些所谓的入门书籍,没提及参考文献就描述很多内容细节,像自己发明的一样。这种做法根本没有用处,甚至经常带有不准确的内容。另一方面,市场上有一些高端的专门领域书籍,例如物理、碰撞、人工智能等。可是,这类书或者啰嗦到让你难以忍受,或者高深到让部分读者无法理解,又或者内容过于零散而难于融会贯通。有一些甚至会直接和某项技术挂钩,软硬件一旦改动,其内容就会迅速过时。 此外,互联网也是收集相关知识的绝佳工具。可是,除非你确实知道要找些什么,否则断链、不准确的资料、质量差的内容也会成为学习障碍。 好在,我们有Jason Gregory,他是一位拥有在顽皮狗(Naughty Dog)工作经验的业界老手,而顽皮狗是全球高度瞩目的游戏工作室之一。Jason在南加州大学教授游戏编程课程时,找不到概括游戏架构的教科书。值得庆幸的是,他承担了这个任务,填补了这个空白。 Jason把应用到实际发行游戏的生产级别知识,以及整个游戏开发的大局编集于本书。他凭经验,不仅融汇了游戏开发的概念和技巧,还用实际的代码示例及实现例子去说明怎样贯通知识来制作游戏。本书的引用及参考文献可以让读者更深入探索游戏开发过程的各方面。虽然例子经常是基于某些技术的,但是概念和技巧是用来实际创作游戏的,它们可以超越个别引擎或API的束缚。 本书是一本我们入行做游戏时想要的书。我们认为本书能让入门者增长知识,也能为有经验者开拓更大的视野。 Jeff Lander(注3) Matthew Whiting(注4) 译注:Genre一词在文学中为体裁。电影和游戏里通常译作类型。不同的游戏类型可见1.2节。 译注:按一般说法,2005年至今属于第7个游戏机世代。这3款游戏机的发行年份为Xbox 360(2005)、PlayStation 3(2006)、Wii(2006)。有关游戏机世代可参考维基百科。 译注:Jeff Lander现时为Darwin 3D公司的首席技术总监、Game Tech公司创始人,曾为艺电首席程序员、Luxoflux公司游戏性及动画技术程序员。 译注:Matthew Whiting现时为Wholesale Algorithms公司程序员,曾为Luxoflux公司首席软件工程师、Insomniac Games公司程序员。 序言 欢迎来到《游戏引擎架构》世界。本书旨在全面探讨典型商业游戏引擎的主要组件。游戏编程是一个庞大的主题,有许多内容需要讨论。不过相信你会发现,我们讨论的深度将足以使你充分理解本书所涵盖的工程理论及常用实践的方方面面。话虽如此,令人着迷的漫长游戏编程之旅其实才刚刚启程。与此相关的每项技术都包含丰富内容,本书将为你打下基础,并引领你进入更广阔的学习空间。 本书焦点在于游戏引擎的技术及架构。我们会探讨商业游戏引擎中,各个子系统的相关理论,以及实现这些理论所需要的典型数据结构、算法和软件接口。游戏引擎与游戏的界限颇为模糊。我们将把注意力集中在引擎本身,包括多个低阶基础系统(low-level foundation system)、渲染引擎(rendering engine)、碰撞系统(collision system)、物理模拟(physics simulation)、人物动画(character animation),及一个我称为游戏性基础层(gameplay foundation layer)的深入讨论。此层包括游戏对象模型(game object model)、世界编辑器(world editor)、事件系统(event system)及脚本系统(scripting system)。我们也将会接触游戏性编程(gameplay programming)的多个方面,包括玩家机制(player mechanics)、摄像机(camera)及人工智能(artificial intelligence,AI)。然而,这类讨论会被限制在游戏性系统和引擎接口范围。 本书可以作为大学中等级游戏程序设计中两到三门课程的教材。当然,本书也适合软件工程师、业余爱好者、自学的游戏程序员,以及游戏行业从业人员。通过阅读本书,资历较浅的游戏程序员可以巩固他们所学的游戏数学、引擎架构及游戏科技方面的知识。专注某一领域的资深程序员也能从本书更为全面的介绍中获益。 为了更好地学习本书内容,你需要掌握基本的面向对象编程概念并至少拥有一些C++编程经验。尽管游戏行业已经开始尝试使用一些新的、令人兴奋的编程语言,然而工业级的3D游戏引擎仍然是用C或C++编写的,任何认真的游戏程序员都应该掌握C++。我们将在第3章重温一些面向对象编程的基本原则,毫无疑问,你还会从本书学到一些C++的小技巧,不过C++的基础最好还是通过阅读[39]、[31]及[32]来获得。如果你对C++已经有点生疏,建议你在阅读本书的同时,最好能重温这几本或者类似书籍。如果你完全没有C++经验,在看本书之前,可以考虑先阅读[39]的前几章,或者尝试学习一些C++的在线教程。 学习编程技能最好的方法就是写代码。在阅读本书时,强烈建议你选择一些特别感兴趣的主题付诸实践。举例来说,如果你觉得人物动画很有趣,那么可以首先安装OGRE,并测试一下它的蒙皮动画示范。接着还可以尝试用OGRE实现本书谈及的一些动画混合技巧。下一步你可能会打算用游戏手柄控制人物在平面上行走。等你能玩转一些简单的东西了,就应该以此为基础,继续前进!之后可以转移到另一个游戏技术范畴,周而复始。这些项目是什么并不重要,重要的是你在实践游戏编程的艺术,而不是纸上谈兵。 游戏科技是一个活生生、会呼吸的家伙 ,永远不可能将之束缚于书本之上 。因此,附加的资源、勘误、更新、示例代码、项目构思等已经发到本书的网站。 目录 推荐序1 iii推荐序2 v译序 vii序言 xvii前言 xix致谢 xxi第一部分 基础 1第1章 导论 31.1 典型游戏团队的结构 41.2 游戏是什么 71.3 游戏引擎是什么 101.4 不同游戏类型中的引擎差异 111.5 游戏引擎概观 221.6 运行时引擎架构 271.7 工具及资产管道 46第2章 专业工具 532.1 版本控制 532.2 微软Visual Studio 612.3 剖析工具 782.4 内存泄漏和损坏检测 792.5 其他工具 80第3章 游戏软件工程基础 833.1 重温C++及最佳实践 833.2 C/C++的数据、代码及内存 903.3 捕捉及处理错误 118第4章 游戏所需的三维数学 1254.1 在二维中解决三维问题 1254.2 点和矢量 1254.3 矩阵 1394.4 四元数 1564.5 比较各种旋转表达方式 1644.6 其他数学对象 1684.7 硬件加速的SIMD运算 1734.8 产生随机数 180第二部分 低阶引擎系统 183第5章 游戏支持系统 1855.1 子系统的启动和终止 1855.2 内存管理 1935.3 容器 2085.4 字符串 2255.5 引擎配置 234第6章 资源及文件系统 2416.1 文件系统 2416.2 资源管理器 251第7章 游戏循环及实时模拟 2777.1 渲染循环 2777.2 游戏循环 2787.3 游戏循环的架构风格 2807.4 抽象时间线 2837.5 测量及处理时间 2857.6 多处理器的游戏循环 2967.7 网络多人游戏循环 304第8章 人体学接口设备(HID) 3098.1 各种人体学接口设备 3098.2 人体学接口设备的接口技术 3118.3 输入类型 3128.4 输出类型 3168.5 游戏引擎的人体学接口设备系统 3188.6 人体学接口设备使用实践 332第9章 调试及开发工具 3339.1 日志及跟踪 3339.2 调试用的绘图功能 3379.3 游戏内置菜单 3449.4 游戏内置主控台 3479.5 调试用摄像机和游戏暂停 3489.6 作弊 3489.7 屏幕截图及录像 3499.8 游戏内置性能剖析 3499.9 游戏内置的内存统计和泄漏检测 356第三部分 图形及动画 359第10章 渲染引擎 36110.1 采用深度缓冲的三角形光栅化基础 36110.2 渲染管道 40410.3 高级光照及全局光照 42610.4 视觉效果和覆盖层 43810.5 延伸阅读 446第11章 动画系统 44711.1 角色动画的类型 44711.2 骨骼 45211.3 姿势 45411.4 动画片段 45911.5 蒙皮及生成矩阵调色板 47111.6 动画混合 47611.7 后期处理 49311.8 压缩技术 49611.9 动画系统架构 50111.10 动画管道 50211.11 动作状态机 51511.12 动画控制器 535第12章 碰撞及刚体动力学 53712.1 你想在游戏中加入物理吗 53712.2 碰撞/物理中间件 54212.3 碰撞检测系统 54412.4 刚体动力学 56912.5 整合物理引擎至游戏 60112.6 展望:高级物理功能 616第四部分 游戏性 617第13章 游戏性系统简介 61913.1 剖析游戏世界 61913.2 实现动态元素:游戏对象 62313.3 数据驱动游戏引擎 62613.4 游戏世界编辑器 627第14章 运行时游戏性基础系统 63714.1 游戏性基础系统的组件 63714.2 各种运行时对象模型架构 64014.3 世界组块的数据格式 65714.4 游戏世界的加载和串流 66314.5 对象引用与世界查询 67014.6 实时更新游戏对象 67614.7 事件与消息泵 69014.8 脚本 70714.9 高层次的游戏流程 726第五部分 总结 727第15章 还有更多内容吗 72915.1 一些未谈及的引擎系统 72915.2 游戏性系统 730参考文献 733中文索引 737英文索引 755 参考文献 Tomas Akenine-Moller, Eric Haines, and Naty Hoffman. Real-Time Rendering (3rd Edition). Wellesley, MA: A K Peters, 2008. 中译本:《实时计算机图形学(第2版)》,普建涛译,北京大学出版社,2004. Andrei Alexandrescu. Modern C++ Design: Generic Programming and Design Patterns Applied. Resding, MA: Addison-Wesley, 2001. 中译本:《C++设计新思维:泛型编程与设计模式之应用》,侯捷/於春景译,华中科技大学出版社,2003. Grenville Armitage, Mark Claypool and Philip Branch. Networking and Online Games: Understanding and Engineering Multiplayer Internet Games. New York, NY: John Wiley and Sons, 2006. James Arvo (editor). Graphics Gems II. San Diego, CA: Academic Press, 1991. Grady Booch, Robert A. Maksimchuk, Michael W. Engel, Bobbi J. Young, Jim Conallen, and Kelli A. Houston. Object-Oriented Analysis and Design with Applications (3rd Edition). Reading, MA: Addison-Wesley, 2007. 中译本:《面向对象分析与设计(第3版)》,王海鹏/潘加宇译,电子工业出版社,2012. Mark DeLoura (editor). Game Programming Gems. Hingham, MA: Charles River Media, 2000. 中译本:《游戏编程精粹 1》, 王淑礼译,人民邮电出版社,2004. Mark DeLoura (editor). Game Programming Gems 2. Hingham, MA: Charles River Media, 2001. 中译本:《游戏编程精粹 2》,袁国忠译,人民邮电出版社,2003. Philip Dutré, Kavita Bala and Philippe Bekaert. Advanced Global Illumination (2nd Edition). Wellesley, MA: A K Peters, 2006. David H. Eberly. 3D Game Engine Design: A Practical Approach to Real-Time Computer Graphics. San Francisco, CA: Morgan Kaufmann, 2001. 国内英文版:《3D游戏引擎设计:实时计算机图形学的应用方法(第2版)》,人民邮电出版社,2009. David H. Eberly. 3D Game Engine Architecture: Engineering Real-Time Applications with Wild Magic. San Francisco, CA: Morgan Kaufmann, 2005. David H. Eberly. Game Physics. San Francisco, CA: Morgan Kaufmann, 2003. Christer Ericson. Real-Time Collision Detection. San Francisco, CA: Morgan Kaufmann, 2005. 中译本:《实时碰撞检测算法技术》,刘天慧译,清华大学出版社,2010. Randima Fernando (editor). GPU Gems: Programming Techniques, Tips and Tricks for Real-Time Graphics. Reading, MA: Addison-Wesley, 2004. 中译本:《GPU精粹:实时图形编程的技术、技巧和技艺》,姚勇译,人民邮电出版社,2006. James D. Foley, Andries van Dam, Steven K. Feiner, and John F. Hughes. Computer Graphics: Principles and Practice in C (2nd Edition). Reading, MA: Addison-Wesley, 1995. 中译本:《计算机图形学原理及实践──C语言描述》,唐泽圣/董士海/李华/吴恩华/汪国平译,机械工业出版社,2004. Grant R. Fowles and George L. Cassiday. Analytical Mechanics (7th Edition). Pacific Grove, CA: Brooks Cole, 2005. John David Funge. AI for Games and Animation: A Cognitive Modeling Approach. Wellesley, MA: A K Peters, 1999. Erich Gamma, Richard Helm, Ralph Johnson, and John M. Vlissiddes. Design Patterns: Elements of Reusable Object-Oriented Software. Reading, MA: Addison-Wesley, 1994. 中译本:《设计模式:可复用面向对象软件的基础》,李英军/马晓星/蔡敏/刘建中译,机械工业出版社,2005. Andrew S. Glassner (editor). Graphics Gems I. San Francisco, CA: Morgan Kaufmann, 1990. Paul S. Heckbert (editor). Graphics Gems IV. San Diego, CA: Academic Press, 1994. Maurice Herlihy, Nir Shavit. The Art of Multiprocessor Programming. San Francisco, CA: Morgan Kaufmann, 2008. 中译本:《多处理器编程的艺术》,金海/胡侃译,机械工业出版社,2009. Roberto Ierusalimschy, Luiz Henrique de Figueiredo and Waldemar Celes. Lua 5.1 Reference Manual. Lua.org, 2006. Roberto Ierusalimschy. Programming in Lua, 2nd Edition. Lua.org, 2006. 中译本:《Lua程序设计(第2版)》,周惟迪译,电子工业出版社,2008. Isaac Victor Kerlow. The Art of 3-D Computer Animation and Imaging (2nd Edition). New York, NY: John Wiley and Sons, 2000. David Kirk (editor). Graphics Gems III. San Francisco, CA: Morgan Kaufmann, 1994. Danny Kodicek. Mathematics and Physics for Game Programmers. Hingham, MA: Charles River Media, 2005. Raph Koster. A Theory of Fun for Game Design. Phoenix, AZ: Paraglyph, 2004. 中译本:《快乐之道:游戏设计的黄金法则》,姜文斌等译,百家出版社,2005. John Lakos. Large-Scale C++ Software Design. Reading, MA: Addison-Wesley, 1995. 中译本:《大规模C++程序设计》,李师贤/明仲/曾新红/刘显明译,中国电力出版社,2003. Eric Lengyel. Mathematics for 3D Game Programming and Computer Graphics (2nd Edition). Hingham, MA: Charles River Media, 2003. Tuoc V. Luong, James S. H. Lok, David J. Taylor and Kevin Driscoll. Internationalization: Developing Software for Global Markets. New York, NY: John Wiley & Sons, 1995. Steve Maguire. Writing Solid Code: Microsoft's Techniques for Developing Bug Free C Programs. Bellevue, WA: Microsoft Press, 1993. 国内英文版:《编程精粹:编写高质量C语言代码》,人民邮电出版社,2009. Scott Meyers. Effective C++: 55 Specific Ways to Improve Your Programs and Designs (3rd Edition). Reading, MA: Addison-Wesley, 2005. 中译本:《Effective C++:改善程序与设计的55个具体做法(第3版)》,侯捷译,电子工业出版社,2011. Scott Meyers. More Effective C++: 35 New Ways to Improve Your Programs and Designs. Reading, MA: Addison-Wesley, 1996. 中译本:《More Effective C++:35个改善编程与设计的有效方法(中文版)》,侯捷译,电子工业出版社,2011. Scott Meyers. Effective STL: 50 Specific Ways to Improve Your Use of the Standard Template Library. Reading, MA: Addison-Wesley, 2001. 中译本:《Effective STL:50条有效使用STL的经验》,潘爱民/陈铭/邹开红译,电子工业出版社,2013. Ian Millington. Game Physics Engine Development. San Francisco, CA: Morgan Kaufmann, 2007. Hubert Nguyen (editor). GPU Gems 3. Reading, MA: Addison-Wesley, 2007. 中译本:《GPU精粹3》,杨柏林/陈根浪/王聪译,清华大学出版社,2010. Alan W. Paeth (editor). Graphics Gems V. San Francisco, CA: Morgan Kaufmann, 1995. C. Michael Pilato, Ben Collins-Sussman, and Brian W. Fitzpatrick. Version Control with Subversion (2nd Edition). Sebastopol , CA: O'Reilly Media, 2008. (常被称作“The Subversion Book”,线上版本.) 国内英文版:《使用Subversion进行版本控制》,开明出版社,2009. Matt Pharr (editor). GPU Gems 2: Programming Techniques for High-Performance Graphics and General-Purpose Computation. Reading, MA: Addison-Wesley, 2005. 中译本:《GPU精粹2:高性能图形芯片和通用计算编程技巧》,龚敏敏译,清华大学出版社,2007. Bjarne Stroustrup. The C++ Programming Language, Special Edition (3rd Edition). Reading, MA: Addison-Wesley, 2000. 中译本《C++程序设计语言(特别版)》,裘宗燕译,机械工业出版社,2010. Dante Treglia (editor). Game Programming Gems 3. Hingham, MA: Charles River Media, 2002. 中译本:《游戏编程精粹3》,张磊译,人民邮电出版社,2003. Gino van den Bergen. Collision Detection in Interactive 3D Environments. San Francisco, CA: Morgan Kaufmann, 2003. Alan Watt. 3D Computer Graphics (3rd Edition). Reading, MA: Addison Wesley, 1999. James Whitehead II, Bryan McLemore and Matthew Orlando. World of Warcraft Programming: A Guide and Reference for Creating WoW Addons. New York, NY: John Wiley & Sons, 2008. 中译本:《魔兽世界编程宝典:World of Warcraft Addons完全参考手册》,杨柏林/张卫星/王聪译,清华大学出版社,2010. Richard Williams. The Animator's Survival Kit. London, England: Faber & Faber, 2002. 中译本:《原动画基础教程:动画人的生存手册》,邓晓娥译,中国青年出版社,2006. 勘误 第1次印册(2014年2月) P.xviii: 译注中 Wholesale Algoithms -> Wholesale Algorithms P.10: 最后一段第一行 微软的媒体播放器 -> 微软的Windows Media Player (多谢读者OpenGPU来函指正) P.15: 1.4.3节第三点 按妞 -> 按钮 (多谢读者一个小小凡人来函指正) P.40: 正文最后一行 按扭 -> 按钮 P.50: 1.7.8节第二节第一行 同是 -> 同时 (多谢读者czfdd来函指正) P.98: 代码 writeExampleStruct(Example& ex, Stream& ex) 中 Stream& ex -> Stream& stream (多谢读者Snow来函指正) P.106: 第一段中有六处 BBS -> BSS,最后一段代码的注释也有同样错误 (多谢读者trout来函指正) P.119: 译注中 软体工程 -> 软件工程 (多谢读者Snow来函指正) P.214: 正文第一段有两处 虚内存 -> 虚拟内存 (多谢读者Snow来函指正) P.216: 脚注24应标明为译注 (多谢读者Snow来函指正) P.221: 第一段代码的第二个断言应为 ASSERT(link.m_pPrev != NULL); (多谢读者Snow来函指正) P.230: 5.4.4.1节 第二段 软体 -> 软件 P.286: 脚注4应标明为译注 (多谢读者Snow来函指正) P.322: 第二段 按扭事件字 -> 按钮事件 P.349: 9.8节第二段第二行两处 部析器 -> 剖析器 (多谢读者Snow来函指正) P.738-572: 双数页页眉 参考文献 -> 中文索引 P.755-772: 双数页页眉 参考文献 -> 英文索引 P.755: kd tree项应归入K而不是Symbols 以上的错误已于第2次印册中修正。 第2次印册及之前 P.11: 第四行 细致程度 -> 层次细节 (这是level-of-detail/LOD的内地通译,多谢读者OpenGPU来函指正) P.12: 正文第一段及图1.2标题 使命之唤 -> 使命召唤 (多谢读者OpenGPU来函指正) P.12: 正文第一段 战栗时空 -> 半条命 (多谢读者OpenGPU来函指正) P.16: 第一点 表面下散射 -> 次表面散射 (多谢读者OpenGPU来函指正) P.17: 1.4.4节第五行 次文化 -> 亚文化 (此译法在内地更常用。多谢读者OpenGPU来函提示) P.22: 战栗时空 -> 半条命 P.24: 战栗时空2 -> 半条命2 P.34: 1.6.8.2节第一行 提呈 -> 提交 (这术语在本书其他地方都写作提交。多谢读者OpenGPU来函提示) P.35: 第七行 提呈 -> 提交 (这术语在本书其他地方都写作提交。多谢读者OpenGPU来函提示) P.50: 战栗时空2 -> 半条命2 P.365: 第四段第二行: 细致程度 -> 层次细节 P.441: 10.4.3.2节第三行 细致程度 -> 层次细节 P.494: sinusiod -> sinusoid (多谢读者OpenGPU来函指正) P.511: 11.10.4节第一行 谈入 -> 淡入 (多谢读者Snow来函指正) P.541: 战栗时空2 -> 半条命2 P.627: 战栗时空2 -> 半条命2 P.654: 第二行 建康值 -> 血量 (原来是改正错别字,但译者发现应改作前后统一使用的“血量”。多谢读者Snow来函指正) P.692: 第二行 内部分式 -> 内部方式 (多谢读者Snow来函指正) P.696: 14.7.6节第四行 不设实际 -> 不切实际 (多谢读者Snow来函指正) 以上的错误已于第3次印册中修正。 其他意见 P.220: 正文第一段 m_root.m_pElement 和 P.218 第一段代码中的 m_pElem 不统一。原文有此问题,但因为它们是不同的struct,暂不列作错误。 (多谢读者Snow来函提示) P.331: 8.5.8节第二段中 “反覆”较常见的写法为“反复”,但前者也是正确的,暂不列作错误。 (多谢读者Snow来函提示) P.390: 10.1.3.3节静态光照第二段中“取而代之,我们会使用一张光照纹理贴到所有受光源影响范围内的物体上。这样做能令动态物体经过光源时得到正确的光照。” 后面的一句与前句好像难以一起理解。译者认为,作者应该是指,使用同一静态光源去为静态物件生成光照纹理,以及用于动态对象的光照,能使两者的效果维持一致性。译者会考虑对译文作出改善或加入译注解译。(多谢读者店残来函查询) P.689: 第五行 并行处理世代 -> 并行处理时代 是对era较准确的翻译。 (多谢读者Snow来函提示) 本篇文章为转载内容。原文链接:https://blog.csdn.net/mypongo/article/details/38388381。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-02-12 23:04:05
327
转载
JQuery插件下载
...TodoList)、任务分配列表等。通过集成dragslot.js,开发者能够轻松地为应用程序添加拖拽排序功能,使得用户能够直观、便捷地调整列表项目的顺序,从而更高效地组织和管理信息。dragslot.js的核心优势包括:1.兼容性与易用性:作为一款基于jQuery的插件,dragslot.js具有良好的浏览器兼容性和易于集成的特点。只需引入jQuery库,即可快速将拖拽排序功能添加至项目中,无需复杂的配置或额外的依赖。2.高度定制化:dragslot.js提供了丰富的配置选项,允许开发者根据具体需求自定义插件的行为,包括拖拽提示、允许操作范围、响应事件等,以满足不同应用场景的个性化需求。3.流畅的用户体验:插件内部采用了优化的算法和动画效果,确保了拖拽操作的平滑流畅,提升用户的互动体验。无论是小规模的列表调整还是大规模的数据重组,dragslot.js都能提供高效的性能表现。4.广泛的应用场景:除了待办事项列表和任务分配之外,dragslot.js还适用于各类需要动态排序功能的列表管理场景,如产品分类、文章标签管理、日程安排等,几乎涵盖了任何需要用户参与排序的列表应用。总之,dragslot.js凭借其简单易用、高度定制化的特性,成为开发人员构建具备动态排序功能应用的理想选择。通过集成这款插件,不仅能够显著提升用户体验,还能简化开发流程,降低维护成本,是现代Web应用中不可或缺的工具之一。 点我下载 文件大小:723.62 KB 您将下载一个JQuery插件资源包,该资源包内部文件的目录结构如下: 本网站提供JQuery插件下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2024-09-06 10:37:13
41
本站
MySQL
...据库的安全管理、权限分配以及实际应用中如何优化权限设置有了更深入的兴趣。近期,随着数据安全问题愈发凸显,MySQL的权限管理机制备受关注。 2022年,MySQL官方发布了8.0版本的重要更新,其中包含了更多精细化的权限管理功能,如资源组管理和动态权限变更等特性。这些新特性使得管理员可以根据业务需求更为灵活地为不同用户分配和调整权限,从而提升整个系统的安全性(来源:MySQL官网公告)。 此外,信息安全研究机构近期发布了一份关于数据库权限滥用导致的数据泄露案例分析报告。报告指出,在许多数据泄露事件中,攻击者往往利用的是内部或外部用户权限配置不当这一弱点,因此,正确理解和实施MySQL用户的权限管理显得至关重要(来源:知名信息安全研究机构报告)。 同时,业界专家建议在实际操作中,应遵循最小权限原则,即每个用户仅拥有完成其任务所需的最少权限,避免因权限过大而造成潜在的安全风险。对于特定场景下的权限设置策略与最佳实践,可以参考《MySQL 5.7 Administrator's Bible》等权威书籍或相关技术博客的深度解读文章。 综上所述,深入了解MySQL用户权限管理不仅有助于日常运维工作,更能有效提升数据库层面的信息安全保障能力。持续关注MySQL官方更新动态,结合行业实践经验和专业指导,将使您的数据库管理工作更加得心应手。
2023-04-12 13:59:00
92
软件工程师
MySQL
...ySQL是一个开源的关系型数据库管理系统(RDBMS),广泛应用于网站和应用程序开发中,以处理和存储结构化数据。在本文的上下文中,MySQL是用于存储用户账号和密码信息的数据库系统,通过命令行工具或相关管理界面可以进行账户管理和密码操作。 密码哈希值 , 密码哈希值是在密码学领域中,将原始密码通过特定算法(如SHA-1、SHA-256等)进行单向加密后的结果。在MySQL数据库中,为了保护用户密码的安全性,实际存储的是密码经过哈希运算后的哈希值而非明文密码。当用户登录时,输入的密码也会经过相同的哈希算法处理,然后与数据库中存储的哈希值进行对比验证,而不是直接比对密码原文。 最小权限原则 , 最小权限原则是数据库安全管理中的基本原则之一,指的是每个数据库用户(账号)仅被赋予完成其工作所需任务的最小权限,避免因权限过大导致的数据泄露或破坏。在本文提到的MySQL账号管理实践中,管理员应遵循这一原则,只给每个用户分配必要的访问和操作权限,例如,只允许查询某些表的用户无权修改或删除数据,以此提高数据库系统的安全性。
2024-01-21 10:37:36
52
算法侠
MySQL
...署方式,实现资源按需分配与扩展。 而对于开发者而言,掌握MySQL优化技巧及其实战应用至关重要。例如,合理设计数据库表结构、熟练运用索引策略、适时进行查询优化等方法,能够在很大程度上提高MySQL数据库在高并发场景下的响应速度和稳定性。 总的来说,MySQL作为全球最广泛使用的开源关系型数据库之一,在不断迭代升级中持续赋能各行业业务发展,而深入理解和熟练掌握MySQL的各项功能,无疑将为企业和个人开发者在大数据时代带来更强竞争力。
2023-02-06 16:45:27
103
程序媛
MySQL
关系型数据库管理系统 , 关系型数据库管理系统(RDBMS)是一种基于关系模型的数据库管理系统,它以表格的形式存储数据,并通过预定义的关系结构来组织和管理这些数据。在MySQL中,数据以行和列的形式存储在表中,且不同表之间可通过键值关联形成复杂的查询和数据交互,确保了数据的一致性、完整性和高效访问。 MySQL命令行客户端 , MySQL命令行客户端是MySQL提供的一个用于直接与MySQL服务器交互的文本界面工具。用户可以通过输入SQL语句来执行各种数据库操作,如创建数据库、表,插入、修改和删除数据,以及查询数据库版本等。在本文上下文中,开发者或管理员使用MySQL命令行客户端输入特定的SQL命令“SELECT VERSION();”来查询MySQL服务器的当前版本号。 Web应用程序 , Web应用程序是一种运行于网络服务器上并通过HTTP协议与用户的Web浏览器进行交互的应用程序。用户通过浏览器访问Web应用程序,可以查看、提交信息或者进行其他复杂的数据处理任务。在开发Web应用程序时,MySQL作为后台数据库系统被广泛采用,用于存储和管理应用程序需要处理的各种数据。例如,电子商务网站可能利用MySQL来存储商品信息、订单记录、用户账户等数据,确保了数据的安全存储和高效检索。
2023-10-03 21:22:15
106
软件工程师
Javascript
...中的函数参数和实参的关系。 2. 函数参数和实参的概念 函数参数是在函数声明中列出的变量名称,它们是函数的形式参数。实参是在函数调用时传递给函数的值。这两个词经常搭伴出现,比如我们平常聊天可能会说:“这个函数运行需要两个小帮手”,这里的小帮手其实就是指函数的形式参数。而当我们提到“我们把两个数字塞给函数当小帮手”时,这里的“小帮手”实际就是函数的实参啦。 3. 函数参数和实参的关系 函数参数和实参之间的关系非常简单。当你调用一个函数时,你需要向函数传递一些值。这些值被称为实参,它们会被分配给函数的形参。换句话说,实参就像是函数在干活儿时需要的原料,它是实实在在要喂给函数的东西;而形参呢,你可以把它理解成一个篮子或者箱子,它的任务就是用来装这些原料,等待函数来取用。 例如,考虑下面的函数: javascript function addNumbers(num1, num2) { return num1 + num2; } 在这个函数中,num1和num2是我们定义的两个形参。当我们调用这个函数时,我们需要向它传递两个值。这些值被称为实参。例如: javascript var result = addNumbers(5, 10); 在这个例子中,5和10是我们传递给addNumbers()函数的两个实参。这两个实参分别被分配给了num1和num2形参。然后,函数返回了这两个形参的和。 4. 默认参数 默认参数是JavaScript中一种非常有用的特性。在我们声明函数并给参数排排坐的时候,完全可以给每个小参数都安排一个默认值,这样它们就不用担心没被“喂饱”啦。这样,如果我们在函数调用时不提供该参数的值,那么函数将使用默认值。 例如,让我们修改我们的addNumbers()函数,使其接受可选的第三个参数: javascript function addNumbers(num1, num2, thirdNum = 0) { return num1 + num2 + thirdNum; } 在这个版本的函数中,thirdNum是一个形参,它有一个默认值0。如果咱们在调用addNumbers()这个函数的时候,忘记给thirdNum赋个值的话,那这个函数就相当机智地,默认把thirdNum当作是零来用。 例如: javascript var result = addNumbers(5, 10); // 返回15 var result2 = addNumbers(5, 10, 20); // 返回45 在这个例子中,我们首先调用了addNumbers()函数两次,但只提供了两个实参。因此,函数使用其形参的默认值。然后,我们再次调用了addNumbers()函数,这次提供了三个实参。所以,函数使用提供的值。 5. 总结 函数参数和实参是JavaScript中的重要概念。他们之间的关系其实特简单,就像这样:当你在呼唤一个函数的时候,得给它带上一些小礼物,这些小礼物我们就叫它们“实参”。实参被分配给函数的形参。在编写JavaScript代码时,理解函数参数和实参的关系是非常重要的。要是你能正确地理解和运用这两个小概念,那你就能够编写出更加灵活、更加强劲的函数啦,就像给你的编程技能插上翅膀一样。
2023-01-14 16:01:21
293
飞鸟与鱼_t
MySQL
...现今业界使用最广泛的关系型数据库管理系统(RDBMS),其具有高效能、扩展性好、方便易用等优点。随着互联网应用的普及,数据量越来越大,单机MySQL已经难以满足业务需求,因此MySQL的分散式就成为了热议焦点。那么,如何领会MySQL的分散式呢? 首先,我们需要了解分散式系统的理念。分散式系统是由若干台独立计算机通过网络进行协同与通讯,实现信息共享和协作作业的一个系统。在分散式系统中,不同计算机处理不同的任务,相互之间相互协作、协调,完成整个系统的功能。现在,将这个理念应用到MySQL中,我们可以说MySQL的分散式就是由若干台计算机组成的一个系统,可以分担MySQL的读写压力,提高CPU、内存等硬件资源使用率,从而达到更高的吞吐量、更高的并发性能。 MySQL的分散式,主要有两种实现方式: 1. MySQL Proxy:MySQL Proxy是一个轻量级的可插入的中间件,用于分发数据库负载,并实现复制和高可用性(HA)。它可以处理大量的并发连接和查询,并能够将这些请求转发到不同的MySQL数据库上。MySQL Proxy提供了可编程性,使其能够扩展和自定义,以适应不同的需求。 2. MySQL Cluster:MySQL Cluster是一个基于InnoDB存储引擎的面向事务的分散式数据库系统。它使用自己的数据节点和数据复制技术,实现平滑的水平扩展,提供高可用性和高可扩展性,支持分散式事务和分区表。MySQL Cluster尤其适合处理实时的在线业务应用,如电信、金融、电子商务等。 总之,MySQL的分散式是现代互联网应用的必备技术之一,它可以提高MySQL的可扩展性和高效能,同时也增加了系统的稳定性和可用性。对于需要处理大量读写请求和海量数据存储的应用,MySQL的分散式是一个非常好的解决方案。
2023-02-25 16:35:15
123
逻辑鬼才
转载文章
...RHEL)有着紧密的关系,旨在提供一个稳定、可靠和免费的企业级计算平台。在本文中,CentOS是进行用户管理和权限分配的操作系统环境。 /etc/passwd , 在类Unix操作系统中,/etc/passwd是一个用于存储用户账户信息的重要系统文件。每个条目代表一个独立的用户账户,包含用户名、密码提示符(在现代系统中,实际密码通常已加密并存储在/etc/shadow文件中)、用户ID(UID)、默认组ID(GID)、用户信息说明以及用户的主目录路径等字段。在文章语境中,它是用来查看或管理系统用户配置的关键文件之一。 /etc/shadow , /etc/shadow是Linux系统中的一个安全文件,专门用于存储用户的密码信息。该文件以加密形式保存了所有用户的密码哈希值,并且只有超级用户root才有权限读取。相较于/etc/passwd,此文件加强了对用户密码的保护,防止未经授权的访问。在文中,提到用户的密码实际存放在/etc/shadow文件中。 sudo , sudo(Super User DO)是在类Unix系统中提供的一种程序,允许普通用户以系统管理员(root)的身份执行命令,而无需切换到root用户。通过sudo,系统管理员可以有针对性地为普通用户分配特定的root权限,从而实现更细粒度的安全控制。在本文中,sudo是一个重要的命令行工具,用于在CentOS以及其他Linux发行版中管理权限和执行需要更高权限的任务。 usermod , usermod 是Linux系统下用于修改用户账户属性的命令行工具,可以更改已存在的用户的各种参数,如用户ID(UID)、附加用户组、家目录、登录shell等。在文章给出的例子中,使用usermod命令分别修改了用户的UID、默认解释器(shell),以及迁移用户的家目录。这个命令对于动态调整用户账户设置非常关键。
2023-10-12 23:41:45
52
转载
MySQL
...QL是一种广泛使用的关系型数据库管理系统(RDBMS),开源且免费,由Oracle公司开发和维护。在本文中,MySQL是用于创建、读取、更新和删除数据的主要平台,通过SQL语句实现对数据的管理和操作,如文中所示的创建新表的操作。 InnoDB存储引擎 , InnoDB是MySQL支持的一种高性能事务处理存储引擎,它提供了行级锁定以及外键约束等特性,适合处理大量并发事务的场景。在本文中,通过设置engine=InnoDB指定新建的表将采用该存储引擎进行数据存储,以确保数据的一致性和完整性。 数据类型 , 在数据库系统中,数据类型是指列可以存储的数据的种类或格式。例如,在MySQL中,数据类型包括int(整数)、varchar(可变长度字符串)、date(日期)等多种类型。在文章给出的示例中,每列都定义了特定的数据类型,如id为无符号整数类型(int unsigned),以便根据实际业务需求合理存储对应字段的数据。 主键(Primary Key) , 主键是一个或一组列,其值能够唯一标识表中的每一行记录。在MySQL建表语法中,通过primary key关键字定义主键,如例子中的id字段被设为主键,且具有自增特性(auto_increment),这意味着每当有新的记录插入时,系统会自动为id字段生成一个唯一的递增数值。 自动递增(Auto_increment) , 在MySQL中,auto_increment是一个属性,可用于整数类型的字段上,当插入新记录时,如果该字段没有明确赋值,MySQL将自动为其分配一个比当前已存在的最大值大1的新值。例如,文章中id字段设置为auto_increment,即每次新增记录时,id字段的值会自动递增。 字符集(Charset) , 字符集是在数据库中表示和存储文本数据的一套编码规则,如UTF8就是一种常用的字符集,它可以支持多种语言字符的存储和显示。在MySQL建表语法中,default charset=utf8指定了新建表的默认字符集为UTF-8,确保能够兼容并正确处理不同语言环境下的文本数据。
2023-10-30 22:22:20
117
码农
PostgreSQL
...量读写负载平衡及存储成本等因素。 此外,随着机器学习和AI技术的发展,智能化索引管理工具也逐渐崭露头角,它们可以根据历史查询模式自动推荐、调整甚至自动生成索引,以实现数据库性能的动态优化。这为数据库管理员提供了更为便捷高效的索引管理手段,有助于持续提升PostgreSQL等关系型数据库的服务质量和响应速度。
2023-11-16 14:06:06
485
晚秋落叶_t
DorisDB
...式数据库系统是一种非关系型数据库,它以列存储数据,而非传统的行存储方式。在DorisDB中,列式存储设计使得数据在查询时能够高效地对某一列进行扫描和过滤,特别适合于大数据量的分析型应用场景,如复杂报表生成、实时数据分析等,能够显著提高查询性能并降低存储成本。 用户权限管理 , 用户权限管理是数据库系统中的核心安全机制之一,用于控制不同用户对数据库内数据和功能的访问级别与操作权限。在DorisDB中,用户权限管理包括用户创建、密码设置、角色分配以及对特定表或数据库的SELECT、INSERT、UPDATE、DELETE等操作权限的授予和撤销。通过精细的权限管理,可以防止未经授权的访问和操作,有效保护敏感数据的安全性。 动态数据 masking , 动态数据 masking 是一种数据库安全技术,主要用于保护敏感信息,在不改变底层真实数据的前提下,根据预设规则和用户角色动态展示脱敏后的数据。例如,对于包含个人身份证号的数据,当非授权用户查询时,系统会自动遮盖部分数字,仅显示部分信息或用星号替代,从而避免了敏感数据的直接泄露,确保符合隐私保护和合规要求。尽管该名词未在文章中直接提及,但其作为数据库安全领域的重要实践,可与DorisDB或其他数据库系统的权限管理及安全防护措施相提并论。
2024-01-22 13:14:46
454
春暖花开-t
Datax
...,可以有效地完成这个任务。不过,在实际操作的时候,咱们可能免不了会遇到一些小插曲。就拿DataX来说吧,如果它的并行度设置得不够科学合理,那可能会让数据迁移的速度慢得像蜗牛一样,让人干着急。 本文将深入探讨如何合理设置DataX的并行度,以提高数据迁移效率。 数据迁移的重要性 随着大数据的发展,数据量的增长速度远超过我们的想象。这就需要我们在数据迁移时尽可能地提高效率,减少数据迁移的时间成本。 DataX并行度设置的影响因素 DataX的并行度设置直接影响到数据迁移的速度。一般来说,并行度越大,数据迁移速度越快。但是呢,如果我们一股脑儿地随便增加并行度,可能不仅白白浪费资源,还会引发数据不一致这类头疼的问题。 因此,我们需要根据实际情况来调整并行度的设置。 如何合理设置DataX的并行度 那么,如何合理设置DataX的并行度呢?这里,我们将从以下几个方面进行探讨: 数据库容量 首先,我们需要考虑的是数据库的容量。如果数据库是个大胖子,那咱们就可以给它多分几条跑道,让数据迁移跑得飞快。换句话说,就是当数据库容量超级大的时候,我们可以适当提升并行处理的程度,这样一来,数据迁移的速度就能噌噌噌地往上窜了。 例如,如果我们有一个包含1TB数据的大规模数据库,我们可以设置并行度为1000。 java // 设置并行度为1000 dataxConf.setParallelNum(1000); 网络带宽 其次,我们需要考虑的是网络带宽。假如网络带宽不够宽裕,咱们就不能任性地提高并行处理的程度,不然的话,可能会让数据传输直接扑街。 例如,如果我们所在的数据中心的网络带宽只有1Gbps,那么我们应该将并行度设置在50以下。 java // 设置并行度为50 dataxConf.setParallelNum(50); CPU和内存资源 最后,我们还需要考虑的是CPU和内存资源。如果CPU和内存资源有限,那么我们也应该限制并行度。 例如,如果我们有一台8核CPU,32GB内存的服务器,那么我们可以将并行度设置在50以下。 java // 设置并行度为50 dataxConf.setParallelNum(50); 总结 通过以上分析,我们可以看出,DataX的并行度设置并不是一个简单的问题,它需要考虑到多个因素,包括数据库容量、网络带宽、CPU和内存资源等。 因此,我们在使用DataX时,一定要根据实际情况来调整并行度的设置,才能最大程度地提高数据迁移效率。 尾声 总的来说,DataX是一款功能强大的大数据工具,它的并行度设置是影响数据迁移效率的一个重要因素。要是我们给数据迁移设定个合适的并行处理级别,嘿,就能嗖嗖地提升速度,这样一来,既省了宝贵的时间,又缩减了成本开支,一举两得!
2023-11-16 23:51:46
639
人生如戏-t
转载文章
...于网站和应用开发中的关系型数据库管理系统(RDBMS)。在桃源社区车辆管理系统中,MySQL作为后台数据库承担了存储和管理所有与车辆报修、用户信息、维修进度等相关数据的任务。它提供了安全可靠的数据存储能力,支持高效的数据查询、插入、更新和删除等操作,确保了系统的稳定运行和数据的安全性。同时,通过PHP语言可以方便地与MySQL数据库进行交互,实现数据的存取和业务逻辑处理,为用户提供及时准确的信息服务。
2023-12-19 18:46:46
238
转载
Impala
...a是一种快速,开源的关系型数据库查询引擎,它主要用于Apache Hadoop生态系统中的数据处理和分析。不过,随着数据量蹭蹭往上涨,我们可能得让Impala能应对更多的同时在线连接请求,就像一个服务员在高峰期时需要接待越来越多的顾客一样。这篇文章将教你如何配置Impala以支持更多的并发连接。 2. 配置impala.conf文件 Impala使用一个名为impala.conf的配置文件来控制它的行为。在该文件中,你可以找到几个与并发连接相关的参数。例如,你可以在以下部分设置最大并行任务的数量: [query-engine] max_threads = 100 在这个例子中,我们将最大并行任务数量设置为100。这意味着Impala可以同时处理的最大查询请求数量为100。 3. 使用JVM选项 除了修改impala.conf文件外,你还可以通过Java虚拟机(JVM)选项调整Impala的行为。例如,你可以使用以下命令启动Impala服务: java -Xms1g -Xmx4g \ -Dcom.cloudera.impala.thrift.MAX_THREADS=100 \ -Dcom.cloudera.impala.service.COMPACTION_THREAD_COUNT=8 \ -Dcom.cloudera.impala.util.COMMON_JVM_OPTS="-XX:+UseG1GC -XX:MaxRAMPercentage=95" \ -Dcom.cloudera.impala.service.STORAGE_AGENT_THREAD_COUNT=2 \ -Dcom.cloudera.impala.service.JAVA_DEBUGGER_ADDRESS=localhost:9999 \ -Djava.net.preferIPv4Stack=true \ -Dderby.system.home=/path/to/derby/data \ -Dderby.stream.error.file=/var/log/impala/derby.log \ com.cloudera.impala.service.ImpalaService 在这个例子中,我们添加了几个JVM选项来调整Impala的行为。比如,我们就拿MAX_THREADS这个选项来说吧,它就像是个看门人,专门负责把控同时进行的任务数量,不让它们超额。再来说说COMPACTION_THREAD_COUNT这个小家伙,它的职责呢,就是限制同一时间能有多少个压缩任务挤在一起干活,防止大家伙儿一起上阵导致场面过于混乱。 4. 性能优化 当你增加了并发连接时,你也应该考虑性能优化。例如,你可以考虑增加内存,以避免因内存不足而导致的性能问题。你也可以使用更快的硬件,如SSD,以提高I/O性能。 5. 结论 Impala是一个强大的工具,可以帮助你在Hadoop生态系统中进行高效的数据处理和分析。只要你把Impala设置得恰到好处,就能让它同时处理更多的连接请求,这样一来,甭管你的需求有多大,都能妥妥地得到满足。虽然这需要一些努力和知识,但最终的结果将是值得的。
2023-08-21 16:26:38
421
晚秋落叶-t
站内搜索
用于搜索本网站内部文章,支持栏目切换。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
cat <(command1) <(command2) > output.txt
- 将两个命令的输出合并到一个文件中。
推荐内容
推荐本栏目内的其它文章,看看还有哪些文章让你感兴趣。
2023-04-28
2023-08-09
2023-06-18
2023-04-14
2023-02-18
2023-04-17
2024-01-11
2023-10-03
2023-09-09
2023-06-13
2023-08-07
2023-03-11
历史内容
快速导航到对应月份的历史文章列表。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"