前端技术
HTML
CSS
Javascript
前端框架和UI库
VUE
ReactJS
AngularJS
JQuery
NodeJS
JSON
Element-UI
Bootstrap
Material UI
服务端和客户端
Java
Python
PHP
Golang
Scala
Kotlin
Groovy
Ruby
Lua
.net
c#
c++
后端WEB和工程框架
SpringBoot
SpringCloud
Struts2
MyBatis
Hibernate
Tornado
Beego
Go-Spring
Go Gin
Go Iris
Dubbo
HessianRPC
Maven
Gradle
数据库
MySQL
Oracle
Mongo
中间件与web容器
Redis
MemCache
Etcd
Cassandra
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Nacos
Consul
Tomcat
Nginx
Netty
大数据技术
Hive
Impala
ClickHouse
DorisDB
Greenplum
PostgreSQL
HBase
Kylin
Hadoop
Apache Pig
ZooKeeper
SeaTunnel
Sqoop
Datax
Flink
Spark
Mahout
数据搜索与日志
ElasticSearch
Apache Lucene
Apache Solr
Kibana
Logstash
数据可视化与OLAP
Apache Atlas
Superset
Saiku
Tesseract
系统与容器
Linux
Shell
Docker
Kubernetes
[最大并发连接数设置对Beego应用性能的...]的搜索结果
这里是文章列表。热门标签的颜色随机变换,标签颜色没有特殊含义。
点击某个标签可搜索标签相关的文章。
点击某个标签可搜索标签相关的文章。
Go-Spring
...,咱就能轻轻松松地把应用流量玩转起来,高效管理、灵活分配,让服务运行那叫一个溜!本文将深入探讨如何运用Go-Spring实现负载均衡,并通过实例代码让您亲身体验这一过程。 1. Go-Spring与负载均衡简介 Go-Spring借鉴了Spring Boot的理念和设计模式,为Golang开发者提供了一套便捷、高效的微服务解决方案。它就像一个超级智能的交通指挥员,肚子里装着好几种调配工作量的“小妙招”,比如轮流分配、随机挑选、最少连接数原则等。这样一来,服务间的相互呼叫就能灵活地分散到多个不同的干活机器上,就像是大家一起分担任务一样,既能让整个系统更麻溜地处理大量同时涌进来的请求,又能增强系统的抗故障能力,即使有个别机器罢工了,其他机器也能顶上,保证工作的正常进行。 2. 使用Go-Spring实现负载均衡的基本步骤 2.1 配置服务消费者 首先,我们需要在服务消费者端配置负载均衡器。想象一下,我们的服务使用者需要联系一个叫做“.UserService”的小伙伴来帮忙干活儿,这个小伙伴呢,有很多个分身,分别在不同的地方待命。 go import ( "github.com/go-spring/spring-core" "github.com/go-spring/spring-cloud-loadbalancer" ) func main() { spring.NewApplication(). RegisterBean(new(UserServiceConsumer)). AddCloudLoadBalancer("userService", func(c loadbalancer.Config) { c.Name = "userService" // 设置服务名称 c.LbStrategy = loadbalancer.RandomStrategy // 设置负载均衡策略为随机 c.AddServer("localhost:8080") // 添加服务实例地址 c.AddServer("localhost:8081") }). Run() } 2.2 调用远程服务 在服务消费者内部,通过@Service注解注入远程服务,并利用Go-Spring提供的Invoke方法进行调用,此时请求会自动根据配置的负载均衡策略分发到不同的服务实例。 go import ( "github.com/go-spring/spring-core" "github.com/go-spring/spring-web" ) type UserServiceConsumer struct { UserService spring.Service service:"userService" } func (uc UserServiceConsumer) Handle(ctx spring.WebContext) { user, err := uc.UserService.Invoke(func(service UserService) (User, error) { return service.GetUser(1) }) if err != nil { // 处理错误 } // 处理用户数据 ... } 3. 深入理解负载均衡策略 Go-Spring支持多种负载均衡策略,每种策略都有其适用场景: - 轮询(RoundRobin):每个请求按顺序轮流分配到各个服务器,适用于所有服务器性能相近的情况。 - 随机(Random):从服务器列表中随机选择一个,适用于服务器性能差异不大且希望尽可能分散请求的情况。 - 最少连接数(LeastConnections):优先选择当前连接数最少的服务器,适合于处理时间长短不一的服务。 根据实际业务需求和系统特性,我们可以灵活选择并调整这些策略,以达到最优的负载均衡效果。 4. 思考与讨论 在实践过程中,我们发现Go-Spring的负载均衡机制不仅简化了开发者的配置工作,而且提供了丰富的策略选项,使得我们能够针对不同场景采取最佳策略。不过呢,负载均衡可不是什么万能灵药,想要搭建一个真正结实耐造的分布式系统,咱们还得把它和健康检查、熔断降级这些好兄弟一起,手拉手共同协作才行。 总结来说,Go-Spring以其人性化的API设计和全面的功能集,极大地降低了我们在Golang中实施负载均衡的难度。而真正让它火力全开、大显神通的秘诀,就在于我们对业务特性有如数家珍般的深刻理解,以及对技术工具能够手到擒来的熟练掌握。让我们一起,在Go-Spring的世界里探索更多可能,打造更高性能、更稳定的分布式服务吧!
2023-12-08 10:05:20
530
繁华落尽
ClickHouse
...House作为一款高性能的列式数据库管理系统,以其出色的查询速度和处理能力赢得了众多企业的青睐。然而,为了让ClickHouse数据中心彻底展现它的威力,并且完美适应特定业务环境的需求,我们得给它来个“量体裁衣”式的精细设置。嘿,伙计们,这篇内容将会手把手地带你们踏上一段实战之旅,咱们一步步地通过具体的步骤和鲜活的代码实例,来揭开如何搭建一个既高效又稳定的ClickHouse数据中心的秘密面纱。 1. 确定硬件配置与集群架构 首先,我们从硬件配置和集群设计开始。根据业务的具体需求,数据量大小和并发查询的压力等因素,就像指挥棒一样,会直接影响到我们选择硬件资源的规格以及集群结构的设计布局。比如说,如果我们的业务需要处理海量数据或者面临大量的并发查询挑战,那就得像搭积木一样,精心设计和构建强大的硬件支撑体系以及合理的集群架构,才能确保整个系统的稳定高效运行。 例如,如果您的业务涉及到PB级别的海量数据存储和实时分析,可能需要考虑采用分布式集群部署的方式,每个节点配置较高的CPU核心数、大内存以及高速SSD硬盘: yaml 配置文件(/etc/clickhouse-server/config.xml) true node1.example.com 9000 这里展示了如何配置一个多副本、多分片的ClickHouse集群。my_cluster是集群名称,内部包含多个shard,每个shard又包含多个replica,确保了高可用性和容错性。 2. 数据分区策略与表引擎选择 ClickHouse支持多种表引擎,如MergeTree系列,这对于数据分区和优化查询性能至关重要。以MergeTree为例,我们可以根据时间戳或其他业务关键字段进行分区: sql CREATE TABLE my_table ( id Int64, timestamp DateTime, data String ) ENGINE = MergeTree() PARTITION BY toYYYYMMDD(timestamp) ORDER BY (timestamp, id); 上述SQL语句创建了一个名为my_table的表,使用MergeTree引擎,并按照timestamp字段进行分区,按timestamp和id排序,这有助于提高针对时间范围的查询效率。 3. 调优配置参数 ClickHouse提供了一系列丰富的配置参数以适应不同的工作负载。比如,对于写入密集型场景,可以调整以下参数: yaml 1048576 增大插入块大小 16 调整后台线程池大小 16 最大并行查询线程数 这些参数可以根据实际服务器性能和业务需求进行适当调整,以达到最优写入性能。 4. 监控与运维管理 为了保证ClickHouse数据中心的稳定运行,必须配备完善的监控系统。ClickHouse自带Prometheus metrics exporter,方便集成各类监控工具: bash 启动Prometheus exporter clickhouse-server --metric_log_enabled=1 同时,合理规划备份与恢复策略,利用ClickHouse的备份工具或第三方工具实现定期备份,确保数据安全。 总结起来,配置ClickHouse数据中心是一个既需要深入理解技术原理,又需紧密结合业务实践的过程。当面对特定的需求时,我们得像玩转乐高积木一样,灵活运用ClickHouse的各种强大功能。从挑选合适的硬件设备开始,一步步搭建起集群架构,再到精心设计数据模型,以及日常的运维调优,每一个环节都不能落下,都要全面、细致地去琢磨和优化,确保整个系统运作流畅,高效满足需求。在这个过程中,我们得不断摸爬滚打、动动脑筋、灵活变通,才能让我们的ClickHouse数据中心持续进步,更上一层楼地为业务发展添砖加瓦、保驾护航。
2023-07-29 22:23:54
510
翡翠梦境
Mongo
连接Mongo数据库与异步写入:一次深入探索之旅 在现代Web开发领域,MongoDB作为一款高性能、灵活且易用的NoSQL数据库,凭借其强大的文档存储能力和高度可扩展性赢得了广大开发者的青睐。本文我们将围绕一个核心问题展开探讨:“在MongoDB中,连接数据库和往数据库中写入数据是异步执行的吗?” 1. 异步编程与MongoDB的交互模型 首先,我们来理解下“异步”这个概念。在编程世界里,异步操作意味着你无需等待某个任务完成就可以继续执行其他代码,而当那个任务完成后,程序会通过回调、事件或者Promise等方式通知你结果。这种方式极大地提高了系统并发处理能力。 MongoDB的驱动程序(如Node.js中的mongodb库)确实采用了异步模式进行数据库连接和写入操作。这是因为,在处理像网络传输、磁盘读写这类IO密集型操作时,如果选择同步执行的方式,会让线程或者进程陷入“等待”的状态,就像堵车一样停滞不前,这样一来,就会影响到整个应用程序的运行效率和性能表现。所以,MongoDB的这个异步设计妙就妙在,即使你的应用程序正在处理海量数据读写,也能稳稳保证响应速度贼快,运行起来流畅得飞起,一点儿不卡顿。 2. 连接MongoDB数据库的异步过程 (以下示例采用Node.js环境及官方mongodb库) javascript const MongoClient = require('mongodb').MongoClient; // 异步连接MongoDB MongoClient.connect('mongodb://localhost:27017/mydatabase', { useNewUrlParser: true, useUnifiedTopology: true }, (err, client) => { if (err) { console.error('Error connecting to MongoDB:', err); return; } console.log('Connected successfully to MongoDB'); // 使用client对象进行数据库操作... const db = client.db(); // ... // 在完成所有数据库操作后,记得关闭连接 client.close(); }); 上述代码展示了如何异步地连接到MongoDB数据库。这里,MongoClient.connect()方法接受一个连接字符串、配置选项以及一个回调函数。当连接成功建立或发生错误时,回调函数会被调用。这正是异步编程的体现,主线程不会被阻塞,直到连接操作完成才执行后续逻辑。 3. 向MongoDB数据库异步写入数据 同样,向MongoDB插入或更新数据也是异步执行的。下面是一个向集合中插入文档的例子: javascript db.collection('mycollection').insertOne({ name: 'John Doe', age: 30 }, (err, result) => { if (err) { console.error('Error inserting document:', err); return; } console.log('Document inserted successfully:', result.insertedId); // 插入操作完成后,可以在这里执行其他逻辑 }); // 注意:这里的db是上一步异步连接成功后获取的数据库实例 这段代码展示了如何异步地向MongoDB的一个集合插入一个文档。你知道吗,这个insertOne()方法就像是个贴心的小帮手,它会接收一个文档对象作为“礼物”,然后再加上一个神奇的回调函数。当你把这个“礼物”放进去,或者在插入过程中不小心出了点小差错的时候,这个神奇的回调函数就会立马跳出来开始干活儿啦! 4. 思考与探讨 在实际开发过程中,异步操作无疑提升了我们的应用性能和用户体验。然而,这也带来了回调地狱、复杂的流程控制等问题。还好啦,现代的JavaScript可真是够意思的,它引入了Promise、async/await这些超级实用的工具,让咱们在处理异步编程时简直如虎添翼。这样一来,我们在和MongoDB打交道的时候,就能写出更加顺溜、更好懂、更好维护的代码,那感觉别提多棒了! 总结来说,MongoDB在连接数据库和写入数据时采取异步机制,这种设计让我们能够在高并发环境下更好地优化资源利用,提升系统效率。同时,作为开发者大兄弟,咱们得深入理解并灵活玩转异步编程这门艺术,才能应对各种意想不到的挑战,把MongoDB那牛哄哄的功能发挥到极致。
2024-03-10 10:44:19
167
林中小径_
Tornado
...依赖于稳定可靠的网络连接。然而,有时候咱们会碰上网络信号闹别扭或者干脆罢工的情况,这可不只是耽误了咱们的工作、影响了日常生活那么简单,还可能悄无声息地给咱们的信息安全带来隐患呐。那么,如何有效地解决这个问题呢?让我们来看看Python的Tornado库。 二、什么是Tornado? Tornado是一个高性能的Python Web服务器和异步网络库,它被设计用来构建实时Web应用和服务。它的最大亮点就是能够支持异步IO操作,这就意味着即使在单线程环境下也能轻松应对海量的并发请求,这样一来,系统的性能和稳定性都得到了超级大的提升,就像给系统装上了涡轮增压器一样,嗖嗖地快,稳稳地好。 三、Tornado如何解决网络连接不稳定或中断的问题? 网络连接不稳定或中断通常是由以下几个原因引起的:网络拥塞、路由器故障、服务提供商问题等。这些问题虽然没法彻底躲开,不过只要我们巧妙地进行网络编程,就能最大限度地降低它们对我们应用程序的影响程度,尽可能让它们少添乱。Tornado就是这样一个可以帮助我们处理这些问题的工具。 四、Tornado的使用示例 下面我们将通过几个实例来展示如何使用Tornado来处理网络连接不稳定或中断的问题。 1. 异步I/O操作 在传统的同步I/O操作中,当一个线程执行完一个任务后,会阻塞等待新的任务。这种方式在处理大量并发请求时效率较低。而异步I/O这招厉害的地方就在于,它能充分榨干多核CPU的潜能,让多个请求同时开足马力并行处理,就像一个超级服务员,能够同时服务多位顾客,既高效又灵活。Tornado这个家伙,厉害之处就在于它采用了异步I/O操作这招杀手锏,这样一来,面对蜂拥而至的高并发网络请求,它也能游刃有余地高效应对,处理起来毫不含糊。 python import tornado.web class MainHandler(tornado.web.RequestHandler): def get(self): 这里是你的业务逻辑 pass application = tornado.web.Application([ (r"/", MainHandler), ]) application.listen(8888) tornado.ioloop.IOLoop.current().start() 2. 自动重连机制 在网络连接不稳定或中断的情况下,传统的TCP连接可能会因为超时等原因断开。为了避免这种情况,我们可以设置自动重连机制。Tornado提供了一个方便的方法来实现这个功能。 python import tornado.tcpclient class MyClient(tornado.tcpclient.TCPClient): def __init__(self, host='localhost', port=80, kwargs): super().__init__(host, port, kwargs) self.retries = 3 def connect(self): for _ in range(self.retries): try: return super().connect() except Exception as e: print(f'Connect failed: {e}') tornado.ioloop.IOLoop.current().add_timeout( tornado.ioloop.IOLoop.current().time() + 5, lambda: self.connect(), ) raise tornado.ioloop.TimeoutError('Connect failed after retrying') client = MyClient() 以上就是Tornado的一些基本使用方法,它们都可以帮助我们有效地处理网络连接不稳定或中断的问题。当然,Tornado的功能远不止这些,你还可以利用它的WebSocket、HTTP客户端等功能来满足更多的需求。 五、总结 总的来说,Tornado是一个非常强大的工具,它不仅可以帮助我们提高网络应用程序的性能和稳定性,还可以帮助我们更好地处理网络连接不稳定或中断的问题。如果你是一名网络开发工程师,我强烈推荐你学习和使用Tornado。相信你会发现,它会给你带来很多惊喜和收获。 六、结语 希望通过这篇文章,你能了解到Tornado的基本概念和使用方法,并且能将这些知识运用到实际的工作和项目中。记住了啊,学习这件事儿可是没有终点线的马拉松,只有不断地吸收新知识、动手实践操作,才能让自己的技能树茁壮成长,最终修炼成一名货真价实的网络开发大神。
2023-05-20 17:30:58
169
半夏微凉-t
Redis
...释 , 在高流量、高并发的Web应用中,低延迟是指系统能够迅速响应用户请求,减少用户等待时间。通过优化网络传输、数据处理和存储机制,Redis能够显著降低数据访问延迟,确保在高负载情况下,Web应用仍能保持良好的响应速度和用户体验。 名词 , 高并发。 解释 , 高并发指的是系统在同一时间内能够处理多个用户请求的能力。在现代Web应用中,面对海量用户访问和实时交互的需求,系统必须具备高效的并发处理能力。Redis通过其内存优先的数据存储机制,以及支持大量并发连接的特性,能够有效支撑高并发场景,确保应用在高峰期也能稳定运行,避免因资源争抢导致的性能瓶颈。 名词 , 微服务架构。 解释 , 微服务架构是一种将大型应用分解为一组小而独立的服务的设计模式。每个服务负责处理特定的业务功能,通过轻量级通信机制(如HTTP)进行交互。这种架构模式有助于提高系统的可维护性、可扩展性和容错性。在分布式系统中,Redis作为数据存储和缓存系统,可以与微服务协同工作,提供快速的数据访问和一致性保证,优化微服务架构下的数据管理和通信效率。
2024-08-20 16:11:43
100
百转千回
Go Gin
...在构建现代 Web 应用时,API 的安全性与性能管理是至关重要的环节。哎呀,兄弟,你懂的,设置API访问频率的限制这事儿啊,就像是给自家的宝藏门口放了个看门狗,既能防止那些乱糟糟的家伙随便闯进来搞破坏,又能保护咱们的宝贝资源不被那些坏心眼的人给掏空了。这招儿,可真是既实用又有效呢!哎呀,你知道吗?Go 语言这玩意儿,那可是超级厉害的!它就像个武林高手,出手快如闪电,又稳如泰山。用 Go 来做网站啥的,不仅效率高得飞起,代码还简洁明了,看着都舒服。而且,你放心,用 Go 做的网站安全性能杠杠的,能防得住不少小偷小摸呢!所以啊,现在好多大厂做高性能、安全的网络服务,都喜欢用 Go 语言来搞,因为它真的太牛了!gin-contrib/ratelimit 是一个用于 Go 语言中 Gin 框架的库,专门用于实现 API 访问速率限制。本文将深入探讨如何利用 gin-contrib/ratelimit 来增强 API 安全性和性能。 二、基础概念与原理 速率限制(也称为限流)是一种常见的流量控制手段,它允许系统在单位时间内处理的请求数量不超过某个阈值。哎呀,你瞧这招儿挺机灵的!它能帮咱们解决一个大难题——就是那些疯了似的并发请求,就像一群蚂蚁围攻面包,瞬间就把服务器给淹没了。这样不仅能让我们的服务器喘口气,不至于被这些请求给累趴下,还能给那些没权没份的家伙们上上锁,别让他们乱用咱们的API,搞得咱们这边乱七八糟的。这招儿,既保护了服务器,又守住了规矩,真是一举两得啊! gin-contrib/ratelimit 提供了一种简单且灵活的方式来配置和应用速率限制规则。它支持多种存储后端,包括内存、Redis 和数据库等,以适应不同的应用场景需求。 三、安装与初始化 首先,确保你的 Go 环境已经配置好,并且安装了 gin-contrib/ratelimit 库。可以通过以下命令进行安装: bash go get github.com/gin-contrib/ratelimit 接下来,在你的 Gin 应用中引入并初始化 ratelimit 包: go import ( "github.com/gin-contrib/ratelimit" "github.com/gin-gonic/gin" ) func main() { r := gin.Default() // 配置限流器 limiter := ratelimit.New(ratelimit.Config{ AllowedRequests: 5, // 允许每分钟最多5次请求 Duration: time.Minute, }) // 将限流器应用于路由 r.Use(limiter) // 定义路由 r.GET("/api", func(c gin.Context) { c.JSON(200, gin.H{"message": "Hello, World!"}) }) r.Run(":8080") } 四、高级功能与自定义 除了基本的速率限制配置外,gin-contrib/ratelimit 还提供了丰富的高级功能,允许开发者根据具体需求进行定制化设置。 - 基于 IP 地址的限制: go limiter := ratelimit.New(ratelimit.Config{ AllowedRequests: 5, Duration: time.Minute, PermitsBy: ratelimit.PermitByIP, }) - 基于 HTTP 请求头的限制: go limiter := ratelimit.New(ratelimit.Config{ AllowedRequests: 5, Duration: time.Minute, PermitsBy: ratelimit.PermitByHeader("X-User-ID"), }) - 基于用户会话的限制: go limiter := ratelimit.New(ratelimit.Config{ AllowedRequests: 5, Duration: time.Minute, PermitsBy: ratelimit.PermitBySessionID, }) 这些高级功能允许你更精细地控制哪些请求会被限制,从而提供更精确的访问控制策略。 五、实践案例 基于 IP 地址的限流 假设我们需要限制某个特定 IP 地址的访问频率: go limiter := ratelimit.New(ratelimit.Config{ AllowedRequests: 10, // 每小时最多10次请求 Duration: time.Hour, PermitsBy: ratelimit.PermitByIP, }) // 在路由上应用限流器 r.Use(limiter) 六、性能考量与优化 在实际部署时,考虑到速率限制的性能影响,合理配置限流参数至关重要。哎呀,你得注意了,设定安全防护的时候,这事儿得拿捏好度才行。要是设得太严,就像在门口挂了个大锁,那些坏人进不来,可合法的访客也被挡在外头了,这就有点儿不地道了。反过来,如果设置的门槛太松,那可就相当于给小偷开了个后门,让各种风险有机可乘。所以啊,找那个平衡点,既不让真正的朋友感到不便,又能守住自家的安全,才是王道!因此,建议结合业务场景和流量预测进行参数调整。 同时,选择合适的存储后端也是性能优化的关键。哎呀,你知道的,在处理那些超级多人同时在线的情况时,咱们用 Redis 来当存储小能手,那效果简直不要太好!它就像个神奇的魔法箱,能飞快地帮我们处理各种数据,让系统运行得又顺溜又高效,简直是高并发环境里的大救星呢! 七、结论 通过集成 gin-contrib/ratelimit,我们不仅能够有效地管理 API 访问频率,还能够在保障系统稳定运行的同时,为用户提供更好的服务体验。嘿,兄弟!业务这玩意儿,那可是风云变幻,快如闪电。就像你开车,路况不一,得随时调整方向,对吧?API安全性和可用性这事儿,就跟你的车一样重要。所以,咱们得像老司机一样,灵活应对各种情况,时不时地调整和优化限流策略。这样,不管是高峰还是低谷,都能稳稳地掌控全局,让你的业务顺畅无阻,安全又高效。别忘了,这可是保护咱们业务不受攻击,保证用户体验的关键!希望本文能够帮助你更好地理解和应用 gin-contrib/ratelimit,在构建强大、安全的 API 时提供有力的支持。
2024-08-24 16:02:03
110
山涧溪流
MemCache
服务连接超时 , 指应用程序在尝试与MemCache服务器建立连接时,由于网络延迟、服务器过载或其他原因,未能在预期时间内完成连接,导致请求失败并返回超时错误的现象。在文中,这种情况常发生在高并发场景下,尤其是在MemCache服务器负载较高或网络状况不佳的情况下,客户端会因等待响应时间过长而触发超时异常。 MemCache , 一种高性能的分布式内存对象缓存系统,主要用于减轻数据库的压力并提升应用的响应速度。MemCache通过将热点数据存储在内存中,减少了对数据库的频繁访问,从而提高了系统的整体性能。在文中提到,MemCache适用于电商网站等需要快速响应用户请求的场景,但同时也需要注意其配置和使用方式,否则可能会引发诸如服务连接超时等问题。 重试机制 , 一种容错设计模式,用于在初次操作失败后自动尝试重新执行该操作。在文中,重试机制被用来解决MemCache服务连接超时的问题,通过设定最大重试次数和间隔时间,允许客户端在遇到暂时性错误时有机会恢复正常的连接状态。这种机制有助于提高系统的鲁棒性,但在实现时也需要谨慎处理,以免造成资源浪费或引发连锁反应。
2025-04-08 15:44:16
88
雪落无痕
转载文章
...程的各个环节后,找出影响用户安装率提升的关键因素。然后对新版本安装包采用了多种技术方案,将单用户获取成本削减了20%+,这一年下来就是千万级别的成本节约。 我们还主动在手机助手的搜索模块中应用了简单的学习算法。采用了用户协同,标签相似,点击反馈等方法将手机助手的搜索转化率提升了数个百分点。 除了用技术提升业务以外,我还结合工作中的问题进行了很多的深度技术思考。 如有一次我们自己维护了一个线上的redis(当时工程部还没有redis平台,redis服务要业务自己维护)。为了优化性能,我把后端的请求由短连接改成了长连接。虽然看效果性能确实是优化了,但是我的思考并没有停止。我们所有的后端机都会连接这个redis。这样在这个redis实例上可能得有6000多条并发连接存在。我就开始疑惑,Linux 最多能有多少个TCP连接呢,我这 6000 条长连接会不会把这个服务器玩坏? 再比如,我们组的服务器遭遇过几次连接相关的线上问题。其中一次是因为端口紧张而导致 CPU 消耗飙升。后来我又深入研究了一下。 最近,由于 Docker 的广泛应用。底层的网络工作方式已经在悄悄地发生变化了。所以我又开辟了一个网络虚拟化的坑,来一点一点地填。 现在我们的「开发内功修炼」公众号和 Github 就是在作为一个我和大家分享我的技术思考的一个窗口。 04 重回腾讯 时隔 7 年,我又以一种奇特的方式变回了腾讯人的身份。 腾讯再一次收购了搜狗的股份,这一次不再是控股,而是全资。 在离开腾讯的这 7 年多的时间里,腾讯的内部技术工作方式已经发生了翻天覆地的变化。 所以在刚转回腾讯的这一段时间里,我花了大量的精力来熟悉腾讯基于 tRPC 的各种技术生态。除了工作日,也投入了不少周末的精力。 05 再叨叨几句 最后,水文里挤干货,通过我今天的文章我想给大家分享这么几点经验。 第一,是要学会抬头看路,选择一个好的赛道进去。我非常庆幸我当年从广电赛道切换到了互联网,获得了更大的舞台。不过其实我自己在这点上做的也不是特别好,2013年底入职搜狗前拒绝了字节大把期权的offer,要不然我我早就财务自由了。 第二,不要光被动接收领导的指令干活。要主动积极思考项目中哪些地方是待改进的,想到了你就去做。领导都非常喜欢积极主动的员工。我自己也是喜欢招一些能主动思考,积极推进的同学。这些人能创造意外的价值。 第三,工作中除了业务以外还要主动技术的深度思考。毕竟技术仍然是开发的立命之本。在晋升考核的时候,业务数据做的再好也代替不了技术实力的核心位置。把工作中的技术点总结一下,在公司内分享出来。不涉及机密的话在外网分享一下更好。对你自己,对你的团队,都是好事。 技术交流群 最近有很多人问,有没有读者交流群,想知道怎么加入。 最近我创建了一些群,大家可以加入。交流群都是免费的,只需要大家加入之后不要随便发广告,多多交流技术就好了。 目前创建了多个交流群,全国交流群、北上广杭深等各地区交流群、面试交流群、资源共享群等。 有兴趣入群的同学,可长按扫描下方二维码,一定要备注:全国 Or 城市 Or 面试 Or 资源,根据格式备注,可更快被通过且邀请进群。 ▲长按扫描 往期推荐 武大94年博士年薪201万入职华为!学霸日程表曝光,简直降维打击! 腾讯三面:40亿个QQ号码如何去重? 我被开除了。。只因为看了骂公司的帖子 如果你喜欢本文, 请长按二维码,关注 Hollis. 转发至朋友圈,是对我最大的支持。 点个 在看 喜欢是一种感觉 在看是一种支持 ↘↘↘ 本篇文章为转载内容。原文链接:https://blog.csdn.net/hollis_chuang/article/details/121738393。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-02-06 11:38:24
233
转载
转载文章
...高可用、低成本、安全应用的能力 – 在工作上或社区中得到尊重和认可 – 可以把认证放到简历中,linkedin中整合了AWS认证徽章 对企业雇主 – 具备AWS上服务和工具的使用的认可 – 客户认可,降低AWS项目实施风险 – 增加客户满意度 3.3 再认证模式 因为AWS的服务在更新,因此每两年要重新认证(证件的有效期2年),再次参加考试时,题目、时间将会更少,且认证费用更低 3.4 助理架构师认证的知识领域 四大知识域 1 设计:高可用、高效率、可容错低、可扩展的系统 2 实施和部署:强调部署操作能力 3 数据安全性:在部署操作时,始终保持数据保存和传输的安全 4 排除故障:在系统出现问题时,可以快速找到问题并解决问题 知识权重 - 设计:60%的题目 - 实施和部署:10%的题目 - 数据安全:20%的题目 - 排除故障:10%的题目 PS:考试不会按照上面的次序、考试不会注明考试题目的分类 3.5 认证过程 需要在网上注册,找到距离家里比较近的地方考试(考点) 到了现场需要携带身份证,证明自己 并不允许带手机入场 证件上必须有照片 签署NDA保证不会泄露考题 考试中心的电脑中考试(80分钟,55个考题) 考试后马上知道分数和是否通过(不会看到每道题目是否正确) 通过后的成绩、认证证书等将发到email邮箱中 3.6 考试机制 助理级别考试的重点是:单一服务和小规模的组合服务的掌握程度 所有题目都是选择题(多选或单选) 不惩罚打错,所以留白没意义,可以猜一个 55道题 可以给不确定的题目打标签,没提交前都可以回来改答案 3.7 题目示例 单选题 多选题(会告诉你有多少个答案) 汇总查看答案以及mark(标记) 4 AWS架构的7大设计原则 4.1 松耦合 松耦合是容错、运维自动扩容的基础,在设计上应该尽量减少模块间的依赖性,将不会成为未来应用调整、发展的阻碍 松耦合模式的情况 不要标示(依赖)特定对象,依赖特定对象耦合性将非常高 – 使用负载均衡器 – 域名解析 – 弹性IP – 可以动态找到配合的对象,为松耦合带来方便,为应用将来的扩展带来好处 不要依赖其他模块的正确处理或及时的处理 – 使用尽量使用异步的处理,而不是同步的(SQS可以帮到用户) 4.2 模块出错后工作不会有问题 问问某个模块出了问题,应用会怎么样? 在设计的时候,在出了问题会有影响的模块,进行处理,建立自动恢复性 4.3 实现弹性 在设计上,不要假定模块是正常的、始终不变的 – 可以配合AutoScaling、EIP和可用区AZ来满足 允许模块的失败重启 – 无状态设计比有状态设计好 – 使用ELB、云监控去检测“实例”运行状态 有引导参数的实例(实现自动配置) – 例如:加入user data在启动的时候,告知它应该做的事情 在关闭实例的时候,保存其配置和个性化 – 例如用DynamoDB保存session信息 弹性后就不会为了超配资源而浪费钱了 4.4 安全是整体的事,需要在每个层面综合考虑 基础架构层 计算/网络架构层 数据层 应用层 4.5 最小授权原则 只付于操作者完成工作的必要权限 所有用户的操作必须授权 三种类型的权限能操作AWS – 主账户 – IAM用户 – 授权服务(主要是开发的app) 5 设计:高可用、高效率、可容错、可扩展的系统 本部分的目标是设计出高可用、高效率低成本、可容错、可扩展的系统架构 - 高可用 – 了解AWS服务自身的高可靠性(例如弹性负载均衡)—-因为ELB是可以多AZ部署的 – 用好这些服务可以减少可用性的后顾之忧 - 高效率(低成本) – 了解自己的容量需求,避免超额分配 – 利用不同的价格策略,例如:使用预留实例 – 尽量使用AWS的托管服务(如SNS、SQS) - 可容错 – 了解HA和容错的区别 – 如果说HA是结果,那么容错则是保障HA的一个重要策略 – HA强调系统不要出问题,而容错是在系统出了问题后尽量不要影响业务 - 可扩展性 – 需要了解AWS哪些服务自身就可以扩展,例如SQS、ELB – 了解自动伸缩组(AS) 运用好 AWS 7大架构设计原则的:松耦合、实现弹性 6 实施和部署设计 本部分的在设计的基础上找到合适的工具来实现 对比第一部分“设计”,第一章主要针对用什么,而第二章则讨论怎么用 主要考核AWS云的核心的服务目录和核心服务,包括: 计算机和网络 – EC2、VPC 存储和内容分发 – S3、Glacier 数据库相关分类 – RDS 部署和管理服务 – CloudFormation、CloudWatch、IAM 应用服务 – SQS、SNS 7 数据安全 数据安全的基础,是AWS责任共担的安全模型模型,必须要读懂 数据安全包括4个层面:基础设施层、计算/网络层、数据层、应用层 - 基础设施层 1. 基础硬件安全 2. 授权访问、流程等 - 计算/网络层 1. 主要靠VPC保障网络(防护、路由、网络隔离、易管理) 2. 认识安全组和NACLs以及他们的差别 安全组比ACL多一点,安全组可以针对其他安全组,ACL只能针对IP 安全组只允许统一,ACL可以设置拒绝 安全组有状态!很重要(只要一条入站规则通过,那么出站也可以自动通过),ACL没有状态(必须分别指定出站、入站规则) 安全组的工作的对象是网卡(实例)、ACL工作的对象是子网 认识4种网关,以及他们的差别 共有4种网关,支撑流量进出VPC internet gatway:互联网的访问 virtual private gateway:负责VPN的访问 direct connect:负责企业直连网络的访问 vpc peering:负责VPC的peering的访问 数据层 数据传输安全 – 进入和出AWS的安全 – AWS内部传输安全 通过https访问API 链路的安全 – 通过SSL访问web – 通过IP加密访问VPN – 使用直连 – 使用OFFLINE的导入导出 数据的持久化保存 – 使用EBS – 使用S3访问 访问 – 使用IAM策略 – 使用bucket策略 – 访问控制列表 临时授权 – 使用签名的URL 加密 – 服务器端加密 – 客户端加密 应用层 主要强调的是共担风险模型 多种类型的认证鉴权 给用户在应用层的保障建议 – 选择一种认证鉴权机制(而不要不鉴权) – 用安全的密码和强安全策略 – 保护你的OS(如打开防火墙) – 用强壮的角色来控制权限(RBAC) 判断AWS和用户分担的安全中的标志是,哪些是AWS可以控制的,那些不能,能的就是AWS负责,否则就是用户(举个例子:安全组的功能由AWS负责—是否生效,但是如何使用是用户负责—自己开放所有端口跟AWS无关) AWS可以保障的 用户需要保障的 工具与服务 操作系统 物理内部流程安全 应用程序 物理基础设施 安全组 网络设施 虚拟化设施 OS防火墙 网络规则 管理账号 8 故障排除 问题经常包括的类型: - EC2实例的连接性问题 - 恢复EC2实例或EBS卷上的数据 - 服务使用限制问题 8.1 EC2实例的连接性问题 经常会有多个原因造成无法连接 外部VPC到内部VPC的实例 – 网关(IGW–internet网关、VPG–虚拟私有网关)的添加问题 – 公司网络到VPC的路由规则设置问题 – VPC各个子网间的路由表问题 – 弹性IP和公有IP的问题 – NACLs(网络访问规则) – 安全组 – OS层面的防火墙 8.2 恢复EC2实例或EBS卷上的数据 注意EBS或EC2没有任何强绑定关系 – EBS是可以从旧实例上分离的 – 如有必要尽快做 将EBS卷挂载到新的、健康的实例上 执行流程可以针对恢复没有工作的启动卷(boot volume) – 将root卷分离出来 – 像数据一样挂载到其他实例 – 修复文件 – 重新挂载到原来的实例中重新启动 8.3 服务使用限制问题 AWS有很多软性限制 – 例如AWS初始化的时候,每个类型的EBS实例最多启动20个 还有一些硬性限制例如 – 每个账号最多拥有100个S3的bucket – …… 别的服务限制了当前服务 – 例如无法启动新EC2实例,原因可能是EBS卷达到上限 – Trusted Advisor这个工具可以根据服务水平的不同给出你一些限制的参考(从免费试用,到商业试用,和企业试用的建议) 常见的软性限制 公共的限制 – 每个用户最多创建20个实例,或更少的实例类型 – 每个区域最多5个弹性ip – 每个vpc最多100个安全组 – 最多20个负载均衡 – 最多20个自动伸缩组 – 5000个EBS卷、10000个快照,4w的IOPS和总共20TB的磁盘 – …更多则需要申请了 你不需要记住限制 – 知道限制,并保持数值敏感度就好 – 日后遇到问题时可以排除掉软限制的相关的问题 9. 总结 9.1 认证的主要目标是: 确认架构师能否搜集需求,并且使用最佳实践,在AWS中构建出这个系统 是否能为应用的整个生命周期给出指导意见 9.2 希望架构师(助理或专家级)考试前的准备: 深度掌握至少1门高级别语言(c,c++,java等) 掌握AWS的三份白皮书 – aws概览 – aws安全流程 – aws风险和应对 – 云中的存储选项 – aws的架构最佳实践 按照客户需求,使用AWS组件来部署混合系统的经验 使用AWS架构中心网站了解更多信息 9.3 经验方面的建议 助理架构师 – 至少6个月的实际操作经验、在AWS中管理生产系统的经验 – 学习过AWS的基本课程 专家架构师 – 至少2年的实际操作经验、在AWS中管理多种不同种类的复杂生产系统的经验(多种服务、动态伸缩、高可用、重构或容错) – 在AWS中执行构建的能力,架构的高级概念能力 9.4 相关资源 认证学习的资源地址 - 可以自己练习,模拟考试需要付费的 接下来就去网上报名参加考试 本篇文章为转载内容。原文链接:https://blog.csdn.net/QXK2001/article/details/51292402。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-11-29 22:08:40
271
转载
转载文章
...,如果是集群部署,高并发情况下那个性能更好。 1.2 Java中间件二面 技术二面考察范围: 问了项目相关的技术实现细节 数据库相关:索引、索引底层实现、mysql相关的行锁、表锁等 redis相关:架构设计、数据一致性问题 容器:容器的设计原理等技术 二面题目: 参与的项目,选一个,技术难度在哪里? Collections.sort底层排序方式 负载均衡的原理设计模式与重构,谈谈你对重构的理解 谈谈redis相关的集群有哪些成熟方案? 再谈谈一致hash算法(redis)? 数据库索引,B+树的特性和建树过程 Mysql相关的行锁,表锁;乐观锁,悲观锁 谈谈多线程和并发工具的使用 谈谈redis的架构和组件 Redis的数据一致性问题(分布式多节点环境&单机环境) Docker容器 1.3 Java中间件三面 技术三面考察范围: 主要谈到了高并发的实现方案 以及中间件:redis、rocketmq、kafka等的架构设计思路 最后问了平时怎么提升技术的技术 三面题目 高并发情况下,系统是如何支撑大量的请求的? 接着上面的问题,延伸到了中间件,kafka、redis、rocketmq、mycat等设计思路和适用场景等 最近上过哪些技术网站;最近再看那些书。 工作和生活中遇见最大的挑战,怎么去克服? 未来有怎样的打算 1.4 Java中间件四面 最后,你懂的,主要就是HR走流程了,主要问了未来的职业规划。 02 头条Java后台3面 2.1 头条一面 讲讲jvm运行时数据库区 讲讲你知道的垃圾回收算法 jvm内存模型jmm 内存泄漏与内存溢出的区别 select、epool 的区别?底层的数据结构是什么? mysql数据库默认存储引擎,有什么优点 优化数据库的方法,从sql到缓存到cpu到操作系统,知道多少说多少 什么情景下做分表,什么情景下做分库 linkedList与arrayList区别 适用场景 array list是如何扩容的 volatile 关键字的作用?Java 内存模型? java lock的实现,公平锁、非公平锁 悲观锁和乐观锁,应用中的案例,mysql当中怎么实现,java中的实现 2.2 头条二面 Java 内存分配策略? 多个线程同时请求内存,如何分配? Redis 底层用到了哪些数据结构? 使用 Redis 的 set 来做过什么? Redis 使用过程中遇到什么问题? 搭建过 Redis 集群吗? 如何分析“慢查询”日志进行 SQL/索引 优化? MySQL 索引结构解释一下?(B+ 树) MySQL Hash 索引适用情况?举下例子? 2.3 头条三面 如何保证数据库与redis缓存一致的Redis 的并发竞争问题是什么? 如何解决这个问题? 了解 Redis 事务的 CAS 方案吗? 如何保证 Redis 高并发、高可用? Redis 的主从复制原理,以及Redis 的哨兵原理? 如果让你写一个消息队列,该如何进行架构设计啊?说一下你的思路。 MySQL数据库主从同步怎么实现? 秒杀模块怎么设计的,如何压测,抗压手段 03 今日头条Java后台研发三面 3.1 一面 concurrent包下面用过哪些? countdownlatch功能实现 synchronized和lock区别,重入锁thread和runnable的区别 AtomicInteger实现原理(CAS自旋) java并发sleep与wait、notify与notifyAll的区别 如何实现高效的同步链表 java都有哪些加锁方式(synchronized、ReentrantLock、共享锁、读写锁等) 设计模式(工厂模式、单例模式(几种情况)、适配器模式、装饰者模式) maven依赖树,maven的依赖传递,循环依赖 3.2 二面 synchronized和reentrantLock的区别,synchronized用在代码快、方法、静态方法时锁的都是什么? 介绍spring的IOC和AOP,分别如何实现(classloader、动态代理)JVM的内存布局以及垃圾回收原理及过程 讲一下,讲一下CMS垃圾收集器垃圾回收的流程,以及CMS的缺点 redis如何处理分布式服务器并发造成的不一致OSGi的机制spring中bean加载机制,bean生成的具体步骤,ioc注入的方式spring何时创建- applicationContextlistener是监听哪个事件? 介绍ConcurrentHashMap原理,用的是哪种锁,segment有没可能增大? 解释mysql索引、b树,为啥不用平衡二叉树、红黑树 Zookeeper如何同步配置 3.3 三面 Java线程池ThreadPoolEcecutor参数,基本参数,使用场景 MySQL的ACID讲一下,延伸到隔离级别 dubbo的实现原理,说说RPC的要点 GC停顿原因,如何降低停顿? JVM如何调优、参数怎么调? 如何用工具分析jvm状态(visualVM看堆中对象的分配,对象间的引用、是否有内存泄漏,jstack看线程状态、是否死锁等等) 描述一致性hash算法 分布式雪崩场景如何避免? 再谈谈消息队列 04 抖音Java 三面 4.1 一面: hashmap,怎么扩容,怎么处理数据冲突? 怎么高效率的实现数据迁移? Linux的共享内存如何实现,大概说了一下。 socket网络编程,说一下TCP的三次握手和四次挥手同步IO和异步IO的区别? Java GC机制?GC Roots有哪些? 红黑树讲一下,五个特性,插入删除操作,时间复杂度? 快排的时间复杂度,最坏情况呢,最好情况呢,堆排序的时间复杂度呢,建堆的复杂度是多少 4.2 二面: 自我介绍,主要讲讲做了什么和擅长什么 设计模式了解哪些? AtomicInteger怎么实现原子修改的? ConcurrentHashMap 在Java7和Java8中的区别? 为什么Java8并发效率更好?什么情况下用HashMap,什么情况用ConcurrentHashMap? redis数据结构? redis数据淘汰机制? 4.3 三面(约五十分钟): mysql实现事务的原理(MVCC) MySQL数据主从同步是如何实现的? MySQL索引的实现,innodb的索引,b+树索引是怎么实现的,为什么用b+树做索引节点,一个节点存了多少数据,怎么规定大小,与磁盘页对应。 如果Redis有1亿个key,使用keys命令是否会影响线上服务? Redis的持久化方式,aod和rdb,具体怎么实现,追加日志和备份文件,底层实现原理的话知道么? 遇到最大困难是什么?怎么克服? 未来的规划是什么? 你想问我什么? 05 百度三面 5.1 百度一面 自我介绍 Java中的多态 为什么要同时重写hashcode和equals Hashmap的原理 Hashmap如何变线程安全,每种方式的优缺点 垃圾回收机制 Jvm的参数你知道的说一下 设计模式了解的说一下啊 手撕一个单例模式 手撕算法:反转单链表 手撕算法:实现类似微博子结构的数据结构,输入一系列父子关系,输出一个类似微博评论的父子结构图 手写java多线程 手写java的soeket编程,服务端和客户端 手撕算法: 爬楼梯,写出状态转移方程 智力题:时针分针什么时候重合 5.2 百度二面(现场) 自我介绍 项目介绍 服务器如何负载均衡,有哪些算法,哪个比较好,一致性哈希原理,怎么避免DDOS攻击请求打到少数机器。 TCP连接中的三次握手和四次挥手,四次挥手的最后一个ack的作用是什么,为什么要time wait,为什么是2msl。 数据库的备份和恢复怎么实现的,主从复制怎么做的,什么时候会出现数据不一致,如何解决。 Linux查看cpu占用率高的进程 手撕算法:给定一个数字三角形,找到从顶部到底部的最小路径和。每一步可以移动到下面一行的相邻数字上。 然后继续在这个问题上扩展 求出最短那条的路径 递归求出所有的路径 设计模式讲一下熟悉的 会不会滥用设计模式 多线程条件变量为什么要在while体里 你遇到什么挫折,怎么应对和处理 5.3 百度三面(现场) 自我介绍 项目介绍 Redis的特点 Redis的持久化怎么做,aof和rdb,有什么区别,有什么优缺点。 Redis使用哨兵部署会有什么问题,我说需要扩容的话还是得集群部署。 说一下JVM内存模型把,有哪些区,分别干什么的 说一下gc算法,分代回收说下 MySQL的引擎讲一下,有什么区别,使用场景呢 分布式事务了解么 反爬虫的机制,有哪些方式 06 蚂蚁中间件团队面试题 6.1 蚂蚁中间件一面: 自我介绍 JVM垃圾回收算法和垃圾回收器有哪些,最新的JDK采用什么算法。 新生代和老年代的回收机制。 讲一下ArrayList和linkedlist的区别,ArrayList与HashMap的扩容方式。 Concurrenthashmap1.8后的改动。 Java中的多线程,以及线程池的增长策略和拒绝策略了解么。 Tomcat的类加载器了解么 Spring的ioc和aop,Springmvc的基本架构,请求流程。 HTTP协议与Tcp有什么区别,http1.0和2.0的区别。 Java的网络编程,讲讲NIO的实现方式,与BIO的区别,以及介绍常用的NIO框架。 索引什么时候会失效变成全表扫描 介绍下分布式的paxos和raft算法 6.2 蚂蚁中间件二面 你在项目中怎么用到并发的。 消息队列的使用场景,谈谈Kafka。 你说了解分布式服务,那么你怎么理解分布式服务。 Dubbo和Spring Clound的区别,以及使用场景。 讲一下docker的实现原理,以及与JVM的区别。 MongoDB、Redis和Memcached的应用场景,各自优势 MongoDB有事务吗 Redis说一下sorted set底层原理 讲讲Netty为什么并发高,相关的核心组件有哪些 6.3 蚂蚁中间件三面 完整的画一个分布式集群部署图,从负载均衡到后端数据库集群。 分布式锁的方案,Redis和Zookeeper哪个好,如果是集群部署,高并发情况下哪个性能更好。 分布式系统的全局id如何实现。 数据库万级变成亿级,你如何来解决。 常见的服务器雪崩是由什么引起的,如何来防范。 异地容灾怎么实现 常用的高并发技术解决方案有哪些,以及对应的解决步骤。 07 京东4面(Java研发) 7.1 一面(基础面:约1小时) 自我介绍,主要讲讲做了什么和擅长什么 springmvc和spring-boot区别 @Autowired的实现原理 Bean的默认作用范围是什么?其他的作用范围? 索引是什么概念有什么作用?MySQL里主要有哪些索引结构?哈希索引和B+树索引比较? Java线程池的原理?线程池有哪些?线程池工厂有哪些线程池类型,及其线程池参数是什么? hashmap原理,处理哈希冲突用的哪种方法? 还知道什么处理哈希冲突的方法? Java GC机制?GC Roots有哪些? Java怎么进行垃圾回收的?什么对象会进老年代?垃圾回收算法有哪些?为什么新生代使用复制算法? HashMap的时间复杂度?HashMap中Hash冲突是怎么解决的?链表的上一级结构是什么?Java8中的HashMap有什么变化?红黑树需要比较大小才能进行插入,是依据什么进行比较的?其他Hash冲突解决方式? hash和B+树的区别?分别应用于什么场景?哪个比较好? 项目里有个数据安全的,aes和md5的区别?详细点 7.2 二面(问数据库较多) 自我介绍 为什么MyISAM查询性能好? 事务特性(acid) 隔离级别 SQL慢查询的常见优化步骤? 说下乐观锁,悲观锁(select for update),并写出sql实现 TCP协议的三次握手和四次挥手过程? 用到过哪些rpc框架 数据库连接池怎么实现 Java web过滤器的生命周期 7.3 三面(综合面;约一个小时) 自我介绍。 ConcurrentHashMap 在Java7和Java8中的区别?为什么Java8并发效率更好?什么情况下用HashMap,什么情况用ConcurrentHashMap? 加锁有什么机制? ThreadLocal?应用场景? 数据库水平切分,垂直切分的设计思路和切分顺序 Redis如何解决key冲突 soa和微服务的区别? 单机系统演变为分布式系统,会涉及到哪些技术的调整?请从前面负载到后端详细描述。 设计一个秒杀系统? 7.4 四面(HR面) 你自己最大优势和劣势是什么 平时遇见过什么样的挑战,怎么去克服的 工作中遇见了技术解决不了的问题,你的应对思路? 你的兴趣爱好? 未来的职业规划是什么? 08 美团java高级开发3面 8.1 美团一面 自我介绍 项目介绍 Redis介绍 了解redis源码么 了解redis集群么 Hashmap的原理,增删的情况后端数据结构如何位移 hashmap容量为什么是2的幂次 hashset的源码 object类你知道的方法 hashcode和equals 你重写过hashcode和equals么,要注意什么 假设现在一个学生类,有学号和姓名,我现在hashcode方法重写的时候,只将学号参与计算,会出现什么情况? 往set里面put一个学生对象,然后将这个学生对象的学号改了,再put进去,可以放进set么?并讲出为什么 Redis的持久化?有哪些方式,原理是什么? 讲一下稳定的排序算法和不稳定的排序算法 讲一下快速排序的思想 8.2 美团二面 自我介绍 讲一下数据的acid 什么是一致性 什么是隔离性 Mysql的隔离级别 每个隔离级别是如何解决 Mysql要加上nextkey锁,语句该怎么写 Java的内存模型,垃圾回收 线程池的参数 每个参数解释一遍 然后面试官设置了每个参数,给了是个线程,让描述出完整的线程池执行的流程 Nio和IO有什么区别 Nio和aio的区别 Spring的aop怎么实现 Spring的aop有哪些实现方式 动态代理的实现方式和区别 Linux了解么 怎么查看系统负载 Cpu load的参数如果为4,描述一下现在系统处于什么情况 Linux,查找磁盘上最大的文件的命令 Linux,如何查看系统日志文件 手撕算法:leeetcode原题 22,Generate Parentheses,给定 n 对括号,请- 写一个函数以将其生成新的括号组合,并返回所有组合结果。 8.3 美团三面(现场) 三面没怎么问技术,问了很多技术管理方面的问题 自我介绍 项目介绍 怎么管理项目成员 当意见不一致时,如何沟通并说服开发成员,并举个例子 怎么保证项目的进度 数据库的索引原理 非聚簇索引和聚簇索引 索引的使用注意事项 联合索引 从底层解释最左匹配原则 Mysql对联合索引有优化么?会自动调整顺序么?哪个版本开始优化? Redis的应用 Redis的持久化的方式和原理 技术选型,一个新技术和一个稳定的旧技术,你会怎么选择,选择的考虑有哪些 说你印象最深的美团点评技术团队的三篇博客 最近在学什么新技术 你是怎么去接触一门新技术的 会看哪些书 怎么选择要看的书 最后 由于篇幅限制,小编在此截出几张知识讲解的图解,有需要的程序猿(媛)可以点赞后戳这里免费领取全部资料获取哦 子 怎么保证项目的进度 数据库的索引原理 非聚簇索引和聚簇索引 索引的使用注意事项 联合索引 从底层解释最左匹配原则 Mysql对联合索引有优化么?会自动调整顺序么?哪个版本开始优化? Redis的应用 Redis的持久化的方式和原理 技术选型,一个新技术和一个稳定的旧技术,你会怎么选择,选择的考虑有哪些 说你印象最深的美团点评技术团队的三篇博客 最近在学什么新技术 你是怎么去接触一门新技术的 会看哪些书 怎么选择要看的书 最后 由于篇幅限制,小编在此截出几张知识讲解的图解,有需要的程序猿(媛)可以点赞后戳这里免费领取全部资料获取哦 [外链图片转存中…(img-SFREePIJ-1624074891834)] [外链图片转存中…(img-5kF3pkiC-1624074891834)] [外链图片转存中…(img-HDVXfOMR-1624074891835)] [外链图片转存中…(img-RyaAC5jy-1624074891836)] [外链图片转存中…(img-iV32C5Ok-1624074891837)] 本篇文章为转载内容。原文链接:https://blog.csdn.net/m0_57285325/article/details/118051767。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-11-13 23:43:59
86
转载
转载文章
...后自己没事也做了两款应用,然后J哥 把应用展示给他看,他看了连连称赞不错啊。。。(lalala,其实都是J哥网上巴拉的项目啦。) (然后大体给他介绍了 项目基本框架,是 v4包里的 SlidingPaneLayout 嵌套了实现了轮询效果 自定义的viewpager 。然后 具体界面是用的瀑布流,项目的关键就是 对 图片的处理,因为有N张 图片,但是并没有卡顿,所以就说了 自己用 了开源的imagedownloader 和 volley 以及自己定义的 lrucache 缓存 bitmap 对象,这里大家一定要把图片的三级缓存 自己了解清楚,基本面试会问到。) 其实 当面试问你如何避免oom,内存泄露导致的原因,以及如何处理大图片等等,其实都是 如何优化内存。 可以按照我自己总结的回答,你可以说,这个问题 ,跟 oom以及 内存泄露,其实是一样的,关键 就是 如何 优化内存,避免不必要的 内存泄露, 而 内存泄露 的原因 ,我总结了 4点, 1. 匿名内部类,和非静态内部类, 举个栗子:我们用handler 进行线程间 假如 我们在activity中这样定义 handler : [java] view plain copy print ? Handler mHandler = new Handler() { @Override public void handleMessage(Message msg) { mImageView.setImageBitmap(mBitmap); } } 然后,我们用 右键 选中工程 运行 lint工具 , android tools---run lint ,就会提示我们这样一个warning: In Android, Handler classes should be static or leaks might occur.。 就是 ,推荐我们 把handler 定义成static,具体 看这里解释的很详细:http://www.linuxidc.com/Linux/2013-12/94065.htm 类似的还有 匿名子线程。 2.还是 拿网上的 栗子来说, [java] view plain copy print ? Vector v = new Vector( 10 ); for ( int i = 1 ;i < 100 ; i ++ ){ Object o = new Object(); v.add(o); o = null ; } 即便是 我们把 o 对象 置为 null,但是 vector 集合中还有有o的引用,所以 集合 没有被清空,这一部分内存 还是不能被释放,这就导致了内存泄露。 3, 当我们操作数据库的时候,我们在执行完 相应的crud 方法后,我们没有关闭 cursor .close()或者 db.close(),也同样会占用内存、因为只有关闭连接后,才会被GC 回收。 4.继续举个栗子 [java] view plain copy print ? Set<Person> set = new HashSet<Person>(); Person p1 = new Person("唐僧","pwd1",25); Person p2 = new Person("孙悟空","pwd2",26); Person p3 = new Person("猪八戒","pwd3",27); set.add(p1); set.add(p2); set.add(p3); System.out.println("总共有:"+set.size()+" 个元素!"); //结果:总共有:3 个元素! p3.setAge(2); //修改p3的年龄,此时p3元素对应的hashcode值发生改变 set.remove(p3); //此时remove不掉,造成内存泄漏 set.add(p3); //重新添加,居然添加成功 System.out.println("总共有:"+set.size()+" 个元素!"); //结果:总共有:4 个元素! J哥 亲自 实践了下,发现问题了,这个网上的栗子 是错的。实际上是可以remove掉得、真是个悲伤地故事。这个栗子是不正确的。。网上好有一片这样的文章,都是这个栗子。。 这里 看下其他网站上的总结吧 :强烈推荐http://developer.51cto.com/art/201111/302465.htm。很详细。 OK。还有最后一点,就是关于图片的,bitmap对象的及时释放,这里 就不细说了,等在图片三级缓存一起去总结。 此时 感觉 对面的android 小哥 已经被我吸引了。好像很认真的在听我讲课一样。 然后, 他问我问题。我大体总结了一下。 面试官01问:有没有自定义过view。 J哥回答:这个很常见,我自己定义过很多,比如 下拉刷新,上拉加载更多数据的listview,类似github 上面的pulltorefreshlistview。 还有图片轮询播放的viewpager,也是 继承viewpager,然后自己开启一个线程,去控制 切换的。还比如,跑马灯效果的textview ,scrollview与 listview 相互嵌套 导致 listview 高度计算不正确,我也是 自定义listview,复写了 onmeaure方法,然后解决冲突的。在比如 一些开源的 可以放大缩小的图片,我也是做过,主要是对onmeasure 方法,onlayout方法,ondraw 方法的复写。以及复写一下 view 自己的 touch事件等等,奥 对了,我们公司当时有需求 做一个 锁屏软件,侧滑解锁的,我也是自己定义的,然后展示给他看了一下,当时 那篇文章在这里。传送门http://blog.csdn.net/u011733020/article/details/41863861。 面试官01问:listview的优化、 J哥回答:(PS:这种问题,基本上 都快被问烂了,但是没办法 还是要回答。)listview作为最常见的 用来显示数据的view ,一般 从四个方面 去优化。 1 ,复用convertview, 不然假如有1000条数据,那么我们滑动,就会 产生1000个convertview ,这对内存是很大的浪费,所以 我们一定要复用。 2. 减少 findviewbyid 的次数, 因为 每次 去 执行 findviewbyid 也是要消耗资源的,我们要尽可能的减少,通常 我们定义一个viewholder,去管理 这些id ,然后通过tag 去直接拿到 id。 3, 分页加载,延迟加载 预加载。 这个在我们以前项目,有一个榜单,数据量很大,一次请求过来的数据量很大,这样有两个问题,一个是请求网络 时间可能会很长,另一个展示数据 上面 体验对不是很好,所以 我们做了 第一次加载 20条,然后每次请求 再去 加载10条新数据。 4.就是 对 listview 中一些 类似头像, 图片的 优化。这里 类似 三级缓存,推荐大家看一下 开源 的universal-image-loader 的源码。或者 这篇文章http://www.jb51.net/article/38162.htm,J哥有时间 专门写一篇过于 图片缓存的。 面试官01问: 看你简历上面 做过 社交,通信这块是怎么做的。 J哥回答:我看 咱们公司 也用到了 聊天,咱们公司是 自己做的 还是 用的第三方的类似 环信的。结果被J哥猜中,他说 是集成的环信(但是 有丢包现象,所以打算自己做通信)。 OK,J哥说 ,我们 项目中聊天 是基于xmpp协议的做的,在没有android以前 ,java有个开源的 smack ,android 上 现在有一个asmack ,其实 就是移植到android 中来了, 服务端是基于 openfire的 ,我们就是做的 openfire+asmack 的 聊天,这个原理主要 就是 绑定 ip 拿到 connection 然后 connect ,然后进行通信,我说,这个 跟http请求 其实原理上一样,都是 绑定ip,然后 设置一些property,然后通过类似流进行通信的, asmack,其实底层 就是xml通信的。 面试官01问: touch 事件的传递机制,还特意画了,一个 就是 button LinearLayout 嵌套 。 J哥回答:就是这个, 这也难不倒我。因为J哥觉得 这个问题肯定会问到 所以 早有准备,这里 我就大体说下结论,详细原理 给你传送门。 我回答,这个很简单,只要你继承一下 button 和 linearlayout 复写一下 三个方法 dispatchtouchEvent onInterceptTouchEvent 和onTouchEvent .就能很清楚的明白 传递的过程,我给你总的说下结论的,点击这个button,一般是 外面的父控件 先响应这个down 事件,然后 往子类里面传递,让子类 在往子类的下一级子类去传递,让最终的孩子去决定是不要要消费掉这个点击事件,如果消费掉,那么父类将不会响应,如果子类不消费,那么会退回到次级子类,然后看是否要消费,这样,一句话 就是父传子, 子决定要不要,不要 然后传回去。 这里有很详细 很详细的介绍, 包裹事件的分发。所以我就不罗嗦,http://blog.csdn.net/yanbober/article/details/45887547?ref=myread 面试官01问: 项目中图片的优化。 J哥回答:我给他展示的项目 其中有一款app 是有很多图片 ,但是 很流畅,也没有oom。关于图片 优化,一般我们采用三级缓存,1 。内存加载 2.本地加载 3 网络加载。 首先 我们看 内存中有没有,有直接拿来用,这里 我项目里是这样做的,我先获取一下 分配给我们应用的可用内存是多少,然后 拿1/4 或者 1/8做一个 lrucache. 把我们的bitmap对象添加进去。有些比较常用的图片,我会保存到本地,避免每次重复联网下载。结合 开源的 afinal universalimageloader 以及 13年谷歌官方推荐的volley(号称是 asynchttpclient 和universalimageloader)的结合、 所以 在我的项目中基本没有遇到过图片导致的oom 问题,对于单张的 大图片,我也会利用bitmapFactory,进行计算大小,然后 计算手机分辨率,进行定量的 压缩 处理。 面试官问: GC的回收 J哥回答:我说。GC 回收 应该不只是按照一种方式,应该有多种不同的算法,我看过谷歌 官网介绍的一点,有这样一块区域,他分为 latest(最近) middle(中等)permanent(永久的),这样三块子区域。里面分别存放,刚刚被创建的,以及 时间 靠后的,很久的,对象,不断地新对象 往latest里面添加,当达到相应对象区域的阀值的时候,就会触发GC,GC 进行回收的时候,对于latest 中回收的速度是最快的,而permanent 相对是最久的,而时间 也跟 每块区域中对象的个数有关系, 还有一种算法,是根据最近被引用的时间,或者 被引用的次数 去进行 GC的、、这里随便扯就是了。GC 回收并不是立即执行的。是不定时的。GC回收的时候 会阻塞线程,所以代码中要避免创建不必要的对象,例如for循环中 创建大量对象 就会容易引起GC。 当我们也可以主动 在方法中执行system.gc() 去手动释放一些资源。 面试官01问: 怎么避免 viewpager 预加载 fragment的、 J哥回答:这个问题 我也碰到过,我们都知道,viewpager 它本身会预加载 左右两个 和当前一个对象、而 我们viewpager setOffscreenPageLimit(0) 不生效因为看源码知道,这个方法默认最少也要加载一个。所以 这个fragment 还没有被当前页面显示出来,已经夹在好了,有可能数据不是最新的,我是在 setuservisibilityhint() 这个方法中跟参数 动态去判断 要不要刷新的。 问了一圈,这个哥们大概没什么问的了,然后 就让我等一下,说让他们技术总监过来 。 我就等。。。 然后等了几分钟,进来一小姑娘,坐下,看了我简历,我以为是人事,来跟我谈人生理想。结果,没说几句话,让我讲一下我的项目。我qu,惊呆我了。我问,你也是做android的,我去,是这样的、、把J哥吓到, 然后问了J哥几个问题。 Android 小姑娘问: 看你项目中的listview 中item类型 是统一的,而加入 item 差别挺大的 你怎么复用。 J哥回答:J哥装作很牛的样子说,我暂时想到两种方法,1.给这个对象 加一个type 然后 根据 type 去复用,或者 把这几种类型 一起加载,然后控制显示隐藏。然后 我反问小姑娘,假如 我这里 有一百条数据,这一百条是无序的,包含了 10种 item类型,你有没有什么好方法 去处理这个问题, 小姑娘说,你不是定义了类型吗,我们就是 通过type 去判断的。 Android 小姑娘问: onAttch onDetach还是onAttachedToWindow,onDetachedFromWindow J哥回答:其实 那个小姑娘忘记这两个方法了。我说什么方法,她说onAttachIntent() 和 onDetachIntent(). 反正 J哥是没听说过, 我只见过 onAttach ,但是 这个方法 我也没用过。我就问她,这两个方法是做什么的,小姑娘跟我说 是 把子view绑定到界面上的,那么的话 应该是onAttachedToWindow,onDetachedFromWindow方法了,小姑娘说: 在这个方法 可以计算子 view的高度宽度,在 oncreate 里面不能计算,其实虽然刚开始 在oncreate里面是不能计算,但是还是有方法计算的,(本人觉得面试 问你 API 是 最2的了,忍不住吐槽下,我遇到过,Camera 拍照,问我获取 一个图片,还是 视频的 方法,我去百度 一下,随便就知道,真是不懂 为什么会问方法。随便一个程序员 都会百度。。) 跟小姑娘聊得其他问题 不太记得了,感觉这个女程序员啊。。就问方法 给我的印象不太好,不管方法用没用到,我觉得面试 直接问你方法 好2 好2... 然后技术总监 有进来跟我聊了,后技术总监 有进来跟我聊了、技术总监 年龄30出头吧,到是没有问我什么技术问题, 总监: 问我 做没做过通信这块,能不能做这一块。 J哥回答:,我说做过,通信有几种协议的,我们用的 是xmpp协议的 ,服务器 是 基于apache的 openfire 搭建的,客户端 是用的asmack。还有一些 其他协议的 ,比如我知道有些项目中用的 soap协议的,还有ip 协议的。PS:反正就是扯 我说 通信 客户端这一块 我没问题,但是 服务端 我 从工作以来 一直偏向 android 移动端开发,后台这一块,如果数据量大了,还要考虑并发之类的,我是做不了,让我做个tomcat搭建的demo 我可能可以。 其他也是随便聊了下,然后 就说,让人事来跟我谈理想了。 总监: 问我 什么时候能上班 J哥回答:我说 这个看公司需求啦。 其他也是随便聊了下,然后 就说,让人事来跟我谈理想了。 这里 感觉应该没问题了。差不多能拿下了。 人事1:一进来,就问东问西。问加班看法啊,他们公司技术 一般都八九点走啊。说七点基本没有走的啊、、、 J哥回答:我说,一般遇到项目加功能 ,版本升级,等等 这些加班都没什么,只要不是一直在加班。。。。这里每个人自己看法就好了、、 反正人事 是一直跟我强调这个,她不停强调 我就暗暗下决心,薪资 我是不会要低了。 人事1:看你还年轻啊,还能拼一拼啊、、、、 J哥回答:我说现在 这几年对我人生规划也算比较重要的时期,也是过一年少一年了,其实她的意思 还是侧面强调加班。。。。日了UZI了。 中间一堆废话,然后我问了她 公司一般上下班时间啊。。之类的有没有技术交流啊,之类的。。。 最后到关键问题上啦,最关心的,薪资问题。 人事1:期望薪资 J哥回答:我说16K左右吧。她问 你以前公司多少 握手 15K。她说她们公司 是 14薪。反正 我还是说16K。她说 那好,你等下,然后就出去了。 不知道 跟什么人 讨论了许久,然后又来一个 可能是人事吧。又进来,问了一遍,也问了薪资。。哥还是说16K 。 。。估计是她们公司想要我,但是又觉得有点超出她们薪资期望吧,当场被没有给什么offer。然后就有点婉拒的说,两天给我答复,心里很气愤,饿着肚子 面试到三点,竟然婉拒、、、 反正我是很生气,我说,好,然后我就走。结果,没过一个小时,人事又打电话来,非要约我 见一下她们CEO。这是什么鬼,难道她们CEO要给我煲汤 了?我说可以,然后时间定在后天了,,反正心灵鸡汤对我是没用了、 OK ,这家面试 先写到这里,下面下午还有一家,等下在写。准备睡觉。今天面试回来,累的就睡着了,晚上十点多才醒过来,想了想还是 把今天面试的过程总结一下。 ------------------------------待续------------------------- 第二弹http://blog.csdn.net/u011733020/article/details/46058273 本篇文章为转载内容。原文链接:https://blog.csdn.net/haluoluo211/article/details/51010955。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-06-19 17:42:52
338
转载
转载文章
...效率,改善数据库工作性能,提高数据访问速度。对于索引,我们要知其然,更要知其所以然,关键在于认识索引的工作原理,才能更好的管理索引。 为认识索引工作原理,首先有必要对数据表的基本结构作一次全面的复习。 SQLS当一个新表被创建之时,系统将在磁盘中分配一段以8K为单位的连续空间,当字段的值从内存写入磁盘时,就在这一既定空间随机保存,当一个8K用完的时候,SQLS指针会自动分配一个8K的空间。这里,每个8K空间被称为一个数据页(Page),又名页面或数据页面,并分配从0-7的页号,每个文件的第0页记录引导信息,叫文件头(File header);每8个数据页(64K)的组合形成扩展区(Extent),称为扩展。全部数据页的组合形成堆(Heap)。 SQLS规定行不能跨越数据页,所以,每行记录的最大数据量只能为8K。这就是char和varchar这两种字符串类型容量要限制在8K以内的原因,存储超过8K的数据应使用text类型,实际上,text类型的字段值不能直接录入和保存,它只是存储一个指针,指向由若干8K的文本数据页所组成的扩展区,真正的数据正是放在这些数据页中。 页面有空间页面和数据页面之分。 当一个扩展区的8个数据页中既包含了空间页面又包括了数据或索引页面时,称为混合扩展(Mixed Extent),每张表都以混合扩展开始;反之,称为一致扩展(Uniform Extent),专门保存数据及索引信息。 表被创建之时,SQLS在混合扩展中为其分配至少一个数据页面,随着数据量的增长,SQLS可即时在混合扩展中分配出7个页面,当数据超过8个页面时,则从一致扩展中分配数据页面。 空间页面专门负责数据空间的分配和管理,包括:PFS页面(Page free space):记录一个页面是否已分配、位于混合扩展还是一致扩展以及页面上还有多少可用空间等信息;GAM页面(Global allocation map)和SGAM页面(Secodary global allocation map):用来记录空闲的扩展或含有空闲页面的混合扩展的位置。SQLS综合利用这三种类型的页面文件在必要时为数据表创建新空间; 数据页或索引页则专门保存数据及索引信息,SQLS使用4种类型的数据页面来管理表或索引:它们是IAM页、数据页、文本/图像页和索引页。 在WINDOWS中,我们对文件执行的每一步操作,在磁盘上的物理位置只有系统(system)才知道;SQL SERVER沿袭了这种工作方式,在插入数据的过程中,不但每个字段值在数据页面中的保存位置是随机的,而且每个数据页面在“堆”中的排列位置也只有系统(system)才知道。 这是为什么呢?众所周知,OS之所以能管理DISK,是因为在系统启动时首先加载了文件分配表:FAT(File Allocation Table),正是由它管理文件系统并记录对文件的一切操作,系统才得以正常运行;同理,作为管理系统级的SQL SERVER,也有这样一张类似FAT的表存在,它就是索引分布映像页:IAM(Index Allocation Map)。 IAM的存在,使SQLS对数据表的物理管理有了可能。 IAM页从混合扩展中分配,记录了8个初始页面的位置和该扩展区的位置,每个IAM页面能管理512,000个数据页面,如果数据量太大,SQLS也可以增加更多的IAM页,可以位于文件的任何位置。第一个IAM页被称为FirstIAM,其中记录了以后的IAM页的位置。 数据页和文本/图像页互反,前者保存非文本/图像类型的数据,因为它们都不超过8K的容量,后者则只保存超过8K容量的文本或图像类型数据。而索引页顾名思义,保存的是与索引结构相关的数据信息。了解页面的问题有助我们下一步准确理解SQLS维护索引的方式,如页拆分、填充因子等。 二、索引的基本概念 索引是一种特殊类型的数据库对象,它与表有着密切的联系。 索引是为检索而存在的。如一些书籍的末尾就专门附有索引,指明了某个关键字在正文中的出现的页码位置,方便我们查找,但大多数的书籍只有目录,目录不是索引,只是书中内容的排序,并不提供真正的检索功能。可见建立索引要单独占用空间;索引也并不是必须要建立的,它们只是为更好、更快的检索和定位关键字而存在。 再进一步说,我们要在图书馆中查阅图书,该怎么办呢?图书馆的前台有很多叫做索引卡片柜的小柜子,里面分了若干的类别供我们检索图书,比如你可以用书名的笔画顺序或者拼音顺序作为查找的依据,你还可以从作者名的笔画顺序或拼音顺序去查询想要的图书,反正有许多检索方式,但有一点很明白,书库中的书并没有按照这些卡片柜中的顺序排列——虽然理论上可以这样做,事实上,所有图书的脊背上都人工的粘贴了一个特定的编号①,它们是以这个顺序在排列。索引卡片中并没有指明这本书摆放在书库中的第几个书架的第几本,仅仅指明了这个特定的编号。管理员则根据这一编号将请求的图书返回到读者手中。这是很形象的例子,以下的讲解将会反复用到它。 SQLS在安装完成之后,安装程序会自动创建master、model、tempdb等几个特殊的系统数据库,其中master是SQLS的主数据库,用于保存和管理其它系统数据库、用户数据库以及SQLS的系统信息,它在SQLS中的地位与WINDOWS下的注册表相当。 master中有一个名为sysindexes的系统表,专门管理索引。SQLS查询数据表的操作都必须用到它,毫无疑义,它是本文主角之一。 查看一张表的索引属性,可以在查询分析器中使用以下命令:select from sysindexes where id=object_id(‘tablename’) ;而要查看表的索引所占空间的大小,可以使用系统存储过程命令:sp_spaceused tablename,其中参数tablename为被索引的表名。 三、平衡树 如果你通过书后的索引知道了一个关键字所在的页码,你有可能通过随机的翻寻,最终到达正确的页码。但更科学更快捷的方法是:首先把书翻到大概二分之一的位置,如果要找的页码比该页的页码小,就把书向前翻到四分之一处,否则,就把书向后翻到四分之三的地方,依此类推,把书页续分成更小的部分,直至正确的页码。这叫“两分法”,微软在官方教程MOC里另有一种说法:叫B树(B-Tree,Balance Tree),即平衡树。 一个表索引由若干页面组成,这些页面构成了一个树形结构。B树由“根”(root)开始,称为根级节点,它通过指向另外两个页,把一个表的记录从逻辑上分成两个部分:“枝”—--非叶级节点(Non-Leaf Level);而非叶级节点又分别指向更小的部分:“叶”——叶级节点(Leaf Level)。根节点、非叶级节点和叶级节点都位于索引页中,统称为索引节点,属于索引页的范筹。这些“枝”、“叶”最终指向了具体的数据页(Page)。在根级节点和叶级节点之间的叶又叫数据中间页。 “根”(root)对应了sysindexes表的Root字段,其中记载了非叶级节点的物理位置(即指针);非叶级节点位于根节点和叶节点之间,记载了指向叶级节点的指针;而叶级节点则最终指向数据页。这就是“平衡树”。 四、聚集索引和非聚集索引 从形式上而言,索引分为聚集索引(Clustered Indexes)和非聚集索引(NonClustered Indexes)。 聚集索引相当于书籍脊背上那个特定的编号。如果对一张表建立了聚集索引,其索引页中就包含着建立索引的列的值(下称索引键值),那么表中的记录将按照该索引键值进行排序。比如,我们如果在“姓名”这一字段上建立了聚集索引,则表中的记录将按照姓名进行排列;如果建立了聚集索引的列是数值类型的,那么记录将按照该键值的数值大小来进行排列。 非聚集索引用于指定数据的逻辑顺序,也就是说,表中的数据并没有按照索引键值指定的顺序排列,而仍然按照插入记录时的顺序存放。其索引页中包含着索引键值和它所指向该行记录在数据页中的物理位置,叫做行定位符(RID:Row ID)。好似书后面的的索引表,索引表中的顺序与实际的页码顺序也是不一致的。而且一本书也许有多个索引。比如主题索引和作者索引。 SQL Server在默认的情况下建立的索引是非聚集索引,由于非聚集索引不对表中的数据进行重组,而只是存储索引键值并用一个指针指向数据所在的页面。一个表如果没有聚集索引时,理论上可以建立249个非聚集索引。每个非聚集索引提供访问数据的不同排序顺序。 五、数据是怎样被访问的 若能真正理解了以上索引的基础知识,那么再回头来看索引的工作原理就简单和轻松多了。 (一)SQLS怎样访问没有建立任何索引数据表: Heap译成汉语叫做“堆”,其本义暗含杂乱无章、无序的意思,前面提到数据值被写进数据页时,由于每一行记录之间并没地有特定的排列顺序,所以行与行的顺序就是随机无序的,当然表中的数据页也就是无序的了,而表中所有数据页就形成了“堆”,可以说,一张没有索引的数据表,就像一个只有书柜而没有索引卡片柜的图书馆,书库里面塞满了一堆乱七八糟的图书。当读者对管理员提交查询请求后,管理员就一头钻进书库,对照查找内容从头开始一架一柜的逐本查找,运气好的话,在第一个书架的第一本书就找到了,运气不好的话,要到最后一个书架的最后一本书才找到。 SQLS在接到查询请求的时候,首先会分析sysindexes表中一个叫做索引标志符(INDID: Index ID)的字段的值,如果该值为0,表示这是一张数据表而不是索引表,SQLS就会使用sysindexes表的另一个字段——也就是在前面提到过的FirstIAM值中找到该表的IAM页链——也就是所有数据页集合。 这就是对一个没有建立索引的数据表进行数据查找的方式,是不是很没效率?对于没有索引的表,对于一“堆”这样的记录,SQLS也只能这样做,而且更没劲的是,即使在第一行就找到了被查询的记录,SQLS仍然要从头到尾的将表扫描一次。这种查询称为“遍历”,又叫“表扫描”。 可见没有建立索引的数据表照样可以运行,不过这种方法对于小规模的表来说没有什么太大的问题,但要查询海量的数据效率就太低了。 (二)SQLS怎样访问建立了非聚集索引的数据表: 如前所述,非聚集索引可以建多个,具有B树结构,其叶级节点不包含数据页,只包含索引行。假定一个表中只有非聚集索引,则每个索引行包含了非聚集索引键值以及行定位符(ROW ID,RID),他们指向具有该键值的数据行。每一个RID由文件ID、页编号和在页中行的编号组成。 当INDID的值在2-250之间时,意味着表中存在非聚集索引页。此时,SQLS调用ROOT字段的值指向非聚集索引B树的ROOT,在其中查找与被查询最相近的值,根据这个值找到在非叶级节点中的页号,然后顺藤摸瓜,在叶级节点相应的页面中找到该值的RID,最后根据这个RID在Heap中定位所在的页和行并返回到查询端。 例如:假定在Lastname上建立了非聚集索引,则执行Select From Member Where Lastname=’Ota’时,查询过程是:①SQLS查询INDID值为2;②立即从根出发,在非叶级节点中定位最接近Ota的值“Martin”,并查到其位于叶级页面的第61页;③仅在叶级页面的第61页的Martin下搜寻Ota的RID,其RID显示为N∶706∶4,表示Lastname字段中名为Ota的记录位于堆的第707页的第4行,N表示文件的ID值,与数据无关;④根据上述信息,SQLS立马在堆的第 707页第4行将该记录“揪”出来并显示于前台(客户端)。视表的数据量大小,整个查询过程费时从百分之几毫秒到数毫秒不等。 在谈到索引基本概念的时候,我们就提到了这种方式: 图书馆的前台有很多索引卡片柜,里面分了若干的类别,诸如按照书名笔画或拼音顺序、作者笔画或拼音顺序等等,但不同之处有二:① 索引卡片上记录了每本书摆放的具体位置——位于某柜某架的第几本——而不是“特殊编号”;② 书脊上并没有那个“特殊编号”。管理员在索引柜中查到所需图书的具体位置(RID)后,根据RID直接在书库中的具体位置将书提出来。 显然,这种查询方式效率很高,但资源占用极大,因为书库中书的位置随时在发生变化,必然要求管理员花费额外的精力和时间随时做好索引更新。 (三)SQLS怎样访问建立了聚集索引的数据表: 在聚集索引中,数据所在的数据页是叶级,索引数据所在的索引页是非叶级。 查询原理和上述对非聚集索引的查询相似,但由于记录是按照聚集索引中索引键值进行排序,换句话说,聚集索引的索引键值也就是具体的数据页。 这就好比书库中的书就是按照书名的拼音在排序,而且也只按照这一种排序方式建立相应的索引卡片,于是查询起来要比上述只建立非聚集索引的方式要简单得多。仍以上面的查询为例: 假定在Lastname字段上建立了聚集索引,则执行Select From Member Where Lastname=’Ota’时,查询过程是:①SQLS查询INDID值为1,这是在系统中只建立了聚集索引的标志;②立即从根出发,在非叶级节点中定位最接近Ota的值“Martin”,并查到其位于叶级页面的第120页;③在位于叶级页面第120页的Martin下搜寻到Ota条目,而这一条目已是数据记录本身;④将该记录返回客户端。 这一次的效率比第二种方法更高,以致于看起来更美,然而它最大的优点也恰好是它最大的缺点——由于同一张表中同时只能按照一种顺序排列,所以在任何一种数据表中的聚集索引只能建立一个;并且建立聚集索引需要至少相当于源表120%的附加空间,以存放源表的副本和索引中间页! 难道鱼和熊掌就不能兼顾了吗?办法是有的。 (四)SQLS怎样访问既有聚集索引、又有非聚集索引的数据表: 如果我们在建立非聚集索引之前先建立了聚集索引的话,那么非聚集索引就可以使用聚集索引的关键字进行检索,就像在图书馆中,前台卡片柜中的可以有不同类别的图书索引卡,然而每张卡片上都载明了那个特殊编号——并不是书籍存放的具体位置。这样在最大程度上既照顾了数据检索的快捷性,又使索引的日常维护变得更加可行,这是最为科学的检索方法。 也就是说,在只建立了非聚集索引的情况下,每个叶级节点指明了记录的行定位符(RID);而在既有聚集索引又有非聚集索引的情况下,每个叶级节点所指向的是该聚集索引的索引键值,即数据记录本身。 假设聚集索引建立在Lastname上,而非聚集索引建立在Firstname上,当执行Select From Member Where Firstname=’Mike’时,查询过程是:①SQLS查询INDID值为2;②立即从根出发,在Firstname的非聚集索引的非叶级节点中定位最接近Mike的值“Jose”条目;③从Jose条目下的叶级页面中查到Mike逻辑位置——不是RID而是聚集索引的指针;④根据这一指针所指示位置,直接进入位于Lastname的聚集索引中的叶级页面中到达Mike数据记录本身;⑤将该记录返回客户端。 这就完全和我们在“索引的基本概念”中讲到的现实场景完全一样了,当数据发生更新的时候,SQLS只负责对聚集索引的健值驾以维护,而不必考虑非聚集索引,只要我们在ID类的字段上建立聚集索引,而在其它经常需要查询的字段上建立非聚集索引,通过这种科学的、有针对性的在一张表上分别建立聚集索引和非聚集索引的方法,我们既享受了索引带来的灵活与快捷,又相对规避了维护索引所导致的大量的额外资源消耗。 六、索引的优点和不足 索引有一些先天不足:1:建立索引,系统要占用大约为表的1.2倍的硬盘和内存空间来保存索引。2:更新数据的时候,系统必须要有额外的时间来同时对索引进行更新,以维持数据和索引的一致性——这就如同图书馆要有专门的位置来摆放索引柜,并且每当库存图书发生变化时都需要有人将索引卡片重整以保持索引与库存的一致。 当然建立索引的优点也是显而易见的:在海量数据的情况下,如果合理的建立了索引,则会大大加强SQLS执行查询、对结果进行排序、分组的操作效率。 实践表明,不恰当的索引不但于事无补,反而会降低系统性能。因为大量的索引在进行插入、修改和删除操作时比没有索引花费更多的系统时间。比如在如下字段建立索引应该是不恰当的:1、很少或从不引用的字段;2、逻辑型的字段,如男或女(是或否)等。 综上所述,提高查询效率是以消耗一定的系统资源为代价的,索引不能盲目的建立,必须要有统筹的规划,一定要在“加快查询速度”与“降低修改速度”之间做好平衡,有得必有失,此消则彼长。这是考验一个DBA是否优秀的很重要的指标。 至此,我们一直在说SQLS在维护索引时要消耗系统资源,那么SQLS维护索引时究竟消耗了什么资源?会产生哪些问题?究竟应该才能优化字段的索引? 在上篇中,我们就索引的基本概念和数据查询原理作了详细阐述,知道了建立索引时一定要在“加快查询速度”与“降低修改速度”之间做好平衡,有得必有失,此消则彼长。那么,SQLS维护索引时究竟怎样消耗资源?应该从哪些方面对索引进行管理与优化?以下就从七个方面来回答这些问题。 一、页分裂 微软MOC教导我们:当一个数据页达到了8K容量,如果此时发生插入或更新数据的操作,将导致页的分裂(又名页拆分): 1、有聚集索引的情况下:聚集索引将被插入和更新的行指向特定的页,该页由聚集索引关键字决定; 2、只有堆的情况下:只要有空间就可以插入新的行,但是如果我们对行数据的更新需要更多的空间,以致大于了当前页的可用空间,行就被移到新的页中,并且在原位置留下一个转发指针,指向被移动的新行,如果具有转发指针的行又被移动了,那么原来的指针将重新指向新的位置; 3、如果堆中有非聚集索引,那么尽管插入和更新操作在堆中不会发生页分裂,但是在非聚集索引上仍然产生页分裂。 无论有无索引,大约一半的数据将保留在老页面,而另一半将放入新页面,并且新页面可能被分配到任何可用的页。所以,频繁页分裂,后果很严重,将使物理表产生大量数据碎片,导致直接造成I/O效率的急剧下降,最后,停止SQLS的运行并重建索引将是我们的唯一选择! 二、填充因子 然而在“混沌之初”,就可以在一定程度上避免不愉快出现:在创建索引时,可以为这个索引指定一个填充因子,以便在索引的每个叶级页面上保留一定百分比的空间,将来数据可以进行扩充和减少页分裂。填充因子是从0到100的百分比数值,设为100时表示将数据页填满。只有当不会对数据进行更改时(例如只读表中)才用此设置。值越小则数据页上的空闲空间越大,这样可以减少在索引增长过程中进行页分裂的需要,但这一操作需要占用更多的硬盘空间。 填充因子只在创建索引时执行,索引创建以后,当表中进行数据的添加、删除或更新时,是不会保持填充因子的,如果想在数据页上保持额外的空间,则有悖于使用填充因子的本意,因为随着数据的输入,SQLS必须在每个页上进行页拆分,以保持填充因子指定的空闲空间。因此,只有在表中的数据进行了较大的变动,才可以填充数据页的空闲空间。这时,可以从容的重建索引,重新指定填充因子,重新分布数据。 反之,填充因子指定不当,就会降低数据库的读取性能,其降低量与填充因子设置值成反比。例如,当填充因子的值为50时,数据库的读取性能会降低两倍!所以,只有在表中根据现有数据创建新索引,并且可以预见将来会对这些数据进行哪些更改时,设置填充因子才有意义。 三、两道数学题 假定数据库设计没有问题,那么是否象上篇中分析的那样,当你建立了众多的索引,在查询工作中SQLS就只能按照“最高指示”用索引处理每一个提交的查询呢?答案是否定的! 上篇“数据是怎样被访问的”章节中提到的四种索引方案只是一种静态的、标准的和理论上的分析比较,实际上,将在外,军令有所不从,SQLS几乎完全是“自主”的决定是否使用索引或使用哪一个索引! 这是怎么回事呢? 让我们先来算一道题:如果某表的一条记录在磁盘上占用1000字节(1K)的话,我们对其中10字节的一个字段建立索引,那么该记录对应的索引大小只有10字节(0.01K)。上篇说过,SQLS的最小空间分配单元是“页(Page)”,一个页面在磁盘上占用8K空间,所以一页只能存储8条“记录”,但可以存储800条“索引”。现在我们要从一个有8000条记录的表中检索符合某个条件的记录(有Where子句),如果没有索引的话,我们需要遍历8000条×1000字节/8K字节=1000个页面才能够找到结果。如果在检索字段上有上述索引的话,那么我们可以在8000条×10字节/8K字节=10个页面中就检索到满足条件的索引块,然后根据索引块上的指针逐一找到结果数据块,这样I/O访问量肯定要少得多。 然而有时用索引还不如不用索引快! 同上,如果要无条件检索全部记录(不用Where子句),不用索引的话,需要访问8000条×1000字节/8K字节=1000个页面;而使用索引的话,首先检索索引,访问8000条×10字节/8K字节=10个页面得到索引检索结果,再根据索引检索结果去对应数据页面,由于是检索全部数据,所以需要再访问8000条×1000字节/8K字节=1000个页面将全部数据读取出来,一共访问了1010个页面,这显然不如不用索引快。 SQLS内部有一套完整的数据索引优化技术,在上述情况下,SQLS会自动使用表扫描的方式检索数据而不会使用任何索引。那么SQLS是怎么知道什么时候用索引,什么时候不用索引的呢?因为SQLS除了维护数据信息外,还维护着数据统计信息! 四、统计信息 打开企业管理器,单击“Database”节点,右击Northwind数据库→单击“属性”→选择“Options”选项卡,观察“Settings”下的各项复选项,你发现了什么? 从Settings中我们可以看到,在数据库中,SQLS将默认的自动创建和更新统计信息,这些统计信息包括数据密度和分布信息,正是它们帮助SQLS确定最佳的查询策略:建立查询计划和是否使用索引以及使用什么样的索引。 在创建索引时,SQLS会创建分布数据页来存放有关索引的两种统计信息:分布表和密度表。查询优化器使用这些统计信息估算使用该索引进行查询的成本(Cost),并在此基础上判断该索引对某个特定查询是否有用。 随着表中的数据发生变化,SQLS自动定期更新这些统计信息。采样是在各个数据页上随机进行。从磁盘读取一个数据页后,该数据页上的所有行都被用来更新统计信息。统计信息更新的频率取决于字段或索引中的数据量以及数据更改量。比如,对于有一万条记录的表,当1000个索引键值发生改变时,该表的统计信息便可能需要更新,因为1000 个值在该表中占了10%,这是一个很大的比例。而对于有1千万条记录的表来说,1000个索引值发生更改的意义则可以忽略不计,因此统计信息就不会自动更新。 至于它们帮助SQLS建立查询计划的具体过程,限于篇幅,这里就省略了,请有兴趣的朋友们自己研究。 顺便多说一句,SQLS除了能自动记录统计信息之外,还可以记录服务器中所发生的其它活动的详细信息,包括I/O 统计信息、CPU 统计信息、锁定请求、T-SQL 和 RPC 统计信息、索引和表扫描、警告和引发的错误、数据库对象的创建/除去、连接/断开、存储过程操作、游标操作等等。这些信息的读取、设置请朋友们在SQLS联机帮助文档(SQL Server Books Online)中搜索字符串“Profiler”查找。 五、索引的人工维护 上面讲到,某些不合适的索引将影响到SQLS的性能,随着应用系统的运行,数据不断地发生变化,当数据变化达到某一个程度时将会影响到索引的使用。这时需要用户自己来维护索引。 随着数据行的插入、删除和数据页的分裂,有些索引页可能只包含几页数据,另外应用在执行大量I/O的时候,重建非聚聚集索引可以维护I/O的效率。重建索引实质上是重新组织B树。需要重建索引的情况有: 1) 数据和使用模式大幅度变化; 2)排序的顺序发生改变; 3)要进行大量插入操作或已经完成; 4)使用I/O查询的磁盘读次数比预料的要多; 5)由于大量数据修改,使得数据页和索引页没有充分使用而导致空间的使用超出估算; 6)dbcc检查出索引有问题。 六、索引的使用原则 接近尾声的时候,让我们再从另一个角度认识索引的两个重要属性----唯一性索引和复合性索引。 在设计表的时候,可以对字段值进行某些限制,比如可以对字段进行主键约束或唯一性约束。 主键约束是指定某个或多个字段不允许重复,用于防止表中出现两条完全相同的记录,这样的字段称为主键,每张表都可以建立并且只能建立一个主键,构成主键的字段不允许空值。例如职员表中“身份证号”字段或成绩表中“学号、课程编号”字段组合。 而唯一性约束与主键约束类似,区别只在于构成唯一性约束的字段允许出现空值。 建立在主键约束和唯一性约束上的索引,由于其字段值具有唯一性,于是我们将这种索引叫做“唯一性索引”,如果这个唯一性索引是由两个以上字段的组合建立的,那么它又叫“复合性索引”。 注意,唯一索引不是聚集索引,如果对一个字段建立了唯一索引,你仅仅不能向这个字段输入重复的值。并不妨碍你可以对其它类型的字段也建立一个唯一性索引,它们可以是聚集的,也可以是非聚集的。 唯一性索引保证在索引列中的全部数据是唯一的,不会包含冗余数据。如果表中已经有一个主键约束或者唯一性约束,那么当创建表或者修改表时,SQLS自动创建一个唯一性索引。但出于必须保证唯一性,那么应该创建主键约束或者唯一性键约束,而不是创建一个唯一性索引。当创建唯一性索引时,应该认真考虑这些规则:当在表中创建主键约束或者唯一性键约束时, SQLS钭自动创建一个唯一性索引;如果表中已经包含有数据,那么当创建索引时,SQLS检查表中已有数据的冗余性,如果发现冗余值,那么SQLS就取消该语句的执行,并且返回一个错误消息,确保表中的每一行数据都有一个唯一值。 复合索引就是一个索引创建在两个列或者多个列上。在搜索时,当两个或者多个列作为一个关键值时,最好在这些列上创建复合索引。当创建复合索引时,应该考虑这些规则:最多可以把16个列合并成一个单独的复合索引,构成复合索引的列的总长度不能超过900字节,也就是说复合列的长度不能太长;在复合索引中,所有的列必须来自同一个表中,不能跨表建立复合列;在复合索引中,列的排列顺序是非常重要的,原则上,应该首先定义最唯一的列,例如在(COL1,COL2)上的索引与在(COL2,COL1)上的索引是不相同的,因为两个索引的列的顺序不同;为了使查询优化器使用复合索引,查询语句中的WHERE子句必须参考复合索引中第一个列;当表中有多个关键列时,复合索引是非常有用的;使用复合索引可以提高查询性能,减少在一个表中所创建的索引数量。 综上所述,我们总结了如下索引使用原则: 1)逻辑主键使用唯一的成组索引,对系统键(作为存储过程)采用唯一的非成组索引,对任何外键列采用非成组索引。考虑数据库的空间有多大,表如何进行访问,还有这些访问是否主要用作读写。 2)不要索引memo/note 字段,不要索引大型字段(有很多字符),这样作会让索引占用太多的存储空间。 3)不要索引常用的小型表 4)一般不要为小型数据表设置过多的索引,假如它们经常有插入和删除操作就更别这样作了,SQLS对这些插入和删除操作提供的索引维护可能比扫描表空间消耗更多的时间。 七、大结局 查询是一个物理过程,表面上是SQLS在东跑西跑,其实真正大部分压马路的工作是由磁盘输入输出系统(I/O)完成,全表扫描需要从磁盘上读表的每一个数据页,如果有索引指向数据值,则I/O读几次磁盘就可以了。但是,在随时发生的增、删、改操作中,索引的存在会大大增加工作量,因此,合理的索引设计是建立在对各种查询的分析和预测上的,只有正确地使索引与程序结合起来,才能产生最佳的优化方案。 一般来说建立索引的思路是: (1)主键时常作为where子句的条件,应在表的主键列上建立聚聚集索引,尤其当经常用它作为连接的时候。 (2)有大量重复值且经常有范围查询和排序、分组发生的列,或者非常频繁地被访问的列,可考虑建立聚聚集索引。 (3)经常同时存取多列,且每列都含有重复值可考虑建立复合索引来覆盖一个或一组查询,并把查询引用最频繁的列作为前导列,如果可能尽量使关键查询形成覆盖查询。 (4)如果知道索引键的所有值都是唯一的,那么确保把索引定义成唯一索引。 (5)在一个经常做插入操作的表上建索引时,使用fillfactor(填充因子)来减少页分裂,同时提高并发度降低死锁的发生。如果在只读表上建索引,则可以把fillfactor置为100。 (6)在选择索引字段时,尽量选择那些小数据类型的字段作为索引键,以使每个索引页能够容纳尽可能多的索引键和指针,通过这种方式,可使一个查询必须遍历的索引页面降到最小。此外,尽可能地使用整数为键值,因为它能够提供比任何数据类型都快的访问速度。 SQLS是一个很复杂的系统,让索引以及查询背后的东西真相大白,可以帮助我们更为深刻的了解我们的系统。一句话,索引就象盐,少则无味多则咸。 本篇文章为转载内容。原文链接:https://blog.csdn.net/qq_28052907/article/details/75194926。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-04-30 23:10:07
98
转载
Beego
...在Go的大千世界中,Beego框架就像个贴心的小伙伴,它让处理那些定时小任务变得超级简单,轻松上手!当然啦,毕竟咱们都是凡人,Beego的定时任务执行也不例外,偶尔会遇到点小麻烦。比如说,要是Cron表达式设错了,或者你的任务代码不小心蹦出了个bug,那就会有点尴尬。这篇文章将带你深入理解这些问题,并给出解决方案。 二、Cron表达式的理解与配置 1.1 Cron表达式简介 Cron表达式是一种用于描述时间规律的字符串,它由六个或七个字段组成,用来定义任务的执行周期。例如,"0 0 ?" 表示每天的0点0分执行。理解Cron表达式对于正确配置定时任务至关重要。 1.2 Beego中Cron表达式的配置 在Beego中,你可以通过/app/controllers/cron.go文件来配置Cron任务。下面是一个简单的例子: go package controllers import ( "github.com/astaxie/beego" "time" ) func init() { beego.AddFuncTask("DailyReport", func() { // 你的任务代码 log.Println("每日报告执行") }, "0 0 ") // 每天0点0分执行 } 如果配置出错,如误写为"0 0 ??",程序可能无法按照预期执行,导致任务丢失。 三、任务代码错误分析 2.1 错误类型 任务代码错误可以分为语法错误、逻辑错误和运行时错误。打个比方,就像这样,假如你的程序像小孩子没吃饱饭一样,依赖一个还没填满的“变量”玩具,或者你试图打开一个压根不存在的“数据宝箱”,那这整个任务啊,铁定会玩不转。 2.2 示例代码 go func DailyReport() { // 假设db没有被初始化 db := GetDB() // 这里会抛出错误,因为GetDB函数可能尚未被调用 // ... } 2.3 解决策略 检查代码是否遵循了正确的编程规范,确保所有的依赖都已初始化。同时,使用调试工具(如Beego的内置日志)来追踪错误,找出问题所在。 四、异常处理与调试 3.1 异常捕获 在任务函数中添加适当的错误处理,可以让你更好地追踪到问题。例如: go func DailyReport() error { // ... if db == nil { return errors.New("数据库连接未初始化") } // ... } 3.2 调试技巧 使用beego.BeeApp.SetDebug(true)开启调试模式,这将显示详细的错误堆栈信息。另外,你还可以利用Go的断点和日志功能进行调试。 五、总结与展望 定时任务是现代应用不可或缺的一部分,但它们的稳定性和准确性同样重要。通过理解Cron表达式和任务代码,我们可以避免很多常见的问题。你知道的,哥们,遇到麻烦别急,就像侦探破案一样,冷静分析,一步一步来,答案肯定会出现的!在Beego的天地里,搞定定时任务就像演奏一曲动听的交响乐,得把每个细节、每一步都精准地安排好,就像指挥家挥舞着魔杖,让时间的旋律流畅自如。祝你在探索Beego定时任务的道路上越走越远!
2024-06-14 11:15:26
426
醉卧沙场
Beego
Beego中的SSL/TLS证书问题与HTTPS配置错误:证书验证失败 一、引言 初识SSL/TLS与HTTPS 大家好!今天我们要聊的是一个在开发过程中经常遇到的问题——SSL/TLS证书问题以及HTTPS配置错误导致的证书验证失败。这个问题不仅让网站的安全性和用户体验大打折扣,还经常搞得开发者们焦头烂额。特别是当你使用Beego框架时,这个问题可能会更加复杂。 首先,让我们来简单了解一下SSL/TLS证书是什么。SSL(Secure Sockets Layer)和TLS(Transport Layer Security)就像是网络世界的保安,专门负责在你上网的时候保护你的数据不被坏人偷走或篡改。简单来说,就是让你在网上交流时更安全。HTTPS其实就是HTTP的升级版,它在原来的HTTP上加了个SSL/TLS的锁,这样一来,咱们在网上发送的信息就变得安全多了,别人偷不走。 为什么我们需要关注这些问题呢?因为随着网络安全意识的提升,越来越多的用户开始注意网站是否采用HTTPS进行数据传输。对开发者而言,搞清楚怎么正确设置SSL/TLS证书,防止证书验证出问题,这可是提升应用安全性的关键一步。 二、Beego中的HTTPS配置基础 在Beego框架中,配置HTTPS其实并不复杂。但首先,你需要确保你的服务器已经安装了有效的SSL/TLS证书。这通常涉及到购买或者自签名证书的过程,这里不深入讨论。接下来,我们看看如何在Beego中配置HTTPS。 示例代码:基本HTTPS配置 go package main import ( "github.com/astaxie/beego" ) func main() { // 设置监听端口 beego.RunConfig.Listen.HTTPPort = 8080 // 配置HTTPS beego.RunConfig.Listen.HTTPSPort = 8443 beego.RunConfig.Listen.HTTPSKey = "path/to/private.key" beego.RunConfig.Listen.HTTPSCert = "path/to/certificate.crt" // 启动Beego应用 beego.Run() } 上面这段代码展示了如何在Beego中配置HTTPS的基本步骤。嘿,你知道嘛,HTTPSPort就是用来设置HTTPS服务要监听的端口号的。至于HTTPSKey和HTTPSCert嘛,它们分别告诉你私钥文件和证书文件藏在哪里。 三、常见问题及解决策略 尽管配置看似简单,但在实际操作中却可能遇到各种各样的问题。下面我们就来看看几个常见的问题及其解决方案。 3.1 证书验证失败 问题描述:当客户端尝试连接到你的HTTPS服务时,可能会因为证书验证失败而导致连接被拒绝。 原因分析:这通常是因为客户端无法信任你的服务器证书。可能是由于证书过期、自签名证书未被客户端信任等原因造成的。 解决方案: - 更新证书:如果是证书过期问题,确保及时更新你的SSL/TLS证书。 - 导入证书到信任库:如果使用的是自签名证书,需要将该证书导入到客户端的信任库中。 示例代码:检查证书有效期 go package main import ( "crypto/x509" "fmt" "io/ioutil" "time" ) func main() { pemData, err := ioutil.ReadFile("path/to/certificate.crt") if err != nil { fmt.Println("Error reading certificate file:", err) return } cert, err := x509.ParseCertificate(pemData) if err != nil { fmt.Println("Error parsing certificate:", err) return } // 检查证书有效期 if cert.NotAfter.Before(time.Now()) { fmt.Println("证书已过期!") } else { fmt.Println("证书有效!") } } 这段代码可以帮助你检查证书的有效期限,从而避免因证书过期引发的问题。 四、进阶探索 高级配置与最佳实践 除了上述基础配置外,还有一些高级配置和最佳实践可以进一步提高你的HTTPS服务的安全性和性能。 4.1 使用Let's Encrypt获取免费证书 推荐理由:Let's Encrypt提供了完全免费且自动化的SSL/TLS证书服务,非常适合个人开发者和小型项目使用。 实施方法:你可以使用Certbot等工具自动化地从Let's Encrypt获取证书,并自动续期。 4.2 HTTP严格传输安全(HSTS) 推荐理由:启用HSTS可以增强网站的安全性,防止中间人攻击。 实施方法:只需在响应头中添加Strict-Transport-Security字段即可。 示例代码:设置HSTS响应头 go package main import ( "github.com/astaxie/beego" ) func init() { beego.InsertFilter("", beego.BeforeRouter, func() { beego.resp.Header().Set("Strict-Transport-Security", "max-age=31536000; includeSubDomains") }) } func main() { beego.Run() } 以上就是今天分享的内容啦!希望大家能够通过这篇文章更好地理解和解决在Beego框架中遇到的SSL/TLS证书问题。如果你有任何疑问或建议,欢迎随时交流讨论! --- 希望这篇内容能够帮助你理解并解决Beego中的SSL/TLS证书问题。如果有任何其他问题或需要进一步的帮助,请随时告诉我!
2024-11-14 16:21:52
99
秋水共长天一色
Docker
...例如,当需要处理大量并发连接时,可以通过调整内核参数或使用ipVS的负载均衡特性来提升性能。 总之,Docker端口映射虽为基础功能,但在实际生产环境中的应用却千变万化,从简单的单机部署到大规模分布式系统,都需要我们不断深化理解并灵活运用相关知识,以适应不断发展的云计算和容器化技术趋势。
2023-09-21 17:15:59
837
电脑达人
Java
...言,用于研制多平台的应用软件。Java虚拟机(JVM)是Java语言的核心执行环境,是一个在执行时提供Java机器码执行环境的虚拟机。在JVM中,主要有两种内存管理器,分别是G1和CMS。下面我们来看一下它们的差异。 G1(Garbage-First)是一种使用复合式回收算法的内存管理器,主要用于于大型应用软件和并行处理系统。它的主要特点是: 1. G1的回收速度比CMS更稳定,不容易出现大范围的停顿。 2. G1在空间管理方面比CMS更灵活。 3. G1能够对整个堆(heap)进行回收。 4. G1会为每个年轻代设置最大的暂停时间目标,以保持良好的吞吐量。 CMS(Concurrent Mark Sweep)是一种使用并发式回收算法的内存管理器,主要用于于大型、低延迟的应用软件。它的主要特点是: 1. CMS的回收速度比G1更快,但容易出现大范围的停顿。 2. CMS在空间管理方面比G1更受限制。 3. CMS只能对年轻代进行回收,老年代需要使用标记压缩算法进行回收。 4. CMS支持并发的垃圾回收,能够减少大型堆面临的暂停时间。 综上所述,G1和CMS在很多方面都有差异。大型、低延迟的应用需要使用CMS算法进行垃圾回收,而大型应用软件和并行处理系统需要使用G1算法进行垃圾回收。对于系统管理员来说,选择合适的垃圾回收算法非常重要,能够有效提高应用软件的性能和稳定性。
2023-11-22 10:36:57
342
逻辑鬼才
转载文章
...ttp框架以其高效的性能和易用性受到了广泛的关注。OkHttp不仅支持同步和异步请求,还对HTTP/2、SPDY协议有良好支持,提供了连接池、自动重试等高级特性,是进行网络编程时值得研究的现代工具(参考阅读:“OkHttp:一个现代、快速且灵活的HTTP客户端”)。 2. 安全实践:在网络通信中,数据的安全性和隐私保护至关重要。在使用HttpClient或HttpURLConnection发送HTTP请求时,如何配置SSL/TLS加密以保证传输过程的安全是一个重要课题。可以关注最新的HTTPS最佳实践指南以及Java中相关API的更新(参见:“Java 11+ 中如何正确实现HTTPS连接与证书验证”)。 3. 性能优化:针对不同的应用场景,合理选择并优化HTTP客户端能显著提升应用性能。对比分析HttpURLConnection、HttpClient和OkHttp在实际项目中的表现,并结合响应速度、内存占用、并发处理能力等方面进行深入探讨(推荐文章:“Java HTTP客户端性能大比拼:HttpURLConnection vs HttpClient vs OkHttp”)。 4. 实战案例解析:通过剖析真实项目的源码,理解如何在复杂业务场景下运用这些HTTP客户端完成登录认证、文件上传下载、服务端推送通知等功能(“基于Java的大型Web系统中HTTP请求实战案例详解”)。 综上所述,在掌握基础HTTP请求操作的基础上,紧跟行业发展趋势,关注安全策略和性能优化手段,并通过实战演练深化理论知识,将有助于我们更好地应对各种网络通信挑战。
2023-05-22 10:11:18
303
转载
Hive
...况,这中间就有数据库连接超时这个问题。本文将从数据库连接超时的原因出发,探讨其解决方法。 二、原因剖析 1. 网络问题 网络不稳定或者带宽不足可能导致数据库连接超时。 2. 资源瓶颈 如果服务器资源(如 CPU 或内存)不足,也会影响数据库连接速度,从而导致连接超时。 3. 大量并发查询 在高并发情况下,大量的查询请求可能造成数据库服务过载,进而引发连接超时。 4. 参数设置不当 Hive 的一些配置参数可能会影响到连接性能,例如连接超时时间等。 三、案例分析 以下是一个简单的例子,演示了如何在 HQL 中设置连接超时时间: sql set mapred.job.timeout=3600; -- 设置作业执行超时时间为 1 小时 四、解决方案 针对以上问题,我们可以采取以下策略来避免或解决数据库连接超时问题: 1. 检查网络状况并优化网络环境 确保网络畅通无阻,提高带宽,减少丢包率。 2. 增加服务器资源 根据业务需求适当增加服务器硬件资源,提高数据库处理能力。 3. 优化查询语句 合理设计和编写查询语句,避免不必要的数据扫描,提高查询效率。 4. 调整 Hadoop 配置 修改适当的 Hadoop 配置参数,如增大任务超时时间等。 5. 使用连接池 通过使用数据库连接池技术,能够有效地管理和复用数据库连接,降低单次连接成本。 五、总结与反思 数据库连接超时问题对于大数据项目来说是一种常见的现象,但是只要我们找出问题的根源,就能有针对性地提出解决方案。希望通过本文的分享,大家能对 Hive 数据库连接超时问题有一个更加深入的理解,以便更好地应对类似的问题。 六、展望未来 随着大数据技术的不断发展和进步,我们可以期待更多优秀的工具和技术涌现出来,帮助我们更好地进行数据处理和分析。同时呢,咱们也得不断跟进学习研究各种新技术,这样才能更好地把这些工具和技术运用起来,解决实际问题。
2023-04-17 12:03:53
515
笑傲江湖-t
Tornado
...要用于构建可伸缩、高性能的Web应用程序以及处理非阻塞I/O操作,特别适合需要实时交互的应用和服务场景,如Web聊天应用、实时分析系统等。在Tornado中,开发者可以创建高度并发的服务,轻松应对海量的同时连接请求。 依赖包 , 在计算机编程领域,尤其是像Tornado这样的软件项目中,依赖包是指那些为了保证项目正常运行而必须预先安装的其他第三方库或组件。例如,在运行Tornado服务器时,可能需要诸如asyncio、httptools等一系列相关的Python库作为支撑。如果这些依赖包缺失或者版本不兼容,就可能导致Tornado服务器无法启动。 路径配置 , 路径配置是程序运行时对文件或目录路径的一种设定方式,确保程序能够正确找到所需的资源或执行环境。在Tornado服务器的上下文中,路径配置可能涉及设置项目的根目录、静态文件目录、日志文件输出路径等。例如,通过Python代码中的os.chdir()函数更改当前工作目录至项目根目录,确保Tornado能正确加载应用模块及配置文件,否则可能导致服务器启动失败。
2023-12-23 10:08:52
157
落叶归根-t
RocketMQ
...积压。这种情况不仅会影响系统的正常运行,还可能导致数据丢失。所以呢,你瞧,在设计分布式系统的时候,有一个挺关键的问题咱们得好好琢磨琢磨,那就是怎么才能聪明又高效地把堆积如山的消息给处理好,确保整个系统的稳定性和可靠性杠杠的。 二、RocketMQ简介 RocketMQ是由阿里巴巴开源的一款基于Java的高性能、高可用、可扩展的分布式消息中间件。它能够灵活支持各种消息传输模式,比如发布/订阅模式、点对点模式等,而且人家还自带了不少酷炫的高级功能。比如说,事务处理啊,保证消息按顺序发送啥的,让你用起来既顺手又安心。 三、RocketMQ消息积压原因分析 1. 网络延迟 在网络不稳定的情况下,消息可能因为延迟而不能及时到达接收方。 2. 服务器故障 如果服务器突然崩溃或者负载过高,那么消息就可能会堆积在服务器上,无法进行处理。 3. 消息消费速度慢 如果消息的消费速度远低于生产速度,那么就会导致消息积压。 4. 消费者异常 如果消费者程序出现异常,例如程序挂起或者重启,那么未被消费的消息就会堆积起来。 四、RocketMQ消息积压解决方案 1. 异步处理 对于一些不重要的消息,可以采用异步处理的方式,将消息放入一个队列中,然后在后台线程中慢慢处理这些消息。 2. 提升消费速度 通过优化消费者的程序逻辑,提升消息的消费速度,减少消息的积压。 3. 设置最大消息积压量 可以通过设置RocketMQ的配置参数,限制消息的最大积压量,当达到这个量时,RocketMQ就会拒绝新的消息。 4. 使用死信队列 对于那些无论如何都无法被消费的消息,可以将其放入死信队列中,由人工来处理这些消息。 五、代码示例 以下是一个使用RocketMQ处理消息积压的例子: java // 创建Producer实例 DefaultMQProducer producer = new DefaultMQProducer("MyProducer"); // 设置Producer相关的属性 producer.setNamesrvAddr("localhost:9876"); producer.start(); // 创建Message实例 Message msg = new Message("topic", "tag", ("Hello RocketMQ").getBytes()); // 发送消息 SendResult sendResult = producer.send(msg); 在这个例子中,我们首先创建了一个Producer实例,然后设置了其相关的属性,最后发送了一条消息。 六、结论 消息积压是分布式系统中常见的问题,但通过合理的策略和工具,我们可以有效地解决这个问题。RocketMQ这款超强的消息中间件,就像一个超级信使,浑身都是本领,各种功能一应俱全,还能根据你的需求灵活调整配置。它就像是我们消息生产和消费的贴心管家,确保整个系统的稳定性和可靠性杠杠的,让我们的工作省心又高效。
2023-03-14 15:04:18
160
春暖花开-t
Apache Solr
...用过高的问题。这不仅影响了系统的性能,也大大增加了运维成本。为了解决这个问题,本文将详细介绍如何通过Solr的JVM调优来降低内存占用。 二、什么是JVM调优? JVM调优是指通过对JVM运行环境的设置和调整,优化Java应用程序的运行效率和性能的过程。主要包括以下几个方面: 1. 设置合理的堆内存大小 ; 2. 调整垃圾收集器的参数 ; 3. 调整线程池的参数 ; 4. 配置JVM的其他参数 。 三、为什么要进行JVM调优? 由于Java程序运行时需要大量的内存资源,如果内存管理不当,就会导致内存溢出或者性能下降等问题。所以呢,对JVM进行调优这个操作,就能让Java程序跑得更溜更快,这样一来,甭管业务需求有多高,都能妥妥地满足。 四、如何通过Solr的JVM调优降低内存占用? 1. 设置合理的堆内存大小 堆内存是Java程序运行时所需的主要内存资源,也是最容易导致内存占用过高的部分。在Solr中,可以通过修改solr.in.sh文件中的-Xms和-Xmx参数来设置初始和最大堆内存的大小。 例如,我们可以将这两个参数的值分别设置为4g和8g,这样就可以为Solr提供足够的内存资源。 bash solr.in.sh export JAVA_HOME=/path/to/java export SOLR_HOME=/path/to/solr export CLASSPATH=$SOLR_HOME/bin/bootstrap.jar:$SOLR_HOME/bin/solr.jar export CATALINA_OPTS="-server -Xms4g -Xmx8g" 2. 调整垃圾收集器的参数 垃圾收集器是负责回收Java程序中不再使用的内存的部分。在Solr中,可以通过修改solr.in.sh文件中的-XX:+UseConcMarkSweepGC参数来启用并发标记清除算法,这种算法可以在不影响程序运行的情况下,高效地回收无用内存。 bash solr.in.sh export JAVA_HOME=/path/to/java export SOLR_HOME=/path/to/solr export CLASSPATH=$SOLR_HOME/bin/bootstrap.jar:$SOLR_HOME/bin/solr.jar export CATALINA_OPTS="-server -XX:+UseConcMarkSweepGC" 3. 调整线程池的参数 线程池是Java程序中用于管理和调度线程的工具。在使用Solr的时候,如果你想要提升垃圾回收的效率,有个小窍门可以试试。你只需打开solr.in.sh这个配置文件,找到其中关于-XX:ParallelGCThreads的参数,然后对它进行修改,就可以调整并行垃圾收集线程的数量了。这样一来,Solr就能调动更多的“小工”同时进行垃圾清理工作,从而让你的系统运行更加流畅、高效。 bash solr.in.sh export JAVA_HOME=/path/to/java export SOLR_HOME=/path/to/solr export CLASSPATH=$SOLR_HOME/bin/bootstrap.jar:$SOLR_HOME/bin/solr.jar export CATALINA_OPTS="-server -XX:+UseConcMarkSweepGC -XX:ParallelGCThreads=4" 4. 配置JVM的其他参数 除了上述参数外,还可以通过其他一些JVM参数来进一步优化Solr的性能。比如说,我们可以调整一个叫-XX:MaxTenuringThreshold的参数,这个参数就像个开关一样,能控制对象从年轻代晋升到老年代的“毕业标准”。这样一来,就能有效降低垃圾回收的频率,让程序运行更加流畅。 bash solr.in.sh export JAVA_HOME=/path/to/java export SOLR_HOME=/path/to/solr export CLASSPATH=$SOLR_HOME/bin/bootstrap.jar:$SOLR_HOME/bin/solr.jar export CATALINA_OPTS="-server -XX:+UseConcMarkSweepGC -XX:ParallelGCThreads=4 -XX:MaxTenuringThreshold=8" 五、结论 通过以上的JVM调优技巧,我们可以有效地降低Solr的内存占用,从而提高其运行效率和性能。不过要注意,不同的使用场景可能需要咱们采取不同的优化招数。所以,在实际操作时,我们得像变戏法一样,根据实际情况灵活调整策略,才能把事情做得更漂亮。
2023-01-02 12:22:14
470
飞鸟与鱼-t
Nginx
...们不妨将视线转向网络性能优化和服务器配置的最新实践与研究。近期,随着云计算和大数据应用的飞速发展,网络环境的复杂性与服务器负载压力显著增加,这对网络连接稳定性和响应速度提出了更高要求。 例如,2022年的一项技术报告中,研究者们探讨了在大规模分布式系统环境下,如何通过深度调优Nginx及其他网络服务组件,以适应高并发、低延迟的需求。他们不仅关注到了proxy_connect_timeout等关键参数的设置,还提出了一套动态调整策略,可以根据实时网络状况进行智能适配,从而有效减少超时丢包现象。 同时,在网络架构层面,边缘计算和5G技术的发展为改善网络环境提供了新的解决方案。通过在更接近用户的边缘节点部署服务,可以大幅度降低网络延迟并缓解拥塞问题,从而避免tcping测试过程中可能出现的超时丢包情况。 此外,心跳包机制的实际运用也在不断丰富和完善。在某些前沿应用场景中,如物联网(IoT)设备通信,已经采用更为先进的双向心跳检测机制,并结合TCP keepalive特性,实现了对长连接状态的高效维护,进一步提升了服务可靠性。 综上所述,无论是从服务器配置的精细化管理,还是从网络基础设施的升级换代,都为我们应对tcping Nginx端口超时丢包等问题提供了有力武器。紧跟行业发展趋势和技术研究成果,将有助于我们在实际工作中更好地诊断并解决这类网络通讯难题。
2023-12-02 12:18:10
193
雪域高原_t
站内搜索
用于搜索本网站内部文章,支持栏目切换。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
history | awk '{a[$2]++}END{for(i in a){print a[i] " " i} }' | sort -rn | head -n 10
- 查看最常使用的十条命令。
推荐内容
推荐本栏目内的其它文章,看看还有哪些文章让你感兴趣。
2023-04-28
2023-08-09
2023-06-18
2023-04-14
2023-02-18
2023-04-17
2024-01-11
2023-10-03
2023-09-09
2023-06-13
2023-08-07
2023-03-11
历史内容
快速导航到对应月份的历史文章列表。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"