新用户注册入口 老用户登录入口

[转载]SQLite损坏修复

文章作者:转载 更新时间:2023-11-23 18:22:40 阅读数量:126
文章标签:SQLite损坏修复预防措施master表数据恢复dump恢复
本文摘要:本文针对SQLite数据库可能因空间不足、设备断电或App崩溃等原因导致的损坏问题,提出了预防措施和补救方案。通过调整SQLite配置如synchronous与fullfsync参数优化写入同步,减少损坏概率。在修复策略上,采用数据导出(.dump)结合备份master表的方法提高恢复成功率,通过WCDB框架剥离封装RepairKit组件进行恢复操作。当检测到SQLite数据库Head完整性受损时,利用备份信息,在CoreData初始化前介入修复。最终实现约78%的成功恢复率,有效保护了用户的聊天记录等核心数据。关键词:SQLite、损坏修复、预防措施、空间不足、设备断电、App崩溃、文件sync失败、备份方案、master表、.dump恢复。
转载文章

本篇文章为转载内容。原文链接:https://blog.csdn.net/a66666225/article/details/81637368。

该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。

作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。

如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。

SQLite损坏修复

问题背景

目前后台服务器应该是不保存聊天记录,口袋助理iOS端的所有聊天记录都存储在一个 SQLite 数据库中,一旦这个数据库损坏,将会丢失用户的聊天记录。


解决思路

预防措施:

SQLite 是一个号称每行代码都有对应测试的成熟框架,其代码问题导致的 bug 非常少见。而一般损坏原因主要有3点:

  1. 空间不足
  2. 设备断电或 AppCrash
  3. 文件 sync 失败

针对空间不足:

通过中度的使用和观察,我发现 iOS 端的空间占用是相对合理的,并没有对存储空间的明显浪费。并且 App 会在数据库写入时检查可用空间,如果不足时会抛出空间不足的提示。

针对设备断电或App崩溃:

设备断电属于不可抗力。而 App 崩溃目前我们准备上线 APM 监控平台,预期在一到两个版本的迭代中把崩溃率降低到千分之一以下的行业优秀水平。

针对文件 sync 失败:

调整 synchronous = FULL , 保证每个事务的操作都能写入文件。目前CoreData的默认配置项。
调整 fullfsync = 1 , 保证写入文件顺序和提交顺序一致,拒绝设备重排顺序以优化性能。此项会降低性能。对比得出写入性能大概降低至默认值的25%左右。

优化效果:

根据微信的实践,调整配置项后,损坏率可以降低一半,但并不能完全避免损坏,所以我们还是需要补救措施。

补救措施:

通过查阅 SQLite 的相关资料,发现修复损坏数据库的两种思路和四种方案。

思路一:数据导出

.dump修复

从 master 表中读出一个个表的信息,根据根节点地址和创表语句来 select 出表里的数据,能 select 多少是多少,然后插入到一个新 DB 中。

每个SQLite DB都有一个sqlite_master表,里面保存着全部table和index的信息(table本身的信息,不包括里面的数据哦),遍历它就可以得到所有表的名称和 CREATE TABLE ...的SQL语句,输出CREATE TABLE语句,接着使用SELECT * FROM ... 通过表名遍历整个表,每读出一行就输出一个INSERT语句,遍历完后就把整个DB dump出来了。 这样的操作,和普通查表是一样的,遇到损坏一样会返回SQLITE_CORRUPT,我们忽略掉损坏错误, 继续遍历下个表,最终可以把所有没损坏的表以及损坏了的表的前半部分读取出来。将 dump 出来的SQL语句逐行执行,最终可以得到一个等效的新DB。

思路二:数据备份

拷贝:

不能再直白的方式。由于SQLite DB本身是文件(主DB + journal 或 WAL), 直接把文件复制就能达到备份的目的。

.dump备份:

上一个恢复方案用到的命令的本来目的。在DB完好的时候执行.dump, 把 DB所有内容输出为 SQL语句,达到备份目的,恢复的时候执行SQL即可。

Backup API:

SQLite自身提供的一套备份机制,按 Page 为单位复制到新 DB, 支持热备份。

综合思路:备份master表+数据导出

WCDB框架:

数据库完整时备份master表,数据库损坏时通过使用已备份的master表读取损坏数据库来恢复数据。成功率大概是70%。缺点在于我们目前项目使用的是CoreData框架,迁移成本非常的高。没有办法使用。

补救措施选型原则:

这么多的方案孰优孰劣?作为一个移动APP,我们追求的就是用户体验,根据资料推断只有万分之一不到的用户会发生DB损坏,不能为了极个别牺牲全体用户的体验。不影响用户体验的方法就是好方案。主要考量指标如下:

一:恢复成功率

由于牵涉到用户核心数据,“姑且一试”的方案是不够的,虽说 100% 成功率不太现实,但 90% 甚至 99% 以上的成功率才是我们想要的。

二:备份大小:

原本用户就可能有2GB 大的 DB,如果备份数据本身也有2GB 大小,用户想必不会接受。

三:备份性能:

性能则主要影响体验和备份成功率,作为用户不感知的功能,占用太多系统资源造成卡顿 是不行的,备份耗时越久,被系统杀死等意外事件发生的概率也越高。

数据导出方案考量:

恢复成功率大概是30%。不需要事先备份,故备份大小和备份性能都是最优的。

备份方案考量:

备份方案的理论恢复成功率都为100%,需要考量的即为备份大小和性能。

  • 拷贝:备份大小等于原文件大小。备份性能最好,直接拷贝文件,不需要运算。
  • Backup API: 备份大小等于原文件大小。备份性能最差,原因是热备份,需要用到锁机制。
  • .dump:因为重新进行了排序,备份大小小于原文件。备份性能居中,需要遍历数据库生成语句。

可以看出,比较折中的选择是 Dump ,备份大小具有明显优势,备份性能尚可,恢复性能较差但由于需要恢复的场景较少,算是可以接受的短板。

深入钻研

即使优化后的方案,对于大DB备份也是耗时耗电,对于移动APP来说,可能未必有这样的机会做这样重度的操作,或者频繁备份会导致卡顿和浪费使用空间。
备份思路的高成本迫使我们从另外的方案考虑,于是我们再次把注意力放在之前的Dump方案。 Dump 方案本质上是尝试从坏DB里读出信息,这个尝试一般来说会出现两种结果:

  1. DB的基本格式仍然健在,但个别数据损坏,读到损坏的地方SQLite返回SQLITE_CORRUPT错误, 但已读到的数据得以恢复。
  2. 基本格式丢失(文件头或sqlite_master损坏),获取有哪些表的时候就返回SQLITE_CORRUPT, 根本没法恢复。

第一种可以算是预期行为,毕竟没有损坏的数据能部分恢复。从成功率来看,不少用户遇到的是第二种情况,这种有没挽救的余地呢?

要回答这个问题,先得搞清楚sqlite_master是什么。它是一个每个SQLite DB都有的特殊的表, 无论是查看官方文档Database File Format,还是执行SQL语句 SELECT * FROM sqlite_master;,都可得知这个系统表保存以下信息: 表名、类型(table/index)、 创建此表/索引的SQL语句,以及表的RootPage。sqlite_master的表名、表结构都是固定的, 由文件格式定义,RootPage 固定为 page 1。

正常情况下,SQLite 引擎打开DB后首次使用,需要先遍历sqlite_master,并将里面保存的SQL语句再解析一遍, 保存在内存中供后续编译SQL语句时使用。假如sqlite_master损坏了无法解析,“Dump恢复”这种走正常SQLite 流程的方法,自然会卡在第一步了。为了让sqlite_master受损的DB也能打开,需要想办法绕过SQLite引擎的逻辑。

由于SQLite引擎初始化逻辑比较复杂,为了避免副作用,没有采用hack的方式复用其逻辑,而是决定仿造一个只可以 读取数据的最小化系统。

虽然仿造最小化系统可以跳过很多正确性校验,但sqlite_master里保存的信息对恢复来说也是十分重要的, 特别是RootPage,因为它是表对应的B-tree结构的根节点所在地,没有了它我们甚至不知道从哪里开始解析对应的表。

sqlite_master信息量比较小,而且只有改变了表结构的时候(例如执行了CREATE TABLE、ALTER TABLE 等语句)才会改变,因此对它进行备份成本是非常低的,一般手机典型只需要几毫秒到数十毫秒即可完成,一致性也容易保证, 只需要执行了上述语句的时候重新备份一次即可。有了备份,我们的逻辑可以在读取DB自带的sqlite_master失败的时候 使用备份的信息来代替。

到此,初始化必须的数据就保证了,可以仿造读取逻辑了。我们常规使用的读取DB的方法(包括dump方式恢复), 都是通过执行SQL语句实现的,这牵涉到SQLite系统最复杂的子系统——SQL执行引擎。我们的恢复任务只需要遍历B-tree所有节点, 读出数据即可完成,不需要复杂的查询逻辑,因此最复杂的SQL引擎可以省略。同时,因为我们的系统是只读的, 写入恢复数据到新 DB 只要直接调用 SQLite 接口即可,因而可以省略同样比较复杂的B-tree平衡、Journal和同步等逻辑。 最后恢复用的最小系统只需要:

  1. VFS读取部分的接口(Open/Read/Close),或者直接用stdio的fopen/fread、Posix的open/read也可以
  2. B-tree解析逻辑

Database File Format 详细描述了SQLite文件格式, 参照之实现B-tree解析可读取 SQLite DB。

实现了上面的逻辑,就能读出DB的数据进行恢复了,但还有一个小插曲。我们知道,使用SQLite查询一个表, 每一行的列数都是一致的,这是Schema层面保证的。但是在Schema的下面一层——B-tree层,没有这个保证。 B-tree的每一行(或者说每个entry、每个record)可以有不同的列数,一般来说,SQLite插入一行时, B-tree里面的列数和实际表的列数是一致的。但是当对一个表进行了ALTER TABLE ADD COLUMN操作, 整个表都增加了一列,但已经存在的B-tree行实际上没有做改动,还是维持原来的列数。 当SQLite查询到ALTER TABLE前的行,缺少的列会自动用默认值补全。恢复的时候,也需要做同样的判断和支持, 否则会出现缺列而无法插入到新的DB。

解析B-tree方案上线后,成功率约为78%。这个成功率计算方法为恢复成功的 Page 数除以总 Page 数。 由于是我们自己的系统,可以得知总 Page 数,使用恢复 Page 数比例的计算方法比人数更能反映真实情况。 B-tree解析好处是准备成本较低,不需要经常更新备份,对大部分表比较少的应用备份开销也小到几乎可以忽略, 成功恢复后能还原损坏时最新的数据,不受备份时限影响。 坏处是,和Dump一样,如果损坏到表的中间部分,比如非叶子节点,将导致后续数据无法读出。

落地实践:

剥离封装RepairKit:

从WCDB框架中,剥离修复组件,并且封装其C++的原始API为OC管理类。

备份 master 表的时机:

我们发现 SQLite 里面 B+树 算法的实现是 向下分裂 的,也就是说当一个叶子页满了需要分裂时,原来的叶子页会成为内部节点,然后新申请两个页作为他的叶子页。这就保证了根节点一旦下来,是再也不会变动的。master 表只会在新创建表或者删除一个表时才会发生变化,而CoreData的机制表明每一次数据库的变动都要改动版本标识,那么我通过缓存和查询版本标识的变动来确定何时进行备份,避免频繁备份。

备份文件有效性:

既然 DB 可以损坏,那么这个备份文件也会损坏,怎么办呢?我用了双备份,每一个版本备份两个文件,如果一个备份恢复失败,就会启动另一个备份文件恢复。

介入恢复时机:

当CoreData初始化SQLite前,校验SQLite的Head完整性,如果不完整,进行介入修复。

经过我深入研究证明了这已经是最佳做法。

本篇文章为转载内容。原文链接:https://blog.csdn.net/a66666225/article/details/81637368。

该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。

作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。

如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。

相关阅读
文章标题:[转载][洛谷P1082]同余方程

更新时间:2023-02-18
[转载][洛谷P1082]同余方程
文章标题:[转载]webpack优化之HappyPack实战

更新时间:2023-08-07
[转载]webpack优化之HappyPack实战
文章标题:[转载]oracle 同时更新多表,在Oracle数据库中同时更新两张表的简单方法

更新时间:2023-09-10
[转载]oracle 同时更新多表,在Oracle数据库中同时更新两张表的简单方法
文章标题:[转载][Unity] 包括场景互动与射击要素的俯视角闯关游戏Demo

更新时间:2024-03-11
[转载][Unity] 包括场景互动与射击要素的俯视角闯关游戏Demo
文章标题:[转载]程序员也分三六九等?等级差异,一个看不起一个!

更新时间:2024-05-10
[转载]程序员也分三六九等?等级差异,一个看不起一个!
文章标题:[转载]海贼王 动漫 全集目录 分章节 精彩打斗剧集

更新时间:2024-01-12
[转载]海贼王 动漫 全集目录 分章节 精彩打斗剧集
名词解释
作为当前文章的名词解释,仅对当前文章有效。
SQLiteSQLite是一个开源的、嵌入式关系型数据库引擎,它不需要服务器进程,可以在本地文件中存储数据,并提供SQL接口来访问和管理数据。在本文的语境下,Pocket Assistant iOS应用使用SQLite作为聊天记录的本地存储解决方案。
dump命令在SQLite环境中,`.dump`是一个用于导出整个数据库内容到标准输出(如控制台或重定向到文本文件)的命令。当数据库损坏需要恢复时,可以尝试通过`.dump`命令将未损坏部分的数据导出为SQL脚本,然后在新的数据库中执行这些脚本来重建数据。
B-tree解析B树(B-tree)是一种自平衡的树数据结构,广泛应用于数据库和文件系统中以优化磁盘I/O操作。在SQLite数据库中,B-tree被用来组织和索引表中的数据。文章提及的“B-tree解析”是指当数据库损坏时,通过直接读取和解析SQLite数据库文件中的B-tree结构,绕过SQLite引擎的正常流程,尝试从损坏的数据库中恢复尽可能多的数据。
WAL(Write Ahead Log)WAL是SQLite数据库实现的一种高级日志机制,全称为“预写日志”。在WAL模式下,SQLite不直接修改主数据库文件,而是在单独的日志文件中记录所有更改,然后异步地将更改合并回主数据库。这提高了并发性能并降低了因意外中断导致数据库损坏的风险。
APM监控平台APM(Application Performance Management)即应用程序性能管理,是一种用于监测、诊断和优化软件应用性能的工具集合。在文中提到的APM监控平台,旨在帮助开发者发现和修复可能导致App崩溃的问题,从而降低SQLite数据库由于App异常终止而损坏的可能性。
Backup APISQLite提供的Backup API是一套用于数据库备份的功能接口,允许在运行时进行热备份,即将一个数据库的全部内容复制到另一个数据库,而无需关闭源数据库或影响其正常的读写操作。在本文背景下,探讨了如何利用Backup API进行SQLite数据库的备份,以及该方法在备份大小和性能上的优缺点。
延伸阅读
作为当前文章的延伸阅读,仅对当前文章有效。
在深入探讨SQLite数据库损坏修复的技术细节后,我们了解到预防措施与高效恢复策略对于确保数据安全至关重要。近期,SQLite数据库技术领域也持续取得新进展,特别是在数据保护和稳定性方面。
2022年5月,SQLite官方发布了版本3.37.0,其中引入了更多的完整性检查机制以及优化的写入策略,以降低因硬件故障、程序异常导致的数据损坏风险。同时,该版本还改进了WAL(Write Ahead Log)模式下的性能和可靠性,使得即使在高并发场景下也能更有效地防止数据库损坏。
此外,一些数据库管理工具如DB Browser for SQLite和SQLite Expert Personal等,也开始集成更为先进的数据库维护功能,如定期健康检查、自动修复及实时备份功能,这些都能够有效帮助开发者和用户在SQLite数据库出现问题时快速恢复数据,减少潜在的数据丢失风险。
值得注意的是,在实际应用中,结合云存储服务进行增量备份和容灾也是提升SQLite数据库安全性的有力手段。例如,将本地SQLite数据库定期同步至云端,并通过云端数据库的冗余备份和故障切换机制,能够在设备断电或App崩溃时,最大程度地保障用户数据的安全性和完整性。
总之,随着SQLite数据库技术的不断演进及其配套工具的日益完善,开发者们在面对数据库损坏问题时有了更多解决方案和选择,为移动应用尤其是聊天记录这类重要数据的持久化存储提供了更强有力的保障。在未来,继续关注SQLite的最新研究动态和技术革新,将是优化数据管理、提升用户体验的重要一环。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
mkdir -p dir1/dir2 - 创建多级目录。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
可自定义logo的jQuery生成二维码插件 01-03 jquery每日签到日历插件 10-10 高度可定制的jQuery瀑布流网格布局插件 03-15 Consul中服务实例自动注销问题解析:健康检查、稳定性与Agent配置的影响及解决策略 01-22 怎么看mysql 的安装路径 12-31 jquery横向手风琴效果 12-23 蓝色数码电子产品销售HTML5网站模板 12-14 jQuery和CSS3汉堡包导航菜单打开动画特效 10-19 python模拟生存游戏 10-08 本次刷新还10个文章未展示,点击 更多查看。
jQuery.eraser-实现橡皮擦擦除功能的jquery插件 05-26 Netty中ChannelNotRegisteredException异常处理:理解原因与确保Channel注册状态的方法示例 05-16 响应式游戏开发类企业前端cms模板下载 05-02 精美的花甲美食网站HTML模板下载 03-09 soulmate粉色干净浪漫唯美婚礼单页响应式网站模板 03-07 Vue.js项目中proxyTable数据转发遭遇504错误:服务器响应时间与网络连接问题排查及解决方案 03-05 SpringCloud服务路由配置错误与失效:识别问题、排查步骤及组件解析这个涵盖了的核心内容,包括SpringCloud框架下的服务路由配置错误失效问题的识别,以及涉及到的服务注册中心、Gateway、Zuul等组件的功能解析和故障排查的具体步骤。同时,字数控制在了50个字以内,满足了要求。 03-01 css水平线长度设置 02-11 [转载]Proxy 、Relect、响应式 01-11 蓝色响应式软件营销代理公司网站静态模板 01-06 python正太分布校验 01-05
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"