...的数据。例如，在采集百度下拉词数据时，当用户在搜索框中输入关键词时出现的下拉推荐词列表就是一种动态数据，它随用户的输入行为实时生成并消失。 JSON格式 , JavaScript Object Notation（JSON）是一种轻量级的数据交换格式，易于人阅读和编写，也易于机器解析和生成。在文中，百度返回的下拉词数据即采用JSON格式，包含键值对结构，通过抓取并解析JSON响应内容，可以提取出具体的下拉推荐词信息。线程池 (concurrent.futures.ThreadPoolExecutor) , 在Python编程中，线程池是一种多线程编程的高效解决方案，通过预先创建一定数量的线程并进行复用，能够减少线程频繁创建销毁带来的开销。文中使用了concurrent.futures.ThreadPoolExecutor来并发处理多个关键词的下拉词数据获取任务，每个关键词的请求作为一个独立的任务提交给线程池，线程池中的空闲线程会自动执行这些任务，从而提高了数据采集效率。抓包操作 , 在网络编程与数据分析领域中，抓包操作指的是利用网络封包分析软件（如Wireshark、Fiddler等，或浏览器开发者工具）捕获、记录网络传输过程中经过计算机网络接口的所有数据包的过程。在本文的具体情境下，作者通过浏览器开发者工具进行抓包操作，找到了包含百度下拉词数据的HTTP请求，进一步分析了该请求的相关参数和返回结果，以实现自动化数据采集的目标。

2023-06-21 12:59:26

490

转载

JSON

精准操控：JSON中的日期时间陷阱与UTC/时区转换实战指南

一、引言 JSON（JavaScript Object Notation）是一种轻量级的数据交换格式，因其简单易读，易于解析和生成，已成为互联网数据传输的主流。你知道吗，跟玩儿似的处理JSON里的日期和时间其实挺让人挠头的，特别是当你还得在各种时区和日期格式之间换来换去的时候，那简直就是一场时区版的"找不同"游戏啊！来吧，伙计们，今天咱们要一起探索一个超实用的话题——如何轻松搞定JSON里的日期时间格式！就像煮咖啡一样，我们要一步步把那些看似复杂的日期数据结构梳理得井井有条，让你的操作行云流水，帅气非凡！跟着我，咱们边聊边实战，让这些数字瞬间变得亲切又好玩！二、JSON日期时间格式的基本概念 1. JSON中的日期表示法 JSON本身并不直接支持日期时间类型，它通常将日期时间转换为字符串，使用ISO 8601标准格式：YYYY-MM-DDTHH:mm:ss.sssZ。例如： json { "createdAt": "2023-01-01T12:00:00.000Z" } 这里，Z表示的是协调世界时（UTC）。三、日期时间格式的常见问题与解决方案 2. 处理本地时间和UTC时间当你的应用需要处理用户所在地区的日期时间时，可能需要进行时区转换。JavaScript的Date对象可以方便地完成这个任务。例如，从UTC到本地时间： javascript const dateInUtc = new Date("2023-01-01T12:00:00.000Z"); const localDate = new Date(dateInUtc.getTime() + dateInUtc.getTimezoneOffset() 60 1000); console.log(localDate.toISOString()); // 输出本地时间的ISO格式 3. 自定义格式化如果你想输出特定格式的日期时间，可以借助第三方库如moment.js或date-fns。例如，使用date-fns： javascript import { format } from 'date-fns'; const formattedDate = format(new Date(), 'yyyy-MM-dd HH:mm:ss'); console.log(formattedDate); // 输出自定义格式的日期字符串四、跨平台兼容性和API设计 4. 跨平台兼容性在处理跨平台的API接口时，确保日期时间格式的一致性至关重要。JSON.stringify()和JSON.parse()方法默认会按照ISO 8601格式进行序列化和反序列化。但如果你的后端和前端使用的时区不同，可能会引发混淆。这时，可以通过传递一个可选的时间zone参数来指定： javascript const date = new Date(); const jsonDate = JSON.stringify(date, null, 2, "America/New_York"); // 使用纽约时区五、总结与展望 5. 总结 JSON日期时间格式化虽然看似简单，但在实际应用中可能会遇到各种挑战。懂规矩，还得配上好工具和诀窍，这样玩数据才能又快又溜！就像厨师炒菜，得知道怎么配料，用啥锅具，才能做出美味佳肴一样。嘿，你知道吗？JavaScript的世界就像个不停冒泡的派对，新潮的库和工具层出不穷，比如那个超酷的day.js和超级实用的js-time-ago，它们让日期时间这事儿变得轻松多了，简直就像魔法一样！通过这次探索，我们不仅掌握了JSON日期时间的格式，还了解了如何优雅地解决跨平台和时区问题。记住，无论何时，面对复杂的数据格式，耐心和实践总是关键。希望这篇文章能帮你更好地驾驭JSON中的日期时间格式，提升你的开发效率。 --- 本文作者是一位热爱编程的开发者，对JSON和日期时间处理有着深厚的兴趣。在日常的码农生涯里，他深感不少小伙伴在这个领域摸不着头脑，于是他慷慨解囊，把自己摸爬滚打的经验和领悟一股脑儿分享出来，就想让大家能少踩点坑，少走点冤枉路。

2024-04-14 10:31:46

564

繁华落尽

JSON

JSON线段格式在数据分块处理中的流式解析与ijson库实践

JSON线段格式：深入解析与实践应用在当今的编程世界中，数据交换已经成为软件开发中的核心环节之一。你知道吗，这玩意儿叫JSON（JavaScript Object Notation），就像个轻量级的“数据快递员”，它超级给力的地方就在于那简单易懂的“语言”和书写起来贼方便的特点。正因为如此，这家伙在Web服务、前后端交流这些场合里，可以说是如鱼得水，大展身手，甚至在配置文件这块地盘上，也玩得风生水起，可厉害啦！嘿，伙计们，这次咱们要一起捣鼓点新鲜玩意儿——“JSON线段格式”，一种特别的JSON用法。我将通过一些实实在在的代码实例和咱们的热烈讨论，让你对它有更接地气、更深刻的领悟，保证你掌握起来得心应手！ 1. JSON线段格式简介 "JSON线段格式"这一概念并非JSON标准规范的一部分，但实际开发中，我们常会遇到需要按行分割JSON对象的情况，这种处理方式通常被开发者称为“JSON线段格式”。比如，一个日志文件就像一本日记本，每行记录就是一个独立的小故事，而且这个小故事是用JSON格式编写的。这样一来，我们就能像翻书一样，快速地找到并处理每一条单独的记录，完全没必要把整本日记本一次性全部塞进大脑里解析！ json {"time": "2022-01-01T00:00:00Z", "level": "info", "message": "Application started."} {"time": "2022-01-01T00:01:00Z", "level": "debug", "message": "Loaded configuration."} 2. 解析JSON线段格式的思考过程当面对这样的JSON线段格式时，我们的首要任务是设计合理的解析策略。想象一下，你正在编写一个日志分析工具，需要逐行读取并解析这些JSON对象。首先，你会如何模拟人类理解这个过程呢？ python import json def parse_json_lines(file): with open(file, 'r') as f: for line in f: 去除末尾换行符，并尝试解析为JSON对象 parsed_line = json.loads(line.strip()) 对每个解析出的JSON对象进行操作，如打印或进一步处理 print(parsed_line) 调用函数解析JSON线段格式的日志文件 parse_json_lines('log.json') 在这个例子中，我们逐行读取文件内容，然后对每一行进行JSON解析。这就像是在模仿人的大脑逻辑：一次只聚焦一行文本，然后像变魔术一样把它变成一个富含意义的数据结构（就像JSON对象那样）。 3. 实战应用场景及优化探讨在实际项目中，尤其是大数据处理场景下，处理JSON线段格式的数据可能会涉及到性能优化问题。例如，我们可以利用Python的ijson库实现流式解析，避免一次性加载大量数据导致的内存压力： python import ijson def stream_parse_json_lines(file): with open(file, 'r') as f: 使用ijson库的items方法按行解析JSON对象 parser = ijson.items(f, '') for item in parser: process_item(item) 定义一个函数来处理解析出的每个JSON对象定义处理单个JSON对象的函数 def process_item(item): print(item) 调用函数流式解析JSON线段格式的日志文件 stream_parse_json_lines('log.json') 这样，我们就实现了更加高效且灵活的JSON线段格式处理方式，不仅节约了内存资源，还能实时处理海量数据。 4. 结语 JSON线段格式的魅力所在总结起来，“JSON线段格式”以其独特的方式满足了大规模数据分块处理的需求，它打破了传统单一JSON文档的概念，赋予了数据以更高的灵活性和可扩展性。当你掌握了JSON线段格式的运用和理解，就像解锁了一项超能力，在解决实际问题时能够更加得心应手，让数据像流水一样顺畅流淌。这样一来，咱们的整体系统就能跑得更欢畅，效率和性能蹭蹭往上涨！所以，下次当你面临大量的JSON数据需要处理时，不妨考虑采用“JSON线段格式”，它或许就是你寻找的那个既方便又高效的解决方案。毕竟，技术的魅力就在于不断发掘和创新，而每一次新的尝试都可能带来意想不到的收获。

2023-03-08 13:55:38

494

断桥残雪

JQuery

jQuery中处理中文字符编码：UTF-8转换实战与Ajax、JSON.stringify配合应用

...串都以UTF-8这种格式编码，那可是相当关键的一环，可马虎不得！尤其是当你在URL查询参数、Ajax请求内容或JSON数据序列化过程中遇到包含中文字符的字符串时，不恰当的编码可能会导致乱码或数据丢失。本文将带你通过生动具体的示例，揭示如何运用jQuery巧妙地实现中文字符到UTF-8编码的转换。 2. 理解基础字符编码与Unicode 首先，让我们对“字符编码”这个概念有个基本的认识。在计算机世界里，每个字符都有对应的数字编码，比如ASCII码对于英文字符，而Unicode则是一个包含了全球所有语言字符的统一编码方案。UTF-8是一种变长的Unicode编码方式，它能高效地表示各种语言的字符，特别是对于中文这种非拉丁字符集尤为适用。 3. jQuery不是万能钥匙 JavaScript原生方法尽管jQuery提供了丰富的DOM操作接口，但在处理字符串编码问题上，并没有直接提供特定的方法。实际上，我们通常会借助JavaScript的内置函数来完成这一任务。这是因为，在JavaScript的大脑里，它其实早就把字符串用UTF-16编码（这货也是Unicode家族的一员）给存起来了。所以，在我们捣鼓JS的时候，更关心的是怎么把这些字符串巧妙地变身成UTF-8格式，这样一来它们就能在网络世界里畅行无阻啦。 javascript // 假设有一个包含中文的字符串 var chineseString = "你好，世界！"; // 转换为UTF-8编码的字节数组 // 注意：在现代浏览器环境下，无需手动转码，此步骤仅作演示 var utf8Bytes = unescape(encodeURIComponent(chineseString)).split('').map(function(c) { return c.charCodeAt(0).toString(16); }); console.log(utf8Bytes); // 输出UTF-8编码后的字节表示上述代码中，encodeURIComponent 方法用于将字符串中的特殊及非ASCII字符转换为适合放在URL中的形式，其实质上就是进行了UTF-8编码。然后使用 unescape 反解这个过程，得到一个已经在内存中以UTF-8编码的字符串。最后将其转化为字节数组并输出十六进制表示。 4. 实战应用场景 Ajax请求与JSON.stringify() 在实际的jQuery应用中，如发送Ajax请求： javascript $.ajax({ url: '/api/some-endpoint', type: 'POST', contentType: 'application/json; charset=UTF-8', // 设置请求头表明数据格式及编码 data: JSON.stringify({ message: chineseString }), // 自动处理中文编码 success: function(response) { console.log('Data sent and received successfully!'); } }); 在这个例子中，jQuery的$.ajax方法配合JSON.stringify将包含中文字符的对象自动转换为UTF-8编码的JSON字符串，服务器端接收到的数据能够正确解码还原。 5. 总结与思考虽然jQuery本身并未直接提供中文转UTF-8编码的API，但通过理解和熟练运用JavaScript的内建方法，我们依然可以轻松应对这类问题。尤其在处理跨语言、跨平台的数据交换时，确保字符编码的一致性和正确性至关重要。在实际动手操作的项目里，除了得把编码转换搞定，还千万不能忘了给HTTP请求头穿上“马甲”，明确告诉服务器咱们数据是啥样的编码格式，这样才能确保信息传递时一路绿灯，准确无误。下一次当你在jQuery项目中遇到中文编码难题时，希望这篇文章能成为你的得力助手，帮你拨开迷雾，顺利解决问题。记住，编码问题虽小，但关乎用户体验，不容忽视。

2023-04-05 10:17:37

308

凌波微步

Tornado

Tornado服务部署：应对依赖缺失与配置文件错误的实战对策

...部署错误：深入剖析与实战解决在我们日常的Web开发工作中，Tornado作为一个高性能、异步非阻塞IO的Python网络库，深受开发者喜爱。然而，在我们动手部署Tornado服务的过程中，难免会踩到一些“坑”，像是突然发现少了关键的依赖项啦，或者是配置文件里藏了小错误啥的，这些都是可能会遇到的小插曲。这篇文章会深入地跟大家伙唠唠这些问题，咱不光讲理论，还会手把手地带你瞧实例代码，一步步解析，并且分享实用的解决方案，保准让你对这类问题摸得门儿清，以后再遇到也能轻松应对。 1. 缺少必要的依赖引发的问题 1.1 问题描述首先，让我们来看看最常见的问题——缺少必要的依赖。想象一下这个场景，你辛辛苦苦捣鼓出一个功能齐全的Tornado应用，满心欢喜准备把它搬到服务器上大展拳脚，结果却发现这小家伙死活不肯启动，真让人挠头。这很可能是因为在实际运行的生产环境里，咱们没把Tornado或者它的一些配套依赖包给装上，或者装得不太对劲儿，才出现这个问题的。 python 假设我们的tornado_app.py中导入了tornado模块 import tornado.ioloop import tornado.web class MainHandler(tornado.web.RequestHandler): 省略具体的处理逻辑... def make_app(): return tornado.web.Application([ (r"/", MainHandler), ]) if __name__ == "__main__": app = make_app() app.listen(8888) tornado.ioloop.IOLoop.current().start() 1.2 解决方案确保在部署环境通过pip或其他包管理工具安装所有必需的依赖。例如： bash 在你的服务器上运行以下命令以安装Tornado及其依赖 pip install tornado 同时，对于项目中自定义的或者第三方的额外依赖，应在requirements.txt文件中列出并使用pip install -r requirements.txt进行安装。 2. 配置文件错误带来的困扰 2.1 问题描述配置文件错误是另一个常见的部署问题。Tornado应用通常会读取配置文件来获取数据库连接信息、监听端口等设置。如果配置文件格式不正确或关键参数缺失，服务自然无法正常启动。 python 示例：从配置文件读取端口信息 import tornadotools.config config = tornadotools.config.load_config('my_config.json') port = config.get('server', {}).get('port', 8000) 如果配置文件中没有指定端口，将默认为8000 然后在启动应用时使用该端口 app.listen(port) 2.2 解决方案检查配置文件是否符合预期格式且包含所有必需的参数。就像上面举的例子那样，假如你在“my_config.json”这个配置文件里头忘记给'server.port'设定端口值了，那服务就可能因为找不到合适的端口而罢工启动不了，跟你闹脾气呢。 json // 正确的配置文件示例： { "server": { "port": 8888 }, // 其他配置项... } 此外，建议在部署前先在本地环境模拟生产环境测试配置文件的有效性，避免上线后才发现问题。 3. 总结与思考面对Tornado服务部署过程中可能出现的各种问题，我们需要保持冷静，遵循一定的排查步骤：首先确认基础环境搭建无误（包括依赖安装），然后逐一审查配置文件和其他环境变量。每次成功解决故障，那都是实实在在的经验在手心里攒着呢，而且这每回的过程，都像是咱们对技术的一次深度修炼，让理解力蹭蹭往上涨。记住，调试的过程就像侦探破案一样，要耐心细致地查找线索，理性分析，逐步抽丝剥茧，最终解决问题。在这个过程中，不断反思和总结，你会发现自己的技术水平也在悄然提升。部署虽然繁琐，但当你看到自己亲手搭建的服务稳定运行时，那种成就感会让你觉得一切付出都是值得的！

2023-03-14 20:18:35

冬日暖阳

Logstash

Logstash+Elasticsearch：实时索引与日志分析中的Grok过滤器和批量处理

...用Grok这个插件来解析这些数据，让信息变得更清晰易懂。下面是一个具体的配置示例： yaml input { file { path => "/var/log/nginx/access.log" start_position => "beginning" } } filter { grok { match => { "message" => "%{COMBINEDAPACHELOG}" } } } 这段配置告诉Logstash，从/var/log/nginx/access.log这个路径下的日志文件开始读取，并使用Grok插件中的COMBINEDAPACHELOG模式来解析每一行日志内容。这样子一来，原始的文本信息就被拆成了一个个有组织的小块儿，给接下来的处理铺平了道路，简直不要太方便！ 2.2 高效索引策略一旦数据被Logstash处理完毕，下一步就是将其导入Elasticsearch。为了确保索引操作尽可能高效，我们可以采取一些策略： - 批量处理：减少网络往返次数，提高吞吐量。 - 动态映射：允许Elasticsearch根据文档内容自动创建字段类型，简化索引管理。 - 分片与副本：合理设置分片数量和副本数量，平衡查询性能与集群稳定性。下面是一个简单的Logstash输出配置示例，演示了如何将处理后的数据批量发送给Elasticsearch： yaml output { elasticsearch { hosts => ["localhost:9200"] index => "nginx-access-%{+YYYY.MM.dd}" document_type => "_doc" user => "elastic" password => "changeme" manage_template => false template => "/path/to/template.json" template_name => "nginx-access" template_overwrite => true flush_size => 5000 idle_flush_time => 1 } } 在这段配置中，我们设置了批量大小为5000条记录，以及空闲时间阈值为1秒，这意味着当达到这两个条件之一时，Logstash就会将缓冲区内的数据一次性发送至Elasticsearch。此外，我还指定了自定义的索引模板，以便更好地控制字段映射规则。 3. 实战案例打造高性能日志分析平台好了，理论讲得差不多了，接下来让我们通过一个实际的例子来看看这一切是如何运作的吧！假设你是一家电商网站的运维工程师，最近你们网站频繁出现访问异常的问题，客户投诉不断。为了找出问题根源，你需要对Nginx服务器的日志进行深入分析。幸运的是，你们已经部署了Logstash和Elasticsearch作为日志处理系统。 3.1 日志采集与预处理首先，我们需要确保Logstash能够正确地从Nginx服务器上采集到所有相关的日志信息。根据上面说的设置，我们可以搞一个Logstash配置文件，用来从特定的日志文件里扒拉出重要的信息。嘿，为了让大家看日志的时候能更轻松明了，我们可以加点小技巧，比如说统计每个用户逛网站的频率，或者找出那些怪怪的访问模式啥的。这样一来，信息就一目了然啦！ 3.2 索引优化与查询分析接下来，我们将这些处理后的数据发送给Elasticsearch进行索引存储。有了合适的索引设置，就算同时来一大堆请求，我们的查询也能嗖嗖地快，不会拖泥带水的。比如说，在上面那个输出配置的例子里面，我们调高了批量处理的门槛，同时把空闲时间设得比较短，这样就能大大加快数据写入的速度啦！一旦数据被成功索引，我们就可以利用Elasticsearch的强大查询功能来进行深度分析了。比如说，你可以写个DSL查询，找出最近一周内访问量最大的10个页面；或者，你还可以通过用户ID捞出某个用户的操作记录，看看能不能从中发现问题。 4. 结语拥抱变化，不断探索通过以上介绍，相信大家已经对如何使用Logstash与Elasticsearch实现高效的实时索引优化有了一个全面的认识。当然啦，技术这东西总是日新月异的，所以我们得保持一颗好奇的心，不停地学新技术，这样才能更好地迎接未来的各种挑战嘛！希望这篇文章能对你有所帮助，如果你有任何疑问或建议，欢迎随时留言交流。让我们一起加油，共同成长！

2024-12-17 15:55:35

追梦人

Shell

Awk流式处理语言在文本分析中的实践：模式匹配、BEGIN与Action块应用，实现字段提取、统计计算与数据过滤

...题，极大地提升了运维响应速度和系统稳定性。同时，数据分析师也在利用awk处理CSV、JSON等多种格式的数据源，结合Python或R等高级编程语言进行深度分析和可视化呈现，为业务决策提供强有力的支持。此外， awk不仅仅局限于处理结构化文本，它还可以结合正则表达式实现复杂模式匹配，这在网络安全领域同样大有可为，比如用于恶意流量的日志识别和追踪。总的来说，awk作为一款经典且功能强大的文本处理工具，其价值在当今时代并未因新型技术的崛起而减弱，反而在与各类现代技术和场景的融合中焕发新生，持续为数据处理与分析工作带来便利与高效。因此，掌握awk并深入了解其在不同领域的实践案例，对于提升个人技能和工作效率具有显著的意义。

2023-05-17 10:03:22

追梦人-t

Kibana

Kibana中Elasticsearch默认搜索查询优化：精确匹配、range查询与bool复合查询在数据分析中的应用实例

...不包含所需数据的深度解析与优化策略 1. 引言大家好，当你在使用Kibana进行数据分析时，是否曾遇到过这样的困扰：明明Elasticsearch中存储了大量宝贵的数据，但在Kibana中执行搜索查询时，返回的结果却并不尽如人意——它们可能不够全面，甚至漏掉了你真正需要的关键信息。这就是我们今天要探讨的主题：“Kibana的默认搜索查询不准确或不包含所需数据”。来吧，咱们一起钻得深一点，把这个问题摸个透彻。我打算通过实实在在的例子，手把手教你如何巧妙地优化查询，从而捞到更精准、更全面的信息。 2. Kibana搜索查询基础原理首先，我们需要理解Kibana搜索背后的机制。Kibana是基于Elasticsearch的可视化平台，默认的搜索查询其实采用了Elasticsearch的“match”查询，它会对索引中的所有字段进行全文本搜索。不过呢，这种模糊匹配的方法，在某些特定情况下可能不太灵光。比如说，当我们面对结构严谨的数据，或者需要找的东西必须严丝合缝地匹配时，搜出来的结果就可能不尽人意了。 3. 默认搜索查询的问题案例（以下代码示例假设我们有一个名为"logstash-"的索引，其中包含日志数据） json GET logstash-/_search { "query": { "match": { "message": "error" } } } 上述代码表示在"logstash-"的所有文档中查找含有"error"关键词的消息。但是，你知道吗，就算消息内容显示是“application has no error”，这个记录也会被挖出来，这明显不是我们想要的结果啊。 4. 优化搜索查询的方法（1）精准匹配查询为了精确匹配某个字段的内容，我们可以采用term查询而非match查询。 json GET logstash-/_search { "query": { "term": { "status.keyword": "error" } } } 在这个例子中，我们针对"status"字段进行精确匹配，".keyword"后缀确保了我们是在对已分析过的非文本字段进行查询。（2）范围查询和多条件查询如果你需要根据时间范围或者多个条件筛选数据，可以使用range和bool复合查询。 json GET logstash-/_search { "query": { "bool": { "must": [ { "term": { "status.keyword": "error" } }, { "range": { "@timestamp": { "gte": "now-1d", "lte": "now" } } } ] } } } 此处的例子展示了同时满足状态为"error"且在过去24小时内的日志记录。 5. 总结与思考 Kibana的默认搜索查询方式虽便捷，但其灵活性和准确性在面对复杂需求时可能会有所欠缺。熟悉并灵活运用Elasticsearch的各种查询“独门语言”（DSL，也就是领域特定语言），就像掌握了一套搜索大法，能够让你随心所欲地定制查询条件，这样一来，搜出来的结果不仅更贴切你想要的，而且信息更全面、准确度蹭蹭上涨，就像是给搜索功能插上了小翅膀一样。这就像是拥有一把精巧的钥匙，能够打开Elasticsearch这座数据宝库中每一扇隐藏的门。所以，下次当你在Kibana中发现搜索结果不尽如人意时，请不要急于怀疑数据的质量，而是尝试调整你的查询策略，让数据告诉你它的故事。记住了啊，每一次咱们对查询方法的改良和优化，其实就像是在数据的世界里不断挖掘宝藏，步步深入，逐渐揭开它的神秘面纱。这不仅是我们对数据理解越来越透彻的过程，更是咱们提升数据分析功力、练就火眼金睛的关键步骤！

2023-05-29 19:00:46

487

风轻云淡

DorisDB

DorisDB在大数据时代下的高效并行数据导入导出：Broker Load与EXPORT实践详解

...DorisDB，这款百度自主研发的高性能、实时分析型MPP数据库，可厉害了！它有着超强的并行处理肌肉，对海量数据管理那叫一个游刃有余。特别是在数据导入导出这块儿，表现得尤为出色，让人忍不住要拍手称赞！本文打算手把手地带大家，通过实实在在的操作演示和接地气的代码实例，深度探索DorisDB这个神器是如何玩转高效的数据导入导出，让数据流转变得轻松又快捷。 2. DorisDB数据导入机制 - Broker Load （1）Broker Load 简介 Broker Load是DorisDB提供的一种高效批量导入方式，它充分利用分布式架构，通过Broker节点进行数据分发，实现多线程并行加载数据，显著提高数据导入速度。 sql -- 创建一个Broker Load任务 LOAD DATA INPATH '/path/to/your/data' INTO TABLE your_table; 上述命令会从指定路径读取数据文件，并将其高效地导入到名为your_table的表中。Broker Load这个功能可厉害了，甭管是您电脑上的本地文件系统，还是像HDFS这种大型的数据仓库，它都能无缝对接，灵活适应各种不同的数据迁移需求场景，真可谓是个全能型的搬家小能手！（2）理解 Broker Load 的内部运作过程当我们执行Broker Load命令时，DorisDB首先会与Broker节点建立连接，然后 Broker 节点根据集群拓扑结构将数据均匀分发到各Backend节点上，每个Backend节点再独立完成数据的解析和导入工作。这种分布式的并行处理方式大大提高了数据导入效率。 3. DorisDB数据导出机制 - EXPORT （1）EXPORT功能介绍 DorisDB同样提供了高效的数据导出功能——EXPORT命令，可以将数据以CSV格式导出至指定目录。 sql -- 执行数据导出 EXPORT TABLE your_table TO '/path/to/export' WITH broker='broker_name'; 此命令将会把your_table中的所有数据以CSV格式导出到指定的路径下。这里使用的也是Broker服务，因此同样能实现高效的并行导出。（2）EXPORT背后的思考 EXPORT的设计充分考虑了数据安全性与一致性，导出过程中会对表进行轻量级锁定，确保数据的一致性。同时，利用Broker节点的并行能力，有效减少了大规模数据导出所需的时间。 4. 高效实战案例假设我们有一个电商用户行为日志表user_behavior需要导入到DorisDB中，且后续还需要定期将处理后的数据导出进行进一步分析。 sql -- 使用Broker Load导入数据 LOAD DATA INPATH 'hdfs://path_to_raw_data/user_behavior.log' INTO TABLE user_behavior; -- 对数据进行清洗和分析后，使用EXPORT导出结果 EXPORT TABLE processed_user_behavior TO 'hdfs://path_to_export/processed_data' WITH broker='default_broker'; 在这个过程中，我们可以明显感受到DorisDB在数据导入导出方面的高效性，以及对复杂业务场景的良好适应性。 5. 结语总的来说，DorisDB凭借其独特的Broker Load和EXPORT机制，在保证数据一致性和完整性的同时，实现了数据的高效导入与导出。对企业来讲，这就意味着能够迅速对业务需求做出响应，像变魔术一样灵活地进行数据分析，从而为企业决策提供无比强大的支撑力量。就像是给企业装上了一双洞察商机、灵活分析的智慧眼睛，让企业在关键时刻总能快人一步，做出明智决策。探索DorisDB的技术魅力，就像解开一把开启大数据宝藏的钥匙，让我们在实践中不断挖掘它的潜能，享受这一高效便捷的数据处理之旅。

2023-01-08 22:25:12

454

幽谷听泉

AngularJS

亲手创建与应用AngularJS过滤器：从全名处理到自定义参数化数据格式化实践

...置过滤器如date、json等的使用方法。 2. Angular 9/10过滤器新特性解读：尽管AngularJS已进入长期支持阶段，但其后续版本Angular仍保留了对数据处理的强大支持。在Angular 9/10中，管道（Pipe）作为过滤器的进化形态，提供了更丰富的功能和更高的性能。例如，通过自定义管道实现复杂的数据格式化需求，以及利用pure和impure管道优化性能表现。 3. 实战教程：构建响应式表单结合自定义过滤器：一篇近期的技术博客详细介绍了如何在Angular应用中结合自定义过滤器与响应式表单，实现实时数据验证和格式化显示，这为开发者解决实际项目中的具体问题提供了极具时效性的解决方案。 4. 案例分享：电商网站商品筛选功能实现：参考某知名电商平台近期公开的技术文章，其中详述了如何运用AngularJS（或Angular）过滤器进行多条件商品列表筛选，展示了过滤器在大规模数据处理场景下的高效应用。 5. 社区讨论：过滤器在状态管理库NGXS中的创新实践：随着状态管理库NGXS在Angular社区的广泛应用，有开发者提出并分享了如何将过滤逻辑融入到状态管理中，从而简化视图层代码，提高应用的整体架构层次性和可维护性。持续关注Angular及前端领域的技术博客、论坛和GitHub项目，可以帮助开发者紧跟行业发展步伐，更好地运用过滤器这一强大工具提升应用程序的数据展示效果与用户体验。

2024-03-09 11:18:03

476

柳暗花明又一村

MyBatis

从实体类到JSON：MyBatis中复杂数据转换与SQL映射实战解析

...器时，如何把实体类和JSON数据之间的转换整得既溜又高效，这可真是个不容忽视的关键点。在这个章节里，我们将一起深入探讨MyBatis如何帮助我们解决这类问题。二、MyBatis基础介绍 MyBatis 是一个优秀的 Java持久层框架，它将 SQL 语句与对象绑定起来，使得开发者无需关心底层数据库操作的繁琐细节。在查询结果处理这个环节，MyBatis特地提供了超级实用的和标签大法，就是为了帮我们轻松搞定基本的数据类型转换，还能无缝衔接处理一对一、一对多这种复杂的关系映射问题，让数据映射过程既简单又省心。但对于复杂的数据结构转换，例如 JSON，MyBatis本身并未直接支持，需要借助一些额外的技术手段。三、实体类与JSON数据之间的映射 1. 使用第三方库——Jackson或Gson 对于实体类与JSON之间的转换，最常用的方法是借助诸如 Jackson 或 Gson 这样的 JSON 库。首先，在项目中引入相应的依赖： xml com.fasterxml.jackson.core jackson-databind 2.13.4 // 或者 Gson com.google.code.gson gson 2.9.1 接下来，为实体类定义一个对应的 toString() 方法，使其自动生成 JSON 字符串： java public class User { private String id; private String name; // getters and setters @Override public String toString() { return new Gson().toJson(this); } } 然后在 MyBatis 的 XML 映射文件中使用语句，并设置其 resultType 为 String 类型，配合 toString() 方法即可得到 JSON 数据：xml SELECT FROM user WHERE id = {id} 通过这种方式，MyBatis 会调用用户自定义的 toString() 方法生成对应的 JSON 字符串。 2. 自定义类型处理器（TypeHandler）然而，如果我们想要更灵活地控制数据转换过程，或者映射包含嵌套的对象结构，可以考虑自定义类型处理器。这里以 Jackson 为例，创建一个继承自 org.apache.ibatis.type.TypeHandler 的 UserToJsonTypeHandler 类： java import com.fasterxml.jackson.databind.ObjectMapper; import org.apache.ibatis.type.BaseTypeHandler; import org.apache.ibatis.type.JdbcType; import org.apache.ibatis.type.MappedTypes; @MappedTypes(User.class) public class UserToJsonTypeHandler extends BaseTypeHandler { private static final ObjectMapper OBJECT_MAPPER = new ObjectMapper(); @Override public void setNonNullParameter(PreparedStatement ps, int i, User parameter, JdbcType jdbcType) throws SQLException { ps.setString(i, OBJECT_MAPPER.writeValueAsString(parameter)); } @Override public User getNullableResult(ResultSet rs, String columnName) throws SQLException { String jsonString = rs.getString(columnName); return OBJECT_MAPPER.readValue(jsonString, User.class); } @Override public User getNullableResult(ResultSet rs, int columnIndex) throws SQLException { // ... (类似地处理其他获取方式) } @Override public User getNullableResult(CallableStatement cs, int columnIndex) throws SQLException { // ... (类似地处理其他获取方式) } } 在配置文件中注册这个自定义类型处理器： xml INSERT INTO user (json_data) VALUES (?) SELECT json_data FROM user WHERE id = {id} 现在，User 对象可以直接插入和查询为 JSON 字符串形式，而不需要手动调用 toString() 方法。四、总结与讨论通过本篇文章的学习，我们可以了解到 MyBatis 在默认情况下并不直接支持实体类与 JSON 数据的自动转换。不过，要是我们借助一些好用的第三方JSON工具，比如Jackson或者Gson，再配上自定义的类型处理器，就能超级灵活、高效地搞定这种复杂的数据映射难题啦，就像变魔术一样神奇！在我们实际做开发的时候，就得瞅准业务需求，挑那个最对味的解决方案来用。而且啊，你可别忘了把 MyBatis 的其他功能也玩得溜溜转，这样一来，你的应用性能就能噌噌往上涨，开发效率也能像火箭升空一样蹭蹭提升。同时呢，掌握并实际运用这些小技巧，也能让你在面对其他各种复杂场景下的数据处理难题时，更加游刃有余，轻松应对。

2024-02-19 11:00:31

海阔天空-t

ElasticSearch

异步采集非业务数据：配置Elasticsearch与Logstash实战

...late）。 json PUT _template/my_template { "index_patterns": ["my-index-"], "settings": { "number_of_shards": 1, "number_of_replicas": 1 }, "mappings": { "_source": { "enabled": true }, "properties": { "timestamp": { "type": "date" }, "message": { "type": "text" } } } } 上面这段代码定义了一个名为my_template的模板，适用于所有以my-index-开头的索引。这个模板里头设定了索引的分片数和副本数，还定义了两个字段：一个存时间戳叫timestamp，另一个存消息内容叫message。 4. 使用Logstash采集数据现在我们有了Elasticsearch，也有了数据采集工具，接下来就是让它们协同工作。这里我们以Logstash为例，看看如何将日志数据采集到Elasticsearch中。首先，你需要创建一个Logstash配置文件（.conf），指定输入源、过滤器和输出目标。 conf input { file { path => "/var/log/nginx/access.log" start_position => "beginning" } } filter { grok { match => { "message" => "%{COMBINEDAPACHELOG}" } } date { match => [ "timestamp", "dd/MMM/yyyy:HH:mm:ss Z" ] } } output { elasticsearch { hosts => ["localhost:9200"] index => "nginx-access-%{+YYYY.MM.dd}" } } 这段配置文件告诉Logstash从/var/log/nginx/access.log文件读取数据，使用Grok过滤器解析日志格式，然后将解析后的数据存入Elasticsearch中。这里的hosts参数指定了Elasticsearch的地址，index参数定义了索引的命名规则。 5. 实战演练分析数据最后，让我们来看看如何通过Elasticsearch查询和分析这些数据。好了，假设你已经把日志数据成功导入到了Elasticsearch里，现在你想看看最近一天内哪些网址被访问得最多。 bash GET /nginx-access-/_search { "size": 0, "aggs": { "top_pages": { "terms": { "field": "request", "size": 10 } } } } 这段查询语句会返回过去一天内访问量最高的10个URL。通过这种方式，你可以快速获取关键信息，从而做出相应的决策。 6. 总结与展望通过这篇文章，我们学习了如何使用Elasticsearch异步采集非业务数据，并进行了简单的分析。这个过程让我们更懂用户的套路，还挖出了不少宝贝，帮我们更好地升级产品和服务。当然，实际操作中可能会遇到各种问题和挑战，但只要保持耐心，不断实践和探索，相信你一定能够掌握这项技能。希望这篇教程能对你有所帮助，如果你有任何疑问或者建议，欢迎随时留言交流！ --- 好了，朋友们，今天的分享就到这里。希望你能从中获得灵感，开始你的Elasticsearch之旅。记住，技术的力量在于应用，让我们一起用它来创造更美好的世界吧！

2024-12-29 16:00:49

飞鸟与鱼_

Golang

Golang中配置文件错误处理：从解析到优化的日志化策略与输入验证

...使用flag包来解析命令行参数，或者通过自定义方式加载配置文件。错误发生的原因可能包括： - 格式不正确：配置文件的格式不符合预期。 - 值不合法：配置项的值不在允许的范围内。 - 路径问题：无法找到配置文件。 - 解析错误：代码逻辑存在缺陷，导致无法正确解析配置文件。 3. 实战案例错误排查与修复假设我们正在开发一个基于命令行的Golang服务，该服务依赖于一个配置文件来设置监听端口和日志级别。配置文件内容如下： yaml server: port: 8080 logLevel: info 代码示例：示例代码1：基本的命令行参数解析 go package main import ( "fmt" "os" "strconv" "github.com/spf13/pflag" ) func main() { var port int var logLevel string pflag.IntVar(&port, "port", 8080, "Server listening port") pflag.StringVar(&logLevel, "log-level", "info", "Log level (debug|info|warn|error)") if err := pflag.Parse(); err != nil { fmt.Println("Error parsing flags:", err) os.Exit(1) } fmt.Printf("Listening on port: %d\n", port) fmt.Printf("Log level: %s\n", logLevel) } 示例代码2：加载配置文件并验证 go package main import ( "encoding/yaml" "fmt" "io/ioutil" "log" yamlfile "path/to/your/config.yaml" // 假设这是你的配置文件路径 ) type Config struct { Server struct { Port int yaml:"port" LogLevel string yaml:"logLevel" } yaml:"server" } func main() { configFile, err := ioutil.ReadFile(yamlfile) if err != nil { log.Fatalf("Failed to read config file: %v", err) } var config Config err = yaml.Unmarshal(configFile, &config) if err != nil { log.Fatalf("Failed to parse config: %v", err) } fmt.Printf("Configured port: %d\n", config.Server.Port) fmt.Printf("Configured log level: %s\n", config.Server.LogLevel) } 4. 错误处理与预防策略当遇到“配置文件无效”的错误时，关键在于： - 详细的错误信息：确保错误信息足够详细，能够指向具体问题所在。 - 日志记录：在关键步骤加入日志输出，帮助追踪问题发生的具体环节。 - 输入验证：对配置文件的每一项进行严格验证，确保其符合预期格式和值域。 - 配置文件格式一致性：保持配置文件格式的一致性和规范性，避免使用过于灵活但难以解析的格式。 - 异常处理：在加载配置文件和解析过程中添加适当的错误处理逻辑，避免程序崩溃。 5. 结语拥抱变化与持续优化面对“配置文件无效”的挑战，关键是保持耐心与细致，从每一次错误中学习，不断优化配置管理实践。哎呀，兄弟！咱们的目标可不小。我们得把输入的东西好好检查一下，不让那些乱七八糟的玩意儿混进来。同时，咱们还得给系统多穿几层防护，万一出了啥差错，也能及时发现，迅速解决。这样，咱们的系统不仅能在风雨中稳如泰山，还能方便咱们后期去调整和优化，就像是自己的孩子一样，越养越顺手，你说是不是？嘿，兄弟！如果你在Golang的海洋里漂泊，那我这小文就是为你准备的一盏明灯。在这片充满智慧和创造力的社区里，大家互相分享经验，就像老渔民分享钓鱼秘籍一样，让每个人都能从前辈们的实战中汲取营养，共同进步。这篇文章，就像是你旅途中的指南针，希望能给你带来灵感，让你的编程之路不再孤单，走得更远，飞得更高！

2024-08-22 15:58:15

168

落叶归根

转载文章

[转载]软件供应链安全威胁：从“奥创纪元”到“无限战争”

...使用（例如腾讯的开源Json解析库RapidJSON，就是纯C++头文件形式）。在开源领域有如GPL等规约对此进行规范，下游开发者遵循协议，引用代码，强制或可选地显式保留其GPL声明，可以进行使用和更改。这样的源码依赖关系，结合规范化的changelog声明代码改动，侧面也是为开发过程中跟进考虑。但是一个成型的产品，比如企业自有的服务端底层产品、中间件，新版本的发版更新是复杂的过程，开发者在旧版本仍然“功能正常”的情况下往往倾向于不跟进新版本；而上游代码如果进行安全漏洞修复，通常也都只在其最新版本代码中改动，安全修复与功能迭代并存，如果没有类似Linux发行版社区的努力，旧版本代码完全没有干净的安全更新patch可用。 ·在特定场景下，有些开发实践可能不严格遵循开源代码协议限定，引入了GPL等协议保护的代码而不做声明（以规避相关责任），丢失了引入和版本的信息跟踪；在另一些场景下，可能存在对开源代码进行大刀阔斧的修改、剪裁、定制，以符合自身业务的极端需求，但是过多的修改、人员的迭代造成与官方代码严重的失同步，丧失可维护性。 ·更一般的情况是，在开发中，开发者个体往往心照不宣的存在对网上代码文件、代码片段的复制-粘贴操作。被参考的代码，可能有上述的开源代码，也可能有各种Github作者练手项目、技术博客分享的代码片段、正式开源项目仅用来说明用法的不完备示例代码。这些代码的引入完全无迹可寻，即便是作者自己也很难解释用了什么。这种情况下，上面两条认定的那些与官方安全更新失同步的问题同样存在，且引入了独特的风险：被借鉴的代码可能只是原作者随手写的、仅仅是功能成立的片段，甚至可能是恶意作者随意散布的有安全问题的代码。由此，问题进入了最大的发散空间。在Synopsys下BLACKDUCK软件之前发布的《2018 Open Source Security and Risk Analysis Report》中分析，96%的应用中包含有开源组件和代码，开源代码在应用全部代码中的占比约为57%，78%的应用中在引用的三方开源代码中存在历史漏洞。也就是说，现在互联网上所有厂商开发的软件、应用，其开发人员自己写的代码都是一少部分，多数都是借鉴来的。而这还只是可统计、可追溯的；至于上面提到的非规范的代码引用，如果也纳入进来考虑，三方代码占应用中的比例会上升到多少？曾经有分析认为至少占80%，我们只期望不会更高。 Ⅱ. 从碎片到乱刃：OpenSSH在野后门一览在进行基础软件梳理时，回忆到反病毒安全软件提供商ESET在2018年十月发布的一份白皮书《THE DARK SIDE OF THE FORSSHE: A landscape of OpenSSH backdoors》。其站在一个具有广泛用户基础的软件提供商角度，给出了一份分析报告，数据和结论超出我们对于当前基础软件使用全景的估量。以下以我的角度对其中一方面进行解读。一些必要背景 SSH的作用和重要性无需赘言；虽然我们站在传统互联网公司角度，可以认为SSH是通往生产服务器的生命通道，但当前多样化的产业环境已经不止于此（如之前libssh事件中，不幸被我言中的，SSH在网络设备、IoT设备上（如f5）的广泛使用）。 OpenSSH是目前绝大多数SSH服务端的基础软件，有完备的开发团队、发布规范、维护机制，本身是靠谱的。如同绝大多数基础软件开源项目的做法，OpenSSH对漏洞有及时的响应，针对最新版本代码发出安全补丁，但是各大Linux发行版使用的有各种版本的OpenSSH，这些社区自行负责将官方开发者的安全补丁移植到自己系统搭载的低版本代码上。天空彩白皮书披露的现状如果你是一个企业的运维管理人员，需要向企业生产服务器安装OpenSSH或者其它基础软件，最简单的方式当然是使用系统的软件管理安装即可。但是有时候，出于迁移成本考虑，可能企业需要在一个旧版本系统上，使用较新版本的OpenSSL、OpenSSH等基础软件，这些系统不提供，需要自行安装；或者需要一个某有种特殊特性的定制版本。这时，可能会选择从某些rpm包集中站下载某些不具名第三方提供的现成的安装包，或者下载非官方的定制化源码本地编译后安装，总之从这里引入了不确定性。这种不确定性有多大？我们粗估一下，似乎不应成为问题。但这份白皮书给我们看到了鲜活的数据。 ESET研究人员从OpenSSH的一次历史大规模Linux服务端恶意软件Windigo中获得启示，采用某种巧妙的方式，面向在野的服务器进行数据采集，主要是系统与版本、安装的OpenSSH版本信息以及服务端程序文件的一个特殊签名。整理一个签名白名单，包含有所有能搜索到的官方发布二进制版本、各大Linux发行版本各个版本所带的程序文件版本，将这些标定为正常样本进行去除。最终结论是： ·共发现了几百个非白名单版本的OpenSSH服务端程序文件ssh和sshd； ·分析这些样本，将代码部分完全相同，仅仅是数据和配置不同的合并为一类，且分析判定确认有恶意代码的，共归纳为 21个各异的恶意OpenSSH家族； ·在21个恶意家族中，有12个家族在10月份时完全没有被公开发现分析过；而剩余的有一部分使用了历史上披露的恶意代码样本，甚至有源代码； ·所有恶意样本的实现，从实现复杂度、代码混淆和自我保护程度到代码特征有很大跨度的不同，但整体看，目的以偷取用户凭证等敏感信息、回连外传到攻击者为主，其中有的攻击者回连地址已经存在并活跃数年之久； ·这些后门的操控者，既有传统恶意软件黑产人员，也有APT组织； ·所有恶意软件或多或少都在被害主机上有未抹除的痕迹。ESET研究者尝试使用蜜罐引诱出攻击者，但仍有许多未解之谜。这场对抗，仍未取胜。白皮书用了大篇幅做技术分析报告，此处供细节分析，不展开分析，以下为根据恶意程序复杂度描绘的21个家族图谱：问题思考问题引入的可能渠道，我在开头进行了一点推测，主要是由人的原因切入的，除此以外，最可能的是恶意攻击者在利用各种方法入侵目标主机后，主动替换了目标OpenSSH为恶意版本，从而达成攻击持久化操作。但是这些都是止血的安全运维人员该考虑的事情；关键问题是，透过表象，这显露了什么威胁形式？这个问题很好回答，之前也曾经反复说过：基础软件碎片化。如上一章节简单提到，在开发过程中有各种可能的渠道引入开发者不完全了解和信任的代码；在运维过程中也是如此。二者互相作用，造成了软件碎片化的庞杂现状。在企业内部，同一份基础软件库，可能不同的业务线各自定制一份，放到企业私有软件仓库源中，有些会有人持续更新供自己产品使用，有些由系统软件基础设施维护人员单独维护，有些则可能是开发人员临时想起来上传的，他们自己都不记得；后续用到的这个基础软件的开发和团队，在这个源上搜索到已有的库，很大概率会倾向于直接使用，不管来源、是否有质量背书等。长此以往问题会持续发酵。而我们开最坏的脑洞，是否可能有黑产人员入职到内部，提交个恶意基础库之后就走人的可能？现行企业安全开发流程中审核机制的普遍缺失给这留下了空位。将源码来源碎片化与二进制使用碎片化并起来考虑，我们不难看到一个远远超过OpenSSH事件威胁程度的图景。但这个问题不是仅仅靠开发阶段规约、运维阶段规范、企业内部管控、行业自查、政府监管就可以根除的，最大的问题归根结底两句话：不可能用一场战役对抗持续威胁；不可能用有限分析对抗无限未知。 Ⅲ. 从自信到自省：RHEL、CentOS backport版本BIND漏洞 2018年12月20日凌晨，在备战冬至的软件供应链安全大赛决赛时，我注意到漏洞预警平台捕获的一封邮件。但这不是一个漏洞初始披露邮件，而是对一个稍早已披露的BIND在RedHat、CentOS发行版上特定版本的1day漏洞CVE-2018-5742，由BIND的官方开发者进行额外信息澄(shuǎi)清(guō)的邮件。一些必要背景关于BIND 互联网的一个古老而基础的设施是DNS，这个概念在读者不应陌生。而BIND“是现今互联网上最常使用的DNS软件，使用BIND作为服务器软件的DNS服务器约占所有DNS服务器的九成。BIND现在由互联网系统协会负责开发与维护参考。”所以BIND的基础地位即是如此，因此也一向被大量白帽黑帽反复测试、挖掘漏洞，其开发者大概也一直处在紧绷着应对的处境。关于ISC和RedHat 说到开发者，上面提到BIND的官方开发者是互联网系统协会（ISC）。ISC是一个老牌非营利组织，目前主要就是BIND和DHCP基础设施的维护者。而BIND本身如同大多数历史悠久的互联网基础开源软件，是4个UCB在校生在DARPA资助下于1984年的实验室产物，直到2012年由ISC接管。那么RedHat在此中是什么角色呢？这又要提到我之前提到的Linux发行版和自带软件维护策略。Red Hat Enterprise Linux（RHEL）及其社区版CentOS秉持着稳健的软件策略，每个大的发行版本的软件仓库，都只选用最必要且质量久经时间考验的软件版本，哪怕那些版本实在是老掉牙。这不是一种过分的保守，事实证明这种策略往往给RedHat用户在最新漏洞面前提供了保障——代码总是跑得越少，潜在漏洞越多。但是这有两个关键问题。一方面，如果开源基础软件被发现一例有历史沿革的代码漏洞，那么官方开发者基本都只为其最新代码负责，在当前代码上推出修复补丁。另一方面，互联网基础设施虽然不像其上的应用那样爆发性迭代，但依然持续有一些新特性涌现，其中一些是必不可少的，但同样只在最新代码中提供。两个刚需推动下，各Linux发行版对长期支持版本系统的软件都采用一致的策略，即保持其基础软件在一个固定的版本，但对于这些版本软件的最新漏洞、必要的最新软件特性，由发行版维护者将官方开发者最新代码改动“向后移植”到旧版本代码中，即backport。这就是基础软件的“官宣”碎片化的源头。讲道理，Linux发行版维护者与社区具有比较靠谱的开发能力和监督机制，backport又基本就是一些复制粘贴工作，应当是很稳当的……但真是如此吗？ CVE-2018-5742漏洞概况 CVE-2018-5742是一个简单的缓冲区溢出类型漏洞，官方评定其漏洞等级moderate，认为危害不大，漏洞修复不积极，披露信息不多，也没有积极给出代码修复patch和新版本rpm包。因为该漏洞仅在设置DEBUG_LEVEL为10以上才会触发，由远程攻击者构造畸形请求造成BIND服务崩溃，在正常的生产环境几乎不可能具有危害，RedHat官方也只是给出了用户自查建议。这个漏洞只出现在RHEL和CentOS版本7中搭载的BIND 9.9.4-65及之后版本。RedHat同ISC的声明中都证实，这个漏洞的引入原因，是RedHat在尝试将BIND 9.11版本2016年新增的NTA机制向后移植到RedHat 7系中固定搭载的BIND 9.9版本代码时，偶然的代码错误。NTA是DNS安全扩展（DNSSEC）中，用于在特定域关闭DNSSEC校验以避免不必要的校验失败的机制；但这个漏洞不需要对NTA本身有进一步了解。漏洞具体分析官方没有给出具体分析，但根据CentOS社区里先前有用户反馈的bug，我得以很容易还原漏洞链路并定位到根本原因。若干用户共同反馈，其使用的BIND 9.9.4-RedHat-9.9.4-72.el7发生崩溃（coredump），并给出如下的崩溃时调用栈backtrace：这个调用过程的逻辑为，在9 dns_message_logfmtpacket函数判断当前软件设置是否DEBUG_LEVEL大于10，若是，对用户请求数据包做日志记录，先后调用8 dns_message_totext、7 dns_message_sectiontotext、6 dns_master_rdatasettotext、5 rdataset_totext将请求进行按协议分解分段后写出。由以上关键调用环节，联动RedHat在9.9.4版本BIND源码包中关于引入NTA特性的源码patch，进行代码分析，很快定位到问题产生的位置，在上述backtrace中的5，masterdump.c文件rdataset_totext函数。漏洞相关代码片段中，RedHat进行backport后，这里引入的代码为：这里判断对于请求中的注释类型数据，直接通过isc_buffer_putstr宏对缓存进行操作，在BIND工程中自定义维护的缓冲区结构对象target上，附加一字节字符串（一个分号）。而漏洞就是由此产生：isc_buffer_putstr中不做缓冲区边界检查保证，这里在缓冲区已满情况下将造成off-by-one溢出，并触发了缓冲区实现代码中的assertion。而ISC上游官方版本的代码在这里是怎么写的呢？找到ISC版本BIND 9.11代码，这里是这样的：这里可以看到，官方代码在做同样的“附加一个分号”这个操作时，审慎的使用了做缓冲区剩余空间校验的str_totext函数，并额外做返回值成功校验。而上述提到的str_totext函数与RETERR宏，在移植版本的masterdump.c中，RedHat开发者也都做了保留。但是，查看代码上下文发现，在RedHat开发者进行代码移植过程中，对官方代码进行了功能上的若干剪裁，包括一些细分数据类型记录的支持；而这里对缓冲区写入一字节，也许开发者完全没想到溢出的可能，所以自作主张地简化了代码调用过程。问题思考这个漏洞本身几乎没什么危害，但是背后足以引起思考。没有人在“借”别人代码时能不出错不同于之前章节提到的那种场景——将代码文件或片段复制到自己类似的代码上下文借用——backport作为一种官方且成熟的做法，借用的代码来源、粘贴到的代码上下文，是具有同源属性的，而且开发者一般是追求稳定性优先的社区开发人员，似乎质量应该有足够保障。但是这里的关键问题是：代码总要有一手、充分的语义理解，才能有可信的使用保障；因此，只要是处理他人的代码，因为不够理解而错误使用的风险，只可能减小，没办法消除。如上分析，本次漏洞的产生看似只是做代码移植的开发者“自作主张”之下“改错了”。但是更广泛且可能的情况是，原始开发者在版本迭代中引入或更新大量基础数据结构、API的定义，并用在新的特性实现代码中；而后向移植开发人员仅需要最小规模的功能代码，所以会对增量代码进行一定规模的修改、剪裁、还原，以此适应旧版本基本代码。这些过程同样伴随着第三方开发人员不可避免的“望文生义”，以及随之而来的风险。后向移植操作也同样助长了软件碎片化过程，其中每一个碎片都存在这样的问题；每一个碎片在自身生命周期也将有持续性影响。多级复制粘贴无异于雪上加霜这里简单探讨的是企业通行的系统和基础软件建设实践。一些国内外厂商和社区发布的定制化Linux发行版，本身是有其它发行版，如CentOS特定版本渊源的，在基础软件上即便同其上游发行版最新版本间也存在断层滞后。RedHat相对于基础软件开发者之间已经隔了一层backport，而我们则人为制造了二级风险。在很多基础而关键的软件上，企业系统基础设施的维护者出于与RedHat类似的初衷，往往会决定自行backport一份拷贝；通过早年心脏滴血事件的洗礼，即暴露出来OpenSSL一个例子。无论是需要RHEL还没来得及移植的新版本功能特性，还是出于对特殊使用上下文场景中更高执行效率的追求，企业都可能自行对RHEL上基础软件源码包进行修改定制重打包。这个过程除了将风险幂次放大外，也进一步加深了代码的不可解释性（包括基础软件开发人员流动性带来的不可解释）。 Ⅳ. 从武功到死穴：从systemd-journald信息泄露一窥API误用 1月10日凌晨两点，漏洞预警平台爬收取一封漏洞披露邮件。披露者是Qualys，那就铁定是重型发布了。最后看披露漏洞的目标，systemd？这就非常有意思了。一些必要背景 systemd是什么，不好简单回答。Linux上面软件命名，习惯以某软件名后带个‘d’表示后台守护管理程序；所以systemd就可以说是整个系统的看守吧。而即便现在描述了systemd是什么，可能也很快会落伍，因为其初始及核心开发者Lennart Poettering（供职于Red Hat）描述它是“永无开发完结完整、始终跟进技术进展的、统一所有发行版无止境的差异”的一种底层软件。笼统讲有三个作用：中央化系统及设置管理；其它软件开发的基础框架；应用程序和系统内核之间的胶水。如今几乎所有Linux发行版已经默认提供systemd，包括RHEL/CentOS 7及后续版本。总之很基础、很底层、很重要就对了。systemd本体是个主要实现init系统的框架，但还有若干关键组件完成其它工作；这次被爆漏洞的是其journald组件，是负责系统事件日志记录的看守程序。额外地还想简单提一句Qualys这个公司。该公司创立于1999年，官方介绍为信息安全与云安全解决方案企业，to B的安全业务非常全面，有些也是国内企业很少有布局的方面；例如上面提到的涉及碎片化和代码移植过程的历史漏洞移动，也在其漏洞管理解决方案中有所体现。但是我们对这家公司粗浅的了解来源于其安全研究团队近几年的发声，这两年间发布过的，包括有『stack clash』、『sudo get_tty_name提权』、『OpenSSH信息泄露与堆溢出』、『GHOST：glibc gethostbyname缓冲区溢出』等大新闻（仅截至2017年年中）。从中可见，这个研究团队专门啃硬骨头，而且还总能开拓出来新的啃食方式，往往爆出来一些别人没想到的新漏洞类型。从这个角度，再联想之前刷爆朋友圈的《安全研究者的自我修养》所倡导的“通过看历史漏洞、看别人的最新成果去举一反三”的理念，可见差距。 CVE-2018-16866漏洞详情这次漏洞披露，打包了三个漏洞： ·16864和16865是内存破坏类型 ·16866是信息泄露 ·而16865和16866两个漏洞组和利用可以拿到root shell。漏洞分析已经在披露中写的很详细了，这里不复述；而针对16866的漏洞成因来龙去脉，Qualys跟踪的结果留下了一点想象和反思空间，我们来看一下。漏洞相关代码片段是这样的（漏洞修复前）：读者可以先肉眼过一遍这段代码有什么问题。实际上我一开始也没看出来，向下读才恍然大悟。这段代码中，外部信息输入通过buf传入做记录处理。输入数据一般包含有空白字符间隔，需要分隔开逐个记录，有效的分隔符包括空格、制表符、回车、换行，代码中将其写入常量字符串；在逐字符扫描输入数据字符串时，将当前字符使用strchr在上述间隔符字符串中检索是否匹配，以此判断是否为间隔符；在240行，通过这样的判断，跳过记录单元字符串的头部连续空白字符。但是问题在于，strchr这个极其基础的字符串处理函数，对于C字符串终止字符'\0'的处理上有个坑：'\0'也被认为是被检索字符串当中的一个有效字符。所以在240行，当当前扫描到的字符为字符串末尾的NULL时，strchr返回的是WHITESPACE常量字符串的终止位置而非NULL，这导致了越界。看起来，这是一个典型的问题：API误用（API mis-use），只不过这个被误用的库函数有点太基础，让我忍不住想是不是还会有大量的类似漏洞……当然也反思我自己写的代码是不是也有同样情况，然而略一思考就释然了——我那么笨的代码都用for循环加if判断了:) 漏洞引入和消除历史有意思的是，Qualys研究人员很贴心地替我做了一步漏洞成因溯源，这才是单独提这个漏洞的原因。漏洞的引入是在2015年的一个commit中：在GitHub中，定位到上述2015年的commit信息，这里commit的备注信息为： journald: do not strip leading whitespace from messages. Keep leading whitespace for compatibility with older syslog implementations. Also useful when piping formatted output to the logger command. Keep removing trailing whitespace. OK，看起来是一个兼容性调整，对记录信息不再跳过开头所有连续空白字符，只不过用strchr的简洁写法比较突出开发者精炼的开发风格（并不），说得过去。之后在2018年八月的一个当时尚未推正式版的另一次commit中被修复了，先是还原成了ec5ff4那次commit之前的写法，然后改成了加校验的方式：虽然Qualys研究者认为上述的修改是“无心插柳”的改动，但是在GitHub可以看到，a6aadf这次commit是因为有外部用户反馈了输入数据为单个冒号情况下journald堆溢出崩溃的issue，才由开发者有目的性地修复的；而之后在859510这个commit再次改动回来，理由是待记录的消息都是使用单个空格作为间隔符的，而上一个commit粗暴地去掉了这种协议兼容性特性。如果没有以上纠结的修改和改回历史，也许我会倾向于怀疑，在最开始漏洞引入的那个commit，既然改动代码没有新增功能特性、没有解决什么问题（毕竟其后三年，这个改动的代码也没有被反映issue），也并非出于代码规范等考虑，那么这么轻描淡写的一次提交，难免有人为蓄意引入漏洞的嫌疑。当然，看到几次修复的原因，这种可能性就不大了，虽然大家仍可以保留意见。但是抛开是否人为这个因素，单纯从代码的漏洞成因看，一个传统但躲不开的问题仍值得探讨：API误用。 API误用：程序员何苦为难程序员如果之前的章节给读者留下了我反对代码模块化和复用的印象，那么这里需要正名一下，我们认可这是当下开发实践不可避免的趋势，也增进了社会开发速度。而API的设计决定了写代码和用代码的双方“舒适度”的问题，由此而来的API误用问题，也是一直被当做单纯的软件工程课题讨论。在此方面个人并没有什么研究，自然也没办法系统地给出分类和学术方案，只是谈一下自己的经验和想法。一篇比较新的学术文章总结了API误用的研究，其中一个独立章节专门分析Java密码学组件API误用的实际，当中引述之前论文认为，密码学API是非常容易被误用的，比如对期望输入数据（数据类型，数据来源，编码形式）要求的混淆，API的必需调用次序和依赖缺失（比如缺少或冗余多次调用了初始化函数、主动资源回收函数）等。凑巧在此方面我有一点体会：曾经因为业务方需要，需要使用C++对一个Java的密码基础中间件做移植。Java对密码学组件支持，有原生的JDK模块和权威的BouncyCastle包可用；而C/C++只能使用第三方库，考虑到系统平台最大兼容和最小代码量，使用Linux平台默认自带的OpenSSL的密码套件。但在开发过程中感受到了OpenSSL满满的恶意：其中的API设计不可谓不反人类，很多参数没有明确的说明（比如同样是表示长度的函数参数，可能在不同地方分别以字节/比特/分组数为计数单位）；函数的线程安全没有任何解释标注，需要自行试验；不清楚函数执行之后，是其自行做了资源释放还是需要有另外API做gc，不知道资源释放操作时是否规规矩矩地先擦除后释放……此类问题不一而足，导致经过了漫长的测试之后，这份中间件才提供出来供使用。而在业务场景中，还会存在比如其它语言调用的情形，这些又暴露出来OpenSSL API误用的一些完全无从参考的问题。这一切都成为了噩梦；当然这无法为我自己开解是个不称职开发的指责，但仅就OpenSSL而言其API设计之恶劣也是始终被人诟病的问题，也是之后其他替代者宣称改进的地方。当然，问题是上下游都脱不了干系的。我们自己作为高速迭代中的开发人员，对于二方、三方提供的中间件、API，又有多少人能自信地说自己仔细、认真地阅读过开发指南和API、规范说明呢？做过通用产品技术运营的朋友可能很容易理解，自己产品的直接用户日常抛出不看文档的愚蠢问题带来的困扰。对于密码学套件，这个问题还好办一些，毕竟如果在没有背景知识的情况下对API望文生义地一通调用，绝大多数情况下都会以抛异常形式告终；但还是有很多情况，API误用埋下的是长期隐患。不是所有API误用情形最终都有机会发展成为可利用的安全漏洞，但作为一个由人的因素引入的风险，这将长期存在并困扰软件供应链（虽然对安全研究者、黑客与白帽子是很欣慰的事情）。可惜，传统的白盒代码扫描能力，基于对代码语义的理解和构建，但是涉及到API则需要预先的抽象，这一点目前似乎仍然是需要人工干预的事情；或者轻量级一点的方案，可以case by case地分析，为所有可能被误用的API建模并单独扫描，这自然也有很强局限性。在一个很底层可信的开发者还对C标准库API存在误用的现实内，我们需要更多的思考才能说接下来的解法。 Ⅴ. 从规则到陷阱：NASA JIRA误配置致信息泄露血案软件的定义包括了代码组成的程序，以及相关的配置、文档等。当我们说软件的漏洞、风险时，往往只聚焦在其中的代码中；关于软件供应链安全风险，我们的比赛、前面分析的例子也都聚焦在了代码的问题；但是真正的威胁都来源于不可思议之处，那么代码之外有没有可能存在来源于上游的威胁呢？这里就借助实例来探讨一下，在“配置”当中可能栽倒的坑。引子：发不到500英里以外的邮件？让我们先从一个轻松愉快的小例子引入。这个例子初见于Linux中国的一篇译文。简单说，作者描述了这么一个让人啼笑皆非的问题：单位的邮件服务器发送邮件，发送目标距离本地500英里范围之外的一律失败，邮件就像悠悠球一样只能飞出一定距离。这个问题本身让描述者感到尴尬，就像一个技术人员被老板问到“为什么从家里笔记本上Ctrl-C后不能在公司台式机上Ctrl-V”一样。经过令人窒息的分析操作后，笔者定位到了问题原因：笔者作为负责的系统管理员，把SunOS默认安装的Senmail从老旧的版本5升级到了成熟的版本8，且对应于新版本诸多的新特性进行了对应配置，写入配置文件sendmail.cf；但第三方服务顾问在对单位系统进行打补丁升级维护时，将系统软件“升级”到了系统提供的最新版本，因此将Sendmail实际回退到了版本5，却为了软件行为一致性，原样保留了高版本使用的配置文件。但Sendmail并没有在大版本间保证配置文件兼容性，这导致很多版本5所需的配置项不存在于保留下来的sendmail.cf文件中，程序按默认值0处理；最终引起问题的就是，邮件服务器与接收端通信的超时时间配置项，当取默认配置值0时，邮件服务器在1个单位时间（约3毫秒）内没有收到网络回包即认为超时，而这3毫秒仅够电信号打来回飞出500英里。这个“故事”可能会给技术人员一点警醒，错误的配置会导致预期之外的软件行为，但是配置如何会引入软件供应链方向的安全风险呢？这就引出了下一个重磅实例。 JIRA配置错误致NASA敏感信息泄露案例我们都听过一个事情，马云在带队考察美国公司期间问Google CEO Larry Page自视谁为竞争对手，Larry的回答是NASA，因为最优秀的工程师都被NASA的梦想吸引过去了。由此我们显然能窥见NASA的技术水位之高，这样的人才团队大概至少是不会犯什么低级错误的。但也许需要重新定义“低级错误”……1月11日一篇技术文章披露，NASA某官网部署使用的缺陷跟踪管理系统JIRA存在错误的配置，可分别泄漏内部员工（JIRA系统用户）的全部用户名和邮件地址，以及内部项目和团队名称到公众，如下：问题的原因解释起来也非常简单：JIRA系统的过滤器和配置面板中，对于数据可见性的配置选项分别选定为All users和Everyone时，系统管理人员想当然地认为这意味着将数据对所有“系统用户”开放查看，但是JIRA的这两个选项的真实效果逆天，是面向“任意人”开放，即不限于系统登录用户，而是任何查看页面的人员。看到这里，我不厚道地笑了……“All users”并不意味着“All ‘users’”，意不意外，惊不惊喜？但是这种字面上把戏，为什么没有引起NASA工程师的注意呢，难道这样逆天的配置项没有在产品手册文档中加粗标红提示吗？本着为JIRA产品设计找回尊严的态度，我深入挖掘了一下官方说明，果然在Atlassian官方的一份confluence文档（看起来更像是一份增补的FAQ）中找到了相关说明：所有未登录访客访问时，系统默认认定他们是匿名anonymous用户，所以各种权限配置中的all users或anyone显然应该将匿名用户包括在内。在7.2及之后版本中，则提供了“所有登录用户”的选项。可以说是非常严谨且贴心了。比较讽刺的是，在我们的软件供应链安全大赛·C源代码赛季期间，我们设计圈定的恶意代码攻击目标还包括JIRA相关的敏感信息的窃取，但是却想不到有这么简单方便的方式，不动一行代码就可以从JIRA中偷走数据。软件的使用，你“配”吗？无论是开放的代码还是成型的产品，我们在使用外部软件的时候，都是处于软件供应链下游的消费者角色，为了要充分理解上游开发和产品的真实细节意图，需要我们付出多大的努力才够“资格”？上一章节我们讨论过源码使用中必要细节信息缺失造成的“API误用”问题，而软件配置上的“误用”问题则复杂多样得多。从可控程度上讨论，至少有这几种因素定义了这个问题： ·软件用户对必要配置的现有文档缺少了解。这是最简单的场景，但又是完全不可避免的，这一点上我们所有有开发、产品或运营角色经验的应该都曾经体会过向不管不顾用户答疑的痛苦，而所有软件使用者也可以反省一下对所有软件的使用是否都以完整细致的文档阅读作为上手的准备工作，所以不必多说。 ·软件拥有者对配置条目缺少必要明确说明文档。就JIRA的例子而言，将NASA工程师归为上一条错误有些冤枉，而将JIRA归为这条更加合适。在边角但重要问题上的说明通过社区而非官方文档形式发布是一种不负责任的做法，但未引发安全事件的情况下还有多少这样的问题被默默隐藏呢？我们没办法要求在使用软件之前所有用户将软件相关所有文档、社区问答实现全部覆盖。这个问题范围内一个代表性例子是对配置项的默认值以及对应效果的说明缺失。 ·配置文件版本兼容性带来的误配置和安全问题。实际上，上面的SunOS Sendmail案例足以点出这个问题的存在性，但是在真实场景下，很可能不会以这么戏剧性形式出现。在企业的系统运维中，系统的版本迭代常见，但为软件行为一致性，配置的跨版本迁移是不可避免的操作；而且软件的更新迭代也不只会由系统更新推动，还有大量出于业务性能要求而主动进行的定制化升级，对于中小企业基础设施建设似乎是一个没怎么被提及过的问题。 ·配置项组合冲突问题。尽管对于单个配置项可能明确行为与影响，但是特定的配置项搭配可能造成不可预知的效果。这完全有可能是由于开发者与用户在信息不对等的情况下产生：开发者认为用户应该具有必需的背景知识，做了用户应当具备规避配置冲突能力的假设。一个例子是，对称密码算法在使用ECB、CBC分组工作模式时，从密码算法上要求输入数据长度必须是分组大小的整倍数，但如果用户搭配配置了秘钥对数据不做补齐（nopadding），则引入了非确定性行为：如果密码算法库对这种组合配置按某种默认补齐方式操作数据则会引起歧义，但如果在算法库代码层面对这种组合抛出错误则直接影响业务。 ·程序对配置项处理过程的潜在暗箱操作。这区别于简单的未文档化配置项行为，仅特指可能存在的蓄意、恶意行为。从某种意义上，上述“All users”也可以认为是这样的一种陷阱，通过浅层次暗示，引导用户做出错误且可能引起问题的配置。另一种情况是特定配置组合情况下触发恶意代码的行为，这种触发条件将使恶意代码具有规避检测的能力，且在用户基数上具有一定概率的用户命中率。当然这种情况由官方开发者直接引入的可能性很低，但是在众包开发的情况下如果存在，那么扫描方案是很难检测的。 Ⅵ. 从逆流到暗流：恶意代码溯源后的挑战如果说前面所说的种种威胁都是面向关键目标和核心系统应该思考的问题，那么最后要抛出一个会把所有人拉进赛场的理由。除了前面所有那些在软件供应链下游被动污染受害的情况，还有一种情形：你有迹可循的代码，也许在不经意间会“反哺”到黑色产业链甚至特殊武器中；而现在研究用于对程序进行分析和溯源的技术，则会让你陷入百口莫辩的境地。案例：黑产代码模块溯源疑云 1月29日，猎豹安全团队发布技术分析通报文章《电信、百度客户端源码疑遭泄漏，驱魔家族窃取隐私再起波澜》，矛头直指黑产上游的恶意信息窃取代码模块，认定其代码与两方产品存在微妙的关联：中国电信旗下“桌面3D动态天气”等多款软件，以及百度旗下“百度杀毒”等软件（已不可访问）。文章中举证有三个关键点。首先最直观的，是三者使用了相同的特征字符串、私有文件路径、自定义内部数据字段格式；其次，在关键代码位置，三者在二进制程序汇编代码层面具有高度相似性；最终，在一定范围的非通用程序逻辑上，三者在经过反汇编后的代码语义上显示出明显的雷同，并提供了如下两图佐证（图片来源）：文章指出的涉事相关软件已经下线，对于上述样本文件的相似度试验暂不做复现，且无法求证存在相似、疑似同源的代码在三者中占比数据。对于上述指出的代码雷同现象，猎豹安全团队认为：我们怀疑该病毒模块的作者通过某种渠道(比如“曾经就职”)，掌握有中国电信旗下部分客户端/服务端源码，并加以改造用于制作窃取用户隐私的病毒，另外在该病毒模块的代码中，我们还发现“百度”旗下部分客户端的基础调试日志函数库代码痕迹，整个“驱魔”病毒家族疑点重重，其制作传播背景愈发扑朔迷离。这样的推断，固然有过于直接的依据（例如三款代码中均使用含有“baidu”字样的特征注册表项）；但更进一步地，需要注意到，三个样本在所指出的代码位置，具有直观可见的二进制汇编代码结构的相同，考虑到如果仅仅是恶意代码开发者先逆向另外两份代码后借鉴了代码逻辑，那么在面临反编译、代码上下文适配重构、跨编译器和选项的编译结果差异等诸多不确定环节，仍能保持二进制代码的雷同，似乎确实是只有从根本上的源代码泄漏（抄袭）且保持相同的开发编译环境才能成立。但是我们却又无法做出更明确的推断。这一方面当然是出于严谨避免过度解读；而从另一方面考虑，黑产代码的一个关键出发点就是“隐藏自己”，而这里居然如此堂而皇之地照搬了代码，不但没有进行任何代码混淆、变形，甚至没有抹除疑似来源的关键字符串，如果将黑产视为智商在线的对手，那这里背后是否有其它考量，就值得琢磨了。代码的比对、分析、溯源技术水准上文中的安全团队基于大量样本和粗粒度比对方法，给出了一个初步的判断和疑点。那么是否有可能获得更确凿的分析结果，来证实或证伪同源猜想呢？无论是源代码还是二进制，代码比对技术作为一种基础手段，在软件供应链安全分析上都注定仍然有效。在我们的软件供应链安全大赛期间，针对PE二进制程序类型的题目，参赛队伍就纷纷采用了相关技术手段用于目标分析，包括：同源性分析，用于判定与目标软件相似度最高的同软件官方版本；细粒度的差异分析，用于尝试在忽略编译差异和特意引入的混淆之外，定位特意引入的恶意代码位置。当然，作为比赛中针对性的应对方案，受目标和环境引导约束，这些方法证明了可行性，却难以保证集成有最新技术方案。那么做一下预言，在不计入情报辅助条件下，下一代的代码比对将能够到达什么水准？这里结合近一年和今年内，已发表和未发表的学术领域顶级会议的相关文章来简单展望： ·针对海量甚至全量已知源码，将可以实现准确精细化的“作者归属”判定。在ACM CCS‘18会议上曾发表的一篇文章《Large-Scale and Language-Oblivious Code Authorship Identification》，描述了使用RNN进行大规模代码识别的方案，在圈定目标开发者，并预先提供每个开发者的5-7份已知的代码文件后，该技术方案可以很有效地识别大规模匿名代码仓库中隶属于每个开发者的代码：针对1600个Google Code Jam开发者8年间的所有代码可以实现96%的成功识别率，而针对745个C代码开发者于1987年之后在GitHub上面的全部公开代码仓库，识别率也高达94.38%。这样的结果在当下的场景中，已经足以实现对特定人的代码识别和跟踪（例如，考虑到特定开发人员可能由于编码习惯和规范意识，在时间和项目跨度上犯同样的错误）；可以预见，在该技术方向上，完全可以期望摆脱特定已知目标人的现有数据集学习的过程，并实现更细粒度的归属分析，例如代码段、代码行、提交历史。 ·针对二进制代码，更准确、更大规模、更快速的代码主程序分析和同源性匹配。近年来作为一项程序分析基础技术研究，二进制代码相似性分析又重新获得了学术界和工业界的关注。在2018年和2019（已录用）的安全领域四大顶级会议上，每次都会有该方向最新成果的展示，如S&P‘2019上录用的《Asm2Vec: Boosting Static Representation Robustness for Binary Clone Search against Code Obfuscation and Compiler Optimization》，实现无先验知识的条件下的最优汇编代码级别克隆检测，针对漏洞库的漏洞代码检测可实现0误报、100%召回。而2018年北京HITB会议上，Google Project Zero成员、二进制比对工具BinDiff原始作者Thomas Dullien，探讨了他借用改造Google自家SimHash算法思想，用于针对二进制代码控制流图做相似性检测的尝试和阶段结果；这种引入规模数据处理的思路，也可期望能够在目前其他技术方案大多精细化而低效的情况下，为高效、快速、大规模甚至全量代码克隆检测勾出未来方案。 ·代码比对方案对编辑、优化、变形、混淆的对抗。近年所有技术方案都以对代码“变种”的检测有效性作为关键衡量标准，并一定程度上予以保证。上文CCS‘18论文工作，针对典型源代码混淆（如Tigress）处理后的代码，大规模数据集上可有93.42%的准确识别率；S&P‘19论文针对跨编译器和编译选项、业界常用的OLLVM编译时混淆方案进行试验，在全部可用的混淆方案保护之下的代码仍然可以完成81%以上的克隆检测。值得注意的是以上方案都并非针对特定混淆方案单独优化的，方法具有通用价值；而除此以外还有很多针对性的的反混淆研究成果可用；因此，可以认为在采用常规商用代码混淆方案下，即便存在隐藏内部业务逻辑不被逆向的能力，但仍然可以被有效定位代码复用和开发者自然人。代码溯源技术面前的“挑战” 作为软件供应链安全的独立分析方，健壮的代码比对技术是决定性的基石；而当脑洞大开，考虑到行业的发展，也许以下两种假设的情景，将把每一个“正当”的产品、开发者置于尴尬的境地。代码仿制在本章节引述的“驱魔家族”代码疑云案例中，黑产方面通过某种方式获得了正常代码中，功能逻辑可以被自身复用的片段，并以某种方法将其在保持原样的情况下拼接形成了恶意程序。即便在此例中并非如此，但这却暴露了隐忧：将来是不是有这种可能，我的正常代码被泄漏或逆向后出现在恶意软件中，被溯源后扣上黑锅？这种担忧可能以多种渠道和形式成为现实。从上游看，内部源码被人为泄漏是最简单的形式（实际上，考虑到代码的完整生命周期似乎并没有作为企业核心数据资产得到保护，目前实质上有没有这样的代码在野泄漏还是个未知数），而通过程序逆向还原代码逻辑也在一定程度上可获取原始代码关键特征。从下游看，则可能有多种方式将恶意代码伪造得像正常代码并实现“碰瓷”。最简单地，可以大量复用关键代码特征（如字符串，自定义数据结构，关键分支条件，数据记录和交换私有格式等）。考虑到在进行溯源时，分析者实际上不需要100%的匹配度才会怀疑，因此仅仅是仿造原始程序对于第三方公开库代码的特殊定制改动，也足以将公众的疑点转移。而近年来类似自动补丁代码搜索生成的方案也可能被用来在一份最终代码中包含有二方甚至多方原始代码的特征和片段。基于开发者溯源的定点渗透既然在未来可能存在准确将代码与自然人对应的技术，那么这种技术也完全可能被黑色产业利用。可能的忧患包括强针对性的社会工程，结合特定开发者历史代码缺陷的漏洞挖掘利用，联动第三方泄漏人员信息的深层渗透，等等。这方面暂不做联想展开。〇. 没有总结作为一场旨在定义“软件供应链安全”威胁的宣言，阿里安全“功守道”大赛将在后续给出详细的分解和总结，其意义价值也许会在一段时间之后才能被挖掘。但是威胁的现状不容乐观，威胁的发展不会静待；这一篇随笔仅仅挑选六个侧面做摘录分析，可即将到来的趋势一定只会进入更加发散的境地，因此这里，没有总结。本篇文章为转载内容。原文链接：https://blog.csdn.net/systemino/article/details/90114743。该文由互联网用户投稿提供，文中观点代表作者本人意见，并不代表本站的立场。作为信息平台，本站仅提供文章转载服务，并不拥有其所有权，也不对文章内容的真实性、准确性和合法性承担责任。如发现本文存在侵权、违法、违规或事实不符的情况，请及时联系我们，我们将第一时间进行核实并删除相应内容。

2023-02-05 13:33:43

300

转载

JSON

json 文件后缀名

...应用程序的不断发展，JSON在现代开发中的地位日益凸显。近期，一项关于前端性能优化的研究指出，使用JSON进行数据交换和存储的方式，在移动优先、响应式设计以及SPA（单页应用）等主流开发模式中，能够显著降低网络传输负担，提升用户体验。具体来说，各大云服务提供商如AWS、Azure和Google Cloud也纷纷推出对JSON格式原生支持的服务，如AWS DynamoDB可以直接处理JSON文档，大大简化了数据读写操作的复杂性。同时，Node.js社区不断涌现新的库和工具，以提高JSON数据处理效率，例如fast-json-stringify和json-bigint等，它们针对大数据量场景进行了深度优化，使得JSON在企业级应用中也能游刃有余。此外，考虑到安全性问题，业界也在探索如何在保证JSON便捷性的前提下增强其安全性。例如，通过JSON Schema实现数据验证，确保接收到的数据符合预期结构，减少因数据格式错误引发的安全隐患。而在加密方面，已有研究提出了将JSON与加密算法结合，构建安全的数据交换通道。综上所述，JSON作为跨平台、易于解析且高效的数据格式，在当前及未来一段时间内将持续发挥关键作用。无论是前端交互、后端数据处理，还是云端存储，深入理解和掌握JSON的应用与最佳实践，都将有助于开发者应对日新月异的技术挑战，打造更高效、更安全的数字化产品。

2023-05-29 11:53:15

526

程序媛

JSON

json 数据操作

JSON , JavaScript Object Notation，一种轻量级的数据交换格式，采用完全独立于语言的文本格式来存储和表示数据。JSON通过简洁、人性化的语法（类似于JavaScript对象字面量）来描述键值对集合，便于人阅读和编写，同时也易于机器解析和生成。在Web开发领域中，JSON广泛应用于前后端数据交互，使得不同平台之间能方便地传递结构化信息。 JavaScript 对象 , 在JavaScript编程语言中，对象是一种复杂数据类型，用于将相关数据和功能组织在一起。它是一个无序的属性集合，每个属性都有唯一的字符串键名和对应的值（可以是任何数据类型）。例如，在文章中提到的JavaScript对象 name: \ Tom\ , age: 18 ，其中\ name\ 和\ age\ 是属性名，\ Tom\ 和18是对应的属性值。 fetch API , Fetch API是现代浏览器提供的一种基于Promise的网络请求接口，用于从服务器获取资源。相较于传统的XMLHttpRequest对象，fetch提供了更简洁易用且符合现代异步编程模式的API。在文章中的示例代码中，fetch方法被用来从后端服务器获取JSON数据，然后通过.then(response => response.json())将响应体转换为JSON格式的数据，以便进一步处理和渲染到网页上。

2023-05-11 17:44:41

267

代码侠

JSON

JSON中多次换行怎么写？用转义字符搞定多段落文本与字符串代码实践

JSON数据键的值，应该如何写多次换行的内容呢？一、初识JSON 为什么我们要讨论这个？大家好呀！今天我们来聊聊JSON——一种轻量级的数据交换格式。它就像是数据世界里的“万金油”，在前端和后端之间搭起了一座沟通的桥，让两边能顺畅地聊起天来。不过，今天我们要聊的可不是它的基本用法，而是稍微有点小复杂的问题：如何在JSON中表示包含多次换行的内容？先别急着翻白眼，这其实是个很有意思的事情。想象一下，如果你要存储一段长篇小说或者多段落的文本信息，而这些内容又包含了换行符，那么该如何优雅地处理呢？是不是有点挠头？但别担心，作为一个热爱折腾的程序员，我决定带你一起探索这个问题！ --- 二、JSON的基本规则它不是魔法，但也不是障碍首先，咱们得知道JSON的基本规则。JSON是一种基于文本的数据格式，主要由键值对组成。每个键必须是字符串，并且键和值之间需要用冒号分隔。至于值嘛，它可以是字符串、数字、布尔值、数组甚至是嵌套的对象。比如这样： json { "name": "张三", "age": 25, "isStudent": false, "hobbies": ["reading", "coding"] } 看起来很简单吧？但是，当我们尝试存储一些更复杂的文本内容时，事情就没那么简单了。比如你想存一首诗，或者一封邮件，里面可能有好多换行符，那怎么办呢？ --- 三、问题来了换行符的“尴尬”存在假设你正在写一个应用程序，需要让用户输入一段多行的文字，比如他们的个人简介。哎，你说如果用户输入的内容里带换行符怎么办？难道直接一股脑儿扔进JSON里？但问题来了啊，JSON这小家伙自己也不太争气，它压根儿就不允许字符串里直接留着换行符呢！这可咋整？除非你用某种方式告诉它，“嘿，这可是真的换行哦！” 这就像是你在写信的时候，突然发现信纸不够宽，只能把一句话分成两行写。而你的朋友收到信后，还得脑补那些断开的部分重新组合起来。所以，我们得想个办法让JSON能够正确地解析这些换行符。 --- 四、解决方案转义字符登场！幸运的是，JSON提供了一种非常聪明的方式来解决这个问题——转义字符。具体来说，如果你想在JSON字符串中表示换行符，可以使用\n来代替。这里的\n是一个特殊的符号，代表一个换行操作。举个例子： json { "poem": "静夜思\n床前明月光,\n疑是地上霜。\n举头望明月,\n低头思故乡。" } 在这个例子中，我们用\n来表示每一句诗之间的换行。当你把这个JSON解析出来时，程序会自动把这些\n替换成实际的换行符，于是输出的结果就会变成：静夜思床前明月光, 疑是地上霜。举头望明月, 低头思故乡。是不是很神奇？不过，这里有一个小技巧需要注意：如果你想要表示真正的反斜杠（\），那么你需要用双反斜杠（\\）来表示。因为单个反斜杠在JSON中会被认为是一个转义符。 --- 五、更复杂的情况多段落文本当然，现实中的情况往往比一首诗复杂得多。比如说，你得把一封邮件的内容存下来，而这封邮件的正文往往是由好几段话组成的，有长有短，啥样的都有。哎呀，光靠换行符 \n 可不一定行啊，毕竟你还得让每段之间留点空白，不然读起来就像一锅粥，分不清哪是哪呀！在这种情况下，你可以继续使用\n，同时注意合理安排段落结构。例如： json { "email": "亲爱的李四：\n\n很高兴收到您的来信。以下是我的回复：\n\n第一段内容...\n第二段内容..." } 在这里，\n\n表示两个连续的换行符，从而形成了一段空行。用这种方法，就能把文章分得清清楚楚的，读起来也顺溜多了！ --- 六、代码实践从理论到实战说了这么多理论，让我们动手试试看吧！下面是一些简单的代码示例，展示如何在JavaScript中生成和解析带有换行符的JSON数据。示例1：生成JSON字符串 javascript const data = { poem: "静夜思\n床前明月光,\n疑是地上霜。\n举头望明月,\n低头思故乡。", email: "亲爱的李四：\n\n很高兴收到您的来信。以下是我的回复：\n\n第一段内容...\n第二段内容..." }; // 将对象转换为JSON字符串 const jsonString = JSON.stringify(data); console.log(jsonString); 运行这段代码后，你会看到类似这样的输出： json {"poem":"静夜思\\n床前明月光,\\n疑是地上霜。\\n举头望明月,\\n低头思故乡。","email":"亲爱的李四：\\n\\n很高兴收到您的来信。以下是我的回复：\\n\\n第一段内容...\\n第二段内容..."} 可以看到，在生成的JSON字符串中，所有的\n都被转义成了\\n。示例2：解析JSON字符串 javascript const jsonString = '{"poem":"静夜思\\n床前明月光,\\n疑是地上霜。\\n举头望明月,\\n低头思故乡。","email":"亲爱的李四：\\n\\n很高兴收到您的来信。以下是我的回复：\\n\\n第一段内容...\\n第二段内容..."}'; // 将JSON字符串解析回对象 const parsedData = JSON.parse(jsonString); console.log(parsedData.poem); console.log(parsedData.email); 运行这段代码后，你会看到如下输出：静夜思床前明月光, 疑是地上霜。举头望明月, 低头思故乡。亲爱的李四：很高兴收到您的来信。以下是我的回复：第一段内容... 第二段内容... 瞧！我们的换行符终于生效啦！ --- 七、总结与反思好了，今天的分享就到这里啦！通过这篇文章，我们不仅了解了如何在JSON中处理多次换行的内容，还学习了一些实用的小技巧。虽然JSON看似简单，但它背后隐藏着很多有趣的细节。希望这些知识能帮助你在未来的编程旅程中更加游刃有余。最后，我想说的是，编程不仅仅是冷冰冰的技术活儿，它也是一种艺术形式。每一次解决问题的过程，都充满了挑战和乐趣。所以，不管遇到什么困难，都别轻易放弃，试着去思考、去尝试，说不定下一个突破就在前方等着你呢！祝大家 coding愉快！ 😊

2025-04-02 15:38:06

时光倒流_

JSON

json 查询 jquery

JSON 是一种简洁的数据交换格式，它普遍用在前后端数据传输。而 jQuery 是一款流行的 JavaScript 库，常用于操作 DOM、发起 AJAX 请求以及处理 JSON 数据的操作。在 jQuery 中，我们可以通过几个函数来完成对 JSON 数据的查询操作。 // 一个基础的 JSON 数据例子 var data = { "name": "小明", "age": 18, "hometown": "北京", "hobbies": ["吃饭", "睡觉", "打游戏"], "friend": { "name": "小红", "age": 17 } } 1. $.parseJSON() var jsonStr = '{"name":"小明","age":18,"hometown":"北京"}'; var jsonData = $.parseJSON(jsonStr); console.log(jsonData.name); // 显示：小明 2. $.getJSON() $.getJSON('https://api.github.com/users/octocat', function(data) { console.log(data.name); // 显示：The Octocat }); 3. $.each() $.each(data.hobbies, function(index, value) { console.log(value); // 显示：吃饭、睡觉、打游戏 }); 4. $.map() var hobbiesArr = $.map(data.hobbies, function(value, index) { return value; }); console.log(hobbiesArr); // 显示：["吃饭", "睡觉", "打游戏"] 以上就是 jQuery 中常用的几种 JSON 查询函数，它们可以使我们更便捷地对数据进行操作。

2023-07-24 23:16:09

441

逻辑鬼才

JSON

json 数组大小

...Notation (JSON) , 一种轻量级的数据交换格式，基于JavaScript的一个子集，用于在不同系统之间以文本形式传输结构化数据。JSON语法简洁且易于人阅读和编写，同时也易于机器解析和生成。在文中提到的场景中，JSON数组是一种特殊的数据结构，其采用方括号包围一组用逗号分隔的值。 JSON.parse() 函数 , 这是JavaScript内置的一个全局方法，用于将符合JSON格式的字符串转换为JavaScript对象或数组。例如，在文章中，通过调用 JSON.parse(jsonStr) 可以将包含数组表示的字符串 apple, banana, orange 转换为实际的JavaScript数组。 AJAX（Asynchronous JavaScript and XML） , 虽然本文未直接提及AJAX，但它是Web开发中与JSON交互密切相关的技术。AJAX是一种创建快速动态网页的技术，通过在后台与服务器交换少量数据而不重新加载整个页面，实现了页面的部分更新。在现代Web应用中，JSON常作为AJAX请求和响应中的数据格式，使得前后端能够高效地进行异步数据交换。例如，前端可以发送一个包含JSON数组的HTTP请求到后端服务器，服务器处理后返回另一个JSON数组作为响应结果。

2023-05-08 12:00:44

538

软件工程师

JSON

json 的转换

JSON , JavaScript Object Notation，一种轻量级的数据交换格式，它基于JavaScript的一个子集，采用完全独立于语言的文本格式来存储和传输数据。JSON格式简洁、易于阅读和编写，同时也易于机器解析和生成。在文中，JSON被用于在不同系统或程序间进行数据交换，并且能够在JavaScript中直接转换为原生对象，或者将JavaScript对象转换为JSON字符串。 JSON.parse() , JavaScript内置方法，用于将一个JSON格式的字符串转换为JavaScript原生对象。例如，在文章中，通过JSON.parse(jsonStr)，可以将JSON字符串 name:Jack,age:20 解析成一个具有 name 和 age 属性的对象，从而可以在JavaScript中直接访问这些属性值。 JSON.stringify() , 与JSON.parse()相对应的JavaScript内置方法，用于将JavaScript对象或值转换为JSON格式的字符串。在文中举例说明，若有一个JavaScript对象 name: Jack , age: 20 ，使用JSON.stringify(obj)后会得到对应的JSON字符串 name: \ Jack\ , age: 20 ，这个字符串可以方便地在网络上传输或保存到文件中。跨域问题（CORS） , 跨源资源共享（Cross-Origin Resource Sharing），是现代Web应用中浏览器实施的一种安全策略。由于同源策略限制，通常情况下，一个源（如网页所在的域名、协议和端口）中的脚本不能读取另一个源中的资源，除非明确允许。在处理JSON数据交互时，如果前后端属于不同的域名，就会触发跨域问题。为了解决这一问题，服务器需要设置Access-Control-Allow-Origin响应头部信息以允许特定或所有来源对资源的请求，从而实现跨域数据访问。 Access-Control-Allow-Origin , HTTP响应头部字段，用于指定哪些网站的请求可以获取当前资源。在解决JSON数据交换时的跨域问题时，服务器可以通过设置该头部信息，允许来自不同源的请求获取资源，从而实现跨域数据通信。例如，如果设置为Access-Control-Allow-Origin: ，则表示任何源都可以访问该资源；如果设置为具体的源地址，如Access-Control-Allow-Origin: https://example.com，则只有该源的请求才能成功获取资源。

2023-12-14 20:46:43

491

程序媛

JSON

Ashx在ASP.NET中处理与解析JSON数据：从HttpApplicationRequest到JsonConvert.DeserializeObject的实践

...下，我们都希望可以将JSON数据从客户端发送到服务器端，并且从服务器端返回响应的数据。这就是Ashx的一个强大功能。 2. 什么是Ashx Ashx是ASP.NET中的一个组件，它可以用于处理HTTP请求。通过Ashx，我们可以创建自己的HTTP处理程序，实现定制的业务逻辑。 3. JSON是什么？ JSON（JavaScript Object Notation）是一种轻量级的数据交换格式，它基于JavaScript的一个子集。它易于人阅读和编写，同时也易于机器解析和生成。 4. 如何使用Ashx处理JSON数据？首先，我们需要定义一个Ashx方法来处理我们的请求。这个方法呐，它得接收一个叫“request”的小家伙作为参数，其实呢，这玩意儿就是一个HttpApplicationRequest对象，里头装着这次请求的所有详细信息，一丁点儿也没落下。 csharp public void HandleHttpRequest(HttpContext context) { // 获取请求的内容 string requestContent = context.Request.InputStream.ReadToEnd(); // 将请求内容转换为JSON对象 dynamic jsonObject = JsonConvert.DeserializeObject(requestContent); // 在这里处理你的JSON数据... // 返回响应 context.Response.Write("处理成功"); } 在这个方法中，我们首先获取了请求的内容，然后使用JsonConvert.DeserializeObject方法将其转换为一个动态类型的JSON对象。这样，我们就可以方便地访问和操作JSON数据了。 5. 总结 Ashx是一个强大的工具，可以帮助我们在ASP.NET中处理各种HTTP请求。尤其是当我们碰上要处理JSON数据这事儿，用Ashx可是能帮咱们省不少力，让事情变得轻松简单多了。当你把请求的内容成功转换成JSON格式后，就等于把它变成一个我们熟悉的.NET对象，这样一来，处理JSON数据就跟玩普通.NET对象一样简单轻松，毫无压力啦！ 6. 深入探讨然而，这只是一个基础的例子。实际上，我们可以使用Ashx做更多的事情。比如说，咱们可以在动手解析JSON数据之前，先给请求做个“体检”确认其靠谱性；又或者，在我们成功搞定数据之后，再添点额外的“小料”，让它更加饱满丰富。此外，我们也需要注意安全问题。虽然“JsonConvert.DeserializeObject”这个小家伙能够自动挡下不少常见的JSON攻击招式，但我们仍然得瞪大眼睛，确保喂给它的数据确实是货真价实、没毛病的。总的来说，Ashx是一个非常有用的工具，但我们也需要谨慎使用，以防止可能的安全问题。

2023-06-29 14:38:59

549

灵动之光-t

AngularJS

AngularJS单页应用中的国际化实现：配置$translateProvider、JSON语言包与动态切换功能

...SPA的国际化支持：实战解析与代码示例在现代Web开发领域，单页应用（Single Page Application, SPA）因其优秀的用户体验和高效的性能而广受青睐。AngularJS，这款超给力的前端MVC框架，那可真是个宝！它不仅能让你轻松玩转各种组件化功能，还悄悄内建了对国际化（Internationalization，也就是我们常说的i18n）的硬核支持。让你不管开发什么项目，都能轻轻松松实现多语言切换，跟全球用户打成一片。本文将深入探讨如何利用AngularJS实现在SPA中的国际化支持，并通过实例代码详细解析这一过程。 1. AngularJS国际化基础原理 AngularJS采用约定优于配置的方式实现国际化，其核心思想是基于$translateProvider服务来加载不同的语言资源文件，并通过指令ng-translate或者过滤器translate动态渲染对应的语言内容。这就意味着，开发者能够根据用户的地域喜好，轻轻松松切换应用的显示语言，让不同地区的用户都感到贴心又自在。就像是个智能小助手，随时准备为用户提供母语般的使用体验。 2. 设置与配置AngularJS国际化模块首先，我们需要引入并配置angular-translate这个专门处理国际化的插件： javascript // 引入angular-translate库 var app = angular.module('myApp', ['pascalprecht.translate']); app.config(['$translateProvider', function ($translateProvider) { // 配置默认语言 $translateProvider.preferredLanguage('en'); // 加载语言资源文件 $translateProvider.useStaticFilesLoader({ prefix: 'languages/', suffix: '.json' }); // 允许模糊匹配，提高语言包利用率 $translateProvider.fallbackLanguage('en'); $translateProvider.useSanitizeValueStrategy('sanitize'); }]); 以上代码中，我们设置了默认语言为英语，并配置了静态文件加载器从指定路径加载JSON格式的语言资源文件。 3. 创建与使用语言资源文件接下来，我们需要创建对应的语言资源文件，例如languages/en.json和languages/zh-cn.json： json // languages/en.json { "greeting": "Hello, world!", "buttonText": "Click me" } // languages/zh-cn.json { "greeting": "你好，世界！", "buttonText": "点击我" } 4. 在视图层应用国际化在视图模板中，我们可以借助translate指令或过滤器来动态替换文本： html { { 'greeting' | translate } } 5. 动态切换语言最后，为了实现用户界面语言的动态切换，可以在控制器中调用 $translate.use() 方法： javascript app.controller('MainCtrl', ['$scope', '$translate', function ($scope, $translate) { $scope.changeLanguage = function (langKey) { $translate.use(langKey); }; }]); 然后在HTML中添加一个语言选择器： html English 简体中文到此为止，我们已经成功地实现了AngularJS单页应用的国际化支持。在整个这个过程中，AngularJS就像个超能小助手，它拥有无比灵活、强大，而且特别好懂的API接口，这可帮了我们大忙了！它把开发国际化功能的那些繁琐步骤给大大简化了，让我们的应用程序轻松突破语言障碍，飞向全球各地，无论哪个地区的用户，都能用自己习惯的语言来顺畅使用。这正是AngularJS让我们能够大显身手，轻松构建出跨越国界的强大Web应用的关键所在，它的价值简直不要太赞！

2023-06-23 10:38:49

376

晚秋落叶

知识学习

实践的时候请根据实际情况谨慎操作。

随机学习一条linux命令：

curl -I http://example.com - 只获取HTTP头信息。

[JSON格式响应解析实战 百度下拉词]的搜索结果

[JSON格式响应解析实战百度下拉词]的搜索结果