前端技术
HTML
CSS
Javascript
前端框架和UI库
VUE
ReactJS
AngularJS
JQuery
NodeJS
JSON
Element-UI
Bootstrap
Material UI
服务端和客户端
Java
Python
PHP
Golang
Scala
Kotlin
Groovy
Ruby
Lua
.net
c#
c++
后端WEB和工程框架
SpringBoot
SpringCloud
Struts2
MyBatis
Hibernate
Tornado
Beego
Go-Spring
Go Gin
Go Iris
Dubbo
HessianRPC
Maven
Gradle
数据库
MySQL
Oracle
Mongo
中间件与web容器
Redis
MemCache
Etcd
Cassandra
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Nacos
Consul
Tomcat
Nginx
Netty
大数据技术
Hive
Impala
ClickHouse
DorisDB
Greenplum
PostgreSQL
HBase
Kylin
Hadoop
Apache Pig
ZooKeeper
SeaTunnel
Sqoop
Datax
Flink
Spark
Mahout
数据搜索与日志
ElasticSearch
Apache Lucene
Apache Solr
Kibana
Logstash
数据可视化与OLAP
Apache Atlas
Superset
Saiku
Tesseract
系统与容器
Linux
Shell
Docker
Kubernetes
[数据压缩格式]的搜索结果
这里是文章列表。热门标签的颜色随机变换,标签颜色没有特殊含义。
点击某个标签可搜索标签相关的文章。
点击某个标签可搜索标签相关的文章。
Datax
一、引言 在大数据时代,数据是企业的核心资产,而DataX作为一款阿里巴巴开源的数据传输工具,凭借其高效稳定的特点,被广泛应用于企业级的数据同步和迁移任务中。这篇指南将手把手地带您探索DataX的核心概念,像是您的私人小助手一样,陪您一步步走过DataX的安装过程,再到搞定基本环境配置的每一步。这样一来,您的数据迁移之路绝对能走得更加顺风顺水,轻松愉快! 二、DataX简介 DataX,全称Data eXchange,是由阿里巴巴开发的一款基于Java语言编写的分布式任务调度系统,主要功能是对不同数据源(如MySQL, Oracle, HDFS等)进行数据的抽取、转换和加载(ETL),以及在不同的数据存储服务间进行数据同步。DataX这家伙,靠着他那身手不凡的高并发处理能力,还有稳如磐石的高可靠性,再加上他那广泛支持多种数据源和目标端的本领,在咱们这个行业里,可以说是混得风生水起,赚足了好口碑! 三、DataX安装准备 1. 确认操作系统兼容性 DataX支持Windows, Linux, macOS等多个主流操作系统。首先,亲,咱得先瞅瞅你电脑操作系统是啥类型、啥版本的,然后再确认一下,你的JDK版本是不是在1.8及以上哈,这一步很重要~ 2. 下载DataX 访问DataX官网(https://datax.apache.org/)下载对应的操作系统版本的DataX压缩包。比如说,如果你正在用的是Linux系统,就可以考虑下载那个最新的“apache-datax-最新版本-number.tar.gz”文件哈。 bash wget https://datax.apache.org/releases/datax-最新版本-number.tar.gz 3. 解压DataX 使用tar命令解压下载的DataX压缩包: bash tar -zxvf apache-datax-最新版本-number.tar.gz cd apache-datax-最新版本-number 四、DataX环境配置 1. 配置DataX主目录 DataX默认将bin目录下的脚本添加至系统PATH环境变量中,以便于在任何路径下执行DataX命令。根据上述解压后的目录结构,设置如下环境变量: bash export DATAX_HOME=绝对路径/to/datax-最新版本-number/bin export PATH=$DATAX_HOME:$PATH 2. 配置DataX运行时依赖 在conf目录下找到runtime.properties文件,配置JVM参数及Hadoop、Spark等运行时依赖。以下是一份参考样例: properties JVM参数配置 设置内存大小为1G yarn.appMaster.resource.memory.mb=1024 yarn.appMaster.heap.memory.mb=512 executor.resource.memory.mb=512 executor.heap.memory.mb=256 executor.instances=1 如果有Hadoop环境 hadoop.home.dir=/path/to/hadoop hadoop.security.authentication=kerberos hadoop.conf.dir=/path/to/hadoop/conf 如果有Spark环境 spark.master=local[2] spark.executor.memory=512m spark.driver.memory=512m 3. 配置DataX任务配置文件 在conf目录下创建一个新的XML配置文件,例如my_data_sync.xml,用于定义具体的源和目标数据源、数据传输规则等信息。以下是简单的配置示例: xml 0 0 五、启动DataX任务 配置完成后,我们可以通过DataX CLI命令行工具来启动我们的数据同步任务: bash $ ./bin/datax job submit conf/my_data_sync.xml 此时,DataX会按照my_data_sync.xml中的配置内容,定时从MySQL数据库读取数据,并将其写入到HDFS指定的路径上。 六、总结 通过本文的介绍,相信您已经对DataX的基本安装及配置有了初步的认识和实践。在实际操作的时候,你可能还会碰到需要根据不同的业务情况,灵活调整DataX任务配置的情况。这样一来,才能让它更好地符合你的数据传输需求,就像是给它量身定制了一样,更加贴心地服务于你的业务场景。不断探索和实践,DataX将成为您数据处理与迁移的强大助手!
2024-02-07 11:23:10
361
心灵驿站-t
转载文章
...th过日志进行筛选,格式打印 删除操作码为0x10000,可对其进行筛选 二、文件审核设置 2.1 开启文件系统审核功能 secpol.msc Advanced Audit Policy Configuration Object Access Audit File System [x] Configure the following audit events: [x] Success [x] Failure 2.2 建立共享文件夹 Folder Properties Sharing Choose people to share with Everyone 2.3 设置文件夹审核的用户组 Folder Properties Security Advanced Auditing Add user 2.4 设置日志路径及大小 Event Viewer Windows Logs Security Log Properties Log Path: E:\FileLog\Security.evtx Maximum log size(KB): 512000 [x] Archive the log when full,do not overwrite events 三、方法 筛选事件ID为4460日志 PS C:\Windows\system32> Get-WinEvent -LogName Security -FilterXPath "[System[EventID=4660]]"ProviderName: Microsoft-Windows-Security-AuditingTimeCreated Id LevelDisplayName Message----------- -- ---------------- -------5/22/2018 10:01:37 AM 4660 Information An object was deleted....5/22/2018 9:03:11 AM 4660 Information An object was deleted.... 筛选文件删除日志 PS C:\Windows\system32> Get-WinEvent -LogName "Security" -FilterXPath "[EventData[Data[@Name='AccessMask']='0x10000']]"ProviderName: Microsoft-Windows-Security-AuditingTimeCreated Id LevelDisplayName Message----------- -- ---------------- -------5/22/2018 10:01:37 AM 4663 Information An attempt was made to access an object....5/22/2018 9:03:11 AM 4663 Information An attempt was made to access an object.... 筛选指定用户文件删除日志 PS C:\Windows\system32> Get-WinEvent -LogName "Security" -FilterXPath "[EventData[Data[@Name='AccessMask']='0x10000']] and [EventData[Data[@Name='SubjectUserName']='lxy']]"ProviderName: Microsoft-Windows-Security-AuditingTimeCreated Id LevelDisplayName Message----------- -- ---------------- -------5/22/2018 9:03:11 AM 4663 Information An attempt was made to access an object.... 以变量方式筛选指定用户文件删除日志 PS C:\Windows\system32> $AccessMask='0x10000'PS C:\Windows\system32> $UserName='lxy'PS C:\Windows\system32> Get-WinEvent -LogName "Security" -FilterXPath "[EventData[Data[@Name='AccessMask']='$AccessMask']] and [EventData[Data[@Name='SubjectUserName']='$UserName']]"ProviderName: Microsoft-Windows-Security-AuditingTimeCreated Id LevelDisplayName Message----------- -- ---------------- -------5/22/2018 9:03:11 AM 4663 Information An attempt was made to access an object.... 从保存的文件筛选文件删除日志 PS C:\Users\F2844290> Get-WinEvent -Path 'C:\Users\F2844290\Desktop\SaveSec.evtx' -FilterXPath "[EventData[Data[@Name='AccessMask']='0x10000']]"PS C:\Windows\system32> $AccessMask='0x10000' 筛选10分钟内发生的安全性日志 XML中时间计算单位为ms,10minute=60 10 1000=600000 PS C:\Windows\system32> Get-WinEvent -LogName Security -FilterXPath "[System[TimeCreated[timediff(@SystemTime) < 600000]]]"ProviderName: Microsoft-Windows-Security-AuditingTimeCreated Id LevelDisplayName Message----------- -- ---------------- -------5/22/2018 4:11:30 PM 4663 Information An attempt was made to access an object....5/22/2018 4:11:30 PM 4663 Information An attempt was made to access an object....5/22/2018 4:11:30 PM 4663 Information An attempt was made to access an object....5/22/2018 4:11:30 PM 4663 Information An attempt was made to access an object.... 其它筛选方法 若有语法不明之处,可参考日志管理器中筛选当前日志的XML方法。 删除超过60天的存档日志并记录 Get-ChildItem E:\FileLog\Archive-Security- | Where-Object {if(( (get-date) - $_.CreationTime).TotalDays -gt 60 ){Remove-Item $_.FullName -ForceWrite-Output "$(Get-Date -UFormat "%Y/%m%d")t$_.Name" >>D:\RoMove-Archive-Logs.txt} } 四、其它文件 文件删除日志结构 Log Name: SecuritySource: Microsoft-Windows-Security-AuditingDate: 5/22/2018 9:03:11 AMEvent ID: 4663Task Category: File SystemLevel: InformationKeywords: Audit SuccessUser: N/AComputer: IDX-ST-05Description:An attempt was made to access an object.Subject:Security ID: IDX-ST-05\lxyAccount Name: lxyAccount Domain: IDX-ST-05Logon ID: 0x2ed3b8Object:Object Server: SecurityObject Type: FileObject Name: C:\Data\net.txtHandle ID: 0x444Process Information:Process ID: 0x4Process Name: Access Request Information:Accesses: DELETEAccess Mask: 0x10000Event Xml:<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"><System><Provider Name="Microsoft-Windows-Security-Auditing" Guid="{54849625-5478-4994-A5BA-3E3B0328C30D}" /><EventID>4663</EventID><Version>0</Version><Level>0</Level><Task>12800</Task><Opcode>0</Opcode><Keywords>0x8020000000000000</Keywords><TimeCreated SystemTime="2018-05-22T01:03:11.876720000Z" /><EventRecordID>1514</EventRecordID><Correlation /><Execution ProcessID="4" ThreadID="72" /><Channel>Security</Channel><Computer>IDX-ST-05</Computer><Security /></System><EventData><Data Name="SubjectUserSid">S-1-5-21-1815651738-4066643265-3072818021-1004</Data><Data Name="SubjectUserName">lxy</Data><Data Name="SubjectDomainName">IDX-ST-05</Data><Data Name="SubjectLogonId">0x2ed3b8</Data><Data Name="ObjectServer">Security</Data><Data Name="ObjectType">File</Data><Data Name="ObjectName">C:\Data\net.txt</Data><Data Name="HandleId">0x444</Data><Data Name="AccessList">%%1537</Data><Data Name="AccessMask">0x10000</Data><Data Name="ProcessId">0x4</Data><Data Name="ProcessName"></Data></EventData></Event> 文件操作码表 File ReadAccesses: ReadData (or ListDirectory)AccessMask: 0x1File WriteAccesses: WriteData (or AddFile)AccessMask: 0x2File DeleteAccesses: DELETEAccessMask: 0x10000File RenameAccesses: DELETEAccessMask: 0x10000File CopyAccesses: ReadData (or ListDirectory)AccessMask: 0x1File Permissions ChangeAccesses: WRITE_DACAccessMask: 0x40000File Ownership ChangeAccesses: WRITE_OWNERAccessMask: 0x80000 转载于:https://blog.51cto.com/linxy/2119150 本篇文章为转载内容。原文链接:https://blog.csdn.net/weixin_34112900/article/details/92532120。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-11-12 11:51:46
151
转载
转载文章
...器脚本 前期准备 按格式排好公开号或者申请号,在编辑器中打开; 把google patent搜索页面和文本编辑器分屏显示,便于操作。 脚本原理 以edge浏览器为例,按键精灵双击全选文本中第一行的公开号,ctrl+c复制,鼠标转到网页搜索框,ctrl+v粘贴,点搜索。等搜索完成右键download PDF,选链接另存为并确定,之后点击网页关闭下载栏,一次下载完成。返回编辑器,删除第一行的文本,把第二行提到第一行,完成复位。 这样就形成了完整的一次过程,只要重复运行脚本就可以把所有专利全文下载下来。 注意事项 实际操作中,可能遇到两大问题: 网页反馈问题 这里指的是搜索后没有来到我们想象中的专利页,可能是没有搜索到专利,或该专利google patent没有pdf文档,这时如果脚本还在运行,那么显然就会错误运行。 脚本运行问题 主要要考虑的是命令之间的延时。延时调小确实运行速度会变快,但是如果电脑运行速度不够或者网速/服务器慢了,就会错误执行命令。我的建议是文本操作可以适当删减延时,涉及网页的部分适量增加延时,保证脚本的容错率。 由此可以看出来这个脚本还是离不开人的,在跑的时候还是需要盯着点,如果有错误可以及时处理。 检查下载效果 看了上面的注意事项,想必你也知道这个脚本不太靠谱。那么解决这个问题的方法就是负反馈。下载完了检查一遍就好了。 由于google patent下载的文件是以公开号命名的,所以对照要下载的和已下载的公开号就能看出哪些专利没有下载成功。 我这里写了一个python小脚本。 import pandas as pdimport os读取待下载专利的公开号,地址修改成你自己存放的位置df = pd.read_excel("target.xlsx",header= 0, usecols= "B").drop_duplicates()取前11位作为对比(以中国专利作为参考)PublicNumber_tgt = list(map(lambda x: x[0:11],df["公开(公告)号"].to_list()))读取已下载专利的公开号,地址修改成你自己存放的位置filelist=os.listdir(r'C:\Users\mornthx\Desktop\专利全文')取前11位作为对比PublicNumber_dl = list(map(lambda x: x[0:11],filelist))比较两者差值diff = set(PublicNumber_tgt).difference(set(PublicNumber_dl))print(diff) 没下载的专利具体问题具体解决就好了。 希望能帮到大家! 本篇文章为转载内容。原文链接:https://blog.csdn.net/weixin_38688347/article/details/124000919。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-11-21 12:55:28
274
转载
Go-Spring
...N、YAML或XML格式的配置文件。下面是一个简单的JSON配置文件示例: json { "app": { "name": "MyApp", "version": "1.0.0", "environment": "development" }, "database": { "host": "localhost", "port": 5432, "username": "myuser", "password": "mypassword", "dbname": "mydb" } } 在Go代码中,我们可以使用yaml或json包来解析这个配置文件: go package main import ( "encoding/json" "fmt" "io/ioutil" "log" "github.com/spf13/viper" ) func main() { viper.SetConfigFile("config.json") // 设置配置文件路径 if err := viper.ReadInConfig(); err != nil { // 读取配置文件 log.Fatalf("Error reading config file: %v", err) } // 获取配置数据 appName := viper.GetString("app.name") appVersion := viper.GetString("app.version") dbHost := viper.GetString("database.host") fmt.Printf("应用名称:%s, 版本:%s, 数据库主机:%s\n", appName, appVersion, dbHost) } 通过这种方式,我们可以在不修改代码的情况下,通过更改配置文件来改变应用的行为,极大地提高了应用的可维护性和灵活性。 四、整合环境变量与配置文件 在实际项目中,通常会结合使用环境变量和配置文件来实现更复杂的配置管理。例如,可以通过环境变量来控制配置文件的加载路径,或者根据环境变量的值来选择使用特定的配置文件: go package main import ( "os" "path/filepath" "testing" "github.com/spf13/viper" ) func main() { // 设置环境变量 os.Setenv("CONFIG_PATH", "path/to/your/config") // 读取配置文件 viper.SetConfigType("yaml") // 根据你的配置文件类型进行设置 viper.AddConfigPath(os.Getenv("CONFIG_PATH")) // 添加配置文件搜索路径 err := viper.ReadInConfig() if err != nil { log.Fatalf("Error reading config file: %v", err) } // 获取配置数据 // ... } 通过这种方式,我们可以根据不同环境(如开发、测试、生产)使用不同的配置文件,同时利用环境变量动态调整配置路径,实现了高度灵活的配置管理。 结语 GoSpring框架通过支持环境变量和配置文件的集成,为开发者提供了强大的工具来管理应用配置。哎呀,这种灵活劲儿啊,可真是帮了大忙!它就像个魔法师,能让你的开发工作变得轻松愉快,效率嗖嗖的往上窜。而且,别看它这么灵巧,稳定性却是一点儿也不含糊。不管是在哪个环境里施展它的魔法,都能保持一贯的好状态,稳如泰山。这就像是你的小伙伴,无论走到哪儿,都能给你带来安全感和惊喜,你说赞不赞?哎呀,兄弟,你懂的,现在咱们的应用就像个大家庭,人多了,事儿也杂了,对吧?这时候,怎么管好这个家庭,让每个人都各司其职,不乱套,就显得特别重要了。这就得靠咱们合理的配置管理策略来搞定。比如说,得有个清晰的分工,谁负责啥,一目了然;还得有规矩,比如更新软件得按流程来,不能随随便便;还得有监控,随时看看家里人都在干啥,有问题能及时发现。这样,咱们的应用才能健健康康地成长,不出岔子。所以,合理的配置管理策略,简直就是咱们应用界的定海神针啊!嘿,兄弟!这篇文章就是想给你开开小灶,让你能轻松掌握 GoSpring 在配置管理这块儿的厉害之处。别担心,我不会用一堆冰冷的术语把你吓跑,咱俩就像老朋友聊天一样,把这玩意儿讲得跟吃饭喝水一样简单。跟着我,你就能发现 GoSpring 配置管理有多牛逼,怎么用都顺手,让你的工作效率嗖嗖地往上涨!咱们一起探索,一起享受技术带来的乐趣吧!
2024-09-09 15:51:14
75
彩虹之上
NodeJS
...应用是指能够实现实时数据交换和互动的应用程序,如在线聊天室、协同编辑文档工具等。这类应用通常依赖于WebSocket、Socket.IO等技术,以确保信息能够近乎实时地在客户端与服务器之间双向传输。 RESTful API , RESTful API是一种基于HTTP协议,遵循Representational State Transfer(表述性状态转移)设计原则构建的应用程序接口。它通过HTTP方法(GET、POST、PUT、DELETE等)来操作资源,并且具有统一接口格式,便于不同系统之间的数据交互。 AWS Lambda , AWS Lambda是Amazon Web Services提供的无服务器计算服务。用户可以在Lambda上部署和执行代码片段(函数),而无需预置或管理服务器。Lambda根据触发器(如API调用、文件上传等事件)自动执行代码,并按实际执行时间计费,从而实现高度可扩展性和成本效益。 npm , npm(Node Package Manager)是Node.js的包管理器,提供了便捷的方式来安装、共享和更新Node.js模块。开发者可以通过npm从全球最大的开源JavaScript软件库下载第三方代码包,以便在自己的项目中复用他人开发的功能组件,极大地提高了开发效率。
2024-01-24 17:58:24
145
青春印记-t
Flink
...高效的容错机制,在大数据领域备受青睐。嘿,伙计们,这篇文咱就一起钻探钻探Flink这家伙在实际生产环境里,是如何靠着它的容错机制稳稳当当地发挥作用的。咱们会手把手通过实例代码,扒开它的“内脏”,瞅瞅这背后的运作原理究竟是啥。再结合几个实实在在的应用场景,来场接地气儿的讨论。现在,大伙儿准备好,咱们这就踏入Flink的世界,亲自体验一下它是如何帮助企业在汹涌澎湃的数据海洋中,稳稳地把舵,赢得胜利的! 二、Flink容错机制概述 1. Checkpointing与Savepoints Flink的核心容错机制基于checkpointing和savepoints。Checkpointing,这个过程就像是Flink系统的“备忘录机制”。它会时不时地把运行状态给记下来,存到一个超级稳定、不会丢数据的地方。设想一下,如果系统突然闹个小脾气,出个故障啥的,别担心,Flink能够迅速翻开最近一次顺利完成的那个“备忘录”,接着从那里继续干活儿,这样一来,处理数据的时候就能保证绝对精确无误,实现我们常说的“精确一次”语义啦。而Savepoints则是在用户自定义的时间点创建的检查点,常用于计划内的维护或作业升级等操作。 java env.enableCheckpointing(5000); // 每5秒生成一个checkpoint env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE); 2. 状态后端与异步快照 Flink支持多种状态后端,如MemoryStateBackend、FileSystemStateBackend和 RocksDBStateBackend等,它们负责在checkpoint过程中持久化和恢复状态。同时,Flink采用了异步快照技术来最小化checkpoint对正常数据处理的影响,确保性能和稳定性。 三、Flink容错机制实战分析 3.1 故障恢复示例 假设我们正在使用Flink处理实时交易流,如下所示: java DataStream transactions = env.addSource(new TransactionSource()); transactions .keyBy(Transaction::getAccountId) .process(new AccountProcessor()) .addSink(new TransactionSink()); 在此场景下,若某个TaskManager节点突然宕机,由于Flink已经开启了checkpoint功能,系统会自动检测到故障并从最新的checkpoint重新启动任务,使得整个应用状态恢复到故障前的状态,从而避免数据丢失和重复处理的问题。 3.2 保存及恢复Savepoints java // 创建并触发Savepoint String savepointPath = "hdfs://path/to/savepoint"; env.executeSavepoint(savepointPath, true); // 从Savepoint恢复作业 StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); env.restore(savepointPath); 四、Flink容错机制在生产环境中的价值体现 在真实的生产环境中,硬件故障、网络抖动等问题难以避免,Flink的容错机制就显得尤为重要。它就像是企业的“守护神”,每当遇到突发状况,都能以迅雷不及掩耳之势,把系统瞬间恢复到正常状态。这样一来,业务中断的时间就能被压缩到最小,保证数据的完整性和一致性,让整体服务更加坚韧、更值得信赖,就像一位永不疲倦的超级英雄,时刻为企业保驾护航。 五、总结与思考 当我们深度剖析并实践Flink的容错机制后,不难发现它的设计之精妙与实用。Flink这个家伙可厉害了,它不仅能确保数据处理的精准无误,就像个严谨的会计师,连一分钱都不会算错。而且在实际工作中,面对各类突发状况,它都能稳如泰山,妥妥地hold住全场,为咱们打造那个既靠谱又高效的大型数据处理系统提供了强大的后盾支持。今后,越来越多的企业会把Flink当作自家数据处理的主力工具,我敢肯定,它的容错机制将在更多实际生产场景中大显身手,效果绝对会越来越赞! 然而,每个技术都有其适用范围和优化空间,我们在享受Flink带来的便利的同时,也应持续关注其发展动态,根据业务特点灵活调整和优化容错策略,以期在瞬息万变的数据世界中立于不败之地。
2023-10-06 21:05:47
389
月下独酌
Dubbo
...程序用来指定日志输出格式、目的地(如控制台、文件、数据库等)、过滤规则以及日志级别等信息的配置文件。在Dubbo框架中,若日志配置文件内容有误,则可能造成日志输出异常,使得开发者无法通过日志获取到有效信息,以了解系统的运行状态和排查问题。例如,在文章中提到的logback.xml即为基于Logback的日志框架所使用的配置文件,其中的错误配置会直接影响到Dubbo应用的日志记录功能。
2023-06-21 10:00:14
435
春暖花开-t
MySQL
当我们面对海量数据要处理的时候,常常会遇到这样的情况:得把数据从一个系统里乾坤大挪移到另一个系统里头去。在这个环节,咱们要一起学习一个实用技巧,就是如何运用Apache Sqoop这个工具,把存放在HDFS里的数据“搬”到MySQL数据库里去。 为什么要将HDFS数据导出到MySQL? Hadoop Distributed File System (HDFS) 是一种分布式文件系统,可以存储大量数据并提供高可用性和容错性。不过呢,HDFS这家伙可不懂SQL查询这门子事儿,所以啊,如果我们想对数据进行更深度的分析和复杂的查询操作,就得先把数据从HDFS里导出来,然后存到像是MySQL这样的SQL数据库中才行。 步骤一:设置环境 首先,我们需要确保已经安装了所有必要的工具和软件。以下是您可能需要的一些组件: - Apache Sqoop:这是一个用于在Hadoop和关系型数据库之间进行数据迁移的工具。 - MySQL:这是一个流行的开源关系型数据库管理系统。 - Java Development Kit (JDK):这是开发Java应用程序所必需的一组工具。 在Windows上,你可以在这里找到Java JDK的下载链接:https://www.oracle.com/java/technologies/javase-downloads.html 。在MacOS上,你可以在这里找到Java JDK的下载链接:https://jdk.java.net/15/ 步骤二:配置Hadoop和MySQL 在开始之前,请确保您的Hadoop和MySQL已经正确配置并运行。 对于Hadoop,您可以查看以下教程:https://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-common/SingleCluster.html 对于MySQL,您可以参考官方文档:https://dev.mysql.com/doc/refman/8.0/en/installing-binary-packages.html 步骤三:创建MySQL表 在开始导出数据之前,我们需要在MySQL中创建一个表来存储数据。以下是一个简单的例子: CREATE TABLE students ( id int(11) NOT NULL AUTO_INCREMENT, name varchar(45) DEFAULT NULL, age int(11) DEFAULT NULL, PRIMARY KEY (id) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; 这个表将包含学生的ID、姓名和年龄字段。 步骤四:编写Sqoop脚本 现在我们可以使用Sqoop将HDFS中的数据导入到MySQL表中。以下是一个基本的Sqoop脚本示例: bash -sqoop --connect jdbc:mysql://localhost:3306/test \ -m 1 \ --num-mappers 1 \ --target-dir /user/hadoop/students \ --delete-target-dir \ --split-by id \ --as-textfile \ --fields-terminated-by '|' \ --null-string 'NULL' \ --null-non-string '\\N' \ --check-column id \ --check-nulls \ --query "SELECT id, name, age FROM students WHERE age > 18" 这个脚本做了以下几件事: - 使用--connect选项连接到MySQL服务器和测试数据库。 - 使用-m和--num-mappers选项设置映射器的数量。在这个例子中,我们只有一个映射器。 - 使用--target-dir选项指定输出目录。在这个例子中,我们将数据导出到/user/hadoop/students目录下。 - 使用--delete-target-dir选项删除目标目录中的所有内容,以防数据冲突。 - 使用--split-by选项指定根据哪个字段进行拆分。在这个例子中,我们将数据按学生ID进行拆分。 - 使用--as-textfile选项指定数据格式为文本文件。 - 使用--fields-terminated-by选项指定字段分隔符。在这个例子中,我们将字段分隔符设置为竖线(|)。 - 使用--null-string和--null-non-string选项指定空值的表示方式。在这个例子中,我们将NULL字符串设置为空格,将非字符串空值设置为\\N。 - 使用--check-column和--check-nulls选项指定检查哪个字段和是否有空值。在这个例子中,我们将检查学生ID是否为空,并且如果有,将记录为NULL。 - 使用--query选项指定要从中读取数据的SQL查询语句。在这个例子中,我们只选择年龄大于18的学生。 请注意,这只是一个基本的示例。实际的脚本可能会有所不同,具体取决于您的数据和需求。 步骤五:运行Sqoop脚本 最后,我们可以使用以下命令运行Sqoop脚本: bash -sqoop \ -Dmapreduce.job.user.classpath.first=true \ --libjars $SQOOP_HOME/lib/mysql-connector-java-8.0.24.jar \ --connect jdbc:mysql://localhost:3306/test \ -m 1 \ --num-mappers 1 \ --target-dir /user/hadoop/students \ --delete-target-dir \ --split-by id \ --as-textfile \ --fields-terminated-by '|' \ --null-string 'NULL' \ --null-non-string '\\N' \ --check-column id \ --check-nulls \ --query "SELECT id, name, age FROM students WHERE age > 18" 注意,我们添加了一个-Dmapreduce.job.user.classpath.first=true参数,这样就可以保证我们的自定义JAR包在任务的classpath列表中处于最前面的位置。 如果一切正常,我们应该可以看到一条成功的消息,并且可以在MySQL中看到导出的数据。 总结 本文介绍了如何使用Apache Sqoop将HDFS中的数据导出到MySQL数据库。咱们先给环境捯饬得妥妥当当,然后捣鼓出一个MySQL表,再接再厉,编了个Sqoop脚本。最后,咱就让这个脚本大展身手,把数据导出溜溜的。希望这篇文章能帮助你解决这个问题!
2023-04-12 16:50:07
247
素颜如水_t
转载文章
...传输方式:HTTP 数据格式:JSON 签名算法:MD5 字符编码:UTF-8 [API]查询商户信息与结算规则 URL地址:http://pay.lqan.cn/api.php?act=query&pid={商户ID}&sign={签名字符串} 请求参数说明: 字段名变量名必填类型示例值描述 操作类型act是Stringquery此API固定值 商户IDpid是Int1001 签名字符串sign是String67d12af9ddbe38d9c7b0931ad102ca3c签名算法与支付宝签名算法相同 返回结果: 字段名变量名类型示例值描述 返回状态码codeInt11为成功,其它值为失败 商户IDpidInt1001所创建的商户ID 商户密钥keyString(32)89unJUB8HZ54Hj7x4nUj56HN4nUzUJ8i所创建的商户密钥 商户类型typeInt1此值暂无用 商户状态activeInt11为正常,0为封禁 商户余额moneyString0.00商户所拥有的余额 结算账号accountString1070077170@qq.com结算的支付宝账号 结算姓名usernameString张三结算的支付宝姓名 满多少自动结算settle_moneyString30此值为系统预定义 手动结算手续费settle_feeString1此值为系统预定义 每笔订单分成比例money_rateString98此值为系统预定义 [API]查询结算记录 URL地址:http://pay.lqan.cn/api.php?act=settle&pid={商户ID}&sign={签名字符串} 请求参数说明: 字段名变量名必填类型示例值描述 操作类型act是Stringsettle此API固定值 商户IDpid是Int1001 签名字符串sign是String67d12af9ddbe38d9c7b0931ad102ca3c签名算法与支付宝签名算法相同 返回结果: 字段名变量名类型示例值描述 返回状态码codeInt11为成功,其它值为失败 返回信息msgString查询结算记录成功! 结算记录dataArray结算记录列表 [API]查询单个订单 URL地址:http://pay.lqan.cn/api.php?act=order&pid={商户ID}&out_trade_no={商户订单号}&sign={签名字符串} 请求参数说明: 字段名变量名必填类型示例值描述 操作类型act是Stringorder此API固定值 商户IDpid是Int1001 商户订单号out_trade_no是String20160806151343349 签名字符串sign是String67d12af9ddbe38d9c7b0931ad102ca3c签名算法与支付宝签名算法相同 返回结果: 字段名变量名类型示例值描述 返回状态码codeInt11为成功,其它值为失败 返回信息msgString查询订单号成功! 易支付订单号trade_noString2016080622555342651凉秋易支付订单号 商户订单号out_trade_noString20160806151343349商户系统内部的订单号 支付方式typeStringalipayalipay:支付宝,tenpay:财付通, qqpay:QQ钱包,wxpay:微信支付 商户IDpidInt1001发起支付的商户ID 创建订单时间addtimeString2016-08-06 22:55:52 完成交易时间endtimeString2016-08-06 22:55:52 商品名称nameStringVIP会员 商品金额moneyString1.00 支付状态statusInt01为支付成功,0为未支付 [API]批量查询订单 URL地址:http://pay.lqan.cn/api.php?act=orders&pid={商户ID}&sign={签名字符串} 请求参数说明: 字段名变量名必填类型示例值描述 操作类型act是Stringorders此API固定值 商户IDpid是Int1001 查询订单数量limit否Int20返回的订单数量,最大50 签名字符串sign是String67d12af9ddbe38d9c7b0931ad102ca3c签名算法与支付宝签名算法相同 返回结果: 字段名变量名类型示例值描述 返回状态码codeInt11为成功,其它值为失败 返回信息msgString查询结算记录成功! 订单列表dataArray订单列表 [API]支付订单退款 URL地址:http://pay.lqan.cn/api.php?act=refund&pid={商户ID}&out_trade_no={商户订单号}&sign={签名字符串} 只支持微信官方、QQ钱包官方、当面付退款 请求参数说明: 字段名变量名必填类型示例值描述 操作类型act是Stringrefund此API固定值 商户IDpid是Int1001 商户订单号out_trade_no是Int1000 退款原因desc否String 退款金额money否Double20.00不填默认退全款 签名字符串sign是String67d12af9ddbe38d9c7b0931ad102ca3c签名算法与支付宝签名算法相同 返回结果: 字段名变量名类型示例值描述 返回状态码codeInt11为成功,其它值为失败 返回信息msgString退款成功! 发起支付请求 URL地址:http://pay.lqan.cn/submit.php?pid={商户ID}&type={支付方式}&out_trade_no={商户订单号}¬ify_url={服务器异步通知地址}&return_url={页面跳转通知地址}&name={商品名称}&money={金额}&sitename={网站名称}&sign={签名字符串}&sign_type=MD5 请求参数说明: 字段名变量名必填类型示例值描述 商户IDpid是Int1001 支付方式type是Stringalipayalipay:支付宝,tenpay:财付通, qqpay:QQ钱包,wxpay:微信支付 商户订单号out_trade_no是String20160806151343349 异步通知地址notify_url是Stringhttp://域名/notify_url.php服务器异步通知地址 跳转通知地址return_url是Stringhttp://域名/return_url.php页面跳转通知地址 商品名称name是StringVIP会员 商品金额money是String1.00 网站名称sitename否String某某某平台 签名字符串sign是String202cb962ac59075b964b07152d234b70签名算法与支付宝签名算法相同 签名类型sign_type是StringMD5默认为MD5 支付结果通知 通知类型:服务器异步通知(notify_url)、页面跳转通知(return_url) 请求方式:GET 特别说明:回调成功之后请输出 SUCCESS字符串,如果没有收到商户响应的SUCCESS字符串,系统将通过策略重新通知5次,通知频率为15s/60s/3m/30m/1h 请求参数说明: 字段名变量名必填类型示例值描述 商户IDpid是Int1001 易支付订单号trade_no是String20160806151343349021凉秋易支付订单号 商户订单号out_trade_no是String20160806151343349商户系统内部的订单号 支付方式type是Stringalipayalipay:支付宝,tenpay:财付通, qqpay:QQ钱包,wxpay:微信支付 商品名称name是StringVIP会员 商品金额money是String1.00 支付状态trade_status是StringTRADE_SUCCESS 签名字符串sign是String202cb962ac59075b964b07152d234b70签名算法与支付宝签名算法相同 签名类型sign_type是StringMD5默认为MD5 签名算法 请对参数按照键名进行降序排序(a-z)sign sign_type 和空值不进行签名!。 排序后请操作参数生成或拼接一个url请求字符串 例如 a=b&c=d&e=f (Url值不能携带参数!不要进行urlencode) 再将拼接好的请求字符串与平台生成的Key进行MD5加密得出sign签名参数 MD5 ( a=b&c=d&e=f + KEY ) (注意:+ 为各语言的拼接符!不是字符!) 本篇文章为转载内容。原文链接:https://blog.csdn.net/weixin_39620334/article/details/115933932。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-12-18 16:55:58
91
转载
转载文章
...文件,支持的配置文件格式有:.babelrc,.babelrc.js,babel.config.js和package.json。它们的配置项都是相同,作用也是一样的,只需要选择其中一种,推荐使用.js结尾的文件,这样可以在配置文件中进行编程控制,如下: module.exports = function (api) {api.cache(true);const presets = [ ... ];const plugins = [ ... ];return {presets,plugins};} 也可以直接使用module.exports = {},没有必要一定是一个function。 在编写配置文件中,最主要的就是设置plugins(插件)和presets(预设),每个插件或预设都是一个npm包,插件和预设会在编译过程中把我们的ES6+代码转换成ES5。 二、插件和预设的关系 babel中的插件太多,以es2015为例: @babel/plugin-transform-arrow-functions @babel/plugin-transform-block-scoped-functions @babel/plugin-transform-block-scoping .... 如果只采用插件的话,我们需要配置非常多的插件数组,如果项目使用了es2016又得增加一堆,而且我们压根也记不住哪个es版本里该使用哪些插件。 preset就是解决这个问题的,它是一系列插件的集合,以@babel/preset-env为例,假设项目中安装的npm包版本是2020年1月发布的,那么这个预设里包含了2020年1月以前所有进入到stage4阶段的语法转换插件。 可能有小伙伴会问,假如我设置了一个语法插件,指定某个预设里又包含了插件,此时会发生什么?这就涉及到插件和预设的执行顺序了,具体的规则如下: 插件比预设先执行 插件执行顺序是插件数组从前向后执行 预设执行顺序是预设数组从后向前执行 三、插件和预设的参数 不配置参数的情况下,每个插件或预设都是数组中的一个字符串成员,例:preset:["@babel/preset-env","@babel/preset-react"],如果某个插件或预设需要配置参数,成员项就需要由字符串换成一个数组,数组的第一项是插件或预设的名称字符串,第二项为对象,该对象用来设置插件或预设的参数,格式如下: {"presets": [["@babel/preset-env",{"useBuiltIns": "entry"}]]} 四、插件和预设的简写 插件或可以在配置文件里用简写名称,如果插件的npm包名称的前缀为 babel-plugin-,可以省略前缀。例如"plugins": ["babel-plugin-transform-decorators-legacy"]可以简写为"plugins": ["transform-decorators-legacy"]。 如果npm包名称的前缀带有作用域@,例如@scope/babel-plugin-xxx,短名称可以写成@scope/xxx。 到babel7版本时,官方的插件大多采用@babel/plugin-xxx格式的,没有明确说明是否可以省略@babel/plugin-,遇到这中npm包时,最好还是采用全称写法比较稳妥。 预设的短名称规则跟插件差不多,前缀为babel-preset-或带有作用域的包@scope/babel-preset-xxx的可以省略掉babel-preset-。 babel7里@babel/preset-前缀开头的包,例如@babel/preset-env的短名称是@babel/env,官方并没有给出明确说明以@babel/preset-xxx卡头的包是否都可以采用简写,因此最好还是采用全称。 五、混乱的babel6预设 如果直接接触babel7的前端同事都知道es预设直接用@babel/preset-env就行了,但是如果要维护和迭代基于babel6的项目呢?各个项目中使用的可能都不一样,babel-preset-es20xx、babel-preset-stage-x、babel-preset-latest这些预设是啥意思? babel-preset-es20xx: TC39每年发布的、进入标准的ES语法转换器预设,最后一个预设是babel-preset-es2017,不再更新。 babel-preset-stage-x: TC39每年草案阶段的ES语法转换器预设。x的值是0到3,babel7时已废弃,不再更新。 babel-preset-latest: TC39每年发布的、进入标准的ES语法转换器预设。在babel6时等于babel-preset-es2015、babel-preset-es2016、babel-preset-es2017。该包从 v2 开始,需要@babel/core@^7.0.0,也就是需要babel7才能使用,既然要升级到babel7,不如使用更加强大的@babel/preset-env。 本篇文章为转载内容。原文链接:https://blog.csdn.net/douyinbuwen/article/details/123729828。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2024-01-16 22:15:54
121
转载
Golang
...设你的应用程序需要从数据库读取数据,但数据库连接失败了。一个好的错误信息可能是:“无法连接到数据库,请检查您的网络连接或联系管理员。这种信息不仅说清楚了问题的来龙去脉(就是数据库连不上),还给咱指了个大概的解决方向呢。 3. 实践中的错误处理 在实际项目中,错误处理是一个贯穿始终的过程。从最简单的错误检查,到复杂的错误链路追踪,每一步都至关重要。让我们来看几个具体的例子,看看如何在Go中实现有效的错误处理。 3.1 基础的错误检查 最基本也是最常见的错误处理方式,就是在函数调用后立即检查返回的错误值。如果错误不为nil,则进一步处理。 go func main() { file, err := os.Open("test.txt") if err != nil { fmt.Println("打开文件失败:", err) return } defer file.Close() // 继续处理文件... } 在这个例子中,我们尝试打开一个名为“test.txt”的文件。如果文件不存在或者权限不足等导致操作失败,os.Open()会返回一个非空的错误对象。通过检查这个错误对象,我们可以及时发现并处理问题。 3.2 使用错误链路 在复杂的应用中,一个操作可能会触发多个后续步骤,每个步骤都可能产生新的错误。在这种情况下,错误链路(即错误传播)变得尤为重要。我们可以利用Go语言的多返回值特性来实现这一点。 go func readConfig(filePath string) (map[string]string, error) { file, err := os.Open(filePath) if err != nil { return nil, fmt.Errorf("打开配置文件失败: %w", err) } defer file.Close() var config map[string]string decoder := json.NewDecoder(file) if err := decoder.Decode(&config); err != nil { return nil, fmt.Errorf("解析配置文件失败: %w", err) } return config, nil } func main() { config, err := readConfig("config.json") if err != nil { log.Fatalf("读取配置文件失败: %v", err) } // 使用配置... } 在这个例子中,readConfig函数尝试打开并解析一个JSON格式的配置文件。如果任何一步失败,我们都会返回一个包含原始错误的错误对象。这样做不仅可以让错误信息更加完整,还便于我们在调用方进行统一处理。 3.3 自定义错误类型 虽然标准库提供的error接口已经足够强大,但在某些场景下,我们可能需要更丰富的错误信息。这时,可以定义自己的错误类型来扩展功能。 go type MyError struct { Message string Code int } func (e MyError) Error() string { return fmt.Sprintf("错误代码%d: %s", e.Code, e.Message) } func doSomething() error { return &MyError{Message: "操作失败", Code: 500} } func main() { err := doSomething() if err != nil { log.Printf("发生错误: %v", err) } } 在这个例子中,我们定义了一个自定义错误类型MyError,它包含了一个消息和一个错误码。这样做的好处是可以根据不同的错误码采取不同的处理策略。 4. 错误信息的最佳实践 最后,我想分享一些我在日常开发中积累的经验,这些经验有助于写出更好的错误信息。 - 明确且具体:错误信息应该直接指出问题所在,避免模糊不清的描述。 - 用户友好的:对于最终用户可见的错误信息,尽量使用通俗易懂的语言。 - 提供解决方案:如果可能的话,给出一些基本的解决建议。 - 避免泄露敏感信息:在生成错误信息时,注意不要暴露敏感数据,如密码或密钥。 结语 错误信息是我们与程序之间的桥梁,它能帮助我们更好地理解问题所在,并找到解决问题的方法。在Go语言里,错误处理不仅仅是个技术活儿,它还代表着一种态度——就是要做出高质量的软件的那种执着精神。希望通过这篇文章,你能在未来的项目中更加重视错误信息的处理,从而写出更加健壮和可靠的代码。 --- 以上内容结合了理论与实践,旨在让你对Go语言中的错误处理有更深的理解。记住,好的错误信息就像是一位优秀的导游,它能带你穿越迷雾,找到正确的方向。
2024-11-09 16:13:46
127
桃李春风一杯酒
ActiveMQ
...骤: 1. 统一消息格式 确保所有语言版本的客户端都使用相同的协议和数据格式,如JSON或XML,以减少跨语言通信的复杂性。 2. 使用统一的API 尽管不同语言有不同的客户端库,但它们都应该遵循统一的API规范,这样可以简化开发和维护。 3. 配置共享资源 在部署时,确保所有语言环境都能访问到同一台ActiveMQ服务器,或者设置多个独立的服务器实例来满足不同语言环境的需求。 4. 性能优化 针对不同语言环境的特点进行性能调优,例如,对于并发处理需求较高的语言(如Java),可能需要更精细地调整ActiveMQ的参数。 示例代码(Python): 利用Apache Paho库来接收刚刚发送的消息: python import paho.mqtt.client as mqtt import json def on_connect(client, userdata, flags, rc): print("Connected with result code "+str(rc)) client.subscribe("myQueue") def on_message(client, userdata, msg): message = json.loads(msg.payload.decode()) print("Received message:", message) client = mqtt.Client() client.on_connect = on_connect client.on_message = on_message client.connect("localhost", 1883, 60) client.loop_forever() 三、实践案例 多语言环境下的一体化消息系统 在一家电商公司中,我们面临了构建一个支持多语言环境的实时消息系统的需求。哎呀,这个系统啊,得有点儿本事才行!首先,它得能给咱们的商品更新发个通知,就像是快递到了,你得知道一样。还有,用户那边的活动提醒也不能少,就像朋友生日快到了,你得记得送礼物那种感觉。最后,后台的任务调度嘛,那就像是家里的电器都自动工作,你不用操心一样。这整个系统要能搞定Java、Python和Node.js这些编程语言,得是个多才多艺的家伙呢! 实现细节: - 消息格式:采用JSON格式,便于解析和处理。 - 消息队列:使用ActiveMQ作为消息中间件,确保消息的可靠传递。 - 语言间通信:通过统一的消息API接口,确保不同语言环境的客户端能够一致地发送和接收消息。 - 负载均衡:通过配置多个ActiveMQ实例,实现消息系统的高可用性和负载均衡。 四、结论与展望 ActiveMQ在多语言环境下的部署不仅提升了开发效率,也增强了系统的灵活性和可扩展性。哎呀,你知道的,编程这事儿,就像是个拼图游戏,每个程序员手里的拼图都代表一种编程语言。每种语言都有自己的长处,比如有的擅长处理并发任务,有的则在数据处理上特别牛。所以,聪明的开发者会好好规划,把最适合的拼图放在最合适的位置上。这样一来,咱们就能打造出既快又稳的分布式系统了。就像是在厨房里,有的人负责洗菜切菜,有的人专门炒菜,分工合作,效率噌噌往上涨!哎呀,你懂的,现在微服务这东西越来越火,加上云原生应用也搞得风生水起的,这不,多语言环境下的应用啊,那可真是遍地开花。你看,ActiveMQ这个家伙,它就像个大忙人似的,天天在多语言环境中跑来跑去,传递消息,可不就是缺不了它嘛!这货一出场,就给多语言环境下的消息通信添上了不少色彩,推动它往更高级的方向发展,你说它是不是有两把刷子? --- 通过上述内容的探讨,我们不仅了解了如何在多语言环境下部署和使用ActiveMQ,还看到了其实现复杂业务逻辑的强大潜力。无论是对于企业级应用还是新兴的微服务架构,ActiveMQ都是一个值得信赖的选择。哎呀,随着科技这玩意儿天天在变新,我们能期待的可是超棒的创新点子和解决办法!这些新鲜玩意儿能让我们在不同语言的世界里写程序时更爽快,系统的运行也更顺溜,就像喝了一大杯冰凉透心的柠檬水一样,那叫一个舒坦!
2024-10-09 16:20:47
65
素颜如水
Apache Lucene
...解决方案。它支持多种数据格式,包括文本、XML和JSON,广泛应用于各种应用程序中,以实现快速、精确的搜索功能。在本文中,Lucene是实现模糊搜索的关键组件,其FuzzyQuery允许在用户输入不精确时找到相关文档。 FuzzyQuery , Lucene中的一个高级查询工具,用于处理模糊匹配。它通过计算查询词与索引中的单词之间的Levenshtein距离,即编辑距离,来找到相似度达到预设阈值的文档。FuzzyQuery允许一定程度的错误容忍度,使得搜索结果更加灵活,适合纠正拼写错误或者处理用户输入的不确定性。 Levenshtein距离 , 也称为编辑距离,是一种衡量两个字符串间差异的方法,通过计算从一个字符串转换为另一个字符串所需的最少单字符插入、删除或替换操作次数。在FuzzyQuery中,编辑距离用来确定搜索词与索引中的词汇之间的相似度,从而在模糊搜索中找到匹配项。 编辑距离阈值 , 在使用FuzzyQuery时,用户可以设置的一个参数,用于控制模糊匹配的程度。这个值决定了搜索时允许的最大编辑距离,较高的阈值意味着更容易找到与查询词相似的文档,但可能会引入更多的非精确结果。 BM25 , 一种经典的文本检索模型,它根据文档中关键词的出现频率和文档的整体长度等因素计算文档的相关度。在现代搜索引擎中,与BERT结合使用,可以提供更准确的模糊查询结果,尤其是在处理长尾查询时。 BERT , 双向编码器表示变换器,是一种预训练的深度学习模型,特别擅长理解和生成自然语言文本。在搜索引擎中,BERT可以理解查询的语义,从而提高模糊查询的准确性,超越了基于编辑距离的传统方法。 Transformer-based检索模型 , 这类模型基于Transformer架构,如ANCE和ANCE-R,能够捕捉文档间的全局关系,提供更高质量的搜索结果,尤其在处理复杂的模糊查询时,性能优越。 个性化推荐 , 根据用户的个人历史行为、偏好和上下文信息,为用户提供定制化搜索结果的过程。现代搜索引擎通过结合模糊查询和用户行为分析,提供更符合用户需求的搜索体验。
2024-06-11 10:54:39
497
时光倒流
Apache Solr
...本特别强调了对大规模数据集的支持,以及对复杂查询的处理能力。Solr 9.0版本引入了全新的查询引擎,该引擎采用了先进的算法,可以显著提升查询效率,特别是在处理高并发请求时表现尤为突出。此外,新版Solr还增强了索引压缩功能,使得索引存储更加高效,降低了磁盘I/O开销,这对于大数据环境下的性能提升尤为重要。 同时,Solr社区也在不断推动对分布式架构的支持。新版Solr支持更灵活的分片策略,可以根据不同的业务场景进行定制化配置,从而更好地应对大规模数据的查询需求。此外,新版Solr还引入了更强大的缓存机制,包括更细粒度的缓存控制和预热策略,进一步提升了查询性能。 值得注意的是,Solr 9.0版本还加强了安全性功能,引入了基于角色的访问控制(RBAC)机制,使得权限管理更加灵活和安全。这对于企业级应用来说尤为重要,可以有效防止敏感数据泄露。 此外,Solr社区还推出了一系列在线培训课程和文档资源,帮助开发者更好地理解和使用新版本的功能。这些资源不仅涵盖了基本的操作指南,还包括了最佳实践案例和性能调优技巧,对于希望深入了解Solr的新手和老手都大有裨益。 总之,Solr 9.0版本的发布标志着Solr在性能、可扩展性和安全性方面迈出了重要的一步。对于正在使用Solr的企业用户来说,升级到最新版本无疑是一个值得考虑的选择。
2025-02-08 16:04:27
36
蝶舞花间
Apache Solr
...he Solr在执行数据导入过程中可能抛出的一个异常类。当索引全量导入(Full Import)失败时,如文中所述由于驱动配置或JNDI名称未指定,就会触发此类异常。这个错误提示通常意味着Solr无法正确连接到外部数据源或者执行SQL查询来获取索引数据。 CoreContainer , 在Apache Solr中,CoreContainer是管理Solr核心集合(Solr Core)的主要容器类。它负责加载、初始化、监控和卸载Solr核心,并在集群环境下协调多个节点之间的状态和服务。在文章给出的代码示例中,CoreContainer用于启动Solr集群并查询其包含的核心集合的状态信息。 JMX (Java Management Extensions) , JMX是一种Java技术标准,用于管理和监控Java应用程序的各种资源,包括内存使用情况、线程池状态以及服务配置等。在Solr安全漏洞排查部分,建议关闭不必要的JMX服务以减少潜在的安全风险,防止恶意用户通过JMX接口远程访问和操控系统。 全文索引 (Full-text Indexing) , 全文索引是一种将文档内容转换为可搜索格式的过程,允许用户搜索文本中的任何词组或短语。在Apache Solr中,全文索引是其主要功能之一,能够对大量非结构化数据进行高效检索。当遇到“全文索引导入失败”的问题时,需要排查与全文索引构建过程相关的配置和数据源连接问题。
2023-05-31 15:50:32
497
山涧溪流-t
JQuery
...组的概念。数组是一种数据结构,用来存储一系列相同类型的值。比如: javascript var fruits = ["苹果", "香蕉", "橙子"]; 在这个例子中,fruits就是一个数组,里面装着三个字符串。那jQuery是什么呢?jQuery是一个轻量级的JavaScript库,它的核心功能就是简化HTML文档遍历、事件处理、动画效果等操作。其实 jQuery 压根儿不是专门搞数组的,但它里面藏着不少好用的小工具,就像随身带了个万能 Swiss Army Knife(瑞士军刀),想干啥都方便,处理数组什么的基本不在话下! 举个例子,如果你有一堆HTML列表项( 标签),你可以用jQuery快速找到它们并对其进行操作。比如给每个列表项添加点击事件,或者修改它们的内容。这不就是数组循环赋值的典型应用场景吗? --- 3. 如何用jQuery循环赋值? 3.1 使用each()方法 先来说说最常用的each()方法吧。each()是jQuery提供的一个非常实用的函数,它可以用来遍历集合中的每一个元素,并执行回调函数。对于数组来说,each()的表现也非常棒! 假设我们有一个数组numbers,里面存放了一些数字。我们想通过jQuery将这些数字显示在一个无序列表( )中。代码可以这样写: html 这里的关键在于$.each()函数的第一个参数是我们要遍历的数组,第二个参数是一个回调函数,其中index表示当前元素的索引,value则是该元素的值。通过这种方式,我们可以轻松地将数组中的每一项添加到页面上。 不过呢,有时候你会发现直接用each()并不能完全满足需求。比如说,你得看看数组里满足不满足某个条件,要是满足了,那就接着往下走;要是不满足,可能就得另想办法,或者干脆就别执行后面那堆事了。这时候就需要稍微动点脑筋了。 --- 3.2 使用for循环结合jQuery 当然啦,如果你觉得each()太过于“黑箱”,不喜欢隐藏内部细节的话,也可以选择传统的for循环。其实呢,jQuery就是JavaScript的一个小帮手啦,说白了,它再厉害,最后还是得靠原生JavaScript去干活儿。 html 这段代码跟前面的例子类似,只不过我们手动控制了循环变量i,并且直接通过colors[i]访问数组中的元素。这样做的好处就是,你可以更随心所欲地摆弄数组里的数据,比如说直接跳过那些你不想管的项目,特别方便! --- 3.3 高级玩法:链式调用 如果你是个追求极致简洁的人,那么jQuery的链式调用绝对会让你爱不释手。简单来说,链式调用就是让你在一整行代码里接连调用好几个方法,这样就能少写好多重复的东西,看着清爽,用起来也方便! 比如,如果你想一次性创建整个无序列表,可以用下面这种方式: html 这段代码看起来是不是特别酷?我们先创建了一个新的 元素,然后利用map()方法生成所有的 标签,最后再将它们拼接成完整的HTML字符串,再插入到指定的容器中。这种写法不仅高效,还非常优雅! --- 4. 小结与感悟 好了,到这里咱们已经讨论了很多关于jQuery数组循环赋值的内容。说实话,最开始接触这些玩意儿的时候,我也是头都大了,心里直犯嘀咕:这是啥呀?这也太复杂了吧?感觉整个人都不好了,差点怀疑自己是不是选错了路子。其实吧,我后来才明白,这东西也没那么难。你只要把最基本的那些道理搞清楚了,再有点儿耐心,多试着练练,慢慢就啥问题都没啦! 在这里,我想分享一个小技巧:多看官方文档!jQuery的官方文档写得非常好,里面不仅有详细的API说明,还有很多生动的例子。每次遇到问题的时候,我都习惯先去看看文档,很多时候都能找到答案。 最后,希望大家都能从这篇文章中学到一些有用的东西。记住,编程不是一蹴而就的事情,它需要不断的尝试和总结。如果你还有其他关于jQuery的问题,欢迎随时交流哦!加油!💪 --- 好了,这就是我关于“jQuery数组怎样循环赋值”的全部内容啦。希望你能喜欢这篇文章,并且从中受益匪浅!如果觉得有用的话,不妨点赞支持一下吧~😊
2025-05-08 16:16:22
62
蝶舞花间
转载文章
...习方法。它是对给定的数据集学到一个模型对新示例进行分类的过程。下图所示为一个流程图的决策树,长方形代表判断模块(decision block),椭圆形代表终止模块(terminating block),表示已经得出结论,可以终止运行。从判断模块引出的左右箭头称作分支(branch),可以达到另一个判断模块或终止模块。 决策过程是基于树结构来进行决策的。如下图,首先检查邮件域名地址,如果地址为myEmployer.com,则将其分类为“无聊时需要阅读的邮件”。否则,则检查邮件内容里是否包含单词“曲棍球”,如果包含则归类为“需要及时处理的朋友邮件”,如果不包含则归类到“无需阅读的垃圾邮件” 流程图形式的决策树 显然,决策过程的最终结论对应了我们所希望的判定结果,例如"需要阅读"或"不需要阅读”。 决策过程中提出的每个判定问题都是对某个属性的"测试",如邮件地址域名为?是否包含“曲棍球”? 每个测试的结果或是导出最终结论,或是导出进一步的判定问题,其考虑范围是在上次决策结果的限定范围之内,例如若邮件地址域名不是myEmployer.com之后再判断是否包含“曲棍球”。 一般的,决策树包含一个根节点、若干个内部节点和若干个叶节点。根节点包含样本全集;叶节点对应于决策结果,例如“无聊时需要阅读的邮件”。其他每个结点则对应于一个属性测试;每个节点包含的样本集合根据属性测试的结果被划分到子结点中。 决策树学习基本算法 显然,决策树的生成是一个递归过程.在决策树基本算法中,有三种情形会导致递归返回: (1)当前结点包含的样本全属于同一类别,无需划分; (2)当前属性集为空,或是所有样本在所有属性上取值相同,无法划分; (3)当前结点包含的样本集合为空,不能划分。 2、划分选择 决策树算法的关键是如何选择最优划分属性。一般而言,随着划分过程不断进行,我们希望决策树的分支结点所包含的样本尽可能属于同一类别,即结点的"纯度" (purity)越来越高。 (1)信息增益 信息熵 "信息熵" (information entropy)是度量样本集合纯度最常用的一种指标,定义为信息的期望。假定当前样本集合 D 中第 k 类样本所占的比例为 ,则 D 的信息熵定义为: H(D)的值越小,则D的纯度越高。信息增益 一般而言,信息增益越大,则意味着使周属性 来进行划分所获得的"纯度提升"越大。因此,我们可用信息增益来进行决策树的划分属性选择,信息增益越大,属性划分越好。 以西瓜书中表 4.1 中的西瓜数据集 2.0 为例,该数据集包含17个训练样例,用以学习一棵能预测设剖开的是不是好瓜的决策树.显然,。 在决策树学习开始时,根结点包含 D 中的所有样例,其中正例占 ,反例占 信息熵计算为: 我们要计算出当前属性集合{色泽,根蒂,敲声,纹理,脐部,触感}中每个属性的信息增益。以属性"色泽"为例,它有 3 个可能的取值: {青绿,乌黑,浅自}。若使用该属性对 D 进行划分,则可得到 3 个子集,分别记为:D1 (色泽=青绿), D2 (色泽2=乌黑), D3 (色泽=浅白)。 子集 D1 包含编号为 {1,4,6,10,13,17} 的 6 个样例,其中正例占 p1=3/6 ,反例占p2=3/6; D2 包含编号为 {2,3,7,8, 9,15} 的 6 个样例,其中正例占 p1=4/6 ,反例占p2=2/6; D3 包含编号为 {5,11,12,14,16} 的 5 个样例,其中正例占 p1=1/5 ,反例占p2=4/5; 根据信息熵公式可以计算出用“色泽”划分之后所获得的3个分支点的信息熵为: 根据信息增益公式计算出属性“色泽”的信息增益为(Ent表示信息熵): 类似的,可以计算出其他属性的信息增益: 显然,属性"纹理"的信息增益最大,于是它被选为划分属性。图 4.3 给出了基于"纹理"对根结点进行划分的结果,各分支结点所包含的样例子集显示在结点中。 然后,决策树学习算法将对每个分支结点做进一步划分。以图 4.3 中第一个分支结点( "纹理=清晰" )为例,该结点包含的样例集合 D 1 中有编号为 {1, 2, 3, 4, 5, 6, 8, 10, 15} 的 9 个样例,可用属性集合为{色泽,根蒂,敲声,脐部 ,触感}。基于 D1计算出各属性的信息增益: "根蒂"、 "脐部"、 "触感" 3 个属性均取得了最大的信息增益,可任选其中之一作为划分属性.类似的,对每个分支结点进行上述操作,最终得到的决策树如圈 4.4 所示。 3、剪枝处理 剪枝 (pruning)是决策树学习算法对付"过拟合"的主要手段。决策树剪枝的基本策略有"预剪枝" (prepruning)和"后剪枝 "(post" pruning) [Quinlan, 1993]。 预剪枝是指在决策树生成过程中,对每个结点在划分前先进行估计,若当前结点的划分不能带来决策树泛化性能提升,则停止划 分并将当前结点标记为叶结点; 后剪枝则是先从训练集生成一棵完整的决策树,然后自底向上地对非叶结点进行考察,若将该结点对应的子树替换为叶结点能带来决策树泛化性能提升,则将该子树替换为叶结点。 往期回顾 ● 带你详细了解机器视觉竞赛—ILSVRC竞赛 ● 到底什么是“机器学习”?机器学习有哪些基本概念?(简单易懂) ● 带你自学Python系列(一):变量和简单数据类型(附思维导图) ● 带你自学Python系列(二):Python列表总结-思维导图 ● 2018年度最强的30个机器学习项目! ● 斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能(附195页PDF) ● 一文详解计算机视觉的广泛应用:网络压缩、视觉问答、可视化、风格迁移 本篇文章为转载内容。原文链接:https://blog.csdn.net/Sophia_11/article/details/113355312。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-08-27 21:53:08
284
转载
ElasticSearch
...ticSearch做数据索引的时候,遇到了一个特别让人抓狂的问题——“Failed to bulk index documents into index my_index”。这就跟我在跑马拉松的时候鞋带突然散了似的,不仅跑得磕磕绊绊,连带着心里也一阵慌乱,开始怀疑自己是不是天生不适合这项运动。 当时我的代码是这样的: python from elasticsearch import Elasticsearch es = Elasticsearch() actions = [ { "_index": "my_index", "_id": "1", "_source": {"name": "John", "age": 30} }, { "_index": "my_index", "_id": "2", "_source": {"name": "Jane", "age": 25} } ] response = es.bulk(index="my_index", body=actions) print(response) 结果呢?直接报错:“Failed to bulk index documents into index my_index”。我当时就纳闷了,到底哪儿出错了呢?是数据格式搞拧巴了,还是索引没弄对?要不就是我自己写的代码坑太多了?那种感觉啊,就好比你在厨房按着菜谱一步一步做菜,结果一开锅,发现把一顿饭整成了糊锅底的“黑暗料理”,真是欲哭无泪啊! 二、初步排查 从错误信息入手 既然报错了,那我们就得从错误信息入手。首先,我们得看看ElasticSearch的日志,这是排查问题的第一步。日志里头一般会写得更详细一点,像是到底哪里错了、错得有多惨这种,还有那个堆栈信息啥的,看得人头都大了,但有时候不看又不行啊! 我先打开了ElasticSearch的日志文件(一般在/var/log/elasticsearch/目录下),然后发现日志里显示了一个错误:“MapperParsingException[failed to parse]”。看到这个,我就明白了,可能是数据格式有问题。 这时候我开始反思:是不是我的数据结构不符合ElasticSearch的映射规则?于是我又仔细检查了一下我的数据结构,发现确实有一个字段的数据类型没有定义好。比如说啊,我有个字段叫age,本来应该是整数类型的,但之前手滑写成字符串了,真是自己给自己挖坑。 修正后的代码如下: python actions = [ { "_index": "my_index", "_id": "1", "_source": {"name": "John", "age": 30} 确保age是整数类型 }, { "_index": "my_index", "_id": "2", "_source": {"name": "Jane", "age": 25} } ] 再次运行代码后,果然不再报错了。这就算是舒了口气吧,不过也给我提了个醒:用 ElasticSearch 做批量索引的时候,这数据格式啊,真的一点都不能含糊,不然分分钟让你抓狂! 三、深入分析 为什么会出现这种问题? 虽然问题解决了,但作为一个喜欢刨根问底的人,我还是想知道为什么会发生这样的事情。说白了,就是下次再碰到这种事儿,我可不想抓耳挠腮半天还搞不定,希望能一下子就找到路子! 首先,我想到了ElasticSearch的映射机制。Elasticsearch 会检查每个字段的类型,就像老师检查作业一样认真。要是你传的数据类型跟它预想的对不上号,它就会直接“翻脸”,给你抛个 MapperParsingException 错误,仿佛在说:“哎哟喂,这啥玩意儿?重写!”比如说啊,你有个字段叫age(年龄),本来应该填数字的,结果你非得塞个字符串进去,那ElasticSearch就直接不认你的文档,直接拒收,根本不带商量的! 其次,我还想到,ElasticSearch的bulk API其实是非常强大的,但它也有自己的规则。比如,bulk API要求每条文档必须包含_index、_type(虽然现在已经被废弃了)和_source字段。如果你漏掉了某个字段,或者字段名拼写错误,都会导致批量索引失败。 最后,我还注意到,ElasticSearch的bulk API是基于HTTP协议的,这意味着它对网络环境非常敏感。要是你的网络老是断线,或者你等了半天也没收到回应,那可能就搞不定批量索引这事啦。
2025-04-20 16:05:02
63
春暖花开
转载文章
动态数据 , 在本文语境中,动态数据是指随着用户交互或系统状态变化而实时更新的数据。例如,在采集百度下拉词数据时,当用户在搜索框中输入关键词时出现的下拉推荐词列表就是一种动态数据,它随用户的输入行为实时生成并消失。 JSON格式 , JavaScript Object Notation(JSON)是一种轻量级的数据交换格式,易于人阅读和编写,也易于机器解析和生成。在文中,百度返回的下拉词数据即采用JSON格式,包含键值对结构,通过抓取并解析JSON响应内容,可以提取出具体的下拉推荐词信息。 线程池 (concurrent.futures.ThreadPoolExecutor) , 在Python编程中,线程池是一种多线程编程的高效解决方案,通过预先创建一定数量的线程并进行复用,能够减少线程频繁创建销毁带来的开销。文中使用了concurrent.futures.ThreadPoolExecutor来并发处理多个关键词的下拉词数据获取任务,每个关键词的请求作为一个独立的任务提交给线程池,线程池中的空闲线程会自动执行这些任务,从而提高了数据采集效率。 抓包操作 , 在网络编程与数据分析领域中,抓包操作指的是利用网络封包分析软件(如Wireshark、Fiddler等,或浏览器开发者工具)捕获、记录网络传输过程中经过计算机网络接口的所有数据包的过程。在本文的具体情境下,作者通过浏览器开发者工具进行抓包操作,找到了包含百度下拉词数据的HTTP请求,进一步分析了该请求的相关参数和返回结果,以实现自动化数据采集的目标。
2023-06-21 12:59:26
490
转载
Hadoop
...oop是一个开源的大数据处理框架,由Apache软件基金会开发和维护。它基于分布式存储系统HDFS(Hadoop Distributed File System)和并行计算框架MapReduce设计,能够高效、可靠地处理海量数据集。在本文语境中,Hadoop是大数据处理的核心技术之一,被广泛应用于各行各业的数据分析、挖掘和存储场景。 ETL工具 , ETL代表Extract(抽取)、Transform(转换)和Load(加载),是一种数据集成方法。ETL工具主要用于从不同数据源提取数据,进行清洗、转换和格式化,然后加载到目标数据仓库或其他系统中。文中提到的Apache NiFi和Apache Beam都是炙手可热的ETL工具,它们能与Hadoop紧密结合,帮助用户构建复杂的数据处理流程,实现对原始数据的有效管理和利用。 Apache NiFi , Apache NiFi是一个基于Java的实时流数据处理系统,提供了一种可视化的方式来定义和管理数据流管道。通过NiFi,用户可以轻松接收、路由、处理和传输数据,并且支持高度的配置性和灵活性,可以处理各种类型的数据源和目的地。在与Hadoop集成时,NiFi可用于从HDFS读取数据、对其进行处理后,再将结果写入其他位置或系统。 Apache Beam , Apache Beam是一个统一的编程模型,旨在简化批处理和实时数据处理应用程序的开发过程。Beam允许开发者编写一次代码,就能在多个执行引擎(包括Apache Flink、Spark和Google Dataflow等)上运行,从而极大地提高了跨平台的数据处理效率。在文章中,Apache Beam被用于整合Hadoop,通过其SDK编写代码来处理HDFS中的数据,实现了数据处理逻辑的一致性和可移植性。
2023-06-17 13:12:22
582
繁华落尽-t
Etcd
...引入Etcd实现了跨数据中心的库存同步管理,显著提升了系统的可用性和响应速度。这一成功实践不仅证明了Etcd在高并发场景下的稳定性,也展示了其在大规模分布式系统中的广泛应用前景。 与此同时,Etcd社区也在不断迭代更新,最新版本已支持更多高级特性,例如更高效的压缩算法和更强的安全加密机制。这些改进使得Etcd在面对日益复杂的分布式环境时更具竞争力。值得一提的是,国内某大型云计算服务商近日宣布将全面支持Etcd 3.x系列,并计划在未来几个月内推出基于Etcd的托管服务,为企业用户提供更加便捷的部署和管理体验。 此外,关于分布式事务管理的话题,近期有专家指出,尽管Etcd提供了强大的工具集,但在实际应用中仍需谨慎对待事务的粒度和范围。过细的事务划分可能导致性能瓶颈,而过于粗略的设计则可能引发数据不一致的风险。因此,在设计分布式事务时,需要综合考虑业务逻辑、系统规模以及硬件资源等因素,制定合理的策略。 最后,回顾历史,我们可以发现,无论是早期的ZooKeeper还是如今的Etcd,这类分布式协调服务始终伴随着分布式计算的发展而演进。正如《分布式系统设计》一书中提到的:“分布式系统的设计是一门艺术,它要求我们在灵活性与可靠性之间找到平衡。”未来,随着5G、物联网等新技术的兴起,分布式系统的复杂性将进一步增加,而像Etcd这样的工具无疑将在其中扮演越来越重要的角色。
2025-03-21 15:52:27
54
凌波微步
转载文章
...作状态即所有内存中的数据,写入到硬盘(这就是hiberfil.sys文件),然后关闭系统,在下次启动开机时,将保持的数据写回内存,虽然需要花费些时间,但好处就是你正在进行中的工作,都会被保存起来,就算断电以后也不回消失,这也就是为什么经常有人说几个月不用关机的原因,当然休眠并不是必须的,完全看你这个需求了,如果确实有需要也不用care这点硬盘啦。有网友说--这个文件大小的描述错误,hiberfil.sys的大小并≠内存大小,因为该文件貌似是压缩过。我的内存是8G,这个.hiberfil.sys有3.12G,这样看这个网友说的对的. hiberfi.sys的链接 首先分清SLEEP睡眠和HIBERNATE休眠两个概念. 我们常用的是SLEEP睡眠功能, 也就是电脑经过一定时间后, 进入低功耗状态, 工作态度保存在内存里, 恢复时1-2秒就可以恢复原状态.这个功能是实用的, 也是最常用的. 而休眠是把工作状态即所有内存信息写入硬盘,如有2-4G内存,即要写入2-4G的文件到硬盘,然后才能关机,开机恢复要读取2-4G的文件到内存,才能恢复原界面.而大文件的读写要花大量 的时间,已经不亚于正常开机了,所以现在休眠功能很不实用(针对1G以上内存). 休眠的HIBERFIL.SYS这个文件就是用来休眠时保存内存状态用的.会占用C盘等同内存容量的空间(以2G内存为例,这个文件也为2G),所以完全可以删掉而不影响大家使用.还会大大节省C盘空间的占用。 操作: 以管理员运行CMD, 打以下命令: POWERCFG -H OFF 即自动删除该文件. 大家看处理前后C盘空间的变化就知道了. 怎么以管理员运行: 在“所有程序”->“附件”->“命令提示符”上右键,选“以管理员运行” 如果本身是以管理员身份登录,直接运行cmd即可。 我做的测试: 文件位置C:\hiberfil.sys “pagefile.sys”是页面交换文件(即虚拟内存),这个文件不能删除,不过可以改变其大小和存放位置. 6.windows中的休眠与睡眠 windows中的休眠与睡眠 7.WPS中如何不做拼写检查 WPS中如何不做拼写检查 8.EV视频相关方法 如何利用EV视频剪辑软件合并视频 EV剪辑怎么给视频添加字幕 9.WINDOW自带剪辑方法 WIN10自带剪辑视频的方法 10.快捷键大全 快捷键大全 11.B站上传合集 B站上传合集 12.查看WIN电脑配置 13.windows远程桌面链接 win+Rmstsc 14.word中的边框和底纹如何应用于文字,段落和页面 word中边框和底纹——应用于文字、段落、页面分别如何设置? 本篇文章为转载内容。原文链接:https://blog.csdn.net/Edidaughter/article/details/111231562。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-03-01 13:02:11
116
转载
站内搜索
用于搜索本网站内部文章,支持栏目切换。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
xz -z -k file.txt
- 使用xz工具压缩文件。
推荐内容
推荐本栏目内的其它文章,看看还有哪些文章让你感兴趣。
2023-04-28
2023-08-09
2023-06-18
2023-04-14
2023-02-18
2023-04-17
2024-01-11
2023-10-03
2023-09-09
2023-06-13
2023-08-07
2023-03-11
历史内容
快速导航到对应月份的历史文章列表。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"