前端技术
HTML
CSS
Javascript
前端框架和UI库
VUE
ReactJS
AngularJS
JQuery
NodeJS
JSON
Element-UI
Bootstrap
Material UI
服务端和客户端
Java
Python
PHP
Golang
Scala
Kotlin
Groovy
Ruby
Lua
.net
c#
c++
后端WEB和工程框架
SpringBoot
SpringCloud
Struts2
MyBatis
Hibernate
Tornado
Beego
Go-Spring
Go Gin
Go Iris
Dubbo
HessianRPC
Maven
Gradle
数据库
MySQL
Oracle
Mongo
中间件与web容器
Redis
MemCache
Etcd
Cassandra
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Nacos
Consul
Tomcat
Nginx
Netty
大数据技术
Hive
Impala
ClickHouse
DorisDB
Greenplum
PostgreSQL
HBase
Kylin
Hadoop
Apache Pig
ZooKeeper
SeaTunnel
Sqoop
Datax
Flink
Spark
Mahout
数据搜索与日志
ElasticSearch
Apache Lucene
Apache Solr
Kibana
Logstash
数据可视化与OLAP
Apache Atlas
Superset
Saiku
Tesseract
系统与容器
Linux
Shell
Docker
Kubernetes
[Python爬虫技术实现数据抓取和处理]的搜索结果
这里是文章列表。热门标签的颜色随机变换,标签颜色没有特殊含义。
点击某个标签可搜索标签相关的文章。
点击某个标签可搜索标签相关的文章。
Python
在深入学习了Python如何实现对一个数的个位、十位和百位等数位进行快速提取后,我们了解到Python强大的数学计算功能在实际应用中的重要性。实际上,这种基础运算能力不仅限于简单数位分离,它在数据分析、人工智能以及网络爬虫等领域有着广泛的应用。 例如,在近日Google发布的TensorFlow 2.x版本中,Python作为其主要编程语言,开发者可以利用Python的高级计算特性与TensorFlow库紧密结合,实现高效率的机器学习模型构建与训练,其中就包含了大量涉及数值处理的操作。同时,Pandas库作为Python数据分析的重要工具,也频繁使用到类似的数学运算来清洗、整理和分析数据集。 此外,Python在网络爬虫领域同样大放异彩,如Scrapy框架中,开发者可通过Python灵活的数学运算对抓取的大量数字信息进行实时处理和格式转换,从而满足特定的业务需求。 进一步地,对于更复杂的数学问题,例如数值分析、科学计算等,Python有诸如NumPy、SciPy等强大的第三方库支持,它们不仅能高效处理数组和矩阵运算,还能解决线性代数、微积分等问题,展现了Python在数学计算领域的强大实力。 因此,掌握Python的数学计算技巧并结合相关库的运用,将极大地提升我们在数据分析、AI开发以及网络爬虫等现代技术领域的实战能力,为应对复杂多变的数据挑战提供有力的支持。
2023-04-20 12:09:22
42
软件工程师
Python
在深入理解了Python正则表达式中点(.)这一元字符的使用后,我们可以进一步探索正则表达式的更多高级应用。近日,随着大数据和机器学习领域的发展,对文本数据预处理的需求日益增强,正则表达式成为了不可或缺的工具。例如,在自然语言处理(NLP)项目中,常常需要利用正则表达式进行分词、去除标点符号、匹配特定模式的词汇等操作。 另外,针对网络安全领域,正则表达式同样发挥着关键作用。在Web爬虫开发中,开发者们常借助正则表达式提取网页中的URL、邮箱地址以及其他敏感信息,以确保网络环境的安全并提升数据抓取效率。近期一篇来自《信息安全与技术》期刊的研究报告指出,通过对复杂正则表达式的优化运用,研究人员成功提升了对恶意软件特征码的检测精度和速度。 同时,Python社区也在持续优化其内置的re模块,不断推出新的特性以适应更广泛的应用场景。比如在最新版本的Python中,正则表达式引擎已支持Unicode 13标准,能够更好地处理全球多种语言的文本匹配需求。 总之,掌握好Python正则表达式的精髓,不仅可以提升日常编程中的文本处理能力,更能紧跟时代步伐,在大数据分析、网络安全、自然语言处理等领域实现高效精准的数据挖掘与分析。因此,建议读者继续关注Python正则表达式的最新发展动态,并通过实践逐步深入学习更多复杂的正则表达式用法及其实战应用场景。
2023-12-18 14:47:10
168
编程狂人
Python
...在今天的互联网时代,数据的价值日益凸显,而获取这些数据的一个重要方式就是通过网络爬虫。Python这门强大的编程语言,如今已经在数据抓取的世界里火得不行,妥妥地坐稳了主流工具的宝座。嘿,这篇帖子我要手把手教你用Python写一个超实用的小程序,专门用来每日自动抓取基金数据。这样一来,你不仅能轻松摸清网络爬虫的底层逻辑,还能实实在在地感受一把Python的魅力和威力,简直是一举两得! 二、Python爬虫的基本流程 1. 导入需要的库 在Python中,我们需要使用requests库来发送HTTP请求,BeautifulSoup库来解析HTML文档。以下是导入所需库的代码: python import requests from bs4 import BeautifulSoup 2. 发送HTTP请求 使用requests库的get方法向指定URL发送GET请求,获取返回的HTML文档。以下是发送HTTP请求的代码: python url = "https://www.xxx.com/基金列表" response = requests.get(url) 3. 解析HTML文档 使用BeautifulSoup库对获取的HTML文档进行解析,提取出我们需要的数据。以下是一个简单的解析HTML文档的例子: python soup = BeautifulSoup(response.text, 'html.parser') fund_list = soup.find_all('div', class_='fund-name') 找到所有基金名称所在的div元素 for fund in fund_list: print(fund.text) 打印出每个基金的名称 三、编写完整的Python爬虫程序 有了以上基础知识,我们就可以编写一个完整的Python爬虫程序了。以下是一个简单的例子,每天从某个网站上抓取基金的最新净值并打印出来: python import requests from bs4 import BeautifulSoup import datetime 定义要爬取的网址 url = "https://www.xxx.com/基金列表" while True: 发送HTTP请求 response = requests.get(url) 解析HTML文档 soup = BeautifulSoup(response.text, 'html.parser') fund_list = soup.find_all('div', class_='fund-name') for fund in fund_list: 提取基金名称和净值 name = fund.find('span', class_='fund-name').text value = fund.find('span', class_='value').text 格式化日期 date_str = datetime.datetime.now().strftime('%Y-%m-%d') 打印出每只基金的名称、净值和日期 print(f"{date_str}: {name} - {value}") 四、总结 通过本文的讲解,你应该已经了解到如何使用Python编写一个简单的基金每日爬取程序。这个啊,其实就是个最基础、最入门级别的小例子啦,真正实战中的爬虫程序,那可复杂多了,会碰到各种让人挠头的问题。比如说网站为了防止被爬取而设置的反爬机制,还有那种内容不是一次性加载完,而是随着你滚动页面慢慢出现的动态加载情况,这些都是实际开发中可能遇到的大挑战!但是,只要你把基本的Python编程技能学到手,再对网络爬虫有个大概摸底,你就完全有能力亲手写出一个符合自己需求的爬虫程序来。就像是学会了烹饪基础和食材知识,就能按照自己的口味炒出一盘好菜一样。
2023-04-21 09:18:01
96
星河万里-t
转载文章
在学习Java爬虫技术并实践于京东商品信息抓取的过程中,可能会遇到各种实际问题,如网页结构变化、登录验证机制、数据解析异常等。这些问题的解决不仅有助于提升个人编程能力,更对了解反爬机制与合法合规的数据抓取有重要启示作用。 近期,关于网络爬虫技术的法律边界和道德规范引起了广泛关注。2022年,中国最高人民法院发布了《关于审理使用人脸识别技术处理个人信息相关民事案件适用法律若干问题的规定》,其中强调了在数据抓取过程中应尊重用户隐私权和个人信息安全。这意味着,在开发爬虫项目时,除了关注技术实现外,开发者还需严格遵守相关法律法规,确保数据来源的合法性。 另外,各大电商平台针对爬虫行为不断升级反爬策略,例如采用动态加载、加密参数、验证码等方式防止非授权抓取。在这种情况下,学习和研究如何通过模拟登录、设置合适的请求头(如User-Agent)、以及运用更高级的网络代理、IP池等手段绕过反爬机制,成为爬虫开发者必须掌握的技术要点。 与此同时,对于页面数据解析环节,诸如Jsoup这样的HTML解析库虽然强大易用,但在面对复杂多变的网页结构时,可能需要结合XPath或CSS选择器等更多工具进行精细化处理。此外,随着JavaScript渲染技术在现代网页中的广泛应用,传统的HTTP请求方式已无法满足部分动态加载内容的抓取需求,因此引入Selenium、Puppeteer等无头浏览器工具进行交互式爬虫开发已成为一种趋势。 总之,在深入学习和应用Java爬虫技术的同时,我们应当紧跟技术发展潮流,并时刻保持对法律、伦理及技术挑战的关注,以确保我们的爬虫项目既高效又合规。
2023-03-13 10:48:12
104
转载
转载文章
...容。 文章目录 一、处理不信任的SSL证书的网站 二、cookie 三、session 一、处理不信任的SSL证书的网站 SSL证书 数字证书的一种 SSL服务器证书 遵守SSL协议 具有服务器身份验证和数据传输加密功能 在爬虫时可能会遇到这样的报错(SSLError)这说明我们要爬取的网站没有SSL证书 处理:res = requests.get(url,verify=False) 二、cookie 通过记录用户信息来确定身份 1 模拟登陆 人人网保持登陆状态import requestsurl = 'http://www.renren.com/976686556/profile' 个人主界面headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36','Cookie':'anonymid=knvqe21amc6ghy; depovince=ZGQT; _r01_=1; taihe_bi\_sdk_uid=c2bd353cea6830a73eb74760fbc9fd5c; taihe_bi_sdk_session=9a91c\62f18e74ee26c3145bb49b4eb9e; ick_login=286c45d0-e571-4fb7-918a-46a9706\18110; first_login_flag=1; ln_uact=17315371375; ln_hurl=http://head.xiao\nei.com/photos/0/0/men_main.gif; wp_fold=0; jebecookies=ee811760-7bc0-43a9-\883c-0d041cb1baf0|||||; _de=A4C6B1A20CD5F525F9DA27654C2D2FDA; p=f5239823cd0af743a5f015652568b6036; t=42783075a815b6cef9f651ca18ff5c166; societyguester=42783075a815b6cef9f651ca18ff5c166; id=976686556; xnsid=f72459d7; ver=7.0; loginfrom=null'}res = requests.get(url,headers=headers) res 响应对象 html = res.textwith open('rr.html','w',encoding='utf-8') as file_obj:file_obj.write(res.text) 2 反反爬机制 12306查票import requests import json json.loads -- json类型的str -> python类型的字典def query():headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36','Cookie':'_uab_collina=159490169403897938828076; JSESSIONID=090F384AC50BE0F1AFA3892BE3F6DBE9; _jc_save_wfdc_flag=dc; _jc_save_fromStation=%u957F%u6C99%2CCSQ; _jc_save_toStation=%u5317%u4EAC%2CBJP; RAIL_DEVICEID=bbXqzYOPTc-SPgujxnGkCBr9t3sq0JQoMSYUdg-FxjyQ5IkfcPCNoreXmBAIh2HSrM9Z9awDR5onIQwy4EZ8pAhaGXWYBAH6etIlFc4dyxLudz525GAcRgVX5HLIxOE1orODUNSb9wvTBAJptPms1z5Pz5K6FXES; RAIL_EXPIRATION=1619479086609; _jc_save_toDate=2021-04-23; BIGipServerpool_passport=182714890.50215.0000; route=6f50b51faa11b987e576cdb301e545c4; _jc_save_fromDate=2021-04-26; BIGipServerportal=3067347210.16671.0000; BIGipServerotn=1725497610.50210.0000'}response = requests.get('https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2021-\04-26&leftTicketDTO.from_station=CSQ&leftTicketDTO.to_station=BJP&purpose_codes=ADULT',headers=headers) print(response.content.decode('utf-8'))return response.json()['data']['result']for i in query(): print(i)tem_list = i.split('|') 定义一个标记 给每个数据做个标记 j = 0 技术特别 for n in tem_list: print(j,n) j += 1 通过以上的测试我们知道了 列出是下标索引为3的数据 软卧是下标索引为23的数据if tem_list[23] != '无' and tem_list[23] != '':print(tem_list[3],'有票',tem_list[23])else:print(tem_list[3],'无票') 三、session Session与cookie功能效果相同。Session与Cookie的区别在于Session是记录在服务端的,而Cookie是记录在客户端的。 由于cookie 是存在用户端,而且它本身存储的尺寸大小也有限,最关键是用户可以是可见的,并可以随意的修改,很不安全。那如何又要安全,又可以方便的全局读取信息呢?于是,这个时候,一种新的存储会话机制:session 诞生了 突破12306验证码import requestsreq = requests.session() 保持会话def login(): 笔记本 win7 python3.6 获取验证码图片pic_response = req.get('https://kyfw.12306.cn/passport/captcha/captcha-image?login_site=E&module=login&rand=sjrand')codeImage = pic_response.contentfn = open('code2.png','wb')fn.write(codeImage)fn.close() 从验证码图片的左上角 (0,0)codeStr = input('请输入验证码坐标:')headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36'}data = {'answer': codeStr,'rand': 'sjrand','login_site': 'E'}response = req.post('https://kyfw.12306.cn/passport/captcha/captcha-check',data=data,headers=headers)print(response.text)login() base64伪加密 根本不算是一种加密算法 只不过它的数据看上去更像密文而已 64个字符来表示任意的二进制数据的方法 使用 A-Z A-Z 0 - 9 + / 这64个字符进行加密 import base64url = '9j/4AAQSkZJRgABAgAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRofHh0aHBwgJC4nICIsIxwcKDcpLDAxNDQ0Hyc5PTgyPC4zNDL/2wBDAQkJCQwLDBgNDRgyIRwhMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjL/wAARCAC+ASUDASIAAhEBAxEB/8QAHwAAAQUBAQEBAQEAAAAAAAAAAAECAwQFBgcICQoL/8QAtRAAAgEDAwIEAwUFBAQAAAF9AQIDAAQRBRIhMUEGE1FhByJxFDKBkaEII0KxwRVS0fAkM2JyggkKFhcYGRolJicoKSo0NTY3ODk6Q0RFRkdISUpTVFVWV1hZWmNkZWZnaGlqc3R1dnd4eXqDhIWGh4iJipKTlJWWl5iZmqKjpKWmp6ipqrKztLW2t7i5usLDxMXGx8jJytLT1NXW19jZ2uHi4+Tl5ufo6erx8vP09fb3+Pn6/8QAHwEAAwEBAQEBAQEBAQAAAAAAAAECAwQFBgcICQoL/8QAtREAAgECBAQDBAcFBAQAAQJ3AAECAxEEBSExBhJBUQdhcRMiMoEIFEKRobHBCSMzUvAVYnLRChYkNOEl8RcYGRomJygpKjU2Nzg5OkNERUZHSElKU1RVVldYWVpjZGVmZ2hpanN0dXZ3eHl6goOEhYaHiImKkpOUlZaXmJmaoqOkpaanqKmqsrO0tba3uLm6wsPExcbHyMnK0tPU1dbX2Nna4uPk5ebn6Onq8vP09fb3+Pn6/9oADAMBAAIRAxEAPwD3+ivPNS1bUJdPlW2XWIJZ550EExgZ4mwMplZDkA5IIJwGA7Vd8P63d2Wi39zqC3k32C3VmR9gYkKSQPmJyeMZxQB21FcPqV14igvb/Vfs2qWlklsh8qKS1fGzeWbDk9iOnpU+r6tqVsohtdYij2W48w3GiT3DuxGdweJ0QcEcAcEHnsADsaK4Xwrq2p3un6fBd6zHIk1oqjydGuIpQxQYbzndkyPUrg0zXZdR0fxLpVqmq65c2k9rdTTpbpC8i+W0IDAbMkASNkAEnjAoA72iuH1C6iNlpk1tr11d2lxcPula7WDpE+FLoF24YDIIyCMYzxXKXOoapB4f1W4k1PUY5LfT7qaOctcxqZlVygjJkZWA25ywGRt4OTgA9jorh/Eev3507xBFb3OnWwtN0S75mWU/u1bcMdPvcfSpdS8RahBZ6lEtxYNLHps1zHNZuWKMm0DIOR/F+lKTsrl04OpNQW7djs6K8t/te+WGCAXOvLM9zsuws0MsxHkGUeWfuKMEE+2e9Ra/4hktvDVguma1qkEt+gWOC9MJdkZjmV5D90EHAO4AYHTBrneJik3Y9eOSVZTjBSXvPz89dL9vu7Hq9FeZaHrl5LqmnaWNcvCsjeWn76yuOFUthim5uQOp596ojxbq41DUzFqFrK90lwDAWZfsQh+VW64GRljgZJFH1mNr2BZHWcnFSW1+vd+Wmz+63VHrMjFY2YKWIGQoxk+3NUrqVUjYsu7A3BfUjkVgeFb3UvPvtLvr2C9Sxt7dormNWzKHDHcxLHJwo596xfiDqSwaTArPKJXmTaYi6nggt8oIz8oPBNbwlzK55mIoOhUdNu+33NXX4Mt/8JpYzR7por+AKoacfZ2YRZB+Vio47Nn3HNXbXXNN1PcLK8hnZQCyo43KPcdRXjuqanNeK+ZZUF2TNIo67XbagOGBPyhVPXp0rUj1S5j0TUrqS4k+1OywJKpJJCcL7/fZqowO91LxFYaeXSWR3lQZZIo2YqM98A449cVVk8Q2K6bHe3Mn2SNwSq3GFY/hz9a83nkEkkcCfbrm1UF2BXyQ0mRgnoT35OT0qCWaUab9ghIjiuLgmUqcg8/d98KOfpQB3sPimwmtYZZC2+WLzMQqZBGM/wARUHHcdualh1SzvmZbWfzSv3sKR3rgI9UuRdvdvetEZAULIqlWCgY657l+nrXWaVc3ctmDdEbyckAbcjPynHrg/rQB6boMirotvyxJD8844c/gOv4/hVRPEVjd6zPp0LO0sEZZnH3Cd2Co9SCOfSqcInl8JxwW832eSQMDKFyVBY5I98dD2rn7qODTby2vEnS1gt42iKtwHDHPJJ65596ANiXxboonngnujbyI+1xco0YDYBGN3HTBGPXNRyeJdGZlRdStXdyAqLICWPbAHWvPLbVXO+8Muo28t07TF4gJUYMePlw2MDA6DpV3Rr4rDeXzM0zvIQrmMKxVRjGAB33du9AHS6h4n0q1n8s3HmygldsKGQ59OOh4z+FZkXjbT3jSacTW/wAwU74CVDDsTjBP/wBevN9SvRLeAhMRISqLIVPJ5JOdwJ65OByabYXKxwlHgt5M/wALsAfqOP60AfUekyxzaNYyxOHje3jZWHRgVGDVysvw1j/hFdHwu0fYYcKDnHyDjNalABRRRQAUUUUAFFFFABRRRQByNx4PuL3UfNu7yJrX7XLcLEIEbYGXA++rBie5wMcY7kw6b4V1GLTtStLiLTok1CdFliXbKnkAYcYEUalmGRgrgZzk4xXXedJ/z7S/mv8A8VR50n/PtL+a/wDxVAHGj4a6KSUfSdEMTNcKSNLgDBH5jIIT7yfdHYjrk1pnT9fjlSdDp80r2EdtOGkeNRIpYllAU8Hd09q3/Ok/59pfzX/4qjzpP+faX81/+KoA5/SNL1q2u9JW9WyFtYWT25aCZ2Z2xGASpUD+A9+9XrvSp5/Fml6qrRiC0tLqB1JO4tI0JUgYxj922ee461pedJ/z7S/mv/xVHnSf8+0v5r/8VQBla3pd5dyWL6cbeJoJpHk8wsuQ0bqSCvO7LA5rmb7wZr8unaxb29/ZFtRsZrRlmUYJdSAxcJv4yepI56V3fnSf8+0v5r/8VR50n/PtL+a//FUAZWueH7XUdJ1GKCztftV1Gw8x4xkuQACTjPQDn2pus+Hob3R762sIbW1urm3aATeUBhWxkHHY4rX86T/n2l/Nf/iqPOk/59pfzX/4qk1dWZdObpzU47rU51/CVvDqNtLYQW1ta28E2Io02l5nUIGOO23d+dV7jwlNc+GNG00tClzaNbCeVSQSkZ+YKcdeTjIrqvOk/wCfaX81/wDiqPOk/wCfaX81/wDiqj2MNTqWYYhcr5tV/wAH/NnJQ+ELyDxVZXqXIawtHZ182YvIxKFcbdoA5J5yah03wjq9nqtvcT3NhNbQm82whGyPOOQCf4h69Mds12fnSf8APtL+a/8AxVHnSf8APtL+a/8AxVT7CH9f15FvNMQ1Z22tt6/j7zOa0TQ7rSjqN1f/AGGA3KwQpBZ58uNI8gDLAZJ3elZfiawXUrZoiSY3HVT1H1rtpnkkiZRbS5Puv+NZlxYTzD/j2J5H3mX/ABrSMVFWRyV60q83Unvp+CseTX+gM7B44oRMpGxnj3bQOg68VB/YlwulxW4lAlSTzd23ILbt3T616lPoFzIDtgAPbLD/ABqtJ4Yum6Qgf8DFUZHmT6XeTE+felVA5EMQQfmc/wA6guNFUwRoNyomSNp9Qe/4mvTv+EUve0Sf99imy+Er98Yjj6c/MBQB5SugF8geaQn3O4jwM5A+gNdNp4nhtBHM43nh1AI5Hf8AU/rXTyeCb9nJSKMDPAMgJpw8IauhwhTABVT5mODnj9T+dAGjpKeZ4ft8HB+fBPTO49RVDVrJJImQxhlPUEcVuabpd7Z6bFbSQ5dM5KsMckn196WTS7yUfNB6/wAYoA8ru9Btt+UtRG2OfKJXP1xiqNppLQac8RZxI6kH5yQMnPAr1G48M3kwOIVz7uBVVvB98RgRx/8AfYoA8duNDbeMlmPYjC/ypBowQYdJAeD949K9bbwNftn91Fn/AK6Co5PAuqSDBSEkYAJk6D0oA7Xwynl+FNHQfw2MI/8AHBWrVDTUms9LtLV7eQtDCkZKlcZCgcc+1WfOk/59pfzX/wCKoAmoqHzpP+faX81/+Ko86T/n2l/Nf/iqAJqKh86T/n2l/Nf/AIqjzpP+faX81/8AiqAJqKh86T/n2l/Nf/iqPOk/59pfzX/4qgCaiofOk/59pfzX/wCKooAmooooAKKKQmgBaKge7hj6yDPoDSR3SSkhT04qeeOw7MsUUgpaoQUUUUAFFFI2QOKAForwP4jeN9UOvTw6fqlzbW0J8kfZp2jyR1PBGc/4VxWi/EPxbpV9DdSazf3MLOV23Nwzo3Q4w2fUduOTx1oA+saK53wd4rtvFujC+hGyRTtljz909iPYjnv3HY10VABRRRQAUUUx84OM5oAfRXByfEjTYpCpulJBwVMTZHtgd6if4l6axwL1UPtC+f5UuZGXt6fWR6DRXnZ+Itht41Nh/wBu7f8AxNIfiNYAD/iaH/wHb/4mlzoPb0+6PRaK83PxIsDwdTP4QN/8TV/QvGNjqutQWkN/LLJIWwhVwD8pPcYppp7Aq0G7Jnc0U1TzWV4jne305GSV48yhSyOVOMHuKmpNQi5djVamvRXGJc3uxNks7DHBNyefzp87X7W8kf2q6gd1IEm8kLx168muT67HsXyM7CiuV+13O8RCeXKqOVkLAgADJPv15560/wC0XRAzPL/32ar65HsTY6eiuXa6uQP9fN1/vmo2vLjn/SJhyf4zR9cj2Cx1lFce95dBM/apv+/hqq1/eY/4/LgH/rof8aPrkewWO6ooorsEFFFFAFO9vVtIixySBnviuan1ma4k2F5RnGwqowc5OQM89scV095bieAr0I5Fca9ssMzbsjewQFjwF69PQA8ew9CMcdeUk7G1NJli3uHkcZLfN2ZSp/I/5xitKKQxyhh171jpKz7XQIuY1Kq0h+XLZ3DOMrtJPTPA6dBy3ivxffWBCWsiWqkcyrh/mPHJ4Xb3BOOo4GCTlHc0kj16GVZVBB59M1LXmHw38S3t2L23vZonERUo4UDPYgkdcfJ15+b349LikEi7h+R7Gu2Er6M52rElFHeitCQpkhIjJHUDOPWmTXVvbDM88cQ9ZHC/zqomt6ZM/lw6javIeAqyqST7c0XA+XtfZXnMkpBBk3EAZGM8gf54zisGK9jhsYrebDItxgeylTn9cflXQePbWXRtXvbSaXLRyFVOMFk7Eg8YI6e2M1wLPLeS7lGfm4XI/wAikI9U8BeLp/Ct8ZZpM2TkKYhycbjux74249xX0jZXkV9axXMDiSGVA6OOjKRwa+KQbuCymW5QhsDYZHwCCeSB346n698V7H8EfHbKX8OX8qKhctaO5wQxOWQ/U8j3yO4oQz3yimI249R0zT6YBTT06ZpTSH7poE2fO2sJdXviDWktoZXP2qQ74oyxU+Y2DxyOh/Oqk1peOy7tIuBkESFYWyfcHPXGce+K6XRGzJrl1yRLcdAMk/ebgDknnoOTXP6lrD3GqT2cI2tkqWMuxowDhs5XOBhskEkAHOOK87nk27HLg8NOVO8dtShcWV5FLhdMvDg4ObdhnpTF0/Uf4tOuwM9oWNTprt9d6msNtO0xVFTfEWfJGRk84xk9eQeOakGo6tc3xNpfbpZlKiDziSoZQwIBPJxgDn+L64Oad7BLKJN3dyfRdLa4nla+sZl2qNiSKybm9vXgdPeu48AWUFl47kjiAVjp0jOgbIB8yPHB5Hf8+9cTomuXdzqxt7rUoTA7Om15g2whgcj164BGc54yAcd94OkJ+J2owAKkUFgVRAOmWjP+R29Kzpxn9YUm9CvqqwyjFx1vueoDrXP+L5zbaZbOHK/6SozjP8LV0AFZXiG/s9P09JL2NZInlEYVgDkkE9/oa68ar4eavbQ7KfxI5C58RLPHHGHEMirtZkfBar9hcyzQ7JJmbCgIwKZz61zc+p2Ty7RYpHH5hXzXJKEdsEf1IqKS3ihVJorpoRngLna3484r4j29aNTWR6XsVa5uaNr8N5rUmnPG8NxzmJ1wCR3B+g5BA/Hmum8nJwBwK8+8L28c/iyzl2O94okM7qNysfmG/PYY2ge5rsH8U2NvBGtwHN0XaNoIBuIIYqT1AxlfrgivocPVvD3ziqxSehf8jPaoZLXJOBWmi74UkZChIyVPUZrO1DUrWwjZpJEGwgFiwCrlgOSSB3zjO44OFY8V1cl9UZWKUltjIIqjJBz/AJNcr4h+Jlpaq0ENuLiUqMbZnjUNkYI+67jkZ+5xnqKk8LzS+OIp7jX7TBXDRQK7LGFJODtAABGDgkkkEj+E0nTajdlRjfVnslFFFeuZBRRRQAjDI5rm9eswZBKCyAnJZTgqfUHBwffFdKaq3luLiB04yw4NY1o3iVB2ZxCRMq/vpFhRmMis0Y2qRzu6lQByRzjnHJGKnlgtL5lhkgimztOHTgZyxwWBVuBjqeMnsaV4WttTi3qDglU+TP3sA49B0JP+yOvSi3nUlJRLG9uSWEezAIYfKM4AACYABzn071wXszpepd07T4rUTacIl8kr5qIOFIzygH+yduDjpgdq2YHkRuGJI65/jH+NULZA80cjtloSRlWyp3Dhc56YIIzgnANWZLiKGVF5dz90Yyfy7fX9a1jKzuZtGtG+9QfWud8deJx4S8NvqQTfIXEUY/2iCf6VtWJmZC8qqpbkAHPHuemfz+przj4+Bz8PoPLzu+3x9P8Ackrui7oweh57B8XLPUp4otX0GS44AkmDrMzHjJCsBjPXGeK04IfCHiASB7K+0uaZig8yN4uD3A5jA+teXaTrlpotgZYY/NvHzncOnPr1xUMvjDV7yXEl28UZP3YTs/XqadkI9Y1/4f3Op6NBFbXv9o20HyWzO+2aOMY+QSfdkAwcA7cZwGAAFcRbeC/K1BLKa9hs5sj9xODE5JOON3Dcg/dJHuap2WvajH5UqXlyWVsrIf3jofZvvL9RzXY2XjK7ghaz1+xGoWWNsiSKCyYIwPm4bAzw/JPO89CAa198Mvtfheazjwb2NN9u7Z4cZwOwAPTnI5rxG2up7G73xjBVsFCe4I9+vT8q9102LT9UDSeDPEU+lXse4vYFsxoc/Putn+7gsFyuAD0ya8w8ceGNestWudR1OxRBO3mSXFsGaBnPVs9VJJAwQOSe1JMD3f4TfEKPxXpzWF3Iw1OzRQ/mMuZl6bhzkkcA8f3T3r0wHIr4r8J+Ibnwr4kstVi3FY2xKg4EkZOGX39u2dp7V9kabeQ39lFdW8gkglQPG46Mp5B/LFUMummN90080x8bD9KBS2Z4docfn+HtQxtzJcMMuAVHydSGIBGD0PB6VzsFuBqV3PbST3G9miWKREVWmI34bBBIznjAxng+u5oE4TQpQSMfalzn0IwSK5TUJtRulaG5ljEJYlVRVLe3OMivJjNKbRGExnsKNr6FsaVd2t/Fv05XBjZ1cxKfNZxk71AIUDDcAHHfrmpLHT7qe+hlSNH+xrs8tmZmKiMKR5fIG4kEDPc+tYralespV5mlVFOCQDjgjOD9a0tO0sXsdtN9tcfaQ5uQh5K5zgDHPXng/XoTtdJXOyOY1KiujWtfDRi1Q3R81FR2mYtdM2Q2QPl2g5yRnJP3D1zmu18GL/xdbWj0xZ4wfrF/n8a5Dw6iR3k8bSzFSocGRjggnr19c5+orsfBJH/CztbA7WoA+mUqaM+aa06nLia860oOfRnqArh/irpUur+F7WCGRY5EvVkBJx0Rx1/Gu471yPxGuPs3h+2kJuABdqD9ni3t9x+3+ecDkkA9OLU3Qlyb2NqTSmmzwe6i8Q6XlQ8+wdGxuB/Hn+dXNKi12+1P7NPdLA8KrI6zyBOCcKDjoSfl69a2/t+qSSRiLTZtpwUEsBByc9R6dD3xvB+bGKvtNNbmGC80iLaTskcCMLsLEbSzAKuMZUHAYnGRwq+XRw14/vkr+h1zrdEdn4S8MWek6W32ae4hvmO6SXfuIODgYOVI+Ynpz17CoNGj0dvELQP9qj1WSR3kZ2UEvktnGOAcE47dBVGDxTHbKbay097med38ydZBa+aqgfOpIyQVU5I4+XOeRUFhosNjqNncrdwRXspLhvPLK5ZAzYbuMeoU85xgrVzpyglZXRzPVnpVzbia2ELyuEYFWZSVYjHZl5U9ORXhfjrSZdD1mK0hkC2MkbmKeUk+QMtuRQx7fzPU173tV05wQwwecg1yHi3wbP4hlg8mWEIgYMZuSdxXtt6YBP1A+o6paJWRMXrqeFWdlcXd5KNIAlaXar3TDepUdcc4Y/N93p0GR0PpHgTwrfNavqD6jeRSOo8u43KRITgtkYIYcA57556V22keAtF00l3gN1I3DG4bcp4Axs+7jgdRkeprqFjUdBxUSjOb12Lc0tieiiivTMAooooAKQjIxS0UAc14ksBMqyYGxv8AWZAIwPUHrxXLrcm3vX+0COFYQA0rNg/KSUI25UDAPHDdW44r0DVFdrGQRJvkONo9Dnr+HX8K5C28DyS3wnvZQcNuzjp7KOgxj8+e9cNSk+fQ6ITXLqRWl1dXxEemB1twFXfIqnpgZUYyenc10lhoYiPmzySFyuG+c5PuT/nitKysLeyjCQoBgYJPJNW8CtoUEviIlUvohkaLGAqKqqAFAHYDoK5f4ieGJfFfhZrG3l2XEcqzRA8BmAIwfwY11dBGa6DI+Kte8PXOlXbW93BNbyKfmDKQCcf5x7fjWPHZkS5VgVHYDJr7a1PQNM1dAt/ZxTgfd3oDj6VhRfDTwxDL5i6cmc98/wAqAPAPAngy/wBZ1eB/JdYI2Du5H5Y9K98k8FWN5YrBdW6yBQQCRyPoa6iz061sIRDbQRxRgcKq4FW8UgPnfxd8Ib+yuV1DRJpC0RV0CZEilemMc8dsciuf034i+JPDcgsdftmv7VcIXfiRQMD72Oen8XPuK+pJYkkXDgEHiuU8Q+BdM12Flnt0MhGA4HPtRYDxk+GvBvjqBrnw9cLYXpG57ULtXA2/ejzwOcbkOASeteg/DTV5tFSPwdrMgTU7dS1sWbK3EWTjYepxz8pCkDHBwTXnviH4OanpMkmoaPM2+D97GIyRICvPy47/AORzXL6Lqurxa9p/iPUnvbyGylRJZ0l/eRKD9193ABB+h3Ebic4QH16ar3rmOzmcc7UY8ewNWGGRWbr8xt/DupTKSrR2srA+hCE05LRiaT0Pn7U9Qs9Ds7a1gzc3EqGTKH5CQxQnJ5xlSB9M98nCn8QXt1lV8qLjosYJ/M5/nV29/sxtO03F15t7JB5bh0+S1Uyu2c4yScg8DueoPC2tjo0LsJdVtSgQgHypXyx+qcD6V5PsYp3sepBYPBUYOcbt9zdtnNnbxJfWrSzqgMkieWozjITlu2QD+faktdSsNRjuJIRtkiZVIMak5bjcTkjqf0P1OLe3ELx3L/2zbyTTKUziUYXuPuc9vyFZj2VobdFg1giUxkSNtkbLE5P8AzzmqjRi9zy5Vabk7M9E0Z4ZY/KMSRhgCMZAY44GcYB4rV8Bvv8AitrRH3fs0g/J48f1rgfCMZ0mWcpP9qhk2/OqMpY+jA9ecflXf/Di6ifxtfRoP3k1q88jf8DTA/I0UqkFVUE7syqK8os9ZFef/F7VINI8Nabc3IkMB1FY3MbAEAxS88j9RgjqCCBXoAryv4/7B4Dsi6qf+JlHjdyAfKl7d/px9a9Rq6sbJnNz67Fc6UJf7XW9ecyTbRbiaUDqqiNxlMBh1yMZIyMGoLuSO1uLe3uZprjYFMjSfIiYwVl2JuKnIYHcgLKoOTg14pGWtpEkhOyVDvDhuQwPBVh3yMjH4muj0/xRqF4IdGvL2LyjPkXd35r7OP7mdpzyfmXOTyR2xdNo0UkdrqmoxQgvb30drCbSOFdswlaIDuoKhlbIPA+YbuB0xn22l6rq2mC/1ETjTynnxX1xGZ5JGKgsOPlOcclwx6gZYFRc8JWnhu7kvri5v/7QvJh5QySrtudlzjbhVIA7cbh6V3EkEjiJBYW8pt2BE8KNbGT5CMbMn5SNvz7jkYHOQKjbcowvCV7fWQXTrXVJbQ6dlmlgt3eBwyNkyAsFYEgYYAkeuOa9CtfH0FlFIviIR2gV5FjuolZoZQrYz04OMHglfmHzZOBwF1p1nbxfZIJYbeNJGgimASYpI25sDCjGXyDuOOmcAnFC3fVYLL7XOWtbyU+XHHGNxZwpL7lK5RgcFWHI+UEHjCW2hLR79aXVveQrNazxzQsMq8bhlP4irHevnDTvE9z4blfUYc2kb4S5Eb+XG8iqMMo2kEt1xzzu4GTXVQfHhEikN1oFwSrcMhKgjseVP9KadxWPZ6KKK6iAooooAKKKKAA0mBS0UAFFFFABRRRQAUUUUAFFFFABRRRQBHJCki4ZQR7141490X/hB9aXxZpaRva3UoivrJuFlznkfzOe9e01zvjLwoni7w/NpbXX2YyMrCXy9+0g+mRnjI696QHRGud8b3jWPg7U5I4nllkhMMaIMlmf5Rge2c/hXRVFPbw3MRjmjV0PYimTJXTR8nXehas4JXSb8HqcQNWcdF1lODp16v8AvQkfzr61Ogaaf+Xc/wDfbf40x/D2nMm1Y2T3DZP65rD2COiniasaapztJLuj5FjS9JdVRwUYq/H3T71NBE8citM5bHRQc5/OvqSPwNosDSNbwmFpTukMSopc+pwvNSnwhpxx8844x95f8Kl4dPQmdadrU0o+iPm+HxQ9lBHFb2iEqP8AWZG5vc59K7P4S60lx4+YzRrC9xZPFGFXG5gVbHHH3UP5V6yfBenM2WknbHTJXj9K0bDQrLT3DxKzyDgPIckD+VKlhYU5cy3OT2dRyTm7mivJzXK/EHS9J1jw/DY6xCJYZLkeWN5Vlk2PgrjqwG7jBzzkEZrrK5zxp4V/4S/R4dP+2/ZPLuFn3+VvzhWGMbhj73XPat583K+Xc6Fa+p85eI/hJqmnebdaFJ/almScw4xcJyeMdHA4yV5PPyjFefIwhmw6vuT5cZ+6Rx/P/Ir610n4f6lpvyy+JDdIPul7PDg/72/kfX86Z4i+E+jeKIy2ovtu+Nt5BEEl46buSHHGPmBIHAIrODqbSQ2l0PlhmlgjWWOSSFiuCeccg8K3XBB+nuc11Ok+Pr/SrgLHbQ3MMMewC4IOwA9VI+5wegP5kA16Gf2axxjxZgZyR/Z2fw/1vSnn9m9ZCzSeKQzEADGm7QMY7eZWjgmCkQReL9G1+1065EzaWbSQST22UiVUXONr4KEYYfKACQWypHI5bW/FEV032PS4PtSmSSKK5bfsfeeeAep/3sYJG3HJ7GH9nJoOV8WZPqdPP9Ja0I/gGqv8/iIPD5gmaH7GwV3BJGT52cYJ4BB561Hs2PmPE7u7u7x4zeCU+SfJQSDChlByuG75K5GCecHjGZreZIoFvbG4Rj92S3lYw7uP7ybNx4/HGa9hPwCnZog3izEcRJSNNO2hcnPA83A5A7dh7Yav7PFuokH/AAkCFX7GwIx+Uoq+W2wrnttFFFWSeYfHfVtR0bwJa3GmX11ZTvqCRmW2maNipjkOMqQcZA/KvnQeOvF//Q1a5/4MJf8A4qvf/wBoj/kntmB1/tOP/wBFS18xJjcN2duRnFJj6G9/wnXi/wD6GrXP/BhL/wDFUjeOvF/H/FVa5/4MJf8A4qsJsbm2525OM009RSGjof8AhOfF2P8Akatc/wDBhL/8VT4vHHi4tg+Kdb/8GEv/AMVXO0qkq3BwaCjqH8b+LPMwPFGtcf8AT/L/APFVA3jnxd5hx4p1vH/YQl/+KrC88liSOTTCckmkDOotfGvi1uW8Ua0frfy//FV9nV8LWwCwF8j0xmvumqRDCiiimIKKjllSJMs6r9TXHeKPF+o6Pq2nWmn2MM8Fykkss0jMDEI8F/lOOzLjJGSwHHGSwHa0lYur+IodH0y5v54ZmitkLyKoG7A6/wBM+n6V57rvxmtbfSft2mmKdHQNEPPjjLHOCMMd/wD4775pNAesyyxwrukkVF7ljgVy+pfEfwppF2tteaxEJi2wpGrOVPuFBIHv0rxrRdT1f4oXk1veeITYRqM+VCGVdgBJZn5zwD8ucHHbqNHxP4L8I+HfCF1YaW7XWuzqoiu5SS3yupby1XjHGMgcBuWx1Bnt2tSyRWaNG7IxkAypx2NYC3d2MD7XMQOpMhrd10Zso/8ArqP5GuOleY6pHbxuYo2jJLAjG7jjnqcZ4FbR2O/DRUoal0ancySvAl5MZEBDjzDkZ6fzH5VR1/Vr6y0m7lS8nXy4WKt55UlsYxnPHPT3rM2Sx6zI9vARIPmwZMqq7eOegyc/p14FVNQ1CK50bUotTjMkQtnkfauMKq549cdiM4PfNNNJo7ZYdct10PNpvGXiO20/Y2v6s06qxd/tshw+7kZDdgoH/Aq9T8G6nrEul3Md5qV1cNHOYopmnZiwVI1Jzn+9u/HPvXP+GPD+nWumWmtarKkdxJGG2tthQLkbQTwW6L1JHPTueui1zQxsih1OxG1dqIlxHxjoAM9Pp+VXJHJGMY6yRF4v16903wubqK+ukmlkjVCkrAglwx79Nu78q4jXPEXiKKH7KNY1GKe1EKyOl24Lny2GOD1yMn6itXXvEGlyPDdXFws0BTNlZYba5/56PtPflQGyu3cTntyETXPirWI7m3huFE12rZVSUVcYY7uTwAOvPPWtIpKLuVDlvsey6Tdaj/ZVmZ724kl8tfMYyHJOPr9a6vW8nTigkkjEh2Fo5CjAEEcEEEH6c+nNcjK5trKR0j3si/KoJyfyBP5An2PSuv1n/j0T/roP5Gud2ukc+MVrNeZxWla1e6fqh0LVb2drhy0lrO8pIuEz79GHcDIGeMAqo6IXVwf+W8v/AH0aytZ0dNZ08Qecbe4jdZba5UAtBKPusM9epBHcEjvUGha0+o20tvdLFFq1o/lXcCtwG7OuedjdVJ+nBBqtDhN77RcY/wBfJ/32aPtM/wDz3k/77NVQW3gO5Vc8dCT169vT39advUsdrA45xnPWiwyY3dxjiaU/8CNNa+mjyzXDLH6mQk/lTCM46c1Tnkjhzt/eSKOFGBzjPXoMgfmaVgNQXM5GRPIR6hzinC4nHJnkx6ljXPaLqEz6hd2NwEA/11sV6Mn3WXoOVO0nk8v1IxjI+J2qHS/CkbC6uLXzrpYvNt5vKYfI7Y3YPB2+lJger0UUVkM8j/aK/wCSf2H/AGFY/wD0VLXiOj/DHxdrthBfWGlF7SZd0cjzRpvGcZAZgf0r6Y+JGg23iHQ7K0uoWliS9Eu0MQAfLkAJwQT97+WeM1m6FapodglnIrC3DFUEbEBB2B5HToMdhnvUSlYasfOWs/DrxXoFs1xqOkSJCuS0kbrKFABJJ2EkDAPJ4/SuYI59+/tX2fex2txat9njknkJyg8w4Q9jyenHoa+ZvFnw9vdCle4sg91YEEpJwSMZyCB6DOeBgAngCpjIq3U4kYzzSnAPymnxW8s8yQwxSSSvwqINxb6AVtad4Q1rU1aSOyeOJc5aU7cH06Z/SrdhGDRX0Svwh8HXWi26i11KKcIN9zBKWZzjqVIYDPsvFeZ+PfhvN4SRr20uTcWDSbVEibZIwckBuxwByeD7VKkmUjgq++K+B/8APFffFWiZCHpWde6gI5BDEw8zq3PQVot0x6mvKPFPiOHRfFz2F1df2fdMDJbS3PMF5E5zglQfLZW3LkjkDP8AEKqO5D2OgTWpofFjadfTWojuEBs1Dnz2YAlsjpjg8nb0xWB8Vb8WPh+HULUyC6jkWINEWyqsyucgEAqTEoweeevY07uS8utRtLw2ubmNSqSwMjhlYdAQSSOfbvxVO81O9t8/abS9RR1dgkaj1OZHUelacqJcr7I7jTtah/sOw3qIZBbR7oghTYdoyNp5XHPB5+tY9y3hq1me9Ol6ek5JZpltk3EnrzjOTWFpcV9rEYlgityjAuhS5+0MwBwRtiG3Oev7ytbVfDX9kabZ6gbh5dRluIIbaRod0UDSyKgYplR/Fj+JhuGDgGjRE3kZdromnXev2thZaRBb62y3F8PLYRG2jJVAXK8ncGyMgkZIwO/oPh/wRpeiyfaHT7XfcZuZxubjGOpPIwOSSfp0rH8KXzv8UfFenXEiEW9rZiyQRgYi2sz4IHI3vk5JPI9K9A71m9zRGXr/APx4J/11H8jXC63eG0WLa5RXJyBnc2OcDj0BrutfGdPUf9NB/I1yl3YW16U86LzPLIIxkfy6j2PHtWkNj1cFJRjqefR+JLiHUWll2KCPKYW2IpCBjOPU9D7/AJCumimjvNHSXR5I5WONzn7/AD1zg59Bjjp19eI1iy8jUr6BAUiDs27ajKf4gPmXOcEcZ6+3NUtB1u60jXjOimW1lx5iKn8HHOMZz6nnoeTiuudK6TR6NV8rTS0LGt3lzpmpRsEFxdNklZI12uQcBuB1zk47YyTS3niTVJraJjOLe1uXBKxYQSDp8uDvHzAg9/QnNehzWmn6mtrd3ENpd25woMyK+S2MFcg87toxx174ArN8R+Gf7WlTyYcJDGreWMojcMAAR6cZBAGB15NSptaM5qnvyd9jlby58zRLjVIIk8xJXF0sJ8sx4XAbIAC5YZwODvI68i14Yu2XWomtWP2edFjAePO7ggk4xj2HI4Iye+r4S8OzRW99HeFZIZwVkXafnY43EqRg45B7c47YGhF4Vt9Ib7TZmeVUlDsu0SMy98EYJ+Yb/rnrnBUp30IpQUNGdRkDGAR/Dnt7j/Pr2rf8Si9/s1GsPs5lWUEpPuCuNp43DO05xzhuh45yMCM+YoOTgqCN/DY7ZBxjr3FP+KXixfB3hD+0RAZp5JhBbrxtEhRyC3IO0bTnHP8AOueWjRxYvoZU3iy306ZLfW4ZNKdvl86U74WJz92VflUHB5k2njgVyHiKz/4RnU7fxX4fFvJp1w+JsvtTcxwSH7I5xgngPtbIV3B5fw/8Wora3Eeu6fJczSlFe8YhmeMEh8gj6gAZHzHpyTYvfFngN7V5dE/tPS7y5wj28KJHC42sB50ZJiZDkE5DcfjQ2cVj1mwvodTsIr2BCYpE4Zm2lPmO4N02kN1HOCCCOCKSbXLW2uWtERp51O0pEFAGMZy2cDG7ocHg4z38Y0fxF/ZUE8E8SXFhKiO0+l3DR79gxJJ5TdXxs3KCnyjdgqWNemeG/EvhHVYre3sryGGbC+Xbzx+XJyueA33u/IznPX1Exm1crLeRAzSTJFj544AcEEY4wN5wSeVK/lUN3I8AVlQeWpBbC5w2Qeg4HJ654PuasrbXuplit41pZE/u/IVWkmI4LbmBAU4IwASQAc9qo65pV1pOmTalpF5IZLOJpXtbgh0mRQSVBxuRsZ2kEDPUYPDAz0k+x+IdH1A3zOksjW2TtKmN1AUKV45kER+hqL4vwTP4Mgmt22yW19FMpyBjhkzz7vVPWbme38PwalCkc8izRXotwNgIV93GeAFxyw9M85q78Sdc0y4+H84inhn+2GNooySpYCQNnb1wCBn0B96TYmew0UUVkM5fxxaR32nafbSxtJFJfIGAI4+V/m59Dg/h0PSsm4tNSvI7uMW0EkDgYeQMuR2G056c9hzjrkYtfE2/TT/DtrJIyqr3gQlmAA/dyHv16YxXIaXrcV1YmOQXSwwnCLaO8PHOMFWTOcdB6j8c5XuZyim3c7G2iurbTFsElBuzku8EfCDOcbTkL1wAfqM4OMXW47fTdAmubi7Q5LSO6naFcA9BnAAKtkDPT2NXDZ28awusmoMwIPzXs+AO+75zn0x6n8a8l+JnisTzy6TZr5bFh9pdQFY7eAGI6nv+WOME5O7djWMEtibwQLDXG1eOwVLd5Loyyog/ePH8pB5HCkg/LyAfqM99Y2EOnXiLFaQJF5ZlmnlwJFjAPDd8fKOSAMHp1NeA+HLma01hfJd1aQEDaSDwQeMEYPccjmvfNLu7tT9slaGeeSAQGRnMbqN5Y4YZXA3cDZk4GWNXbUmatsaSatDBEk1hcW6W7sys24KQcklgpyCSc5475yc1B4x0KLxHoDx37SzxqgIijC8OP+Wg4zuAJ7kcHIPNXHGlC1Mh0uWAxyjLyQCYyjOSwEZZu/cDHoASafNDbaktndSBU8gq6RbJFZCMHjcFI/75HAGRSdkEOdK71PmzxR4Kv/DYFxkT2jEYmUYKk/3h/Ijg+2cD7QYkLkV85/EjxDp9tFe2QjEjTRPGtuQdxJB/ecjG1eCCM8gY7lfo2tIO6Kfoc14zv9dsNE87QrBryXePNEeDIseCSyKfvHIXjuCcc188+LLC81UL4hvbTUoLeEiOW9mt2kLENt5GcDDHHzMuQRgHGK+q8Vz3jnRP+Ei8D6zpSwedLPav5Me7bmVRuj5/3wv9eKsRi/CWeS7+H2nT+but/wB4kCfKSqK5XDEAZOVY5wOG9s1T+Nek/wBo/DPUXWNpJbRkukUdtrAMT/wAtWJ+zvqX2jwZf6e8xeS0vWIQnOxHVSPzYPXpviLThq3h/UNNLiMXdtJb7yPu71K5/WmB5f8AAHUPtXg2aBwP9FvXVBnOAwDZ/NmrtPiCCvg/ULiM4ktEF7H7tCwlUfmn6145+z9fCDVtXsHcq7pHIqHttJDcf8CWvbfFN3p9t4fu5dUliisREyTtI3GDwR6nOcYHcjHNMk5q2Bt/jrBcmP5L3QXhDqOrLMrEn8No/KvSwa8w+Gt43ia/t9VBMkWk6eNOknYAie5cRPLtOc4TYozj5vM4JAyfUKTGjL14ZsY+QP3o6/Q1zTj5TzkHt2NdLr3/AB4p/wBdR/I1zLyIhClhvOSBnritYao9LDfwzkvGdlaRwjUWnkhuNyhShAU+hPQ9AwznuK8+LwOWieaVDIMkbAAxxgncecHjB579a7zxsGVLWQFljG8bjlQpOOT/AJ7etef2Gny6nq8EceEiY/PgHk7sHnGcYPfsG6fdrtpv3LnqrSkjXtfFGoaLFBpiMbjyZDLJtxu2AH5eRxzznHPODmtM/Ea5WKZoNMWOKNW/10j79/Ixkj5jwPzFZN7CkFtfl1ZfL1Bba1wMBUUYyOOOGBJHXOcZrNMUF+qSmNfOQ7g/que/vwfxHTmmoRkrmcI8+q3Oy0L4gWTL5dzbSRAMS8hJbGSfr/PvXbWd9bahAs9tOs0YOQynp9eBzXjTWJR/MVzkHryrHnoTnP8AXoDnrXZeDtIvor5L4CNLR927gAvxjkD3GaidJJXuXPDpRbkzvc7hkEFawvj9PDbeBbCSe2WdP7UjGxiR/wAspeRjv9c1vDPBCj65rS8caHpGv6LDba3AJrWK4EwUysgDBWGcqQTwTxXHNao8bF9D4/0/SdZ8T38i2FlPdzMxaRkHCk/3mPA/E16jo/wIklt1l1nVDFMT80NsA23npuPX8vzr1jTFW2iaC0iggsI8JbxRQ7BGBkNnnB+YHsO/Xqbckvl7eHeRh97aCPbP48fjQo3OK9tWeP3fwetbO8jbSdYuIpIvmHmqku49sLxwSGBDZ69+lZeqeHtZ03SotNt0SdhIW/sy6iSRIQwyfKZslQcMQQ2cCQdY2ZvX7N1jjScQRxLKzgSGQSFsO2MHJyDkkc8cjA4zj+LmtZtNMk0gh1OIbrdy20kjDbC3TnaCOu0gMAStDjbyGmnsZfhW/sNP0+0lbxFd6RPHEDdWOqA+QZMbfkMmBtypwEfnGOMGtmL4keHdQnutN/tC0aXDIrJIWRwSFUcqCzNk8KGAxye9ZCXsupaZBqV2vlo+IJHkwMMHG5dpB2E45X2GGYfPXP65oHhlFg+22tujSMdrIrgYwAR8uDgfLjr9Bmleyuyo05TklFXZ1OrI0c0MV1ArBsCJUQHzAcK3GOQBzxjIAOARzx7aFYadqj6nq8BueNzWx5UdwScHcGI7YGCwyQeKuiXkNlObHTr3UfsfSO0ursLFMCeRgjbGeQevOCOMim6vf2Omlr3XZVvtTV3UadD/AKuMbQcOTjaBkr/e4xwBUKalszavhatB8tRWPqOiiikc55P+0FuHgKxZc5GpxnIHT91LXmngvXdO+yrb3euXlhOsexi8RmQMCcFdpyvbquOOp616b+0AwXwHY7gCDqcYOf8ArlL7GvnRJ0+VW3bV+6vp+tRJ9DWNJTR6T4m8eyWFu1to+ry3kzN81y8GxFXGPlVmZs9PQDPfIx5rJM9xI0szs7sdzM5yST1NWw1pK67ygwMYAx/UfzqaPTraZWeK4jLKCRGu8n9Aw/Ws9DRUrbGarGORZY22yIQyt6H1r0DSPGVyLaOSS2MaE4WcFiokB+6oBwcnB7da5aTw1crDGUeOaSXiKOCWKVifQhX3A/8AAas2kuveErhljE1tLKmJIXiIBGO4lXafyNUmRUpOSPYNJ8R2wtgPtFuIwoOIgz87iDjuT/s4yOCQMjNDxh49t9JtHitXjmupAQiK2SPdvTnt/Pt5prPi2+1S3Ft9jsoCq5Z7O2QO3QklxkqT324HtXMiJ2RmIPy9flP6fpQ9TOFLl3Kmp3d3fXst3dyvLLMdzOec/wD6q+7q+Fbk+WgKEkj7wP8AhX3VWiE9wpG6UtFMR5lq/h3WfB3iS/8AFnhOzW+hv1LalpIba0jjJEsTd2yT8uCTuOOSNuPqfx6sbOOa2fw3q66nEQslrMFRUPcFwWI7/wAPavZcCk2r6D8qAPjHTtf1s+M7zU/DkAs7+9kk22tvH5hIZtxVVYNzkDt9B2rv7H4Z+OvH95Fd+KtQns7HO/bdMfMUHdwkIwEOVGeF4OeelfR+AOwpcU7isZmg6JZeHdGtdI06Py7W1j2ICck85LE+pJJPuTWnRgelFIZl69/x4p1/1g6A+hryHV764uNZnR4zmM/6NIDgxtjpxjjcpzn1HX+H1TxddrZaMsrFf9aAAzYBOD35/kfpXi80bCSa5SNnSWVpPmUOG3ElhwAcEcbuCS2M4ANduHVo8zPYy+F4XsdZfu2rWlvYLGBcXOCXK5WIAKWI6E8MB269RTNJ8N2WhyGVnWSXhY5GULtHXjOeevP1985dxr81hYJHgyTxAoJTE+OABuyAQSck4yOCcmsieRnAnuIZ7sEkmQy8J0H/ACz6DIJ5P41UYykmnsdjhPlcVsP8fmWS9APEMaKQwwQwJ6n06tz7VQ0HR5bnUreJIMIrjcE5CoAMknsfkwD7V2mo6LZ3K6RaTqd7koOrF41UsQTycenPetzTdHtNMRktIBEGO5myWJxzyTzx2Huap1FGIvaQhG63GQaNp9tc/aYbWOOVh1UcfgOgPHUetaC4QYAx6c1Xur61so91zcxQBuQCwGecfjz/ACpljqVrfxmazuY51xyUbP49sD8KwtJ6s5m5PVlxR/eA/Cug8QyxRWMQlmji3yhFMjABmIOAPf6Z+lYBboQAfp0p3xQ0u71bwbNDZLA06M0ipNAsu/EbjaoYHDHOARzWUt1Y4MX0sc5NqFsmqvaWWp2xm3nzmmuP3lsxKqsQTqCWyRnuQDneM8P4g1e7u7uS2nmkMVvIy4ZslmBI3HAAz16YGOgxXk41ONngeS2XfGMNIAOSDkNjoGPQnkH0zzWtD4u8s+XLbKYhgII2I8tMcLg8nAAHXPuetehl2Io0qjlVR5WKp1JxSgzv9I1n+x2upnl2RNbu2TjG5VLJweM5AH0Y+tQWya34wmlu7aMtZrKUaeVtiODjrkkgAxg7FzkN2H3vPtR8Ry6jGLaOIRRscsWPLY/kM8/1r0r4c+KLV7EaRcSwwXCtutyZMefk/j83I4z/ACrzuIMeoxdXDxvb+r2NsvoSUeSoyWLR/FOgW+o3cd1p7wShZJ7bLFcpgiRdwHzDABBwrDg9qyNYxq1vFcaZbTSW8ckpeQDhjlc4P8XzbuRx6Y5r02WeBdkEhVvNyioFLZ45yOSAB1JwAO4ry/X/ABbaG6FzaXymCB8W0UOAFOBluOg/qB2zXgZTja+NhKFZW63tp6HrKawlWNWGtjn8Yx3z0/p+tMvda2M5PlzXqbUE7FTsUKABuIPYgcYK7Md8DD1K/S8uWk86fbIxyg4Gf8n/ADmqCRyXc6W9uju7thIlG4sx6AAdycCvWpUOR7nTmearFw5IxskfeVFFFaniHJ/EHwWfHWgwaYNR+weVdLceZ5AlzhXXbjcP7+c57V5v/wAM5jv4pH4adj/2rXulFKyGpNbHhf8AwzkgbK+KSPrYZ/8AalPH7O5Gf+Kq/wDKf/8AbK9xopciK9pJdTxUfAKdYREPF8gQHIUWOAD9PMp6fAe6ifdF4uMZ9U04KfzEma9noo5EP2s+54u3wEkdiX8UK5bqX0/cT+JlNMP7PqkHHiXBPcWPP/oyva6KOVB7SXc8Nl/Z181Cp8Vde50/JH/kWvcqKKaViG7hRRRTEFFFFABRRRQAUUUUAZHiHQk8QWEVq8oj8uUSglN4yAR0yP71ctD8MQl59ol1ffxtKLahQFwRgDccda9AorRVZqPKnodFPFVqceWDsvkeen4WW/niZdQVJByHW2+bOAOfm5HGMVai+G9vb3a3UN9sk2bGTyMxt6kjdn1713FFNVppWuU8bXe8vyOXfwpdmEGPVIkuQxxKLTIK7cYK789cHqKoX3gnWLuxlhi8SrazShVaSKyOABvztBk+UncvIOfl9+O3orOUnJ3ZH1mr3POL74VyXhtydefMMXlBnhcscksTlZF/iZj6Y2jtk6WgfD1NCinA1WW5lm275JIlHTOMYPuepNdrRWjrTatcPrNW1rmJ/wAI/wDNk3Of+2f/ANetG+s/tsCx+Zsw27OM54Ix+tWqKzcmzOdSU/iPG/FPwBtPEGuTalaa5/Z/n/PLELPzAXPVh864z/PmsX/hmf8A6m7/AMpv/wBtr36ii7IPAR+zOR08Xf8AlN/+21Mn7OEsUiyx+MWWZSGWQaedykdCD5vB4Fe8UUnqFzx7UvgnqWqMZJ/FtuJnh8mWZdGQSSDuS3mZBI4JGMjg1hn9mjJz/wAJdz/2Df8A7bXvtFKKUVZDbbPAh+zRg5/4S7P103/7bXceDvhBpHhBRPHP9r1HnN3LDgrkYwgydoxnuTyeccV6LRVXEFFFFIAttCQAsiQotwsxujAwSy0JzgD/2QoK'img_data = base64.b64decode(url) 返回的是二进制数据print(type(img_data))fn = open('code.png','wb')fn.write(img_data)fn.close()'''我们打开了一个有base64加密的图片数据''' 本篇文章为转载内容。原文链接:https://blog.csdn.net/httpsssss/article/details/116136614。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-03-01 12:40:55
563
转载
Python
Python定时任务在自动化运维、数据抓取、日志处理等领域有着广泛应用。最近,开源社区发布了一款基于schedule库的增强版工具——schedule-ext,它不仅提供了更丰富的定时任务配置选项,还支持分布式任务执行和异常处理机制。用户可以通过schedule-ext更便捷地管理复杂的定时任务流程,实现多线程并行执行以及失败重试等功能。 与此同时,对于需要更高精度和稳定性的企业级场景,可考虑使用APScheduler库。该库除了支持基本的定时任务外,还具备cron风格的表达式调度,并且兼容多种后台运行模式,如配合Celery进行异步任务队列管理或结合Django等框架实现Web环境下的定时任务调度。 此外,深入探究Python定时任务的实际运用案例,例如NASA就利用Python定时任务技术对其空间站的数据采集系统进行定期维护与更新。通过灵活设定每日、每周甚至每月的任务计划,确保了系统能够按照预设时间点准确无误地完成数据同步及分析工作。 综上所述,在Python中实现高效稳定的定时任务方案,既可以借助如schedule这样的轻量级工具快速搭建原型,也可以根据实际需求选用更为强大的调度库如schedule-ext或APScheduler,从而在不同的业务场景下发挥关键作用。同时,众多现实应用的成功案例也证明了Python定时任务功能在各行业自动化流程中的重要价值。
2023-01-01 19:28:30
351
软件工程师
Python
...基于区块链、密码学等技术实现的一种新型货币形态。在文章中,Python语言因其易用性和强大的功能被用于央行数字货币系统的开发,为数字货币的安全性、高效处理和复杂算法实现提供了技术支持。 爬虫 , 爬虫是一种自动获取网页内容的程序或脚本,它通过模拟用户浏览行为或直接访问网站数据接口,按照一定的规则从互联网上抓取大量信息。在文中,Python作为一种广泛应用的编程语言,其在网络爬虫领域的应用十分广泛,可以便捷地编写爬虫程序来批量采集网络数据,为数据分析、市场研究、智能推荐系统等多种应用场景提供数据支持。 人工智能(AI) , 人工智能是计算机科学的一个分支,旨在研究、设计和开发能够模仿人类智能的理论、方法、技术及应用系统,使机器具备学习、推理、感知、理解、交流以及解决实际问题的能力。文中提到,Python凭借其丰富的库资源如TensorFlow等,在人工智能领域表现出色,能有效支持机器学习、深度学习等各种AI技术的研发与应用,例如自然语言处理、图像识别、自动驾驶等场景。
2024-01-19 20:55:40
137
程序媛
转载文章
...Lucene作为核心技术基础被改造和集成,以实现网页抓取、文档索引及检索等核心功能。 Hadoop , Hadoop是一个开源的大数据处理框架,通过分布式存储(HDFS)和并行计算(MapReduce)技术,能够对海量数据进行高效存储与分析处理。在Hawk搜索引擎平台中,Hadoop可能被用于支持大规模的数据抓取和索引构建过程,确保系统具备处理千万级文档的能力,满足中小型网站对于大数据量检索的需求。 Nutch , Nutch是一个开源网络爬虫项目,主要用于从互联网上抓取网页内容,并将其转化为可供搜索的索引。在Hawk搜索引擎平台中,Nutch系统被改造并整合,以增强其网页抓取和分析能力,实现对目标网站进行深度抓取和自定义抓取规则的功能,从而更好地服务于站内搜索和特定领域的垂直搜索应用。
2023-06-14 08:48:19
95
转载
转载文章
...097be 批量合并处理B站视频->https://www.wandouip.com/t5i227224/ You-Get->https://you-get.org/ 思路 首先打开了PC端斗鱼视频一个链接:https://v.douyu.com/show/0Q8mMY0xXDL749Ad 发现一个参数在链接中 0Q8mMY0xXDL749Ad 通过抓包发现了一个很重要的文件:playlist.m3u8 里面包含了数个 .ts 的网络地址; .ts 文件是可以播放的视频片段; 发现 可以通过合并 .ts 片段可以得到完整视频; 出现一个问题:playlist.m3u8 怎么获取? 发现:https://v.douyu.com/api/stream/getStreamUrl 可以获取 playlist.m3u8 文件地址; 需要POST传入一些参数才行,发现: sign 参数是一种签名,一般通过JS生成,找了半天没有方法生成 sign 参数; 通过查阅大佬文献发现:手机端的斗鱼视频有接口可以直接获取 playlist.m3u8 文件地址,成功越过 sign 签名防线; 手机端斗鱼视频链接:https://vmobile.douyu.com/show/0Q8mMY0xXDL749Ad 通过抓包发现:https://vmobile.douyu.com/video/getInfo?vid=0Q8mMY0xXDL749Ad; 这就解决了playlist.m3u8 文件获取问题:json[‘data’][‘video_url’] 第一个难题解决!!; 综上所述,整理一下具体采集流程: 获取vid = 0Q8mMY0xXDL749Ad (就是链接中的参数); 通过 https://vmobile.douyu.com/video/getInfo?vid=0Q8mMY0xXDL749Ad 获取 playlist.m3u8 文件地址; 解析 playlist.m3u8 文件提取所有 .ts文件; 下载所有 .ts 文件; 合并 .ts 成视频文件输出; Python实现 不要开启线程池,因为会有一些问题 app.py config 中可以配置 import requestsimport reimport jsonimport timeimport pymongoimport psutilfrom hashlib import md5from moviepy.editor import from multiprocessing import Pool基本配置config = {'UID':'gKpdxKRWXwaW',用户ID'CID':104,栏目ID'TYPE':1, 1=>按用户id采集列表,2=>按栏目ID采集列表'TIME_START':1,起始时间'TIME_ENT':500,结束时间'PAGE_START':1,起始页'PAGE_END':10,结束页'TIME_GE':0,每个下载间隔时间'POOL':False,是否开启线程池'CHECKID':True, True 过滤已经下载过的视频 False 不过滤'FILE_PATH':'F:/ceshi/',下载目录,【会自动创建文件夹】'TS_PATH':'F:/ceshi/download/',缓存文件目录,【会自动创建文件夹】'DB_URL':'localhost',数据库地址'DB_NAME':'douyu',数据库名称''DB_TABLE':'douyu'数据库表}MongoDB初始化client = pymongo.MongoClient(config['DB_URL'])mango_db = client[config['DB_NAME']]MongoDB存储def save_to_mango(result):if mango_db[config['DB_TABLE']].insert_one({'vid':result}):print('成功存储到MangoDB')return Truereturn FalseMongoDB验证重复def check_to_mongo(vid):count = mango_db[config['DB_TABLE']].find({'vid':vid}).count()if count==0:return Falsereturn True删除文件def del_file(page):if os.path.exists(page): 删除文件,可使用以下两种方法。os.remove(page) os.unlink(my_file)else:print('no such file:%s' % page)循环列表删除文件def loop_del_file(arr):for item in arr:del_file(item)请求器def get_content_requests(url):headers = {}headers['user-agent']='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'headers['cookie'] = 'dy_did=07f83a57d1d2e22942e0883200001501; acf_did=07f83a57d1d2e22942e0883200001501; Hm_lvt_e99aee90ec1b2106afe7ec3b199020a7=1556514266,1557050422,1557208315; acf_auth=; acf_auth_wl=; acf_uid=; acf_nickname=; acf_username=; acf_own_room=; acf_groupid=; acf_notification=; acf_phonestatus=; _dys_lastPageCode=page_video,page_video; Hm_lpvt_e99aee90ec1b2106afe7ec3b199020a7=1557209469; _dys_refer_action_code=click_author_video_cate2'try:req_content = requests.get(url,headers = headers)if req_content.status_code == 200:return req_contentprint('请求失败:',url)return Noneexcept:print('请求失败:', url)return None把时间换算成秒def str_to_int(time):try:time_array = time.split(':')time_int = (int(time_array[0])60)+int(time_array[1])return time_intexcept:print('~~~~~计算视频时间失败~~~~~')return None提取需要采集的数据def get_list(html,type = 1):data = []try:list_json = json.loads(str(html))for om in list_json['data']['list']:gtime = str_to_int(om['video_str_duration'])if gtime > config['TIME_START'] and gtime < config['TIME_ENT']:if type == 2:data.append({'title': om['title'], 'vid': om['url'].split('show/')[1]})else:data.append({'title': om['title'], 'vid': om['hash_id']})return dataexcept:print('~~~~~数据提取失败~~~~~')return None解析playlist.m3u8def get_ts_list(m3u8):data = []try:html_m3u8_json = json.loads(m3u8)m3u8_text = get_content_requests(html_m3u8_json['data']['video_url'])m3u8_vurl =html_m3u8_json['data']['video_url'].split('playlist.m3u8?')[0]if m3u8_text:get_text = re.findall(',\n(.?).ts(.?)\n',m3u8_text.text,re.S)for item in get_text:data.append(m3u8_vurl+item[0]+'.ts'+item[1])return datareturn Noneexcept:print('~~~~~解析playlist.m3u8失败~~~~~')return None 杀死moviepy产生的特定进程def killProcess(): 处理python程序在运行中出现的异常和错误try: pids方法查看系统全部进程pids = psutil.pids()for pid in pids: Process方法查看单个进程p = psutil.Process(pid) print('pid-%s,pname-%s' % (pid, p.name())) 进程名if p.name() == 'ffmpeg-win64-v4.1.exe': 关闭任务 /f是强制执行,/im对应程序名cmd = 'taskkill /f /im ffmpeg-win64-v4.1.exe 2>nul 1>null' python调用Shell脚本执行cmd命令os.system(cmd)except:pass下载.ts文件def download_ts(m3u8_list,name):try:if not os.path.exists(config['FILE_PATH']):os.makedirs(config['FILE_PATH'])if not os.path.exists(config['TS_PATH']):os.makedirs(config['TS_PATH'])if os.path.exists(config['FILE_PATH']+name+'.mp4'):name = name+'_'+str(int(time.time()))print('开始下载:',name)L = []R = []for p in m3u8_list:ts_find = get_content_requests(p)file_ts = '{0}{1}.ts'.format(config['TS_PATH'],md5(ts_find.content).hexdigest())with open(file_ts,'wb') as f:f.write(ts_find.content)R.append(file_ts)hebing = VideoFileClip(file_ts)L.append(hebing)killProcess()print('下载完成:',file_ts)mp4file = '{0}{1}.mp4'.format(config['FILE_PATH'],name)final_clip = concatenate_videoclips(L)final_clip.to_videofile(mp4file, fps=24, remove_temp=True)killProcess()loop_del_file(R)print('\n下载完成:',name)print('')return Trueexcept:print('~~~~~合成.ts文件失败~~~~~')return None下载视频列表def list_get_kong(list_json):for item in list_json:y = Trueif config['CHECKID']:if check_to_mongo(item['vid']):print('~~~~~检测到重复项~~~~~')y = Falseif y:get_show_html = get_content_requests('https://vmobile.douyu.com/video/getInfo?vid=' + item['vid'])if get_show_html:m3u8_list = get_ts_list(get_show_html.text)if m3u8_list:download = download_ts(m3u8_list, item['title'])if download: save_to_mango(item['vid'])time.sleep(config['TIME_GE'])控制器def main(page):if config['TYPE']==1:print('~~~~~按用户ID采集~~~~~')listurl = 'https://v.douyu.com/video/author/getAuthorVideoListByNew?up_id={0}&cate2_id=0&limit=30&page={1}'.format(config['UID'],page)get_list_html = get_content_requests(listurl)if get_list_html:list_json = get_list(get_list_html.text,1)if list_json:list_get_kong(list_json)else:print('~~~~~按列表ID采集~~~~~')listurl = 'https://v.douyu.com/video/video/listData?page={1}&cate2Id={0}&action=new'.format(config['CID'],page)get_list_html = get_content_requests(listurl)if get_list_html:list_json = get_list(get_list_html.text,2)if list_json:list_get_kong(list_json)初始化if __name__=='__main__':if config['POOL']:groups = [x for x in range(config['PAGE_START'],config['PAGE_END']+1)]pool = Pool()pool.map(main, groups)else:for item in range(config['PAGE_START'],config['PAGE_END']+1):main(item)print('~~~~~已经完成【所有操作】~~~~~') 总结:众所周知,BiliBili是一个学习的网站! 本篇文章为转载内容。原文链接:https://blog.csdn.net/qq_35875470/article/details/89857445。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-12-18 11:34:00
119
转载
转载文章
网络爬虫 , 网络爬虫是一种自动浏览互联网并抓取网页数据的程序或脚本,它通过模拟人类浏览器的行为,遵循URL链接在网络中遍历,并使用HTML解析库(如Jsoup)对抓取到的页面内容进行解析和信息抽取。在本文语境中,作者通过Java编程语言实现了一个网络爬虫项目,用于从彼岸桌面网站上爬取各类分类图片。 Jsoup , Jsoup是一个用Java编写的开源库,专注于处理(解析、操作、清洗)HTML文档。它提供了一套基于DOM、CSS选择器以及便捷API的方法,使得开发者能够轻松地提取和操作HTML中的数据。在本文中,Jsoup被用来解析彼岸桌面网站的HTML结构,定位并获取图片链接等所需信息。 DOM解析 , DOM(Document Object Model,文档对象模型)是一种跨平台、与语言无关的接口,用于表示XML和HTML等格式文档的标准信息模型。DOM解析是指将整个HTML文档加载到内存中,形成一个树状结构(节点树),允许开发者通过编程方式动态访问和修改文档的内容、结构及样式。在文章所述的网络爬虫项目中,利用Jsoup进行DOM解析,以识别并提取目标网页上的图片链接及其他相关信息。
2023-06-12 10:26:04
130
转载
Python
在进一步探索Python正则表达式的强大功能时,近期一篇来自TechRepublic的文章《Mastering Regular Expressions in Python: Advanced Techniques and Real-world Use Cases》(掌握Python中的正则表达式:高级技巧与实际应用场景)引起了广泛关注。该文不仅深入剖析了Python正则表达式的复杂模式匹配、条件语句和环视等高级特性,还结合当下大数据处理、网络爬虫及数据分析等领域的需求,提供了丰富的实战案例。 例如,文中详述了如何利用正则表达式高效解析JSON和XML数据结构,这对于提升数据分析效率至关重要。此外,作者还分享了在抓取网页内容时,如何精准提取特定标签内的信息,展示了正则表达式在Web scraping任务中的关键作用。同时,文章讨论了正则表达式在文本清洗过程中过滤特殊字符、标准化日期格式以及识别电子邮件、URL等常见字符串模式的实践方法。 对于希望更深入理解并有效应用Python正则表达式的开发者来说,这篇深度解读与实战指导相结合的文章无疑是极具时效性和针对性的延伸阅读材料,它将帮助读者应对更为复杂的文本处理挑战,提高开发效率,并助力实现项目目标。
2023-01-25 14:35:48
282
键盘勇士
HTML
...文件中HTML代码的处理问题后,我们发现数据预处理是数据分析流程中的关键环节。近日,一项关于数据清洗的研究引起了业界广泛关注。据《Nature》杂志今年的一项报道,研究人员在分析大规模公开数据集时,强调了对非结构化或混合格式数据进行有效清洗的重要性。他们指出,在Web抓取的数据集中,HTML标签、JavaScript代码等非数据内容常会嵌入到CSV或其他文本格式的数据中,这不仅加大了数据解析难度,还可能引入误差。 实际上,许多现代数据处理工具如Pandas库和Apache NiFi等已经提供了应对此类问题的功能扩展。例如,Pandas可以通过自定义函数结合正则表达式实现对特定字段内HTML代码的清理,而Apache NiFi则支持实时数据流处理,可在数据流入系统时就完成格式转换和清洗工作。 此外,Python社区近期推出的一款专门针对Web数据抓取与清洗的库“BeautifulSoup”,它不仅能高效解析HTML文档结构,还能配合csv模块无缝衔接CSV文件处理,帮助用户更方便地从包含HTML元素的CSV数据中提取所需信息。 总的来说,理解和掌握如何识别并清除CSV文件中的HTML代码对于提升数据质量、确保后续分析结果准确至关重要。随着大数据时代的来临,关注并跟进此类实用技巧及最新研究进展,将有助于数据工作者更好地应对复杂多变的数据环境。
2023-01-04 22:21:53
479
数据库专家
转载文章
...侵犯,另一方面也促使技术爱好者们探索更为合规且创新的数据抓取与解析方法。 事实上,上文提到通过解析网页源码中的JSON数据来获取歌曲信息,这一技术手段在实际应用中需谨慎对待。尽管它展示了如何从公开接口中挖掘数据,但未经授权擅自下载、传播音乐资源仍可能触及版权法红线。尤其对于商业用途,应优先考虑合法授权,遵循数字内容产业的良性发展规律。 与此同时,各大音乐平台如网易云音乐、QQ音乐等也在不断推出开放API服务,允许开发者在尊重版权的前提下,依法依规地获取并使用音乐元数据,从而丰富自己的产品功能或研究项目。例如,利用这些官方API,可以创建个性化音乐推荐系统、分析音乐流行趋势或是搭建互动式的音乐社区。 因此,在鼓励技术创新的同时,我们更应关注如何在法律框架内合理运用技术手段。音乐爱好者和开发者可以通过学习并掌握这些合法合规的数据获取方式,既满足个人需求,又推动音乐生态健康发展,实现技术和艺术价值的双重提升。
2023-03-14 14:04:46
227
转载
Greenplum
...nplum这类高效的数据仓库解决方案正扮演着愈发关键的角色。近期,全球诸多知名企业如IBM、Amazon等也纷纷推出了自家的并行数据处理与分析平台以应对大数据挑战。例如,AWS Redshift Spectrum结合云服务优势,实现了对PB级数据的无缝查询,与Greenplum在海量数据分析领域形成竞争态势。 同时,随着AI和机器学习技术的发展,数据仓库不仅需要提供基础的存储与查询能力,还需要与智能算法深度集成,以支持实时预测分析及决策优化。Pivotal Software于2019年发布了Greenplum 6版本,该版本强化了对Python和R语言的支持,使得用户能够在Greenplum平台上直接运行机器学习模型,进一步提升了其在复杂数据分析场景下的应用价值。 此外,在开源社区的推动下,Apache Hadoop生态系统中的Hive、Spark等项目也在不断发展,为大规模数据处理提供了更多元化的选择。然而,Greenplum凭借其MPP架构以及对SQL标准的全面支持,依然在企业级数据仓库市场中占据一席之地,尤其对于寻求稳定、高性能且易于管理的大数据解决方案的企业来说,是值得深入研究和尝试的理想选择。 综上所述,尽管大数据处理领域的技术创新日新月异,但Greenplum通过持续迭代升级,始终保持在行业前沿,为解决现代企业和组织所面临的复杂数据问题提供了有力工具。对于正在寻求大数据解决方案或者希望提升现有数据仓库性能的用户而言,关注Greenplum的最新发展动态和技术实践案例将大有裨益。
2023-12-02 23:16:20
463
人生如戏-t
Datax
...多个源获取大量的日志数据,并将这些数据实时同步到目标系统,如阿里云的Object Storage Service(简称OSS)?如果你的答案是肯定的,那么恭喜你,你来到了正确的地方。这篇内容会手把手教你如何用阿里巴巴那个免费开放给大家的数据搬运神器——DataX,来轻松化解这个问题~ 二、什么是DataX? DataX是一个灵活的数据集成工具,可以用于大数据的抽取、转换、加载等任务。它能够灵活支持各种类型的数据源和数据目标,不管是关系型数据库、NoSQL数据库,还是数据仓库,全都手到擒来,轻松应对。就像一个万能的“数据搬运工”,啥样的数据池子都能接得住,也能送得出。此外,DataX还提供了丰富的插件机制,使得它可以处理各种复杂的数据转换需求。 三、如何使用DataX进行日志数据采集同步至ODPS? 步骤1:准备数据源和ODPS表结构 首先,我们需要在各个数据源上收集日志数据。这可能涉及到爬虫技术,也可能涉及到日志收集服务。在DataX中,我们将这些数据源称为“Source”。 其次,我们需要在ODPS中创建一个表,用于存储我们从数据源中提取的日志数据。这个表的结构应与我们的日志数据一致。 步骤2:编写DataX配置文件 接下来,我们需要编写DataX的配置文件。这个文档呢,就好比是个小教程,它详细说明了咱们的数据源头是啥,在ODPS里的表又是哪个,并且手把手教你如何从这些数据源里巧妙地把数据捞出来,再稳稳当当地放入到ODPS的表里面去。 以下是一个简单的例子: yaml name: DataX Example description: An example of using DataX to extract and load data from multiple sources into an ODPS table. tasks: - name: Extract log data from source A task-type: sink description: Extracts log data from source A and writes it to ODPS. config: 数据源配置 source_type: mysql source_host: 192.168.1.1 source_port: 3306 source_username: root source_password: 123456 source_database: logs source_table: source_a_log 目标表配置 destination_type: odps destination_project: my-project destination_database: logs destination_table: odps_log 转换配置 transform_config: - field: column_name type: expression expression: 'substr(column_name, 1, 1)' 提取配置 extraction_config: type: query sql: SELECT FROM source_a_log WHERE time > now() - INTERVAL 1 DAY - name: Extract log data from source B task-type: sink description: Extracts log data from source B and writes it to ODPS. config: 数据源配置 source_type: mysql source_host: 192.168.1.2 source_port: 3306 source_username: root source_password: 123456 source_database: logs source_table: source_b_log 目标表配置 destination_type: odps destination_project: my-project destination_database: logs destination_table: odps_log 转换配置 transform_config: - field: column_name type: expression expression: 'substr(column_name, 1, 1)' 提取配置 extraction_config: type: query sql: SELECT FROM source_b_log WHERE time > now() - INTERVAL 1 DAY 四、结论 通过以上介绍,我相信你已经对如何使用DataX进行日志数据采集同步至ODPS有了一个大致的理解。在实际应用中,你可能还需要根据自己的需求进行更多的定制化开发。但无论如何,DataX都会是你的好帮手。
2023-09-12 20:53:09
514
彩虹之上-t
JQuery
...每个路由对应的组件及数据加载逻辑,并在组件内部通过JavaScript内置API(如window.location)实时监测和操作URL,实现精细化的页面状态管理。 另外,在处理URL参数时,除了原生方法URLSearchParams之外,越来越多的开发者开始采用第三方库如query-string,它提供了更丰富的查询字符串解析和构建功能,尤其适用于处理RESTful API请求中的复杂参数场景。 值得注意的是,尽管AJAX技术极大地改善了用户体验,但过度依赖异步加载也可能影响SEO效果。为此,现代前端框架及服务器端渲染(SSR)技术应运而生,它们可以在服务端生成包含完整数据的HTML,从而让搜索引擎爬虫能够抓取到基于AJAX动态加载的内容所对应的正确URL。 综上所述,掌握URL的获取与解析仅仅是Web开发中URL管理的一部分,随着技术发展和最佳实践的演进,深入理解和运用前沿的路由技术和SEO优化策略,将更好地助力我们应对日益复杂的Web应用程序需求。
2023-02-17 17:07:14
56
红尘漫步_
ElasticSearch
一、引言 随着大数据时代的发展,关系数据库已经无法满足我们的需求。我们需要一种更加强大且灵活的数据存储和处理方式。这就催生了非关系型数据库ElasticSearch的出现。ElasticSearch是一种开源的分布式搜索引擎,它可以用来存储、搜索和分析大量的数据。那么,如何将关系数据库中的数据提取到ElasticSearch呢? 二、将关系数据库中的数据导入到ElasticSearch 首先,我们需要在ElasticSearch中创建一个索引。在ElasticSearch中,索引是一个容器,它用于存储文档。下面的代码展示了如何创建一个名为my_index的索引: python PUT /my_index { "settings": { "number_of_shards": 5, "number_of_replicas": 1 }, "mappings": { "properties": { "title": {"type": "text"}, "body": {"type": "text"} } } } 然后,我们可以使用ElasticSearch的bulk api来批量导入数据。Bulk API这个厉害的家伙,它能够一次性打包发送多个操作请求,这样一来,咱们导入数据的速度就能像火箭升空一样蹭蹭地往上飙,贼快贼高效!下面的代码展示了如何使用bulk api来导入数据: javascript POST /my_index/_bulk { "index": { "_id": "1" } } {"title":"My first blog post","body":"Welcome to my blog!"} { "index": { "_id": "2" } } {"title":"My second blog post","body":"This is another blog post."} 在这个例子中,我们首先发送了一个index操作请求,它的_id参数是1。然后,我们发送了一条包含title和body字段的JSON数据。最后,咱们再接再厉,给那个index操作发了个请求,这次特意把_id参数设置成了2。就这样,我们一次性导入了两条数据。 三、搜索ElasticSearch中的数据 一旦我们将数据导入到了ElasticSearch中,就可以开始搜索数据了。在ElasticSearch里头找数据,那真是小菜一碟,你只需要给它发送一个search请求,轻轻松松就能搞定。下面的代码展示了如何搜索数据: javascript GET /my_index/_search { "query": { "match_all": {} } } 在这个例子中,我们发送了一个search操作请求,并指定了一个match_all查询。match_all查询表示匹配所有数据。所以,这条请求将会返回索引中的所有数据。 四、总结 通过上述步骤,我们可以很容易地将关系数据库中的数据导入到ElasticSearch中,并进行搜索。不过,这只是个入门级别的例子,真正实操起来,要考虑的因素可就多了去了,比如数据清洗这个环节,还有数据转换什么的,都是必不可少的步骤。所以,对那些琢磨着要把关系数据库里的数据挪到ElasticSearch的朋友们来说,这只是万里长征第一步。他们还需要投入更多的时间和精力,去深入学习、全面掌握ElasticSearch的各种知识和技术要点。
2023-06-25 20:52:37
456
梦幻星空-t
Ruby
...,那就是“多人同时往数据库里写入数据”的问题,这可真是个让人头疼的状况。 那么,什么是并发写入数据库呢?简单来说,就是在多个线程同时访问并尝试修改同一份数据时可能会出现的问题。这个问题在单机情况下,你可能察觉不到啥大问题,不过一旦把它搬到分布式系统或者那种人山人海、同时操作的高并发环境里,那就可能惹出一堆麻烦来。比如说,数据一致性可能会乱套,性能瓶颈也可能冒出来,这些都是我们需要关注和解决的问题。 本文将通过一些具体的例子来探讨如何在Ruby中解决并发写入数据库的问题,并且介绍一些相关的技术和工具。 二、问题复现 首先,我们来看一个简单的例子: ruby require 'thread' class TestDatabase def initialize @counter = 0 end def increment @counter += 1 end end db = TestDatabase.new threads = [] 5.times do |i| threads << Thread.new do db.increment end end threads.each(&:join) puts db.counter 输出: 5 这段代码看起来很简单,但是它实际上隐藏了一个问题。在多线程环境下,当increment方法被调用时,它的内部操作是原子性的。换句话说,甭管有多少线程同时跑这个方法,数据一致性的问题压根就不会冒出来。 然而,如果我们想要改变这个行为,让多线程可以同时修改@counter的值,我们可以这样修改increment方法: ruby def increment synchronize do @counter += 1 end end 在这个版本的increment方法中,我们使用了Ruby中的synchronize方法来保护对@counter的修改。这就意味着,每次只能有一个线程“独享”执行这个方法里面的小秘密,这样一来,数据一致性的问题就妥妥地被我们甩掉了。 这就是并发写入数据库的一个典型问题。在同时做很多件事的场景下,为了让数据不乱套,保持准确无误,我们得采取一些特别的办法来保驾护航。 三、解决方案 那么,我们该如何解决这个问题呢? 一种常见的解决方案是使用锁。锁是一种同步机制,它可以防止多个线程同时修改同一个资源。在Ruby中,我们可以使用synchronize方法来创建一个锁,然后在需要保护的代码块前面加上synchronize方法,如下所示: ruby def increment synchronize do @counter += 1 end end 另外,我们还可以使用更高级的锁,比如RabbitMQ的交换机锁、Redis的自旋锁等。 另一种解决方案是使用乐观锁。乐观锁,这个概念嘛,其实是一种应对多线程操作的“小妙招”。它的核心理念就是,当你想要读取某个数据的时候,要先留个心眼儿,确认一下这个数据是不是已经被其他线程的小手手给偷偷改过啦。假如数据没被人动过手脚,那咱们就痛痛快快地执行更新操作;可万一数据有变动,那咱就得“倒车”一下,先把事务回滚,再重新把数据抓取过来。 在Ruby中,我们可以使用ActiveRecord的lock_for_update方法来实现乐观锁,如下所示: ruby User.where(id: user_id).lock_for_update.first.update_columns(name: 'New Name') 四、结论 总的来说,并发写入数据库是一个非常复杂的问题,它涉及到线程安全、数据一致性和性能等多个方面。在Ruby中,我们可以使用各种方法来解决这个问题,包括使用锁、使用乐观锁等。 但是,无论我们选择哪种方法,都需要充分理解并发编程的基本原理和技术,这样才能正确地解决问题。希望这篇文章能对你有所帮助,如果你有任何疑问,欢迎随时联系我。
2023-06-25 17:55:39
51
林中小径-t
Python
Python与半球体积:一场探索之旅 大家好,我是你们的朋友,今天我们要聊的话题是“Python求半球的体积”。这个主题听起来可能有点冷门,但其实它背后隐藏着许多有趣的数学知识和编程技巧。在这篇文章中,我将带你一起踏上这段旅程,从最基础的概念讲起,到最终通过Python代码实现半球体积的计算。 1. 为什么选择半球? 首先,我们得问自己一个问题:为什么我们要计算半球的体积呢?这个问题看似简单,但实际上它背后涉及到了几何学中的很多有趣概念。半球就像是球体的一个小伙伴,了解它的大小不仅能帮我们更好地摸清整个球体的脾气,还能在很多实际场合派上用场,比如盖房子或者搞工程测量啥的。Python这家伙可真厉害,能帮我们又快又准地搞定这些计算,简直就是这次旅程的最佳拍档嘛! 2. 半球体积的数学公式 在开始编程之前,我们需要了解半球体积的数学公式。根据几何学原理,一个半球的体积可以通过以下公式计算得出: \[ V = \frac{2}{3} \pi r^3 \] 其中,\(V\) 表示体积,\(r\) 是半球的半径,而 \(\pi\) 则是一个常数,约等于 3.14159。这个公式看起来很简单,但它却是整个计算过程的基础。 3. Python代码实现 现在,让我们用Python来实现这个计算吧!Python的简洁性和强大功能使其成为进行这类科学计算的理想选择。接下来,我会给出几个不同版本的代码示例,从基础到进阶,一步步带你了解如何用Python完成这项任务。 示例1:基础版 python import math def volume_of_hemisphere(radius): return (2/3) math.pi (radius 3) 测试代码 print(volume_of_hemisphere(5)) 假设半径为5单位 在这个简单的示例中,我们定义了一个函数 volume_of_hemisphere,它接受一个参数 radius(即半球的半径),然后根据上面提到的公式计算并返回半球的体积。最后,我们通过给定半径为5单位来测试我们的函数。 示例2:增加用户交互 python import math def calculate_volume(): radius = float(input("请输入半球的半径:")) volume = (2/3) math.pi (radius 3) print(f"半球的体积约为:{volume:.2f}") calculate_volume() 在这个版本中,我们增加了用户交互功能,允许用户输入半球的半径,然后程序会输出对应的体积。这儿用的是 input() 函数来抓取大伙儿的输入,然后用 print() 函数把结果弄得漂漂亮亮的,保留俩小数点,看着就顺眼。 示例3:面向对象编程 python import math class Hemisphere: def __init__(self, radius): self.radius = radius def volume(self): return (2/3) math.pi (self.radius 3) 创建半球实例 hemisphere = Hemisphere(5) print(f"半球的体积为:{hemisphere.volume():.2f}") 这个版本采用了面向对象的方法,定义了一个名为 Hemisphere 的类,该类包含一个构造函数和一个方法 volume() 来计算体积。通过这种方式,我们可以更方便地管理和操作半球的相关属性和行为。 4. 总结与反思 通过上述三个不同的示例,我们可以看到,即使是同一个问题,也可以用多种方式来解决。从最基本的函数调用,到让用户动起来的交互设计,再到酷炫的面向对象编程,每种方式都有它的独门绝技。这事儿让我明白,在编程这个圈子里,其实没有什么绝对的对错之分,最重要的是得找到最适合自己眼下情况和需要的方法。 同时,这次探索也让我深刻体会到数学与编程之间的紧密联系。很多时候,我们面对的问题不仅仅是技术上的挑战,更是对数学知识的理解和应用。希望能给你带来点灵感,不管是学Python还是别的啥,保持好奇心和爱折腾的精神可太重要了! 好了,这就是今天的内容。如果你有任何想法或疑问,欢迎随时留言讨论。让我们一起继续学习,享受编程带来的乐趣吧! --- 这篇文章旨在通过具体案例展示如何利用Python解决实际问题,同时穿插了一些个人思考和感受,希望能够符合你对于“口语化”、“情感化”的要求。希望对你有所帮助!
2024-11-19 15:38:42
113
凌波微步
RabbitMQ
...业务流程就可能乱套,数据的一致性也难免会出岔子。最后,网络波动还可能导致RabbitMQ服务器的CPU负载增加,降低其整体性能。 三、监控网络波动对RabbitMQ性能的影响 为了能够及时发现和解决网络波动对RabbitMQ性能的影响,我们需要对其进行实时的监控。以下是几种常见的监控方法: 1. 使用Prometheus监控RabbitMQ Prometheus是一个开源的监控系统,可以用来收集和存储各种系统的监控指标,并提供灵活的查询语言和可视化界面。我们可以利用Prometheus这个小帮手,实时抓取RabbitMQ的各种运行数据,比如消息收发的速度啦、消息丢失的比例呀等等,这样就能像看仪表盘一样,随时了解RabbitMQ的“心跳”情况,确保它健健康康地运行。 python 安装Prometheus和grafana sudo apt-get update sudo apt-get install prometheus grafana 配置Prometheus的配置文件 cat << EOF > /etc/prometheus/prometheus.yml global: scrape_interval: 1s scrape_configs: - job_name: 'prometheus' static_configs: - targets: ['localhost:9090'] - job_name: 'rabbitmq' metrics_path: '/api/metrics' params: username: 'guest' password: 'guest' static_configs: - targets: ['localhost:15672'] EOF 启动Prometheus sudo systemctl start prometheus 2. 使用RabbitMQ自带的管理界面监控 RabbitMQ本身也提供了一个内置的管理界面,我们可以在这个界面上查看RabbitMQ的各种运行状态和监控指标,如消息的消费速度、消息的发布速度、消息的丢失率等。 javascript 访问RabbitMQ的管理界面 http://localhost:15672/ 3. 使用New Relic监控RabbitMQ New Relic是一款功能强大的云监控工具,可以用来监控各种应用程序和服务的性能。我们可以借助New Relic这个小帮手,实时监控RabbitMQ的各种关键表现,比如消息被“吃掉”的速度有多快、消息被“扔”出去的速度如何,甚至还能瞅瞅消息有没有迷路的(也就是丢失率)。这样一来,咱们就能像看比赛直播那样,对这些指标进行即时跟进啦。 ruby 注册New Relic账户并安装New Relic agent sudo curl -L https://download.newrelic.com/binaries/newrelic_agent/linux/x64_64/newrelic RPM | sudo tar xzv sudo mv newrelic RPM/usr/lib/ 配置New Relic的配置文件 cat << EOF > /etc/newrelic/nrsysmond.cfg license_key = YOUR_LICENSE_KEY server_url = https://insights-collector.newrelic.com application_name = rabbitmq daemon_mode = true process_monitor.enabled = true process_monitor.log_process_counts = true EOF 启动New Relic agent sudo systemctl start newrelic-sysmond.service 四、调试网络波动对RabbitMQ性能的影响 除了监控外,我们还需要对网络波动对RabbitMQ性能的影响进行深入的调试。以下是几种常见的调试方法: 1. 使用Wireshark抓取网络流量 Wireshark是一个开源的网络分析工具,可以用来捕获和分析网络中的各种流量。我们能够用Wireshark这个工具,像侦探一样监听网络中的各种消息发送和接收活动,这样一来,就能顺藤摸瓜找出导致网络波动的幕后“元凶”啦。 csharp 下载和安装Wireshark sudo apt-get update sudo apt-get install wireshark 打开Wireshark并开始抓包 wireshark & 2. 使用Docker搭建测试环境 Docker是一种轻量级的容器化平台,可以用来快速构建和部署各种应用程序和服务。我们可以动手用Docker搭建一个模拟网络波动的环境,就像搭积木一样构建出一个专门用来“折腾”RabbitMQ性能的小天地,在这个环境中好好地对RabbitMQ进行一番“体检”。 bash 安装Docker sudo apt-get update sudo apt-get install docker.io 创建一个包含网络波动模拟器的Docker镜像 docker build -t network-flakiness .
2023-10-10 09:49:37
99
青春印记-t
转载文章
...ML解析与信息提取的技术实践后,我们可以进一步关注该领域的一些最新动态和技术应用实例。近期,《信息安全技术与应用》期刊报道了一项关于网络空间安全监控的研究,其中就利用了类似的HTML内容抓取和分析技术,对全球范围内的公开漏洞报告进行了实时监测和智能分析,有效提升了漏洞管理效率并降低了潜在风险。 同时,随着Web技术的快速发展,HTML5标准的普及以及各类网站结构的复杂化,如何更精准高效地从海量网页中提取关键数据成为一个亟待解决的问题。例如,Mozilla最近发布的一篇博客文章详细介绍了其如何借助类似Jsoup的开源库优化Firefox浏览器的安全更新通告系统,通过精确筛选和解析HTML页面中的特定元素,实现了对安全漏洞信息的自动化获取和分类。 此外,针对网络安全领域,国内外众多安全研究团队正积极研发新型的信息抽取模型,结合机器学习、深度学习等先进技术,提升对网页内容的理解能力,以便更快更准确地定位高危漏洞。近日,在Black Hat USA 2023大会上,就有专家演示了利用强化学习方法训练出的智能爬虫,成功在大量网页中挖掘出尚未被广泛认知的隐蔽性安全漏洞。 综上所述,无论是基于Jsoup的传统HTML解析技术,还是结合AI前沿发展的智能信息抽取手段,都在不断推动网络安全监控和漏洞管理领域的进步,为构建更加安全可靠的网络环境提供了有力支持。
2023-07-19 10:42:16
295
转载
转载文章
...了! 适合人群 不会爬虫的都可以来看看!能大概看明白python就够了。 使用前提 python环境配好 有梯子 不排斥键鼠记录器读取键鼠记录 基本思路 现在的专利搜索引擎大概都有批量下载库,如果只要摘要的话直接下载就可以了。但是下载全文的时候,大部分引擎都不支持批量下载,只能一个一个点,还得输验证码。 这里就不得不提到google patent了,这是我目前找到的唯一一个不需要验证码就能下载的专利引擎了(其实主要是还不会用python识别验证码)。那么有了google patent这个神器,就可以用自动办法来进行下载了。我这里使用的是按键精灵,傻瓜式操作。(没用python爬虫的原因是requests不能挂梯子。。。这里我不是很确定是什么问题,希望有大佬指点一下。anyway,主要思路就是用键鼠记录器点点点,我用的是按键精灵,理论上什么记录器都可以。 ps. 听说poxoq能批量下载,但是新版本只能下载前十页,因此我没有尝试,如果能直接下载全文的话请评论区告诉我。 键鼠记录器脚本 前期准备 按格式排好公开号或者申请号,在编辑器中打开; 把google patent搜索页面和文本编辑器分屏显示,便于操作。 脚本原理 以edge浏览器为例,按键精灵双击全选文本中第一行的公开号,ctrl+c复制,鼠标转到网页搜索框,ctrl+v粘贴,点搜索。等搜索完成右键download PDF,选链接另存为并确定,之后点击网页关闭下载栏,一次下载完成。返回编辑器,删除第一行的文本,把第二行提到第一行,完成复位。 这样就形成了完整的一次过程,只要重复运行脚本就可以把所有专利全文下载下来。 注意事项 实际操作中,可能遇到两大问题: 网页反馈问题 这里指的是搜索后没有来到我们想象中的专利页,可能是没有搜索到专利,或该专利google patent没有pdf文档,这时如果脚本还在运行,那么显然就会错误运行。 脚本运行问题 主要要考虑的是命令之间的延时。延时调小确实运行速度会变快,但是如果电脑运行速度不够或者网速/服务器慢了,就会错误执行命令。我的建议是文本操作可以适当删减延时,涉及网页的部分适量增加延时,保证脚本的容错率。 由此可以看出来这个脚本还是离不开人的,在跑的时候还是需要盯着点,如果有错误可以及时处理。 检查下载效果 看了上面的注意事项,想必你也知道这个脚本不太靠谱。那么解决这个问题的方法就是负反馈。下载完了检查一遍就好了。 由于google patent下载的文件是以公开号命名的,所以对照要下载的和已下载的公开号就能看出哪些专利没有下载成功。 我这里写了一个python小脚本。 import pandas as pdimport os读取待下载专利的公开号,地址修改成你自己存放的位置df = pd.read_excel("target.xlsx",header= 0, usecols= "B").drop_duplicates()取前11位作为对比(以中国专利作为参考)PublicNumber_tgt = list(map(lambda x: x[0:11],df["公开(公告)号"].to_list()))读取已下载专利的公开号,地址修改成你自己存放的位置filelist=os.listdir(r'C:\Users\mornthx\Desktop\专利全文')取前11位作为对比PublicNumber_dl = list(map(lambda x: x[0:11],filelist))比较两者差值diff = set(PublicNumber_tgt).difference(set(PublicNumber_dl))print(diff) 没下载的专利具体问题具体解决就好了。 希望能帮到大家! 本篇文章为转载内容。原文链接:https://blog.csdn.net/weixin_38688347/article/details/124000919。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-11-21 12:55:28
274
转载
站内搜索
用于搜索本网站内部文章,支持栏目切换。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
ifconfig 或 ip addr show
- 查看网络接口配置信息。
推荐内容
推荐本栏目内的其它文章,看看还有哪些文章让你感兴趣。
2023-04-28
2023-08-09
2023-06-18
2023-04-14
2023-02-18
2023-04-17
2024-01-11
2023-10-03
2023-09-09
2023-06-13
2023-08-07
2023-03-11
历史内容
快速导航到对应月份的历史文章列表。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"