前端技术
HTML
CSS
Javascript
前端框架和UI库
VUE
ReactJS
AngularJS
JQuery
NodeJS
JSON
Element-UI
Bootstrap
Material UI
服务端和客户端
Java
Python
PHP
Golang
Scala
Kotlin
Groovy
Ruby
Lua
.net
c#
c++
后端WEB和工程框架
SpringBoot
SpringCloud
Struts2
MyBatis
Hibernate
Tornado
Beego
Go-Spring
Go Gin
Go Iris
Dubbo
HessianRPC
Maven
Gradle
数据库
MySQL
Oracle
Mongo
中间件与web容器
Redis
MemCache
Etcd
Cassandra
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Nacos
Consul
Tomcat
Nginx
Netty
大数据技术
Hive
Impala
ClickHouse
DorisDB
Greenplum
PostgreSQL
HBase
Kylin
Hadoop
Apache Pig
ZooKeeper
SeaTunnel
Sqoop
Datax
Flink
Spark
Mahout
数据搜索与日志
ElasticSearch
Apache Lucene
Apache Solr
Kibana
Logstash
数据可视化与OLAP
Apache Atlas
Superset
Saiku
Tesseract
系统与容器
Linux
Shell
Docker
Kubernetes
[计算机教育]的搜索结果
这里是文章列表。热门标签的颜色随机变换,标签颜色没有特殊含义。
点击某个标签可搜索标签相关的文章。
点击某个标签可搜索标签相关的文章。
转载文章
...题后,我们可以延伸至教育评估领域中关于考试设计与数据分析的最新研究进展。近日,美国教育考试服务中心(ETS)发布了一项关于利用大数据优化试题难度与区分度的研究报告。该研究表明,在大规模标准化测试中,运用机器学习算法和统计模型能够有效分析考生答题数据,精确调整题目难度和区分度,从而提高考试结果的信度和效度。 具体而言,研究人员借鉴了单峰函数优化方法,并创新性地结合三分法策略来动态调整试题参数,以实现得分分布的最佳匹配。这种方法不仅适用于编程竞赛的评分系统优化,更在各类资格认证、入学选拔等高风险考试设计中展现出了巨大潜力。同时,报告强调了保留有效数字的重要性,确保成绩计算和排名的公平性和准确性。 此外,随着我国新高考改革的深入推进,考试评价体系也在不断升级和完善。例如,部分地区引入智能化考试系统,通过实时监测和分析学生作答数据,动态生成适合不同层次学生的考题,实现了对考试难度和区分度的精细化管理,有力推动了教育公平与质量提升。 总之,从DTOJ 1486:分数这一具体的编程问题出发,我们看到了现代科技如何赋能传统考试评价方式,使其在保持公正严谨的同时,更加科学高效。未来,随着人工智能和大数据技术的持续发展,考试设计与数据分析将深度融合,进一步推动教育评价体系的现代化进程。
2023-08-30 11:55:56
154
转载
Superset
...大的工具,业界专家和教育机构纷纷推出了一系列在线教程和实操课程,通过实例讲解如何结合实际业务场景编写正确的MDX查询语句,并解决可能出现的问题。 因此,在持续学习和实践MDX查询的过程中,建议读者关注行业动态和技术更新,适时参加专业培训,从而更好地利用诸如Superset等工具实现对企业海量数据的深度洞察与价值挖掘。同时,也应重视数据源配置的准确性,确保数据质量和分析结果的有效性,真正发挥出MDX查询在提升决策效率和优化业务流程中的关键作用。
2023-12-18 18:07:56
97
烟雨江南
Kubernetes
...一决策旨在巩固其在云计算、企业级应用等领域的竞争优势。随着数字化转型的深入,企业对于云计算服务的需求日益增长,微软通过开放其技术栈,不仅可以吸引更多的客户和合作伙伴,还能加强与竞争对手如亚马逊AWS、谷歌云等的竞争。 此外,从社会影响力角度看,微软的开源战略体现了其对社会责任的担当。开源不仅促进了知识共享和技术创新,也有助于培养下一代开发者,推动全球科技教育的发展。微软的这一行动有望激发更多企业和个人投身于开源事业,共同构建更加开放、包容的科技生态系统。 总之,微软的开源战略不仅是对其自身业务布局的一次重大调整,也是对全球科技行业未来发展路径的一次深刻思考。这一转变将对微软及其合作伙伴、整个科技产业乃至社会产生深远影响,值得持续关注与深入研究。
2024-07-25 01:00:27
117
冬日暖阳
转载文章
...采用了更为先进的边缘计算技术,进一步优化了内容分发效率,尤其针对高清视频流媒体、在线教育、电商直播等高流量应用场景,大幅降低了延迟,提升了用户体验。同时,腾讯云也在CDN技术研发方面取得突破,结合AI智能预测算法,实现了热点内容的预加载与精准推送,极大地提高了缓存命中率,减少了回源带宽消耗。 此外,面对网络安全威胁的升级,百度智能云推出的CDN服务在加速功能基础上,集成了深度防御体系,不仅能抵御大规模DDoS攻击,还能有效防止恶意爬虫对源站资源的过度消耗,充分保障了企业级用户的服务连续性和数据安全性。 在全球范围内,CDN行业正在经历一场深刻的变革,5G、物联网、区块链等新兴技术的融入,将进一步拓宽CDN的应用场景,使其在未来数字时代发挥更加关键的作用。例如,Akamai Technologies公司就正在进行基于5G网络环境下的CDN架构升级,旨在构建一个能适应未来超低延迟、超高带宽需求的内容分发生态系统。 总的来看,无论是国内还是国际,CDN技术都在不断迭代更新,以满足瞬息万变的互联网市场需求,特别是在提升用户体验、保障网站稳定性以及应对日益复杂的安全挑战等方面,正以前沿科技驱动行业发展,赋能数字经济建设。在这样的背景下,对于企业和开发者来说,深入理解和合理运用CDN技术,无疑将成为提升自身竞争力、赢得市场份额的关键所在。
2024-03-22 12:25:22
567
转载
Python
...Python也在音乐教育中发挥着独特作用,如MIT的“听觉计算实验室”正在研发一套基于Python的互动式音乐教学工具,旨在帮助学生通过可视化和实时分析音频数据来更直观地理解音乐理论及结构。 总的来说,Python在音乐世界的编程艺术远未止步,它正在持续推动音乐创作、教育和欣赏方式的革新,为全球音乐爱好者和专业人士提供了一个前所未有的科技视角与平台。未来,我们期待更多由Python驱动的音乐科技创新成果涌现,共同构建更加丰富多彩的音乐未来。
2023-08-07 14:07:02
221
风轻云淡
转载文章
...rn的处理速度受限于计算资源,处理大数据集时需要较长时间。 可解释性较差:由于auto-sklearn是自动化的,生成的模型可解释性较差。 应用案例 Kaggle竞赛:auto-sklearn在多个Kaggle竞赛中表现出色,包括房价预测、分类、回归等多个任务。 自动化机器学习平台:auto-sklearn可以作为自动化机器学习平台的核心组件,帮助用户快速构建和部署机器学习模型。 数据科学教育:auto-sklearn可以作为教学工具,帮助学生快速入门机器学习,并加深对机器学习原理的理解。 autosklearn/Auto-Sklearn的安装 pip install auto-sklearnpip install -i https://pypi.tuna.tsinghua.edu.cn/simple auto-sklearnconda install -c conda-forge auto-sklearn 系统安装要求¶ auto-sklearn 具有以下系统要求: Linux 操作系统(例如 Ubuntu)(在此处获取 Linux) Python (>=3.7)(在此处获取 Python), C++ 编译器(支持 C++11)(在此处获取 GCC)。 如果您尝试在没有提供 pyrfr 包的 wheel 文件的系统上安装 Auto-sklearn(请参阅此处了解可用的 wheels),您还需要: SWIG(在此处获取 SWIG)。 有关缺少 Microsoft Windows 和 macOS 支持的说明,请查看Windows/macOS 兼容性部分。 注意:auto-sklearn 当前不支持 Windows系统,因为auto-sklearn严重依赖 Python 模块resource。是 Python 的Unix 特定服务resource 的一部分 ,在 Windows 机器上不可用。因此,无法 在 Windows 机器上运行auto-sklearn 。 autosklearn/Auto-Sklearn的使用方法 1、基础案例 import sklearn.datasetsimport autosklearn.classification 加载Titanic数据集X, y = sklearn.datasets.load_breast_cancer(return_X_y=True) 使用Auto-Sklearn训练模型model = autosklearn.classification.AutoSklearnClassifier()model.fit(X, y) 输出模型评估结果print(model.sprint_statistics()) 本篇文章为转载内容。原文链接:https://blog.csdn.net/qq_41185868/article/details/83758383。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-06-13 13:27:17
114
转载
Python
...别是在科学研究和工程计算中。例如,NASA最近发布了一篇论文,探讨了如何使用Python进行复杂的航天器设计和轨道计算。在这篇论文中,研究人员详细介绍了如何利用Python的强大库,如NumPy、SciPy和Matplotlib,来进行精确的数据分析和可视化。这不仅提高了工作效率,还使得复杂问题的解决变得更加直观和高效。 此外,Python在医疗健康领域的应用也引起了广泛关注。近期,一篇发表在《自然》杂志上的研究指出,Python被用于开发一种新型的人工智能算法,该算法能够通过分析患者的基因数据,预测疾病风险和治疗效果。这种方法不仅大大提高了诊断的准确性,还为个性化医疗提供了新的可能性。通过Python的强大数据分析能力,研究人员可以更有效地处理大规模的医疗数据,从而加速新药的研发和临床试验。 与此同时,Python在教育领域的应用也越来越受到重视。例如,哈佛大学的一门在线课程“CS50”就使用Python作为主要教学语言,帮助学生掌握编程基础和算法思维。这门课程不仅吸引了全球数百万学生,还推动了编程教育的普及和发展。通过Python的学习,学生们能够更好地理解和解决现实世界中的问题,培养创新思维和解决问题的能力。 这些最新的应用实例不仅展示了Python在各领域的强大潜力,也体现了编程教育的重要性。无论是在科研、医疗还是教育领域,Python都发挥着不可替代的作用,为各行各业带来了前所未有的机遇。
2024-11-19 15:38:42
113
凌波微步
HBase
...e软件基金会联合多家教育机构共同推出了线上课程和实战培训项目,旨在帮助开发者深入理解HBase的架构原理,并掌握如何在实际业务场景中有效运用。未来,HBase将持续引领NoSQL数据库技术潮流,为全球企业和开发者提供更加先进、可靠的大数据处理工具。
2023-01-31 08:42:41
430
青春印记-t
Nginx
...设你正在运营一个在线教育平台,学生可以在平台上观看课程视频。为了提高用户体验,你决定为每个学生提供个性化的推荐视频。这种时候,你大概更想每次都拿到最新鲜的推荐列表,而不是老是翻那堆缓存里的东西吧? nginx location /recommendations { proxy_cache my_cache; proxy_cache_bypass $http_x_user_id; proxy_pass http://video_server; } 在这个配置中,$http_x_user_id是一个自定义的HTTP头,当你在请求头中添加这个头时,Nginx就会绕过缓存。 5. 总结与展望 总之,proxy_cache_bypass是Nginx缓存机制中一个非常有用的工具,它允许我们在特定条件下绕过缓存,直接向后端服务器发送请求。用好了这个指令啊,就好比给网站的缓存装了个聪明的小管家,让它该存啥不该存啥都安排得明明白白的。这样不仅能加快网页加载速度,还能让用户打开网站的时候感觉特别顺畅,那体验感直接拉满! 未来,随着互联网技术的不断发展,我相信proxy_cache_bypass会有更多的应用场景。说不定哪天啊,它就更聪明了,自己能分得清哪些请求得绕开缓存走,哪些直接就能用缓存搞定。不管咋说呢,咱们都得对新玩意儿保持那份好奇,老想着学点新鲜的,让自己一直进步才行啊! 最后,我想说的是,Nginx不仅仅是一个工具,它更像是一个伙伴,陪伴着我们一起成长。希望这篇文章能对你有所帮助,如果有任何问题或者想法,欢迎随时交流!
2025-04-18 16:26:46
97
春暖花开
Consul
如何在云计算环境下加强数据安全与隐私保护 随着云计算技术的快速发展,数据存储和处理方式发生了根本性的变化。云计算为全球数亿用户提供便捷、高效的服务,但也带来了前所未有的数据安全和隐私保护挑战。面对这些挑战,企业、政府机构和个人都需要采取更加积极主动的措施来加强数据安全与隐私保护。 一、了解云计算安全风险 云计算环境中的数据安全主要面临以下几类风险: - 数据泄露:不法分子可能通过各种手段窃取云存储的数据。 - 数据篡改:未经授权的修改可能导致数据一致性受损。 - 拒绝服务攻击:攻击者可能通过消耗大量资源来阻止正常用户访问云服务。 - 合规性风险:不同地区和行业有不同的数据保护法规,合规性不当可能引发法律纠纷。 二、加强数据加密与访问控制 1. 加密:采用端到端的数据加密技术,确保数据在传输和存储过程中不被未授权用户访问。 2. 访问控制:实施严格的访问控制策略,基于最小权限原则分配用户访问权限,确保只有必要的人才能访问敏感信息。 3. 多因素认证:结合密码、生物识别等多种认证方式,提高账户安全性。 三、强化云服务提供商的选择与管理 1. 选择可信的云服务商:评估云服务提供商的安全资质、合规性、透明度以及客户案例。 2. 合同条款审查:仔细审阅与云服务提供商签订的合同,明确双方在数据安全方面的责任和义务。 3. 定期审计与评估:对云服务提供商的安全措施进行定期审计,确保其持续满足安全标准。 四、建立应急响应机制 1. 快速响应:制定详细的应急响应计划,一旦发生数据泄露或其他安全事件,能够迅速采取措施减少损失。 2. 持续监控与日志分析:实施全天候的监控体系,及时发现异常行为,通过日志分析追踪潜在威胁。 五、提高员工安全意识 1. 培训教育:定期对员工进行数据安全和隐私保护的培训,增强他们对常见安全威胁的认识和应对能力。 2. 合规培训:确保员工了解并遵守相关法律法规,避免无意间触犯隐私保护规定。 云计算的普及为数据处理提供了前所未有的便利,同时也带来了不可忽视的安全风险。通过综合运用上述策略,企业和个人可以在享受云计算带来的高效便捷的同时,有效保护数据安全与隐私,应对日益复杂的网络环境挑战。
2024-08-26 15:32:27
123
落叶归根
Kotlin
...的领先地位。 4. 教育与培训:随着 Kotlin 在企业中的普及,针对 Kotlin 的在线课程、书籍和教程将更加丰富,有助于更多开发者快速掌握这门语言。 总之,Kotlin 作为一门高效、安全且功能丰富的编程语言,已经在开源社区和现代应用开发中占据了重要地位。随着技术的不断进步和社区的持续发展,Kotlin 有望在未来继续引领编程语言的趋势,为开发者提供更强大、更便捷的工具,促进软件开发的创新与发展。
2024-07-25 00:16:35
266
风轻云淡
转载文章
...an,2012·矩阵计算 Lloyd Trefethen 和 David Bau,1997·数值线性代数 另外推荐一些关于多元统计的好教材,这是线性代数和数值统计方法的集合。 Richard Johnson 和 Dean Wichern,2012·应用多元统计分析 Wolfgang Karl Hardle 和 Leopold Simar,2015·应用多元统计分析 也有一些在线的书籍,这些书籍可以在维基百科线性代数词条的最后一部分内容中可以看到。 线性代数大学课程 大学的线性代数课程是有用的,这使得本科生学习到他们应该掌握的线性代数内容。而作为一名机器学习实践者,大学的线性代数课程内容可能超过你所需掌握的内容,但这也能为你学习机器学习相关线性代数内容打下坚实的基础。 现在许多大学课程提供幻灯片的讲义、笔记等PDF电子版内容。有些大学甚至提供了预先录制的讲座视频,这无疑是珍贵的。 我鼓励你通过使用大学课程教材,深入学习相关课程来加深对机器学习中特定主题的理解。而不需要完全从头学到尾,这对于机器学习从业者来说太费时间了。 美国顶尖学校推荐的课程如下: Gilbert Strang·麻省理工学院·线性代数 Philip Klein·布朗大学·计算科学中的矩阵 Rachel Thomas·旧金山大学·针对编程者的线性代数计算 线性代数在线课程 与线性代数大学课程不同,在线课程作为远程教育而言显得不是那么完整,但这对于机器学习从业者而言学起来相当的快。推荐的一些在线课程如下: 可汗学院·线性代数 edX·线性代数:前沿基础 问答平台 目前网络上存在大量的问答平台,读者们可以在上面进行相关话题的讨论。以下是我推荐的一些问答平台,在这里要注意,一定要记得定期访问之前发布的问题及坛友的解答。 数学栈交换中的线性代数标记 交叉验证的线性代数标记 堆栈溢出的线性代数标记 Quora上的线性代数主题 Reddit上的数学主题 Numpy资源 如果你是用Python实现相关的机器学习项目,那么Numpy对你而言是非常有帮助的。 Numpy API文档写得很好,以下是一些参考资料,读者可以阅读它们来了解更多关于Numpy的工作原理及某些特定的功能。 Numpy参考 Numpy数组创建例程 Numpy数组操作例程 Numpy线性代数 Scipy线性代数 如果你同时也在寻找关于Numpy和Scipy更多的资源,下面有几个好的参考教材: 2017·用Python进行数据分析 2017·Elegant Scipy 2015·Numpy指南 作者信息 Jason Brownlee,机器学习专家,专注于机器学习教育 文章原标题《Top Resources for Learning Linear Algebra for Machine Learning》,作者:Jason Brownlee, 译者:海棠,审阅:袁虎。 原文链接 干货好文,请关注扫描以下二维码: 本篇文章为转载内容。原文链接:https://blog.csdn.net/yunqiinsight/article/details/79722954。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-11-14 09:21:43
326
转载
Golang
...的可能性。例如,量子计算的潜力虽然目前大部分处于理论阶段,但其在加密安全、药物研发等方面的应用前景吸引了大量研究和投资。 实践案例:从失败中学习 “未实现”的故事不仅仅是理论上的探索,更是实践中的试错。以SpaceX为例,其创始人埃隆·马斯克在创业初期面临了无数次技术上的“未实现”挑战,从火箭回收失败到星际飞船的多次试飞挑战。然而,正是这些失败成为了技术创新的催化剂,SpaceX不仅成功实现了火箭的重复使用,还向着火星移民的目标迈进。每个失败都为下一次的成功铺平了道路,这种坚韧不拔的精神值得所有追求创新的人学习。 “未实现”的伦理考量 随着技术的不断进步,面对“未实现”的未来,伦理和社会责任问题日益凸显。例如,AI在医疗健康领域的应用虽然潜力巨大,但如何确保数据隐私、避免算法偏见、制定合理的伦理准则成为亟待解决的问题。面对这些挑战,国际社会和科技企业正积极合作,制定相关政策和标准,确保技术发展的同时兼顾人类福祉。 结语:转变视角,拥抱不确定性 面对“未实现”的挑战,我们应从传统意义上的“缺陷”转变为“机遇”的视角来看待。通过建立开放的合作平台、加强跨学科研究、增强公众教育和参与,我们可以共同探索未知的边界,推动技术向更深远、更可持续的方向发展。在这个过程中,保持创新精神、重视伦理考量、培养跨界合作能力将是关键所在。 拥抱“未实现”,不仅意味着接受未知和不确定性的存在,更意味着勇于探索、敢于梦想,最终引领我们走向更加光明的未来。
2024-07-26 15:58:24
421
素颜如水
转载文章
...重大意义。 同时,在教育领域,美国麻省理工学院的研究者们正将类似的颜色叠加实验引入到K-12科学课程中,以培养学生的跨学科思维能力,通过动手实验让学生直观理解光学原理,并与数学计算相结合,提升他们解决实际问题的能力。 此外,艺术家和设计师也在利用颜色叠加的原理进行创新实践。例如,荷兰艺术家埃舍尔借助颜色叠加创作出视错觉艺术作品,展示出二维空间内不同颜色相互作用产生的神奇效果。而在时尚界,设计师们通过面料上的颜色叠加与透明度变化,营造出丰富多变且极具层次感的视觉体验。 总的来说,颜色叠加这一基本原理不仅在科普实验中有生动体现,更在科技、教育、艺术等多个领域发挥着重要作用,不断推动着人类对色彩世界的深入理解和广泛利用。
2024-01-20 16:20:26
468
转载
转载文章
...edu_class:教育等级,0、1、2、3 依次是小学、初中、高中、大学 二、描述性分析 首先可筛选Acc为1的数据,分别以avg_exp为因变量,其余变量为自变量进行数据探索,主要是发现自变量和因变量是否有线形关系。 raw_1 = raw[raw['Acc'] == 1] 2.1 连续自变量与连续因变量的相关性分析 首先对连续变量和目标变量进行相关性分析,因变量avg_exp为连续变量,一般可以用相关系数来看其线形相关性。 cons_vasr = ['avg_exp', 'avg_exp_ln', 'Age', 'Income', 'dist_home_val', 'dist_avg_income', 'age2', 'high_avg']raw_1[cons_vasr].corr()vg']].corr() 结果如下,可以看到收入 Income 和当地人均收入 dist_avg_income这两个变量和avg_exp月均信用卡支出有较强的相关性,同时观察自变量间的相关性可发现人均收入 Income 和当地人均收入 dist_avg_income 之间也有较强的相关性,相关系数为0.99,说明接下来我们可以把这两个变量加入模型,但要注意可能会存在多重共线性。 2.2 二分类变量与连续变量的相关性分析 分类变量和连续变量之间的相关性可以用t检验进行,接下来以是否自有住房 Ownrent 变量 和 月均收入之间进行相关性检验。首先查看Ownrent 不同取值的数量以及avg_exp均值分布情况如何: pd.pivot_table(raw_1, values = ['avg_exp'], index = ['Ownrent'], aggfunc = {'avg_exp': ['count', np.mean]}) 接着分别对 Ownrent 为0、1的 avg_exp 进行t检验: import scipy.stats as st 引入scipy.stats进行t检验 创建变量Ownrent_0 = raw_1[raw_1['Ownrent'] == 0]['avg_exp'].valuesOwnrent_1 = raw_1[raw_1['Ownrent'] == 1]['avg_exp'].valuesst.ttest_ind(Ownrent_0, Ownrent_1, equal_var = True) p值为0.01 < 0.05,可以拒绝原假设,即认为是否自有住房和月均信用卡支出是相关的。 2.3 多分类变量与连续变量的相关性分析 多分类变量和连续变量之间的相关性检验可以用多次t检验进行,但较为繁琐,用方差分析进行快速检验相关性,然后再运用多重检验查看具体是哪些处理之间存在差异。以教育水平edu_class为例进行分析,同理首先查看分布 raw_1.pivot_table(index = 'edu_class', values = ['avg_exp'], aggfunc={'avg_exp': ['count', np.mean]}) 可以看到不同教育水平之间消费水平有明显差异,接下来通过方差分析进行检验差异是否明显。 from statsmodels.stats.anova import anova_lm 引入anova_lm进行方差分析from ststsmodels.stats.formula import ols 引入ols进行线性回归建模lm = ols('avg_exp~C(edu_class)', data = raw_1).fit() C(edu_class) 将数值型的变量指定为分类型anova_lm(lm, typ = 2) 可以看到不同教育水平之间的月均消费支出之间的差异是显著的,继续用多重检验来看哪些处理之间是显著的。 from statsmodels.stats.multicomp import MultiComparison 引入MultiComparison进行tukey多重检验mc = MultiComparison(raw_1['avg_exp'],raw_1['edu_class'])tukey_result = mc.tukeyhsd(alpha = 0.5)print(tukey_result) 结果是每个处理之间因变量差异的显著性,最后一列reject都为True说明各组之间均存在显著差异。 三、模型建立与诊断 3.1 一元线性回归及模型解读 以Income为自变量,以avg_exp为因变量建立一元线形回归并对模型结果进行解释 lm_1 = ols('avg_exp ~ Income', data = raw_1).fit()print(lm_1.summary()) 首先从第一部分可以看到R^2为0.454,整个模型的F检验p值小于0.05,说明模型通过显著性检验。 其次模型结果的第二块也表明自变量和截距也通过显著性检验。 最后一部分主要是对残差进行检验,左侧Omnibus、Prob(Omnibus)主要是对偏度Skew和峰度Kurtosis进行检验,正态分布的偏度为0,峰度为3,模型的Prob(Omnibus)值为0.156大于0.05,说明不能拒绝残差符合正态分布。 右侧Durbin-Watson主要是对残差的自相关性进行检(改检验可表示为,为残差之间的相关系数),Durbin-Watson的取值范围是0-4,越接近2说明残差不存在自相关性,越接近0说明存在正相关,越接近4说明存在负相关性。 右侧Jarque-Bera (JB)、Prob(JB)是对残差正态性检验,可以用来判断残差是否符合正态分布,本案例中Prob(JB)值为0.173 > 0.05,基不能拒绝残差服从正态分布。 右侧Cond. No.是多重共线性检验,该值越大,共线性越严重。 整体上看模型虽然拟合效果没那么好,但是显著性通过了检验。接下来看一下模型具体的系数,Income的系数为97.7说明模型收入越高信用卡消费越高,是符合业务预期的。 3.2 残差可视化分析 接下来对残差进一步进行可视化分析,主要看残差是否满足以下几个假定,并尝试通过对自变量、因变量进行调整来优化模型。首先来回顾一下残差需要满足的几个假定: a.残差的要服从均值为0,方差为的正态分布; b.残差之间要相互独立 c.残差和自变量没有相关性 (1)通过残差图进行模型优化 模型avg_exp ~ Income的自变量与残差分布图、残差qq图、模型拟合情况图即自变量与因变量及其预测值的图像 lm_1 = ols('avg_exp ~ Income', data = raw_1).fit() 建模raw_1['resid_1'] = lm_1.resid 模型残差raw_1['resid_1_rank'] = raw_1['resid_1'].rank(ascending = False, pct = True) 计算残差的百分位数raw_1['pred_1'] = lm_1.predict() 添加预测值plt.figure(figsize = (20, 6)) 自变量与残差分布图ax1 = plt.subplot(131)ax1.scatter('Income', 'resid', data = raw_1)ax1.set_title('Income & resid') 残差的qq图ax2 = plt.subplot(132)stats.probplot(raw_1['resid_1_rank'], dist = 'norm', plot = ax2) 模型拟合情况图,自变量与因变量以及模型预测值ax3 = plt.subplot(133)ax3.scatter('Income', 'avg_exp', data = raw_1)ax3.plot('Income', 'pred_1', data = raw_1, color = 'red')ax3.legend()ax3.text(12, 1920, 'pred func R^2: %.2f'% lm_1.rsquared)ax3.set_title('Income & avg_exp') 从第一个自变量和残差散点图可以看出,残差基本符合对称分布,但随着自变量增大,残差也在变大,存在方差不齐的情况。第二个图残差的qq图可以看出,残差近似正态分布。第三个图可以看模型的拟合效果并不是很好,R^2只有0.45。对avg_exp取对数,能够改善预测值越大残差越大的情况,但由于只对因变量取对数导致模型不好解释,对自变量Income同时取对数,代码和以上类似,只是改变因变量和自变量形式而已,以下是残差图,可以看到残差的异方差现象被有效的抑制,并且R^2也得到了提高。 (2)通过残差图发现强影响点 仔细观察以上图像结果,左下侧有两个较为异常的数据,对模型的拟和效果有较大的影响, 对于这种影响较大的可将其进行删除并重新建模: 计算学生化残差raw_1['resid_t'] = (raw_1['resid_2'] - raw_1['resid_2'].mean())/raw_1['resid_2'].std() raw_1[abs(raw_1['resid_t']) > 2] 将残差大于2的筛选出来 将强影响点删除后,得到的结果如下,模型结果更稳定。 3.3 多元线性回归 上一篇文章有说到多重共线性会对模型产生致命的影响,用方差膨胀因子来处理的话会非常繁琐。通过正则化处理如Lasso回归,能够产生某些严格等于0的系数,从而达到变量筛选的目的。接下来以Lasso为例,首先用LassoCV来找到最优的alpha。由于statsmodels中的ols的fit_regularized方法没有很好的实现,所以用sklearn中linear_model模块来进行建模 from sklearn.preprocessing import StandardScaler sklearn进行线性回归前必须要进行标准化from sklearn.linear_model import LassoCV Lasso的交叉验证方法con_xcols = ['Age', 'Income', 'dist_home_val', 'dist_avg_income']scaler = StandardScaler()X = scaler.fit_transform(raw_1[con_xcols])y = raw_1['avg_exp_ln']lasso_alphas = np.logspace(-3, 0, 100, base = 10)lcv = LassoCV(alphas = lasso_alphas, cv = 10)lcv.fit(X, y)print('best alpha %.4f' % lcv.alpha_)print('the r-square %.4f' % lcv.score(X, y)) 接下来画出不同alpha下的岭迹图,来看alpha值对系数的影响 from sklearn.linear_model import Lassocoefs = []lasso = Lasso()for i in lasso_alphas:lasso.set_params(alpha = i)lasso.fit(X, y)coefs.append(lasso.coef_)ax = plt.gca()ax.plot(lasso_alphas, coefs)ax.set_xscale('log')ax.set_xlabel('$\\alpha$')ax.set_ylabel('coefs value') 从图中可以看到随着alpha的增大,系数不断在减小,有些系数会优先收缩为0,再继续增大时所欲系数都会为0,通过该特性从而达到变量筛选的目的。将LassoCV得到的系数打印出来,可以看到用户月均信用卡支出和当地小区均价、当地人均收入成正比,当地人均收入水平的影响更大。 以上就是线形回归在应用时的注意事项。 本篇文章为转载内容。原文链接:https://blog.csdn.net/baidu_26137595/article/details/123766191。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-11-23 15:52:56
106
转载
建站模板下载
...于导航,满足各类成人教育及自考资讯发布需求,是创建相关教育网站的理想选择。 点我下载 文件大小:1002.94 KB 您将下载一个资源包,该资源包内部文件的目录结构如下: 本网站提供模板下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2023-06-13 17:13:47
335
本站
建站模板下载
资源介绍 该“远程教育在线考试答题页面通用模板”是一款专为教育行业设计的数字化工具,适用于各类远程教育场景,着力服务于教育事业的发展。模板专注于在线考试答题功能,满足教育在线网的需求,提供便捷、高效的在线答题界面,助力教育答题环节的优化升级。使用者可以快速下载并应用于教育在线平台,推动教育网的现代化建设与教育发展的创新实践。 点我下载 文件大小:61.19 KB 您将下载一个资源包,该资源包内部文件的目录结构如下: 本网站提供模板下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2023-11-12 21:39:03
110
本站
建站模板下载
...源介绍 该“简约基础教育研究中心源码模板”是一款专为教育培训机构及课程类网站设计的绿色HTML模板,以简洁明了的界面风格展现,适用于各类教育培训、学习类平台。模板内含丰富功能模块,满足教育机构展示课程、师资力量、培训资讯等多元化需求,提供便捷的教育网模板下载服务,助力快速构建专业且富有亲和力的在线教育平台。 点我下载 文件大小:2.46 MB 您将下载一个资源包,该资源包内部文件的目录结构如下: 本网站提供模板下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2023-11-21 11:00:04
113
本站
建站模板下载
...HTML5模板”专为教育、教学交流活动设计,采用清新蓝色调,营造专业且舒适的浏览体验。模板基于HTML5技术构建,实现单页面高效展示,内容涵盖国内外教学合作项目的详细介绍及更多拓展信息,适用于各类学校、教育机构展示其国际合作与交流成果的官方网站建设。 点我下载 文件大小:1.47 MB 您将下载一个资源包,该资源包内部文件的目录结构如下: 本网站提供模板下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2023-11-03 15:46:32
130
本站
建站模板下载
...以简洁风格呈现,强调教育机构的专业性与艺术氛围,可便捷搭建包含音乐、舞蹈在内的多元化社会教育信息平台,方便用户快速获取课程信息及报名渠道。 点我下载 文件大小:434.91 KB 您将下载一个资源包,该资源包内部文件的目录结构如下: 本网站提供模板下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2023-10-30 16:59:00
55
本站
建站模板下载
... “蓝色经典在线课程教育培训网站模板”是一款基于HTML5技术打造的响应式企业级模板,专为教育培训机构设计。该模板以优雅的蓝色调为主,营造专业学术氛围,适合展示各类在线课程与教育培训内容。它具备高度自适应特性,能在不同设备上完美呈现,提供用户流畅浏览体验。此模板功能丰富,可便捷管理更多课程信息,是搭建专业教育培训网站的理想选择。 点我下载 文件大小:2.70 MB 您将下载一个资源包,该资源包内部文件的目录结构如下: 本网站提供模板下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2023-05-05 09:50:19
103
本站
建站模板下载
... 这款蓝色通用小学生教育咨询网站html模板专为小学阶段的教育机构、培训机构及学校设计,采用清新蓝色调,营造出适合学生群体的友好氛围。模板内容涵盖了社会教育、课程教育、亲子教育等多个板块,满足各类小学教育场景需求,同时适用于展示教育咨询服务和企业信息,具有高度的通用性和可定制性,是搭建专业、亲和力十足的小学生教育咨询网站的理想之选。 点我下载 文件大小:2.98 MB 您将下载一个资源包,该资源包内部文件的目录结构如下: 本网站提供模板下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2023-01-14 15:54:17
85
本站
站内搜索
用于搜索本网站内部文章,支持栏目切换。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
last reboot
- 显示最近的系统重启记录。
推荐内容
推荐本栏目内的其它文章,看看还有哪些文章让你感兴趣。
2023-04-28
2023-08-09
2023-06-18
2023-04-14
2023-02-18
2023-04-17
2024-01-11
2023-10-03
2023-09-09
2023-06-13
2023-08-07
2023-03-11
历史内容
快速导航到对应月份的历史文章列表。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"