前端技术
HTML
CSS
Javascript
前端框架和UI库
VUE
ReactJS
AngularJS
JQuery
NodeJS
JSON
Element-UI
Bootstrap
Material UI
服务端和客户端
Java
Python
PHP
Golang
Scala
Kotlin
Groovy
Ruby
Lua
.net
c#
c++
后端WEB和工程框架
SpringBoot
SpringCloud
Struts2
MyBatis
Hibernate
Tornado
Beego
Go-Spring
Go Gin
Go Iris
Dubbo
HessianRPC
Maven
Gradle
数据库
MySQL
Oracle
Mongo
中间件与web容器
Redis
MemCache
Etcd
Cassandra
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Nacos
Consul
Tomcat
Nginx
Netty
大数据技术
Hive
Impala
ClickHouse
DorisDB
Greenplum
PostgreSQL
HBase
Kylin
Hadoop
Apache Pig
ZooKeeper
SeaTunnel
Sqoop
Datax
Flink
Spark
Mahout
数据搜索与日志
ElasticSearch
Apache Lucene
Apache Solr
Kibana
Logstash
数据可视化与OLAP
Apache Atlas
Superset
Saiku
Tesseract
系统与容器
Linux
Shell
Docker
Kubernetes
[维度选择与层级设计实践]的搜索结果
这里是文章列表。热门标签的颜色随机变换,标签颜色没有特殊含义。
点击某个标签可搜索标签相关的文章。
点击某个标签可搜索标签相关的文章。
Element-UI
...大型项目时,由于数据层级过深导致的性能瓶颈,通过优化递归渲染逻辑,显著提升了树形组件的响应速度与用户体验。此外,文章还讨论了Vue.js 3.0版本中引入的新特性——Teleport,如何结合虚拟DOM技术有效提升树形组件在特定场景下的渲染效率。 同时,针对Element-UI社区的最新动态,近期发布的Element Plus作为Element-UI的升级版,在处理树形控件等组件上进行了诸多改进,不仅修复了一些遗留问题,还新增了如懒加载、动态加载等功能,以满足现代前端开发对于性能和功能性的更高要求。 因此,对于遇到树形组件节点无法正常展开或收起等问题的前端开发者而言,了解并借鉴上述技术和实践,不仅能针对性地解决现有问题,还能对未来项目的前端架构设计产生深远影响,提升整体开发效能。
2023-08-31 16:39:17
504
追梦人-t
Superset
...绊,就比如MDX(多维度表达式)查询出错这种情况,也是时常让人头疼的问题之一。MDX作为多维表达式语言,主要用于处理多维数据存储如OLAP_cube。本文将带您走进Superset与MDX的交汇点,通过生动的实例和深入的探讨,解决那些令人头疼的MDX查询错误。 2. MDX查询基础理解 MDX查询的强大之处在于其能够对多维数据进行灵活、动态的检索。例如,想象一下我们在Superset中连接到一个包含销售数据的OLAP Cube,我们可以用MDX编写如下查询以获取特定区域和时间段的销售额: mdx SELECT [Measures].[Sales Amount] ON COLUMNS, {[Time].[Year].&[2021], [Product].[Category].&[Electronics]} ON ROWS FROM [SalesCube] 这段代码中,我们选择了"Sales Amount"这个度量值,并在行轴上指定了时间维度的2021年和产品类别维度的"Electronics"子节点。 3. Superset中MDX查询错误的常见类型及原因 3.1 错误语法或拼写错误 由于MDX语法相对复杂,一个小小的语法错误或者对象名称的拼写错误都可能导致查询失败。比如,你要是不小心把[Measures]写成了[Measure],Superset可就不乐意了,它会立马抛出一个错误,告诉你找不到对应的东西。 3.2 对象引用不正确 在Superset中,如果尝试访问的数据立方体中的某个维度或度量并未存在,同样会引发错误。比如,你可能试图从不存在的[Product].[Subcategory]维度提取信息。 3.3 数据源配置问题 有时,MDX查询错误并非源于查询语句本身,而是数据源配置的问题。在Superset里头,你得保证那些设置的数据源连接啊、Cube的名字啥的,全都得准确无误,这可真是至关重要的一环,千万别马虎大意! 4. 解决Superset中MDX查询错误的实战示例 示例1:修复语法错误 假设我们收到以下错误: text Object '[Meaures].[Sales Amount]' not found on cube 'SalesCube' 这表明我们误将Measures拼写为Meaures。修复后的正确查询应为: mdx SELECT [Measures].[Sales Amount] ON COLUMNS, ... 示例2:修正对象引用 假设有这样一个错误: text The dimension '[Product].[Subcategory]' was not found in the cube when parsing string '[Product].[Subcategory].&[Smartphones]' 我们需要检查数据源,确认是否存在Subcategory这一层级,若不存在,则需要调整查询至正确的维度层次,例如更改为[Product].[Category]。 5. 结论与思考 面对Superset中出现的MDX查询错误,关键在于深入理解MDX查询语法,仔细核查数据源配置以及查询语句中的对象引用是否准确。每当遇到这种问题,咱可别急着一蹴而就,得先稳住心态,耐心地把错误信息给琢磨透彻。再配上咱对数据结构的深入理解,一步步像侦探破案那样,把问题揪出来,妥妥地把它修正好。在这个过程中,咱们的数据分析功夫会像游戏升级一样越来越溜,真正做到跟数据面对面“唠嗑”,让Superset变成咱们手中那把锋利无比的数据解密神器。
2023-12-18 18:07:56
97
烟雨江南
Bootstrap
...整列间距,以满足不同设计需求。 此外,Bootstrap 5还增强了响应式设计的支持,使得列间距在不同屏幕尺寸下都能保持一致的视觉效果。这意味着开发者不再需要通过复杂的CSS技巧来手动调整间距,而是可以通过简单的类名配置实现更精细的控制。例如,使用.g-系列类名可以轻松调整不同层级的间距,而无需担心跨设备的一致性问题。 值得一提的是,Bootstrap 5还加强了与现代Web标准的兼容性,如Flexbox和Grid布局的支持,这不仅提高了网格系统的性能,还为开发者提供了更多的布局选项。例如,通过结合Flexbox布局,开发者可以更轻松地实现复杂的垂直和水平对齐,同时保持列间距的均匀分布。 除了技术上的改进,Bootstrap社区也一直在积极推广最佳实践,鼓励开发者利用最新的技术和工具来优化他们的项目。例如,近期一篇由知名前端工程师撰写的博客文章深入探讨了如何利用CSS变量和Sass函数来进一步增强Bootstrap网格系统的灵活性,这为那些追求极致定制化的开发者提供了宝贵的参考。 总之,随着Bootstrap 5的发布及其一系列改进措施,前端开发者现在有了更多的工具和选项来精准控制列间距,进而提升网页的美观性和用户体验。这些改进不仅简化了开发流程,还为未来的Web设计提供了坚实的基础。
2024-11-08 15:35:49
46
星辰大海
Kylin
...溢出问题上具有重要的实践意义。近期,随着技术的不断演进与突破,Kylin社区也推出了诸多优化方案和新特性以应对复杂数据集带来的挑战。 例如,Kylin 4.0版本引入了更为灵活的存储架构设计和增量构建功能,用户可以根据实际需求对Cube进行分层分区构建,有效降低单次构建的数据量,从而避免内存溢出。此外,该版本还支持动态调整查询和构建过程中所需的计算资源,通过智能化的资源调度机制,最大程度地利用硬件资源,减少因系统配置不足导致的内存溢出问题。 同时,结合云原生技术和容器化部署,企业可以更便捷地扩展Kylin集群规模,按需分配计算资源,以适应不断增长的数据处理需求。在实际案例中,不少大型互联网公司已成功运用上述策略优化了Kylin在超大规模数据集上的表现,实现了高效稳定的数据分析服务。 进一步地,对于代码效率低下的问题,开发者应当持续关注并应用最新的编程优化策略和技术,如采用流式计算、列式计算等现代数据处理范式,以提升数据处理算法的内存效率。实践中,可以通过深入研究Apache Kylin源码及社区讨论,借鉴和采纳已经验证过的内存优化方案。 总之,解决Kylin在构建Cube时的内存溢出问题是一个涉及多方面因素的综合性任务,需要紧跟技术发展趋势,适时更新软件版本,并结合实际业务场景进行针对性优化,才能确保大数据分析系统的稳定高效运行。
2023-02-19 17:47:55
129
海阔天空-t
Kylin
...预计算游戏”,把各种维度的数据提前捣鼓好,然后把这些多维度、经过深度整合的聚合结果,妥妥地存放在HBase这个大仓库里。所以,当我们想要实现不同集群间的查询互通时,重点就在于怎样让Kylin能够顺利地触及到各个集群的数据源头,并且在此基础之上成功构建出Cube。这就像是给Kylin装上一双可以跨越数据海洋的翅膀,让它在不同的数据岛屿之间自由翱翔,搭建起高效查询的桥梁。 2. 配置跨集群数据源连接 2.1 配置远程数据源连接 首先,我们需要在Kylin的kylin.properties配置文件中指定远程数据源的相关信息。例如,假设我们的原始数据位于一个名为“ClusterA”的Hadoop集群: properties kylin.source.hdfs-working-dir=hdfs://ClusterA:8020/user/kylin/ kylin.storage.hbase.rest-url=http://ClusterA:60010/ 这里,我们设置了HDFS的工作目录以及HBase REST服务的URL地址,确保Kylin能访问到ClusterA上的数据。 2.2 配置数据源连接器(JDBC) 对于关系型数据库作为数据源的情况,还需要配置相应的JDBC连接信息。例如,若ClusterB上有一个MySQL数据库: properties kylin.source.jdbc.url=jdbc:mysql://ClusterB:3306/mydatabase?useSSL=false kylin.source.jdbc.user=myuser kylin.source.jdbc.pass=mypassword 3. 创建项目及模型并关联远程表 接下来,在Kylin的Web界面创建一个新的项目,并在该项目下定义数据模型。在选择数据表时,Kylin会根据之前配置的HDFS和JDBC连接信息自动发现远程集群中的表。 - 创建项目:在Kylin管理界面点击"Create Project",填写项目名称和描述等信息。 - 定义模型:在新建的项目下,点击"Model" -> "Create Model",添加从远程集群引用的表,并设计所需的维度和度量。 4. 构建Cube并对跨集群数据进行查询 完成模型定义后,即可构建Cube。Kylin会在后台执行MapReduce任务,读取远程集群的数据并进行预计算。构建完成后,您便可以针对这个Cube进行快速、高效的查询操作,即使这些数据分布在不同的集群上。 bash 在Kylin命令行工具中构建Cube ./bin/kylin.sh org.apache.kylin.tool.BuildCubeCommand --cube-name MyCube --project-name MyProject --build-type BUILD 至此,通过精心配置和一系列操作,您的Kylin环境已经成功支持了跨集群的数据源查询。在这一路走来,我们不断挠头琢磨、摸石头过河、动手实践,不仅硬生生攻克了技术上的难关,更是让Kylin在各种复杂环境下的强大适应力和灵活应变能力展露无遗。 总结起来,配置Kylin支持跨集群查询的关键在于正确设置数据源连接,并在模型设计阶段合理引用这些远程数据源。每一次操作都像是人类智慧的一次小小爆发,每查询成功的背后,都是我们对Kylin功能那股子钻研劲儿和精心打磨的成果。在这整个过程中,我们实实在在地感受到了Kylin这款大数据处理神器的厉害之处,它带来的便捷性和无限可能性,真是让我们大开眼界,赞不绝口啊!
2023-01-26 10:59:48
83
月下独酌
转载文章
...中用于存储和操作多个维度数据的数据结构。在C语言中,多维数组使用单个方括号 来表示,并通过指定各维度的大小进行声明。例如,在文章中提到的二维数组int , array=new int 3,2 ,表示一个3行2列的整数数组,可以用来存储具有两个索引(行索引和列索引)的数据。 交错数组(Jagged Array) , 交错数组在Java等编程语言中是指一种非规则的多维数组,它由一维数组构成,每个一维数组又可以有不同的长度,形成类似矩阵但不规则的结构。如文中所述,Java中的交错数组用两个方括号 定义,如int arr,其中每个内部数组(arr i )都可以独立设置长度。 SQL UNION ALL运算符 , 在SQL查询语句中,UNION ALL是将两个或更多SELECT语句的结果集合并为一个结果集的集合操作符。它不会去除重复行,与常规的UNION操作不同。在本文项目实例中,通过UNION ALL将包含特定值的记录与其他记录合并,确保特定值所在的记录始终出现在下拉菜单的最前面。 ASPxDropDownEdit控件 , ASPxDropDownEdit是 DevExpress公司开发的一款用于ASP.NET WebForms应用程序的高级编辑器控件,它提供了一种用户友好的界面,允许用户从下拉列表中选择一个值。这个控件在文章中被用来实现前端显示数据库信息的功能,支持丰富的定制化和事件处理功能。 TreeList控件 , TreeList控件同样是由DevExpress提供的ASP.NET WebForms组件,用于展示具有层次结构(树状结构)的数据,每一项可以展开以查看其子项。在项目中,TreeList控件嵌入到ASPxDropDownEdit控件内,实现了下拉菜单形式的树级结构选择,使得用户可以在下拉框中直观地浏览和选择层级数据。 CASE WHEN语句 , CASE WHEN是SQL中的一种条件表达式,用于根据给定的条件执行不同的计算或返回不同的值。在文章所提及的SQL查询示例中,CASE WHEN用于对 DUTIES_ID 字段进行判断,当其值等于特定值时返回0,否则返回1,以此作为排序依据,确保特定值对应的记录在下拉菜单中优先显示。
2023-06-20 18:50:13
307
转载
Mahout
...例代码帮助大家理解和实践。 二、理解用户相似度 在推荐系统中,用户相似度是用来衡量两个用户在兴趣偏好上有多接近的一种量化方式。想象一下这个场景,假如你发现你的朋友A跟你的“口味”超级合拍,无论是电影还是音乐,你们都喜欢同一挂的。这时候,你心里可能会暗戳戳地觉得,哇塞,我和A简直就是“灵魂伙伴”,相似度爆棚!于是乎,你可能就会自然而然地猜想,那些我还没来得及尝试、但非常喜欢的东西,A说不定也超感兴趣呢!这就是用户相似度在推荐系统中的应用逻辑。 三、Mahout中的用户相似度计算 1. 数据准备 在Mahout中,用户-物品交互数据通常表示为一个稀疏向量,每一维度代表一个物品,值则表示用户对此物品的喜爱程度(如评分)。首先,我们需要将原始数据转换为此格式: java // 假设有一个用户ID为123的用户对物品的评分数据 DataModel model = new FileDataModel(new File("ratings.dat")); // 这里的ratings.dat文件应包含每行格式如:'userId itemId rating' 2. 用户相似度计算 Mahout提供多种用户相似度计算方法,例如皮尔逊相关系数(PearsonCorrelationSimilarity)和余弦相似度(CosineSimilarity)。以下是一个使用皮尔逊相关系数计算用户相似度的例子: java // 创建Pearson相似度计算器 UserSimilarity similarity = new PearsonCorrelationSimilarity(model); // 使用GenericUserBasedRecommender类进行相似度计算 UserNeighborhood neighborhood = new NearestNUserNeighborhood(10, similarity, model); Recommender recommender = new GenericUserBasedRecommender(model, neighborhood, similarity); // 计算用户123与其他用户的相似度 List similarUsers = recommender.mostSimilarItems(123, 10); 这段代码首先创建了一个Pearson相关系数相似度计算器,然后定义了邻域模型(这里选择最近的10个用户),最后通过mostSimilarItems方法找到与用户123最相似的其他用户。 3. 深入思考 值得注意的是,选择何种相似度计算方法很大程度上取决于具体的应用场景和数据特性。比如,假如评分数据分布得比较均匀,那皮尔逊相关系数就是个挺不错的选择。但如果评分数据少得可怜,这时候余弦相似度可能就更显神通了。因为它压根不在乎具体的评分数值大小,只关心相对的偏好方向,所以在这种极端稀疏的情况下,效果可能会更好。 四、总结与探讨 Mahout为我们搭建推荐系统的用户相似度计算提供了有力支持。不过,在实际操作的时候,咱们得灵活应变,根据实际情况对参数进行微调,优化那个算法。有时候,为了更上一层楼的推荐效果,咱可能还需要把用户的社交关系、时间因素等其他信息一并考虑进去,让推荐结果更加精准、接地气儿。在我们一路摸索的过程中,可别光依赖冷冰冰的算法分析,更得把咱们用户的感受和体验揣摩透彻,这样才能够实实在在打造出符合每个人个性化需求的推荐系统,让大家用起来觉得贴心又满意。 总的来说,利用Mahout实现用户相似度计算并不复杂,关键在于理解不同相似度计算方法背后的数学原理以及它们在实际业务中的适用性。实践中,我们要善于运用这些工具,同时保持开放思维,不断迭代和优化我们的推荐策略。
2023-02-13 08:05:07
87
百转千回
Saiku
...幅幅数据图像。 - 维度/度量区(3):位于工作区左侧,就好比你的工具箱,里面装满了各种维度(如时间、地点等分类标签)和度量(如销售额、客户数等数值指标),你可以拖拽它们至中间的查询设计面板,构建出复杂的数据视图。 - 结果展示区(4):当你完成查询设计并执行后,结果显示在右侧区域,像是一块实时更新的数据仪表盘,可能是一个表格、一张图表或者一个自定义的透视表,直观地呈现你的分析成果。 - 过滤器面板(5):有时候,你需要对全局数据进行精细化筛选,这时就可以借助过滤器面板,就如同戴上一副透视眼镜,只看你想看的那一部分数据。 3. 深度探究功能 Saiku还提供了丰富的交互式探索功能,例如,你可以在结果展示区直接对数据进行排序、筛选、钻取等操作,系统会立即响应并动态更新视图,这种即时反馈的体验犹如与数据进行一场即兴对话。 另外,Saiku支持用户自定义公式、设置计算成员以及保存个性化视图,这些高级功能仿佛为你配备了一套强大的数据处理装备,助你在浩瀚的数据海洋中挖掘出更有价值的信息。 总结来说,Saiku的界面设计以用户体验为核心,通过清晰明了的功能分区和直观易用的操作方式,让每一位用户都能轻松驾驭复杂的业务数据,享受数据驱动决策带来的乐趣与便利。这可不只是个普通工具,它更像是一个舞台,让你能和数据一起跳起探戈。每当你点击、拖拽或选择时,就像是在未知世界的版图上又踩下了一小步,离它的秘密更近一步,对它的理解也更深一层。
2023-10-04 11:41:45
104
初心未变
HBase
...的程序。 二、为什么选择HBase 那么,为什么要选择HBase呢?主要有以下几个原因: 1. HBase是一种分布式数据库,能够处理大量的数据,并且能够在大规模集群中运行。 2. HBase是基于列存储的,这意味着我们可以在不需要的时候忽略不重要的列,从而提高性能。 3. HBase支持快速的数据插入和查询操作,这对于实时数据分析和流式处理应用非常有用。 4. HBase有一个非常强大的社区支持,这意味着我们可以获得大量的学习资源和技术支持。 三、使用HBase Shell进行数据查询 接下来,我们将详细介绍如何使用HBase Shell进行数据查询。首先,我们需要打开HBase Shell,然后就可以开始使用各种命令了。 以下是一些基本的HBase Shell命令: 1. 列出所有表 list tables 2. 插入一行数据 sql put 'mytable', 'rowkey', 'columnfamily:qualifier', 'value' 3. 查询一行数据 sql get 'mytable', 'rowkey' 4. 删除一行数据 sql delete 'mytable', 'rowkey' 5. 批量删除多行数据 sql delete 'mytable', [ 'rowkey1', 'rowkey2' ] 四、深入理解HBase查询 然而,这只是HBase查询的基础知识。实际上,HBase查询的功能远比这强大得多。例如,我们可以使用通配符来模糊匹配行键,可以使用范围过滤器来筛选特定范围内的值,还可以使用复杂的组合过滤器来进行高级查询。 以下是一些更复杂的HBase查询示例: 1. 使用通配符模糊匹配行键 sql scan 'mytable', {filter: "RowFilter( PrefixFilter('rowprefix'))"} 2. 使用范围过滤器筛选特定范围内的值 sql scan 'mytable', {filter: "SingleColumnValueFilter(columnFamily, qualifier, CompareFilter.CompareOp.GREATER_OR_EQUAL, value), SingleColumnValueFilter(columnFamily, qualifier, CompareFilter.CompareOp.LESS_OR_EQUAL, value) } 3. 使用组合过滤器进行高级查询 sql scan 'mytable', { filter: [ new org.apache.hadoop.hbase.filter.BinaryComparator('value1'), new org.apache.hadoop.hbase.filter.ColumnCountGetFilter(2) ] } 五、结论 总的来说,HBase是一种功能强大的分布式数据库系统,非常适合用于大数据分析和流式处理应用。通过使用HBase Shell,我们可以方便地进行数据查询和管理。虽然HBase这玩意儿初学时可能会让你觉得有点像爬陡坡,不过只要你把那些基础概念和技术稳稳拿下,就完全能够游刃有余地处理各种眼花缭乱的复杂问题啦。 我相信,在未来的发展中,HBase会变得越来越重要,成为大数据领域的主流工具之一。嘿,老铁!如果你还没尝过HBase这个“甜头”,我真心拍胸脯推荐你,不妨抽点时间深入学习并动手实践一把。这绝对值得你投入精力去探索!你会发现,HBase能为你带来前所未有的体验和收获。
2023-01-31 08:42:41
431
青春印记-t
Superset
...架构是一种专为云环境设计的应用程序开发和部署方式,强调微服务、容器化、持续集成/持续部署(CI/CD)等技术实践。Superset在升级过程中强化与云原生架构的兼容性,意味着它能更好地适应分布式、弹性伸缩的云环境,提供更加稳定、高效的服务。 全局过滤器 , 全局过滤器是Superset中的一项交互功能,允许用户在一个统一的位置设置筛选条件,进而影响整个仪表盘上所有关联的数据图表。这意味着用户可以快速调整视角,从不同维度探索数据,提高数据分析的效率和深度。 自然语言处理(NLP)查询功能 , 自然语言处理是计算机科学领域的一个分支,用于理解和生成人类语言。在BI工具如Tableau和Power BI中应用的NLP查询功能,则是指用户可以通过输入日常对话式的语句来查询和分析数据,降低非技术人员使用数据可视化工具的技术门槛,实现更为人性化和便捷的数据交互体验。 WCAG 2.1标准 , WCAG(Web Content Accessibility Guidelines,网页内容可访问性指南)是由万维网联盟(W3C)制定的一系列指导原则,旨在确保残障人士也能无障碍地访问和使用网络内容。WCAG 2.1是其最新版本,对包括移动设备在内的各类互联网产品提出了更高的无障碍设计要求,微软等公司在BI工具中努力遵循这一标准,目的是让视力障碍、行动不便等各种特殊需求的用户群体都能够平等地获取和利用数据可视化工具提供的信息。
2023-09-02 09:45:15
150
蝶舞花间
DorisDB
...用分布式、MPP架构设计的列式数据库,可以说是相当厉害了。它能像压缩饼干一样高效地“挤”数据,大大节省存储空间;查询速度更是快如闪电,让你无需漫长等待;而且它的实时分析功能强大到飞起,让用户们爱不释手。正是因为这些优点,DorisDB才赢得了众多用户的芳心和点赞呢!然而,在实际操作的时候,我们可能会遇到SQL查询速度卡壳的问题,这篇文呢,咱就来好好唠唠嗑,聊聊怎么通过各种小妙招优化DorisDB这个数据库系统的SQL查询效率,让它跑得溜溜的。 2. 理解与诊断查询性能 首先,我们需要对DorisDB的查询过程有一个基本理解,这包括查询计划的生成、数据分区的选择以及执行引擎的工作原理等。当你发现查询速度不尽如人意时,可以通过EXPLAIN命令来查看SQL语句的执行计划,如同医生检查病人的“体检报告”一样: sql -- 使用EXPLAIN获取查询计划 EXPLAIN SELECT FROM my_table WHERE key = 'some_value'; 通过分析这个执行计划,我们可以了解到查询涉及哪些分区、索引是否被有效利用等关键信息,从而为优化工作找准方向。 3. 优化策略一 合理设计表结构与分区策略 - 列选择性优化:由于DorisDB是列式存储,高选择性的列(即唯一或接近唯一的列)能更好地发挥其优势。例如,对于用户ID这样的列,将其设为主键或构建Bloom Filter索引,可以大幅提升查询性能。 sql -- 创建包含主键的表 CREATE TABLE my_table ( user_id INT PRIMARY KEY, ... ); - 分区设计:根据业务需求和数据分布特性,合理设计分区策略至关重要。比如,咱们可以按照时间段给数据分区,这样做的好处可多了。首先呢,能大大减少需要扫描的数据量,让查询过程不再那么费力;其次,还能巧妙地利用局部性原理,就像你找东西时先从最近的地方找起一样,这样就能显著提升查询的效率,让你的数据查找嗖嗖快! sql -- 按天分区 CREATE TABLE my_table ( ... ) PARTITION BY RANGE (dt) ( PARTITION p20220101 VALUES LESS THAN ("2022-01-02"), PARTITION p20220102 VALUES LESS THAN ("2022-01-03"), ... ); 4. 优化策略二 SQL查询优化 - 避免全表扫描:尽量在WHERE子句中指定明确的过滤条件,利用索引加速查询。例如,假设我们已经为user_id字段创建了索引,那么以下查询会更高效: sql SELECT FROM my_table WHERE user_id = 123; - 减少数据传输量:只查询需要的列,避免使用SELECT 。同时,合理运用聚合函数和分组,避免不必要的计算和排序。 sql -- 只查询特定列,避免全表扫描 SELECT user_name, email FROM my_table WHERE user_id = 123; -- 合理运用GROUP BY和聚合函数 SELECT COUNT(), category FROM my_table GROUP BY category; 5. 优化策略三 系统配置调优 DorisDB提供了丰富的系统参数供用户调整以适应不同场景下的性能需求。比方说,你可以通过调节max_scan_range_length这个参数,来决定每次查询时最多能扫描多少数据范围,就像控制扫地机器人的清扫范围那样。再者,通过巧妙调整那些和内存相关的设置,就能让服务器资源得到充分且高效的利用,就像精心安排储物空间,让每个角落都物尽其用。 6. 结语 优化DorisDB的SQL查询性能是一个综合且持续的过程,需要结合业务特点和数据特征,从表结构设计、查询语句编写到系统配置调整等多个维度着手。每个环节都需细心打磨,才能使DorisDB在大数据洪流中游刃有余,提供更为出色的服务。每一次对DorisDB的优化,都是我们携手这位好伙伴,一起摸爬滚打、不断解锁新技能、共同进步的重要印记。这样一来,咱的数据分析之路也能走得更顺溜,效率嗖嗖往上涨,就像坐上了火箭一样快呢!
2023-05-07 10:47:25
500
繁华落尽
Kylin
...根据实际业务需求灵活选择和优化模型。哎呀,Kylin这玩意儿可真牛!它在处理大数据分析这块儿,简直就是得心应手的利器,灵活又强大,用起来那叫一个顺手,简直就是数据分析界的扛把子啊!哎呀,随着咱手里的数据越来越多,做事儿也越来越复杂了,这时候,学会在Kylin这个工具里搭建和优化各种数据分析模型,就变得超级关键啦!就像是厨房里,你会做各种菜,每道菜的配料和做法都不一样,对吧?在Kylin这里也是一样,得会根据不同的需求,灵活地组合和优化模型,让数据分析既快又准,效率爆棚!这不仅能让咱们的工作事半功倍,还能解锁更多创新的分析思路,是不是想想都觉得挺酷的呢? --- 请注意,上述代码示例为简化版本,实际应用时可能需要根据具体数据集和业务需求进行调整。
2024-10-01 16:11:58
130
星辰大海
Saiku
...也看不清。这玩意儿的设计,有时候真的让人摸不着头脑,仿佛是在和机器玩智力游戏呢。哎呀,这篇文章啊,就是要好好聊一聊 Saiku 配置文件编辑器这个小家伙,看看它在直观性上做得怎么样,然后给它提点改进意见。就像咱们平时用手机APP一样,如果界面简洁明了,操作起来顺手,那大家用着就开心嘛!所以,这篇文章就是想帮 Saiku 找找在直观性上的小问题,然后给出点实用的小建议,让它变得更棒,用起来更舒心! 一、直观性挑战 从用户反馈中窥探 用户反馈显示,Saiku配置文件编辑器的界面设计相对传统,对于非技术背景的用户来说,理解其工作原理和操作逻辑较为困难。主要体现在以下几个方面: - 术语晦涩:专业术语如“维度”、“度量”等在初次接触时难以理解。 - 布局混乱:界面元素分布缺乏逻辑性,导致用户在寻找特定功能时费时费力。 - 信息密度高:大量的配置选项集中在一个页面上,容易造成视觉疲劳,降低操作效率。 二、案例分析 以“时间序列分析”为例 假设我们正在为一家零售公司构建一个销售趋势分析仪表板,需要配置时间序列数据进行展示。在Saiku配置文件编辑器中,用户可能首先会面临以下挑战: 1. 选择维度与度量 - 用户可能不清楚如何在众多维度(如产品类别、地区、时间)和度量(如销售额、数量)中做出最佳选择来反映他们的分析需求。 - 缺乏直观的提示或预览功能,使得用户难以预见到不同选择的最终效果。 2. 配置时间序列 - 在配置时间序列时,用户可能会遇到如何正确设置时间粒度(如日、周、月)以及如何处理缺失数据的问题。 - 缺乏可视化的指导,使得用户在调整时间序列设置时感到迷茫。 三、改进建议 增强直观性和用户友好性 针对上述挑战,我们可以从以下几个方面着手改进Saiku配置文件编辑器: 1. 简化术语 引入更易于理解的语言替换专业术语,例如将“维度”改为“视角”,“度量”改为“指标”。 2. 优化布局与导航 采用更加清晰的分层结构,将相关功能模块放置在一起,减少跳转次数。同时,增加搜索功能,让用户能够快速定位到需要的配置项。 3. 提供可视化预览 在用户进行配置时,实时展示配置结果的预览图,帮助用户直观地理解设置的效果。 4. 引入动态示例 在配置页面中嵌入动态示例,通过实际数据展示不同的配置效果,让用户在操作过程中学习和适应。 5. 增加教程与资源 开发一系列针对不同技能水平用户的教程视频、指南和在线问答社区,帮助用户更快掌握Saiku的使用技巧。 四、结语 从实践到反馈的闭环 改进Saiku配置文件编辑器的直观性是一个持续的过程,需要结合用户反馈不断迭代优化。哎呀,听我说啊,要是咱们按照这些建议去操作,嘿,那可是能大大提升大家用咱们Saiku的体验感!这样一来,不光能让更多的人知道并爱上Saiku,还能让数据分析这块儿的整体发展更上一层楼呢!你懂我的意思吧?就像是给整个行业都添了把火,让数据这事儿变得更热乎,更受欢迎!哎呀,兄弟!在咱们这项目推进的过程中,得保持跟用户之间的交流超级通畅,听听他们在使用咱们产品时遇到的具体难题,还有他们的一些建议。这样咱们才能对症下药,确保咱们改进的措施不是空洞的理论,而是真正能解决实际问题,让大家都满意的好办法。毕竟,用户的反馈可是我们优化产品的大金矿呢! --- 通过这次深入探讨,我们不仅认识到Saiku配置文件编辑器在直观性上的挑战,也找到了相应的解决路径。哎呀,希望Saiku在将来能给咱们的数据分析师们打造一个既温馨又高效的工具平台,就像家里那台超级好用的咖啡机,让人一上手就爱不释手。这样一来,大家就能专心挖出数据背后隐藏的金矿,而不是老是跟那些烦人的技术小难题过不去,对吧?
2024-10-12 16:22:48
73
春暖花开
Kibana
...数,解锁数据洞察的新维度。 一、为何需要自定义数据聚合函数? 在数据科学和业务分析领域,我们经常遇到需要对数据进行定制化的分析需求。比如说,咱们得算出一堆数据里头某个指标的具体数值,就像找出一堆水果中最大的那个苹果。或者,我们还能根据时间序列,也就是按照时间顺序排列的数据,来预测未来的走向,就像是看天气预报,预测明天会不会下雨。还有就是,分析用户的个性化行为,比如有的人喜欢早起刷微博,有的人则习惯晚上熬夜看剧,我们要找出这些不同模式,就像是理解朋友的性格差异,知道什么时候找他们聊天最有效。哎呀,你知道的,有时候我们手上的数据,它们就像一群不听话的小孩,现有的那些内置工具啊,就像妈妈的规则,根本管不住他们。这就逼得我们得自己发明一些新的小把戏,比如自定义的数据聚合函数,这样就能更灵活地把这些数据整理成我们需要的样子啦。就像是给每个小孩量身定制的玩具,既符合他们的特性,又能让他们乖乖听话,多好啊! 二、Kibana自定义聚合函数的实现 在Kibana中,实现自定义聚合函数主要依赖于_scripted_metric聚合类型。这种类型的聚合允许用户编写JavaScript代码来定义自己的聚合逻辑。下面,我们将通过一个简单的示例来展示如何实现一个自定义聚合函数。 示例:计算数据的“活跃天数” 假设我们有一个日志数据集,每条记录代表一次用户操作,我们需要计算用户在某段时间内的活跃天数(即每天至少有一次操作)。 步骤1:定义聚合代码 首先,我们需要编写JavaScript代码来实现我们的逻辑。以下是一个示例: javascript { "aggs": { "active_days": { "scripted_metric": { "init_script": "total_days = 0", "map_script": "if (doc['timestamp'].value > 0) { total_days++; }", "combine_script": "return total_days", "reduce_script": "return sum" } } }, "script_fields": { "timestamp": { "script": { "source": "doc['timestamp'].value", "lang": "painless" } } } } 解释: - init_script:初始化变量total_days为0。 - map_script:当timestamp字段值大于0时,将total_days加1。 - combine_script:返回当前total_days的值。 - reduce_script:用于汇总多个聚合结果,这里使用sum函数将所有total_days值相加。 步骤2:执行聚合 在Kibana中创建一个新的搜索查询,选择_scripted_metric聚合类型,并粘贴上述代码片段。确保数据源正确,然后运行查询以查看结果。 三、实战应用与优化 在实际项目中,自定义聚合函数可以极大地增强数据分析的能力。例如,你可能需要根据业务需求调整map_script中的条件,或者优化init_script和combine_script以提高性能。 实践建议: - 测试与调试:在部署到生产环境前,务必充分测试自定义聚合函数,确保其逻辑正确且性能良好。 - 性能考虑:自定义聚合函数可能会增加查询的复杂度和执行时间,特别是在处理大量数据时。合理设计脚本,避免不必要的计算,以提升效率。 - 可读性:保持代码简洁、注释清晰,方便团队成员理解和维护。 四、结语 自定义数据聚合函数是Kibana强大的功能之一,它赋予了用户无限的创造空间,能够针对特定业务需求进行精细的数据分析。通过本文的探索,相信你已经掌握了基本的实现方法。嘿,兄弟!你得记住,实践就是那最棒的导师。别老是坐在那里空想,多动手做做看,不断试验,然后调整改进。这样啊,你的数据洞察力,那可是能突飞猛进的。就像种花一样,你得浇水、施肥、修剪,它才会开花结果。所以,赶紧去实践吧,让自己的技能开枝散叶!在数据的海洋中航行,自定义聚合函数就是你手中的指南针,引领你发现更多宝藏。
2024-09-16 16:01:07
167
心灵驿站
HBase
...更新为用户提供了更多维度进行性能调优的选择。 同时,在大规模数据处理场景下,学术界和工业界对NoSQL数据库的深度研究也在不断推进。有研究人员通过实证分析指出,结合业务特性和未来数据增长趋势合理设计HBase架构,并采用先进的缓存策略与预加载技术,可显著提升系统响应速度和资源利用率。 此外,对于HBase在实时数据分析、物联网(IoT)数据存储、大规模用户画像构建等实际应用场景中的表现,也有不少成功案例和最佳实践分享。例如,某知名互联网公司就公开介绍了如何通过精细化RowKey设计和智能分区策略,成功解决海量用户行为日志在HBase上的存储与查询难题,实现业务性能的大幅提升。 综上所述,持续跟踪HBase最新发展动态,深入学习并借鉴行业内的优秀实践案例,将有助于我们在实战中更好地运用和优化HBase,充分发挥其在大数据处理中的巨大潜力。
2023-03-14 18:33:25
580
半夏微凉
Beego
...构建Web应用的理想选择。在处理服务不可用错误时,Beego提供了丰富的工具和机制来帮助开发者进行诊断和修复。 三、识别与诊断服务不可用 在Beego应用中,识别服务不可用错误通常通过HTTP响应的状态码来进行。当应用返回503状态码时,说明服务当前无法处理请求。哎呀,兄弟!想要更清晰地找出问题所在,咱们得好好利用Beego自带的日志系统啊。它能帮咱们记录下一大堆有用的信息,比如啥时候出的错、用户是咋操作的、到底哪一步出了问题。有了这些详细资料,咱们在后面分析问题、找解决方案的时候就方便多了,不是吗? 示例代码: go // 在启动Beego应用时设置日志级别和格式 log.SetLevel(log.DEBUG) log.SetOutput(os.Stdout) func main() { // 初始化并启动Beego应用 app := new(beego.AppConfig) app.Run(":8080") } 在上述代码中,通过log.SetLevel(log.DEBUG)设置日志级别为DEBUG,确保在发生错误时能够获取到足够的信息进行诊断。 四、处理服务不可用错误 当检测到服务不可用错误时,Beego允许开发者通过自定义中间件来响应这些异常情况。通过创建一个中间件函数,可以优雅地处理503错误,并向用户呈现友好的提示信息,例如重试机制、缓存策略或简单的等待页面。 示例代码: go // 定义一个中间件函数处理503错误 func errorMiddleware(c beego.Context) { if c.Ctx.Input.StatusCode() == 503 { c.Data["Status"] = "503 Service Unavailable" c.Data["Message"] = "Sorry, our service is currently unavailable. Please try again later." c.ServeContent("error.html", http.StatusOK) } else { c.Next() } } // 注册中间件 func init() { beego.GlobalControllerInterceptors = append(beego.GlobalControllerInterceptors, new(errorMiddleware)) } 这段代码展示了如何在Beego应用中注册一个全局中间件,用于捕获并处理503状态码。哎呀,你遇到服务挂了的情况了吧?别急,这个中间件挺贴心的,它会给你弹出个温馨的小提示,告诉你:“嘿,稍等一下,我们正忙着处理一些事情呢。”然后,它还会给你展示一个等待页面,上面可能有好看的动画或者有趣的图片,让你在等待的时候也不觉得无聊。这样,你就不会因为服务暂时不可用了而感到烦躁了,体验感大大提升! 五、优化与预防服务不可用 预防服务不可用的关键在于资源管理、负载均衡以及监控系统的建立。Beego虽然本身不直接涉及这些问题,但可以通过集成第三方库或服务来实现。 - 资源管理:合理分配和监控CPU、内存、磁盘空间等资源,避免过度消耗导致服务不可用。 - 负载均衡:利用Nginx、HAProxy等工具对流量进行分发,减轻单点压力。 - 监控系统:使用Prometheus、Grafana等工具实时监控应用性能和资源使用情况,及时发现潜在问题。 六、结论 服务不可用是Web应用中不可避免的一部分,但通过使用Beego框架的特性,结合适当的策略和实践,可以有效地识别、诊断和解决这类问题。嘿,兄弟!想做个靠谱的Web应用吗?那可得注意了,你得时刻盯着点,别让你的应用出岔子。得给资源好好规划规划,别让服务器喘不过气来。还有,万一哪天程序出错了,你得有个应对的机制,别让小问题搞大了。这三样,监控、资源管理和错误处理,可是你稳定可靠的三大法宝!别忘了它们,你的应用才能健健康康地跑起来!
2024-10-10 16:02:03
102
月影清风
Kylin
...调整,每一步都得精心设计,才能让整个系统运行得既高效又稳定。所以,这不仅仅是个理论问题,更是一场实战演练,考验的是咱们对数据库知识的掌握和运用能力呢!本文将带你一起揭开这个谜题的面纱,从理论到实践,全方位解析Kylin与MySQL联接优化的关键点。 二、理论基础 理解Kylin与MySQL的联接机制 在深入讨论优化策略之前,我们首先需要理解两者之间的基本联接机制。Kylin是一个基于Hadoop的列式存储OLAP引擎,它通过预先计算并存储聚合数据来加速查询速度。而MySQL作为一个广泛使用的SQL数据库管理系统,提供了丰富的查询语言和存储能力。嘿,兄弟!你听过数据联接这事儿吗?它通常在咱们把数据从一个地方搬进另一个地方或者在查询数据的时候出现。就像拼图一样,对了,就是那种需要精准匹配才能完美组合起来的拼图。用对了联接策略,那操作效率简直能嗖的一下上去,比火箭还快呢!所以啊,小伙伴们,别小瞧了这个小小的联接步骤,它可是咱们大数据处理里的秘密武器! 三、策略一 优化联接条件 实践示例: sql -- 原始查询语句 SELECT FROM kylin_table JOIN mysql_table ON kylin_table.id = mysql_table.id; -- 优化后的查询语句 SELECT FROM kylin_table JOIN mysql_table ON kylin_table.id = mysql_table.id AND kylin_table.date >= '2023-01-01' AND kylin_table.date <= '2023-12-31'; 通过在联接条件中加入过滤条件(如时间范围),可以减少MySQL服务器需要处理的数据量,从而提高联接效率。 四、策略二 利用索引优化 实践示例: 在MySQL表上为联接字段创建索引,可以大大加速查询速度。同时,在Kylin中,确保相关维度的列已经进行了适当的索引,可以进一步提升性能。 sql -- MySQL创建索引 CREATE INDEX idx_kylin_table_id ON kylin_table(id); -- Kylin配置维度索引 id long true 通过这样的配置,不仅MySQL的查询速度得到提升,Kylin的聚合计算也更加高效。 五、策略三 批量导入与增量更新 实践示例: 对于大型数据集,考虑使用批量导入策略,而不是频繁的增量更新。哎呀,你瞧,咱们用批量导入这招,就像是给MySQL服务器做了一次减压操,让它不那么忙碌,喘口气。同时,借助Kylin的离线大法,我们就能让那些实时查询快如闪电,不拖泥带水。这样一来,不管是数据处理还是查询速度,都大大提升了,用户满意度也蹭蹭往上涨呢! bash 批量导入脚本示例 $ hadoop fs -put data.csv /input/ $ bin/hive -e "LOAD DATA INPATH '/input/data.csv' INTO TABLE kylin_table;" 六、策略四 优化联接模式 选择合适的联接模式(如内联接、外联接等)对于性能优化至关重要。哎呀,你得知道,在咱们实际干活的时候,选对了数据联接的方式,就像找到了开锁的金钥匙,能省下不少力气,避免那些没必要的数据大扫荡。比如说,你要是搞个报表啥的,用对了联接方法,数据就乖乖听话,找起来快又准,省得咱们一个个文件翻,一个个字段找,那得多费劲啊!所以,挑对工具,效率就是王道! 实践示例: 假设我们需要查询所有在特定时间段内的订单信息,并且关联了用户的基本信息。这里,我们可以使用内联接: sql SELECT FROM orders o INNER JOIN users u ON o.user_id = u.user_id WHERE o.order_date BETWEEN '2023-01-01' AND '2023-12-31'; 七、总结与展望 通过上述策略的实施,我们能够显著提升Kylin与MySQL联接操作的性能。哎呀,你知道优化数据库操作这事儿,可真是个门道多得很!比如说,调整联接条件啊,用上索引来提速啊,批量导入数据也是一大妙招,还有就是选对联接方式,这些小技巧都能让咱们的操作变得顺畅无比,响应速度嗖嗖的快起来。就像开车走高速,不堵车不绕弯,直奔目的地,那感觉,爽歪歪!哎呀,随着咱手里的数据越来越多,就像超市里的货物堆积如山,技术这玩意儿也跟咱们的手机更新换代一样快。所以啊,要想让咱们的系统运行得又快又好,就得不断调整和改进策略。就像是给汽车定期加油、保养,让它跑得既省油又稳定。这事儿,可得用心琢磨,不能偷懒!未来,随着更多高级特性如分布式计算、机器学习集成等的引入,Kylin与MySQL的联接优化将拥有更广阔的应用空间,助力数据分析迈向更高层次。
2024-09-20 16:04:27
104
百转千回
转载文章
...,负责软件项目的详细设计、编码和内部测试的组织实施。 2、协助项目经理和相关人员同客户进行沟通,保持良好的客户关系。 3、参与需求调研、项目可行性分析、技术可行性分析和需求分析。 4、熟悉并熟练掌握交付软件部开发的软件项目的相关软件技术。 5、负责向项目经理及时反馈软件开发中的情况,并根据实际情况提出改进建议。 6、负责对业务领域内的技术发展动态进行分析研究。 高级程序员 高级程序员学名,工程师。 到了这个level,英文名可改叫做 engineer 或 developer。此时你的功力开始增强,这与你平时的积累努力是分不开的,祝贺你~ 此时的你不仅可以完成任务,开始注重代码的质量,能够写出工业级的代码。你的经验可胜任模块级的系统设计,承担完成较为复杂的技术,能有效的自我管理,有帮助别人快速解决问题(trouble shooting)的能力。 此阶段你需要经历到7、8年左右的体验,中间要经历一段深刻自我历练的过程。 有时给人致命一击其实是心里的小蟊贼。一般人在5年前后遇到一个门槛,碰到天花板+彷徨期,或者你打心眼里不在喜欢编程,可尝试转为其它角色,如产品经理,售前售后支持等岗位,也不失为好选择。 当我们熬过这段儿,就会“山随平野尽,江入大荒流“,渐入佳境矣。 高级程序员定义软件功能、做开发计划推进和管理。可以带几个个帮手把产品规划的功能实现,你是团队中的”大手“,遇到难题也是你亲自攻艰克难。 所以,一个高级程序员,他的职责很清晰: 1、负责产品核心复杂功能的方案设计、编码实现 2、负责疑难BUG分析诊断、攻关解决 架构师 到了架构师级别,想必你已经学会降龙十八掌,可登堂入世,成为一位准(lao)专(you)家(tiao)。 我们大喊声:“单打独斗,老衲谁也不惧!“,遂开始领导一众技术高手,指点武功,来设计和完成一个系统,大多是分布式,高并发的系统架构平台。 架构师的任务是为公司产品的业务问题提供高质量技术解决方案,主要着眼于系统的"技术实现" 。 架构师的主要分类: 可能每条产品线都设置了架构师,也可能多条生产品线的的后端是由一个架构师设计的平台提供,所以架构师也是有所不同的,其分类如下: 软件架构师 信息架构师 网站架构师 其主要职责如下: 1、需求分析:“知彼”有时比“知已”还重要。管理市场,产品等的需求,确立关键需求。坚持技术上的优秀与需求的愿景统一,提升技术负债意识,提供技术选项,风险预判,工期等解决方案。 2、架构设计:在产品功能中抽取中非功能的需求,由关键需求变成概念型架构。列出功能树,分层治之,如用户界面层、系统交互层,数据管理层。达成高扩展,高可用,高性能,高安全,易运维,易部署,易接入等能力。 3、功能设计与实现:对架构设计的底层代码级别实现。如公共核心类,接口实现,应用发现规则、接口变更等。 技术经理 人生就是不断上升的过程,你已经到达经理的层次了。如今的你,需要不断提高领导力,需要定期召开团队会议讨论问题。 首先我们要更加自信,在工作中显示自己的功力,给讲话增添力量。如:“本次项目虽然有很大的困难,我们也需苦战到底。当然示先垂范,身先士卒,方能成功!” 技术经理有时候也可能叫系统分析员,一些小公司可能会整个公司或者部门有一个技术经理。技术经理承担的角色主要是系统分析、架构搭建、系统构建、代 码走查等工作,如果说项目经理是总统,那么技术经理就是总理。当然不是所有公司都是这样的,有些公司项目经理是不管技术团队的,只做需求、进度和同客户沟 通,那么这个时候的项目经理就好像工厂里的跟单人员了,这种情况在外包公司比较多。对于技术经理来说,着重于技术方面,你需要知道某种功能用哪些技术合 适,需要知道某项功能需要多长的开发时间等。同时,技术经理也应该承担提高团队整体技术水平的工作。 你需要和大家站在一起,因为人们也都有解决问题的能力,更需要有以下的能力与责任: 1、任务管理:开发工作量评估、定立开发流程、分配和追踪开发任务 2、质量管理:代码review、开发风险判断/报告/协调解决 3、效率提升:代码底层研发和培训、最佳代码实践规范总结与推广、自动化生产工具、自动化部署工具 4、技术能力提升:招聘面试、试题主拟、新人指导、项目复盘与改进 技术总监 如果一个研发团队超过20人,有多条产品线或业务量很大,这时已经有多个技术经理在负责每个业务,这时需要一位技术总监。 主要职责: 1、组建平台研发部,与架构师共建软件公共平台,方便各条产品业务线研发。 2、通过技术平台、通过高一层的职权,管理和协调公司各个部门与本部门各条线。现在每个产品线都应该有合格的技术经理和高级程序员。 结语:我们相信,每个人都能成为IT大神。现在开始,找个师兄带你入门,让你的学习之路不再迷茫。 这里推荐我们的前端学习交流圈:784783012,里面都是学习前端的从最基础的HTML+CSS+JS【炫酷特效,游戏,插件封装,设计模式】到移动端HTML5的项目实战的学习资料都有整理,送给每一位前端小伙伴。 最新技术,与企业需求同步。好友都在里面学习交流,每天都会有大牛定时讲解前端技术! 点击:前端技术分享 本篇文章为转载内容。原文链接:https://blog.csdn.net/webDk/article/details/88917912。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2024-05-10 13:13:48
755
转载
转载文章
...转换至控制按键。这个层级的筛选允许在 NT 「发现」按键之前,先进行转换和隐藏按键。包括完整的来源。此外,Ctrl2cap 还会显示如何使用 NtDisplayString() 将讯息列印至初始化的蓝色萤幕。 DebugView Sysinternals 的另一个首开先例:这个程式会拦截分别由 DbgPrint 利用装置驱动程式,和 OutputDebugString 利用 Win32 程式所做的呼叫。它能够在您的本机上或跨往际往路,在不需要作用中的侦错工具情况下,检视和录制侦错工作阶段输出。 DiskExt 显示磁碟区磁碟对应。 Diskmon 这个公用程式会撷取全部的硬碟活动,或是提供系统匣中的软体磁碟活动指示器的功能。 DiskView 图形化磁区公用程式。 Du 依目录检视磁碟使用状况。 EFSDump 检视加密档案的资讯。 Filemon 这个监控工具让您即时检视所有档案系统的活动。 Handle 这个易於操纵的命令列公用程式能够显示档案开启的种类和使用的处理程序等更多资讯。 Hex2dec 十六进位数字和十进位数字相互转换。 Junction 建立 Win2K NTFS 符号连结。 LDMDump 倾印逻辑磁碟管理员的磁碟上之资料库内容,其中描述 Windows 2000 动态磁碟分割。 ListDLLs 列出所有目前载入的 DLL,包括载入位置和他们的版本编号。2.0 版列印载入模组的完整路径名称。 LiveKd 使用 Microsoft 核心侦错工具检视即时系统。 LoadOrder 检视在您 WinNT/2K 系统上载入装置的顺序。 LogonSessions 列出系统上的作用中登入工作阶段。 MoveFile 允许您对下一次开机进行移动和删除命令的排程。 NTFSInfo 使用 NTFSInfo 检视详细的 NTFS 磁碟区资讯,包括主档案表格 (MFT) 和 MFT 区的大小和位置,还有 NTFS 中继资料档案的大小。 PageDefrag 将您的分页档和登录 Hive 进行磁碟重组。 PendMoves 列举档案重新命名的清单,删除下次开机将会执行的命令。 Portmon 使用这个进阶的监视工具进行监视序列和平行连接埠活动。它不仅掌握所有标准的序列和平行 IOCTL,甚至会显示传送和接收的资料部份。Version 3.x 具有强大的新 UI 增强功能和进阶的筛选功能。 Process Monitor 即时监控档案系统、登录、程序、执行绪和 DLL 活动。 procexp 任务管理器,这个管理器比windows自带的管理器要强大方便的很多,建议替换自带的任务管理器(本人一直用这个管理器,很不错)。此工具也有汉化版,fans可以自己搜索下载 ProcFeatures 这个小应用程式会描述「实体位址扩充」的处理器和 Windows 支援,而没「没有执行」缓冲区溢位保护。 PsExec 以有限的使用者权限执行处理程序。 PsFile 检视远端开启档案有哪些。 PsGetSid 显示电脑或使用者的 SID。 PsInfo 取得有关系统的资讯。 PsKill 终止本机或远端处理程序。 PsList 显示处理程序和执行绪的相关资讯。 PsLoggedOn 显示使用者登录至一个系统。 PsLogList 倾印事件记录档的记录。 PsPasswd 变更帐户密码。 PsService 检视及控制服务。 PsShutdown 关机及选择重新启动电脑。 PsSuspend 暂停及继续处理程序。 PsTools PsTools 产品系列包括命令列公用程式,其功能有列出在本机或远端电脑上执行的处理程序、远端执行的处理程序、重新开机的电脑和倾印事件记录等等。 RegDelNull 扫描并删除登录机码,这些登录机码包括了标准登录编辑工具无法删除的内嵌式 Null 字元。 RegHide 建立名为 "HKEY_LOCAL_MACHINE\Software\Sysinternals\Can't touch me!\0" 并使用原生 API 的金钥,而且会在此金钥内建立一个值。 Regjump 跳至您在 Regedit 中指定的登录路径。 Regmon 这个监视工具让您即时看到全部的登录活动。 RootkitRevealer 扫描您系统上 Rootkit 为基础的恶意程式码。 SDelete 以安全的方法覆写您的机密档案,并且清除因先前使用这个 DoD 相容安全删除程式所删除档案後而释放的可用空间。包括完整的原始程式码。 ShareEnum 扫描网路上档案共用并检视其安全性设定,来关闭安全性漏洞。 Sigcheck 倾印档案版本资讯和验证系统上的影像皆已完成数位签章。 Strings 搜寻 binaryimages 中的 ANSI 和 UNICODE 字串。 Sync 将快取的资料清除至磁碟。 TCPView 作用中的通讯端命令列检视器。 VolumeId 设定 FAT 或 NTFS 磁碟区 ID。 Whois 看看谁拥有一个网际网路位址。 Winobj 最完整的物件管理员命名空间检视器在此。 ZoomIt 供萤幕上缩放和绘图的简报公用程式。 转自:http://www.360doc.com/content/15/0323/06/20545288_457293504.shtml 本篇文章为转载内容。原文链接:https://blog.csdn.net/qq_33515088/article/details/80721846。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2024-01-22 15:44:41
102
转载
转载文章
...S的服务和技术繁多,选择适合自己的方向,而不是什么都去学 AWS的学习资源异常丰富,包括视频、免费文档、在线实验、社区以及专家课程(收费) AWS的考试包括助理级和专家级,并且分别针对架构师、开发与运维人员 助理架构师考试主要针对:设计、实施部署、数据安全、故障排除等4个方面进行考核 AWS的架构师考试重点需要掌握7大“云设计架构”如:弹性原则、最小授权原则等等,熟悉这些非常有助于答题(就好比当初考车的文科一样,是有规律可循的) 多动手非常有助于通过考试,同时也是熟练掌握的不二法宝 助理架构师考试,建议考生拥有6个月AWS实战经验 专家级架构师考试,建议考生拥有2年的实战经验 2. 概述 2.1 AWS的服务列表概览 2.2 需要确定好自己的定位与方向 包括三个维度: - 什么行业 – (移动?视频?互联网?企业?金融?) - 解决什么问题 – 大规模分发?大数据?混合网络? - 使用哪些服务 – 虚拟主机?虚拟网络和安全?hadoop集群?数据仓库? 2.3 学习方法是以赛代练(步步实践,边学边用) 首先【观看自学视频】 然后听取【在线课堂】 理论差不多有,开始【动手实验室】(15个免费实验) 深入了解需要【详细查看文档】建议至少先从FAQ阅读,可以缩短很长时间 利用【免费AWS套餐】注意平时的理解和学习 再进行高级实验 需要了解各个服务之间的关联等,【听取讲师指导课程】,就可以高层次的了解服务内容 参加认证考试 2.4 AWS导师课程分类和级别 人员分类:解决方案师、开发人员、系统操作人员 课程分类:入门级、基础级、高级、专项 3. AWS认证的背景信息 3.1 认证的类型 助理级 – 助理架构师 – 助理开发人员 – 助理系统管理员 专家级 – 专家架构师 – 专家开发运维 认证共有5个,如果要参加专家级认证必须先通过助理级认证,其中“专家开发运维(devops)”的认证则通过任意(开发 or 运维)的助理级认证即可 3.2 获得认证后的收益? 对个人 – 可以证明个人在AWS平台上具备设计、部署和管理高可用、低成本、安全应用的能力 – 在工作上或社区中得到尊重和认可 – 可以把认证放到简历中,linkedin中整合了AWS认证徽章 对企业雇主 – 具备AWS上服务和工具的使用的认可 – 客户认可,降低AWS项目实施风险 – 增加客户满意度 3.3 再认证模式 因为AWS的服务在更新,因此每两年要重新认证(证件的有效期2年),再次参加考试时,题目、时间将会更少,且认证费用更低 3.4 助理架构师认证的知识领域 四大知识域 1 设计:高可用、高效率、可容错低、可扩展的系统 2 实施和部署:强调部署操作能力 3 数据安全性:在部署操作时,始终保持数据保存和传输的安全 4 排除故障:在系统出现问题时,可以快速找到问题并解决问题 知识权重 - 设计:60%的题目 - 实施和部署:10%的题目 - 数据安全:20%的题目 - 排除故障:10%的题目 PS:考试不会按照上面的次序、考试不会注明考试题目的分类 3.5 认证过程 需要在网上注册,找到距离家里比较近的地方考试(考点) 到了现场需要携带身份证,证明自己 并不允许带手机入场 证件上必须有照片 签署NDA保证不会泄露考题 考试中心的电脑中考试(80分钟,55个考题) 考试后马上知道分数和是否通过(不会看到每道题目是否正确) 通过后的成绩、认证证书等将发到email邮箱中 3.6 考试机制 助理级别考试的重点是:单一服务和小规模的组合服务的掌握程度 所有题目都是选择题(多选或单选) 不惩罚打错,所以留白没意义,可以猜一个 55道题 可以给不确定的题目打标签,没提交前都可以回来改答案 3.7 题目示例 单选题 多选题(会告诉你有多少个答案) 汇总查看答案以及mark(标记) 4 AWS架构的7大设计原则 4.1 松耦合 松耦合是容错、运维自动扩容的基础,在设计上应该尽量减少模块间的依赖性,将不会成为未来应用调整、发展的阻碍 松耦合模式的情况 不要标示(依赖)特定对象,依赖特定对象耦合性将非常高 – 使用负载均衡器 – 域名解析 – 弹性IP – 可以动态找到配合的对象,为松耦合带来方便,为应用将来的扩展带来好处 不要依赖其他模块的正确处理或及时的处理 – 使用尽量使用异步的处理,而不是同步的(SQS可以帮到用户) 4.2 模块出错后工作不会有问题 问问某个模块出了问题,应用会怎么样? 在设计的时候,在出了问题会有影响的模块,进行处理,建立自动恢复性 4.3 实现弹性 在设计上,不要假定模块是正常的、始终不变的 – 可以配合AutoScaling、EIP和可用区AZ来满足 允许模块的失败重启 – 无状态设计比有状态设计好 – 使用ELB、云监控去检测“实例”运行状态 有引导参数的实例(实现自动配置) – 例如:加入user data在启动的时候,告知它应该做的事情 在关闭实例的时候,保存其配置和个性化 – 例如用DynamoDB保存session信息 弹性后就不会为了超配资源而浪费钱了 4.4 安全是整体的事,需要在每个层面综合考虑 基础架构层 计算/网络架构层 数据层 应用层 4.5 最小授权原则 只付于操作者完成工作的必要权限 所有用户的操作必须授权 三种类型的权限能操作AWS – 主账户 – IAM用户 – 授权服务(主要是开发的app) 5 设计:高可用、高效率、可容错、可扩展的系统 本部分的目标是设计出高可用、高效率低成本、可容错、可扩展的系统架构 - 高可用 – 了解AWS服务自身的高可靠性(例如弹性负载均衡)—-因为ELB是可以多AZ部署的 – 用好这些服务可以减少可用性的后顾之忧 - 高效率(低成本) – 了解自己的容量需求,避免超额分配 – 利用不同的价格策略,例如:使用预留实例 – 尽量使用AWS的托管服务(如SNS、SQS) - 可容错 – 了解HA和容错的区别 – 如果说HA是结果,那么容错则是保障HA的一个重要策略 – HA强调系统不要出问题,而容错是在系统出了问题后尽量不要影响业务 - 可扩展性 – 需要了解AWS哪些服务自身就可以扩展,例如SQS、ELB – 了解自动伸缩组(AS) 运用好 AWS 7大架构设计原则的:松耦合、实现弹性 6 实施和部署设计 本部分的在设计的基础上找到合适的工具来实现 对比第一部分“设计”,第一章主要针对用什么,而第二章则讨论怎么用 主要考核AWS云的核心的服务目录和核心服务,包括: 计算机和网络 – EC2、VPC 存储和内容分发 – S3、Glacier 数据库相关分类 – RDS 部署和管理服务 – CloudFormation、CloudWatch、IAM 应用服务 – SQS、SNS 7 数据安全 数据安全的基础,是AWS责任共担的安全模型模型,必须要读懂 数据安全包括4个层面:基础设施层、计算/网络层、数据层、应用层 - 基础设施层 1. 基础硬件安全 2. 授权访问、流程等 - 计算/网络层 1. 主要靠VPC保障网络(防护、路由、网络隔离、易管理) 2. 认识安全组和NACLs以及他们的差别 安全组比ACL多一点,安全组可以针对其他安全组,ACL只能针对IP 安全组只允许统一,ACL可以设置拒绝 安全组有状态!很重要(只要一条入站规则通过,那么出站也可以自动通过),ACL没有状态(必须分别指定出站、入站规则) 安全组的工作的对象是网卡(实例)、ACL工作的对象是子网 认识4种网关,以及他们的差别 共有4种网关,支撑流量进出VPC internet gatway:互联网的访问 virtual private gateway:负责VPN的访问 direct connect:负责企业直连网络的访问 vpc peering:负责VPC的peering的访问 数据层 数据传输安全 – 进入和出AWS的安全 – AWS内部传输安全 通过https访问API 链路的安全 – 通过SSL访问web – 通过IP加密访问VPN – 使用直连 – 使用OFFLINE的导入导出 数据的持久化保存 – 使用EBS – 使用S3访问 访问 – 使用IAM策略 – 使用bucket策略 – 访问控制列表 临时授权 – 使用签名的URL 加密 – 服务器端加密 – 客户端加密 应用层 主要强调的是共担风险模型 多种类型的认证鉴权 给用户在应用层的保障建议 – 选择一种认证鉴权机制(而不要不鉴权) – 用安全的密码和强安全策略 – 保护你的OS(如打开防火墙) – 用强壮的角色来控制权限(RBAC) 判断AWS和用户分担的安全中的标志是,哪些是AWS可以控制的,那些不能,能的就是AWS负责,否则就是用户(举个例子:安全组的功能由AWS负责—是否生效,但是如何使用是用户负责—自己开放所有端口跟AWS无关) AWS可以保障的 用户需要保障的 工具与服务 操作系统 物理内部流程安全 应用程序 物理基础设施 安全组 网络设施 虚拟化设施 OS防火墙 网络规则 管理账号 8 故障排除 问题经常包括的类型: - EC2实例的连接性问题 - 恢复EC2实例或EBS卷上的数据 - 服务使用限制问题 8.1 EC2实例的连接性问题 经常会有多个原因造成无法连接 外部VPC到内部VPC的实例 – 网关(IGW–internet网关、VPG–虚拟私有网关)的添加问题 – 公司网络到VPC的路由规则设置问题 – VPC各个子网间的路由表问题 – 弹性IP和公有IP的问题 – NACLs(网络访问规则) – 安全组 – OS层面的防火墙 8.2 恢复EC2实例或EBS卷上的数据 注意EBS或EC2没有任何强绑定关系 – EBS是可以从旧实例上分离的 – 如有必要尽快做 将EBS卷挂载到新的、健康的实例上 执行流程可以针对恢复没有工作的启动卷(boot volume) – 将root卷分离出来 – 像数据一样挂载到其他实例 – 修复文件 – 重新挂载到原来的实例中重新启动 8.3 服务使用限制问题 AWS有很多软性限制 – 例如AWS初始化的时候,每个类型的EBS实例最多启动20个 还有一些硬性限制例如 – 每个账号最多拥有100个S3的bucket – …… 别的服务限制了当前服务 – 例如无法启动新EC2实例,原因可能是EBS卷达到上限 – Trusted Advisor这个工具可以根据服务水平的不同给出你一些限制的参考(从免费试用,到商业试用,和企业试用的建议) 常见的软性限制 公共的限制 – 每个用户最多创建20个实例,或更少的实例类型 – 每个区域最多5个弹性ip – 每个vpc最多100个安全组 – 最多20个负载均衡 – 最多20个自动伸缩组 – 5000个EBS卷、10000个快照,4w的IOPS和总共20TB的磁盘 – …更多则需要申请了 你不需要记住限制 – 知道限制,并保持数值敏感度就好 – 日后遇到问题时可以排除掉软限制的相关的问题 9. 总结 9.1 认证的主要目标是: 确认架构师能否搜集需求,并且使用最佳实践,在AWS中构建出这个系统 是否能为应用的整个生命周期给出指导意见 9.2 希望架构师(助理或专家级)考试前的准备: 深度掌握至少1门高级别语言(c,c++,java等) 掌握AWS的三份白皮书 – aws概览 – aws安全流程 – aws风险和应对 – 云中的存储选项 – aws的架构最佳实践 按照客户需求,使用AWS组件来部署混合系统的经验 使用AWS架构中心网站了解更多信息 9.3 经验方面的建议 助理架构师 – 至少6个月的实际操作经验、在AWS中管理生产系统的经验 – 学习过AWS的基本课程 专家架构师 – 至少2年的实际操作经验、在AWS中管理多种不同种类的复杂生产系统的经验(多种服务、动态伸缩、高可用、重构或容错) – 在AWS中执行构建的能力,架构的高级概念能力 9.4 相关资源 认证学习的资源地址 - 可以自己练习,模拟考试需要付费的 接下来就去网上报名参加考试 本篇文章为转载内容。原文链接:https://blog.csdn.net/QXK2001/article/details/51292402。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-11-29 22:08:40
270
转载
转载文章
...场的专有云产品,但其设计思路是以公有云为核心,其价值更多在于公有云服务在防火墙内的延伸,其初衷是“将数据迁移到中心云上”,这同样不适合,更难以匹配中国企业希望“将云移动到数据上”的最终目标。 正是源于这些客户“痛点”和市场现状,让华云数据产生了打造一款通用型云操作系统的想法。今年3月1日,华云数据宣布对超融合软件厂商Maxta全部资产完成了合法合规收购。至此,华云数据将独家拥有Maxta的包括产品技术、专利软著、品牌、市场在内的全球范围的资产所有权。 在此基础上,华云数据又把Maxta与华云自身的优势产品相融合,正式推出了安超OS国产通用型云操作系统,并在国产化与通用型方向做了三个方面的重要演进: 首先,兼容国产服务器、CPU、操作系统。安超OS对代码进行了全新的架构扩展,创建并维护新的一套代码分支,从源码级完成众多底层的对国产服务器、CPU、操作系统的支持。 其次,扩展通用型云操作系统的易用性。安超OS以VM为核心做为管理理念,以业务应用的视觉管理基础设施,为云操作系统开发了生命周期管理系统(LCM),提供像服务器操作系统的光盘ISO安装方式,可以30分钟完成云操作系统的搭建,并具备一键集群启停、一键日志收集、一键运维巡检业务等通用型云操作系统所必备的易用性功能。 最后,增强国内行业、企业所需的安全性。安超OS的所有源代码都通过了相关部门的安全检查,确保没有“后门”等漏洞,杜绝安全隐患,并且通过了由中国数据中心联盟、云计算开源产业联盟组织,中国信息通信研究院(工信部电信研究院)测试评估的可信云认证。 不难看出,安超OS不仅具有全球领先的技术,同时又充分满足中国市场和中国客户的需求。正如华云数据集团董事长、总裁许广彬所言:“唯改革者进,唯创新者强,华云数据愿意用全球视野推动中国云计算发展,用云创新驱动数字经济挺进新纵深,植根中国,奉献中国,引领中国,腾飞中国。” 五大维度解读安超OS 那么,什么是云操作系统?安超OS通用型云操作系统又有什么与众不同之处呢? 华云数据集团联席总裁、首席技术官谭瑞忠 在华云数据集团联席总裁、首席技术官谭瑞忠看来,云操作系统是基于服务器操作系统,高度的融合了基础设施的资源,实现了资源弹性伸缩扩展,以及具备运维自动化智能化等云计算的特点。同时,云操作系统具有和计算机操作系统一样的高稳定性,高性能,高易用性等特征。 但是,相比计算机操作系统,云计算的操作系统会更为复杂,属于云计算后台数据中心的整体管理运营系统,是构架于服务器、存储、网络等基础硬件资源和PC操作系统、中间件、数据库等基础软件之上的、管理海量的基础硬件、软件资源的云平台综合管理系统。 更为关键的是,和国内外很多基础设备厂商基于自已的产品与理解推出了云操作系统不同,安超OS走的是通用型云操作系统的技术路线,它不是采用软硬件一体的封闭或半封闭的云操作系统平台,所以这也让安超OS拥有安全稳定、广泛兼容、业务优化、简洁运维、高性价比方面的特性,具体而言: 一是,在安全稳定方面,安超OS采用全容错架构设计,从数据一致性校验到磁盘损坏,从节点故障到区域性灾难,提供端到端的容错和灾备方案,为企业构筑高可用的通用型云环境,为企业的业务运营提供坚实与安全可靠的基础平台。 二是,在广泛兼容方面,安超OS所有产品技术、专利软著、品牌都拥有国内自主权,符合国家相关安全自主可信的规范要求,无服务器硬件锁定,支持国内外主流品牌服务器,同时适配大多数芯片、操作系统和中间件,支持利旧与升级,更新硬件时无需重新购买软件,为企业客户提供显著的投资保护,降低企业IT成本。 三是,在业务优化方面,安超OS具备在同一集群内提供混合业务负载的独特能力,可在一套安超OS环境内实现不同业务的优化:为每类应用定制不同的存储数据块大小,优化应用读写效率,提供更高的业务性能;数据可按组织架构逻辑隔离,部门拥有独立的副本而无需新建一套云环境,降低企业IT的成本与复杂度;数据重构优先级保证关键业务在故障时第一时间恢复,也能避免业务链启动错误的场景出现。 四是,在简捷运维方面,安超OS是一款轻量级云创新平台,其所有管理策略以虚拟机和业务为核心,不需要配置或管理卷、LUN、文件系统、RAID等需求,从根本上简化了云操作系统的管理。通过标准ISO安装,可实现30分钟平台极速搭建,1分钟业务快速部署,一键集群启停与一键运维巡检。降低企业IT技术门槛,使IT部门从技术转移并聚焦于业务推进和变革,助力企业实现软件定义数据中心。 五是,在高性价比方面,安超OS在设计之初,华云数据就考虑到它是一个小而美、大而全的产品,所以给客户提供组件化授权,方便用户按需购买,按需使用,避免一次性采购过度,产生配置浪费。并且安超OS提供在线压缩等容量优化方案,支持无限个数无损快照,无硬件绑定,支持License迁移。 由此可见,安超OS通用型云操作系统的本质,其实就是一款以安全可信为基础,以业务优化为核心的轻量级云创新平台,能够让中国政府和企业在数字化转型中,更好的发挥云平台的价值,同时也能有效的支持他们的业务创新。 生态之上的云操作系统 纵观IT发展的过程,每个时代都离不开通用型操作系统:在PC时代,通用型操作系统是Windows、Linux;在移动互联时代,通用型操作系统是安卓(Android),而这些通用型操作系统之所以能够成功,背后其实也离不开生态的开放和壮大。 如果以此类比的话,生态合作和生态开放同样也是华云安超OS产品的核心战略,这也让安超OS超越了传统意义上的云创新平台,是一款架构于生态开放之上的云操作系统。 华云数据集团副董事长、执行副总裁马杜 据华云数据集团副董事长、执行副总裁马杜介绍,目前华云数据正与业内众多合作伙伴建立了生态合作关系,覆盖硬件、软件、芯片、应用、方案等多个领域,通过生态合作,华云数据希望进一步完善云数据中心的产业链生态,与合作伙伴共建云计算生态圈。 其中,在基础架构方面,华云数据与飞腾、海光、申威等芯片厂商以及中标麒麟、银河麒麟等国产操作系统实现了互认证,与VMware、Dell EMC、广达、浪潮、曙光、长城、Citrix、Veeam、SevOne、XSKY、锐捷网络、上海仪电、NEXIFY等多家国内外知名IT厂商达成了战略合作,共同为中国政企用户提供基于云计算的通用行业解决方案与垂直行业解决方案,助推用户上云实现创新加速模式。 同时,在解决方案方面,华云数据也一直在完善自身的产业链,建立最广泛的生态体系。例如,PaaS平台领域的合作伙伴包括灵雀云、Daocloud、时速云、优创联动、长城超云、蓝云、星环科技、华夏博格、时汇信息、云赛、热璞科技、思捷、和信创天、酷站科技、至臻科技达成合作关系;数据备份领域有金蝶、爱数、Veeam、英方云、壹进制;安全领域有亚信安全、江南安全、绿盟、赛亚安全、默安科技;行业厂商包括善智互联、蓝美视讯、滴滴、天港集团、航天科工等合作伙伴,由此形成了非常有竞争力的整体解决方案。 不仅如此,华云数据与众多生态厂家共同完成了兼容性互认证测试,构建了一个最全面的基础架构生态体系,为推出的国产通用型云操作系统提供了一个坚实的基础。也让该系统提高了其包括架构优化能力、技术研发能力、资源整合能力、海量运营能力在内的综合能力,为客户提供稳定、可靠的上云服务,赋能产业变革。 值得一提的是,华云数据还发布了让利于合作伙伴的渠道合作策略,通过和合作伙伴的合作共赢,华云数据希望将安超OS推广到国内的全行业,让中国企业都能用上安全、放心的国产通用型云操作系统,并让安超OS真正成为未来中国企业上云的重要推手。 显而易见,数字化的转型与升级,以及数字经济的落地和发展,任重而道远,艰难而伟大,而华云数据正以安超OS云操作系统为核心构建的新生态模式和所释放的新能力,不仅会驱动华云数据未来展现出更多的可能性,激发出更多新的升维竞争力,更将会加速整个中国政府和企业的数字化转型步伐。 全文总结,在云计算落地中国的过程中,华云数据既是早期的探索者,也是落地的实践者,更是未来的推动者。特别是安超OS云操作系统的推出,背后正是华云凭借较强的技术驾驭能力,以及对中国企业用户痛点的捕捉,使得华云能够走出一条差异化的创新成长之路,也真正重新定义了“中国云”未来的发展壮大之路。 申耀的科技观察,由科技与汽车跨界媒体人申斯基(微信号:shenyao)创办,16年媒体工作经验,拥有中美两地16万公里自驾经验,专注产业互联网、企业数字化、渠道生态以及汽车科技内容的观察和思考。 本篇文章为转载内容。原文链接:https://blog.csdn.net/W5AeN4Hhx17EDo1/article/details/99899011。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-03-16 21:41:38
302
转载
转载文章
...了解基本语法,就可以选择像Python这样的新编程语言,这对您来说并不重要。这并不意味着您是一名向导编码员,而是可以毫不费力地遵循基本的类似于C的语言。 懂一点机器学习的开发人员。这意味着您了解机器学习的基础知识,例如交叉验证,一些算法和偏差方差折衷。这并不意味着您是机器学习博士,而是您知道地标或知道在哪里查找。 这门迷你课程既不是Python的教科书,也不是机器学习的教科书。 从一个懂一点机器学习的开发人员到一个可以使用Python生态系统获得结果的开发人员,Python生态系统是专业机器学习的新兴平台。 在Python机器学习方面需要帮助吗? 参加我为期2周的免费电子邮件课程,发现数据准备,算法等(包括代码)。 单击立即注册,并获得该课程的免费PDF电子书版本。 立即开始免费的迷你课程! 迷你课程概述 该微型课程分为14节课。 您可以每天完成一堂课(推荐),也可以在一天内完成所有课程(核心!)。这实际上取决于您有空的时间和您的热情水平。 以下是14个课程,可帮助您入门并提高使用Python进行机器学习的效率: 第1课:下载并安装Python和SciPy生态系统。 第2课:深入了解Python,NumPy,Matplotlib和Pandas。 第3课:从CSV加载数据。 第4课:了解具有描述性统计信息的数据。 第5课:通过可视化了解数据。 第6课:通过预处理数据准备建模。 第7课:使用重采样方法进行算法评估。 第8课:算法评估指标。 第9课:现场检查算法。 第10课:模型比较和选择。 第11课:通过算法调整提高准确性。 第12课:利用集合预测提高准确性。 第13课:完成并保存模型。 第14课:Hello World端到端项目。 每节课可能需要您60秒钟或最多30分钟。花点时间按照自己的进度完成课程。提出问题,甚至在以下评论中发布结果。 这些课程希望您能开始学习并做事。我会给您提示,但每节课的重点是迫使您学习从哪里寻求有关Python平台的帮助(提示,我直接在此博客上获得了所有答案,请使用搜索特征)。 在早期课程中,我确实提供了更多帮助,因为我希望您树立一些信心和惯性。 挂在那里,不要放弃! 第1课:下载并安装Python和SciPy 您必须先访问平台才能开始使用Python进行机器学习。 今天的课程很简单,您必须在计算机上下载并安装Python 3.6平台。 访问Python主页并下载适用于您的操作系统(Linux,OS X或Windows)的Python。在计算机上安装Python。您可能需要使用特定于平台的软件包管理器,例如OS X上的macports或RedHat Linux上的yum。 您还需要安装SciPy平台和scikit-learn库。我建议使用与安装Python相同的方法。 您可以使用Anaconda一次安装所有内容(更加容易)。推荐给初学者。 通过在命令行中键入“ python”来首次启动Python。 使用以下代码检查所有您需要的版本: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Python version import sys print('Python: {}'.format(sys.version)) scipy import scipy print('scipy: {}'.format(scipy.__version__)) numpy import numpy print('numpy: {}'.format(numpy.__version__)) matplotlib import matplotlib print('matplotlib: {}'.format(matplotlib.__version__)) pandas import pandas print('pandas: {}'.format(pandas.__version__)) scikit-learn import sklearn print('sklearn: {}'.format(sklearn.__version__)) 如果有任何错误,请停止。现在该修复它们了。 需要帮忙?请参阅本教程: 如何使用Anaconda设置用于机器学习和深度学习的Python环境 第2课:深入了解Python,NumPy,Matplotlib和Pandas。 您需要能够读写基本的Python脚本。 作为开发人员,您可以很快选择新的编程语言。Python区分大小写,使用哈希(#)进行注释,并使用空格指示代码块(空格很重要)。 今天的任务是在Python交互环境中练习Python编程语言的基本语法和重要的SciPy数据结构。 练习作业,在Python中使用列表和流程控制。 练习使用NumPy数组。 练习在Matplotlib中创建简单图。 练习使用Pandas Series和DataFrames。 例如,以下是创建Pandas DataFrame的简单示例。 1 2 3 4 5 6 7 8 dataframe import numpy import pandas myarray = numpy.array([[1, 2, 3], [4, 5, 6]]) rownames = ['a', 'b'] colnames = ['one', 'two', 'three'] mydataframe = pandas.DataFrame(myarray, index=rownames, columns=colnames) print(mydataframe) 第3课:从CSV加载数据 机器学习算法需要数据。您可以从CSV文件加载自己的数据,但是当您开始使用Python进行机器学习时,应该在标准机器学习数据集上进行练习。 今天课程的任务是让您轻松地将数据加载到Python中并查找和加载标准的机器学习数据集。 您可以在UCI机器学习存储库上下载和练习许多CSV格式的出色标准机器学习数据集。 练习使用标准库中的CSV.reader()将CSV文件加载到Python 中。 练习使用NumPy和numpy.loadtxt()函数加载CSV文件。 练习使用Pandas和pandas.read_csv()函数加载CSV文件。 为了让您入门,下面是一个片段,该片段将直接从UCI机器学习存储库中使用Pandas来加载Pima Indians糖尿病数据集。 1 2 3 4 5 6 Load CSV using Pandas from URL import pandas url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] data = pandas.read_csv(url, names=names) print(data.shape) 到现在为止做得很好!等一下 到目前为止有什么问题吗?在评论中提问。 第4课:使用描述性统计数据理解数据 将数据加载到Python之后,您需要能够理解它。 您越了解数据,可以构建的模型就越精确。了解数据的第一步是使用描述性统计数据。 今天,您的课程是学习如何使用描述性统计信息来理解您的数据。我建议使用Pandas DataFrame上提供的帮助程序功能。 使用head()函数了解您的数据以查看前几行。 使用shape属性查看数据的维度。 使用dtypes属性查看每个属性的数据类型。 使用describe()函数查看数据的分布。 使用corr()函数计算变量之间的成对相关性。 以下示例加载了皮马印第安人糖尿病发病数据集,并总结了每个属性的分布。 1 2 3 4 5 6 7 Statistical Summary import pandas url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] data = pandas.read_csv(url, names=names) description = data.describe() print(description) 试试看! 第5课:通过可视化了解数据 从昨天的课程继续,您必须花一些时间更好地了解您的数据。 增进对数据理解的第二种方法是使用数据可视化技术(例如,绘图)。 今天,您的课程是学习如何在Python中使用绘图来单独理解属性及其相互作用。再次,我建议使用Pandas DataFrame上提供的帮助程序功能。 使用hist()函数创建每个属性的直方图。 使用plot(kind ='box')函数创建每个属性的箱须图。 使用pandas.scatter_matrix()函数创建所有属性的成对散点图。 例如,下面的代码片段将加载糖尿病数据集并创建数据集的散点图矩阵。 1 2 3 4 5 6 7 8 9 Scatter Plot Matrix import matplotlib.pyplot as plt import pandas from pandas.plotting import scatter_matrix url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] data = pandas.read_csv(url, names=names) scatter_matrix(data) plt.show() 样本散点图矩阵 第6课:通过预处理数据准备建模 您的原始数据可能未设置为最佳建模形式。 有时您需要对数据进行预处理,以便最好地将问题的固有结构呈现给建模算法。在今天的课程中,您将使用scikit-learn提供的预处理功能。 scikit-learn库提供了两个用于转换数据的标准习语。每种变换在不同的情况下都非常有用:拟合和多重变换以及组合的拟合与变换。 您可以使用多种技术来准备数据以进行建模。例如,尝试以下一些方法 使用比例和中心选项将数值数据标准化(例如,平均值为0,标准偏差为1)。 使用范围选项将数值数据标准化(例如,范围为0-1)。 探索更高级的功能工程,例如Binarizing。 例如,下面的代码段加载了Pima Indians糖尿病发病数据集,计算了标准化数据所需的参数,然后创建了输入数据的标准化副本。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Standardize data (0 mean, 1 stdev) from sklearn.preprocessing import StandardScaler import pandas import numpy url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = pandas.read_csv(url, names=names) array = dataframe.values separate array into input and output components X = array[:,0:8] Y = array[:,8] scaler = StandardScaler().fit(X) rescaledX = scaler.transform(X) summarize transformed data numpy.set_printoptions(precision=3) print(rescaledX[0:5,:]) 第7课:使用重采样方法进行算法评估 用于训练机器学习算法的数据集称为训练数据集。用于训练算法的数据集不能用于为您提供有关新数据的模型准确性的可靠估计。这是一个大问题,因为创建模型的整个思路是对新数据进行预测。 您可以使用称为重采样方法的统计方法将训练数据集划分为子集,一些方法用于训练模型,而另一些则被保留,并用于估计看不见的数据的模型准确性。 今天课程的目标是练习使用scikit-learn中可用的不同重采样方法,例如: 将数据集分为训练集和测试集。 使用k倍交叉验证来估计算法的准确性。 使用留一法交叉验证来估计算法的准确性。 下面的代码段使用scikit-learn通过10倍交叉验证来评估Pima Indians糖尿病发作的Logistic回归算法的准确性。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Evaluate using Cross Validation from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.linear_model import LogisticRegression url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] kfold = KFold(n_splits=10, random_state=7) model = LogisticRegression(solver='liblinear') results = cross_val_score(model, X, Y, cv=kfold) print("Accuracy: %.3f%% (%.3f%%)") % (results.mean()100.0, results.std()100.0) 您获得了什么精度?在评论中让我知道。 您是否意识到这是中间点?做得好! 第8课:算法评估指标 您可以使用许多不同的指标来评估数据集上机器学习算法的技能。 您可以通过cross_validation.cross_val_score()函数在scikit-learn中指定用于测试工具的度量,默认值可用于回归和分类问题。今天课程的目标是练习使用scikit-learn软件包中可用的不同算法性能指标。 在分类问题上练习使用“准确性”和“ LogLoss”度量。 练习生成混淆矩阵和分类报告。 在回归问题上练习使用RMSE和RSquared指标。 下面的代码段演示了根据Pima Indians糖尿病发病数据计算LogLoss指标。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Cross Validation Classification LogLoss from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.linear_model import LogisticRegression url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] kfold = KFold(n_splits=10, random_state=7) model = LogisticRegression(solver='liblinear') scoring = 'neg_log_loss' results = cross_val_score(model, X, Y, cv=kfold, scoring=scoring) print("Logloss: %.3f (%.3f)") % (results.mean(), results.std()) 您得到了什么日志损失?在评论中让我知道。 第9课:抽查算法 您可能无法事先知道哪种算法对您的数据效果最好。 您必须使用反复试验的过程来发现它。我称之为现场检查算法。scikit-learn库提供了许多机器学习算法和工具的接口,以比较这些算法的估计准确性。 在本课程中,您必须练习抽查不同的机器学习算法。 对数据集进行抽查线性算法(例如线性回归,逻辑回归和线性判别分析)。 抽查数据集上的一些非线性算法(例如KNN,SVM和CART)。 抽查数据集上一些复杂的集成算法(例如随机森林和随机梯度增强)。 例如,下面的代码片段对Boston House Price数据集上的K最近邻居算法进行了抽查。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 KNN Regression from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.neighbors import KNeighborsRegressor url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/housing.data" names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV'] dataframe = read_csv(url, delim_whitespace=True, names=names) array = dataframe.values X = array[:,0:13] Y = array[:,13] kfold = KFold(n_splits=10, random_state=7) model = KNeighborsRegressor() scoring = 'neg_mean_squared_error' results = cross_val_score(model, X, Y, cv=kfold, scoring=scoring) print(results.mean()) 您得到的平方误差是什么意思?在评论中让我知道。 第10课:模型比较和选择 既然您知道了如何在数据集中检查机器学习算法,那么您需要知道如何比较不同算法的估计性能并选择最佳模型。 在今天的课程中,您将练习比较Python和scikit-learn中的机器学习算法的准确性。 在数据集上相互比较线性算法。 在数据集上相互比较非线性算法。 相互比较同一算法的不同配置。 创建比较算法的结果图。 下面的示例在皮马印第安人发病的糖尿病数据集中将Logistic回归和线性判别分析进行了比较。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Compare Algorithms from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.linear_model import LogisticRegression from sklearn.discriminant_analysis import LinearDiscriminantAnalysis load dataset url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] prepare models models = [] models.append(('LR', LogisticRegression(solver='liblinear'))) models.append(('LDA', LinearDiscriminantAnalysis())) evaluate each model in turn results = [] names = [] scoring = 'accuracy' for name, model in models: kfold = KFold(n_splits=10, random_state=7) cv_results = cross_val_score(model, X, Y, cv=kfold, scoring=scoring) results.append(cv_results) names.append(name) msg = "%s: %f (%f)" % (name, cv_results.mean(), cv_results.std()) print(msg) 哪种算法效果更好?你能做得更好吗?在评论中让我知道。 第11课:通过算法调整提高准确性 一旦找到一种或两种在数据集上表现良好的算法,您可能希望提高这些模型的性能。 提高算法性能的一种方法是将其参数调整为特定的数据集。 scikit-learn库提供了两种方法来搜索机器学习算法的参数组合。在今天的课程中,您的目标是练习每个。 使用您指定的网格搜索来调整算法的参数。 使用随机搜索调整算法的参数。 下面使用的代码段是一个示例,该示例使用网格搜索在Pima Indians糖尿病发病数据集上的Ridge回归算法。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Grid Search for Algorithm Tuning from pandas import read_csv import numpy from sklearn.linear_model import Ridge from sklearn.model_selection import GridSearchCV url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] alphas = numpy.array([1,0.1,0.01,0.001,0.0001,0]) param_grid = dict(alpha=alphas) model = Ridge() grid = GridSearchCV(estimator=model, param_grid=param_grid, cv=3) grid.fit(X, Y) print(grid.best_score_) print(grid.best_estimator_.alpha) 哪些参数取得最佳效果?你能做得更好吗?在评论中让我知道。 第12课:利用集合预测提高准确性 您可以提高模型性能的另一种方法是组合来自多个模型的预测。 一些模型提供了内置的此功能,例如用于装袋的随机森林和用于增强的随机梯度增强。可以使用另一种称为投票的合奏将来自多个不同模型的预测组合在一起。 在今天的课程中,您将练习使用合奏方法。 使用随机森林和多余树木算法练习装袋。 使用梯度增强机和AdaBoost算法练习增强合奏。 通过将来自多个模型的预测组合在一起来练习投票合奏。 下面的代码段演示了如何在Pima Indians糖尿病发病数据集上使用随机森林算法(袋装决策树集合)。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Random Forest Classification from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.ensemble import RandomForestClassifier url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] num_trees = 100 max_features = 3 kfold = KFold(n_splits=10, random_state=7) model = RandomForestClassifier(n_estimators=num_trees, max_features=max_features) results = cross_val_score(model, X, Y, cv=kfold) print(results.mean()) 你能设计出更好的合奏吗?在评论中让我知道。 第13课:完成并保存模型 找到有关机器学习问题的良好模型后,您需要完成该模型。 在今天的课程中,您将练习与完成模型有关的任务。 练习使用模型对新数据(在训练和测试过程中看不到的数据)进行预测。 练习将经过训练的模型保存到文件中,然后再次加载。 例如,下面的代码片段显示了如何创建Logistic回归模型,将其保存到文件中,之后再加载它以及对看不见的数据进行预测。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 Save Model Using Pickle from pandas import read_csv from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression import pickle url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] test_size = 0.33 seed = 7 X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=test_size, random_state=seed) Fit the model on 33% model = LogisticRegression(solver='liblinear') model.fit(X_train, Y_train) save the model to disk filename = 'finalized_model.sav' pickle.dump(model, open(filename, 'wb')) some time later... load the model from disk loaded_model = pickle.load(open(filename, 'rb')) result = loaded_model.score(X_test, Y_test) print(result) 第14课:Hello World端到端项目 您现在知道如何完成预测建模机器学习问题的每个任务。 在今天的课程中,您需要练习将各个部分组合在一起,并通过端到端的标准机器学习数据集进行操作。 端到端遍历虹膜数据集(机器学习的世界) 这包括以下步骤: 使用描述性统计数据和可视化了解您的数据。 预处理数据以最好地揭示问题的结构。 使用您自己的测试工具抽查多种算法。 使用算法参数调整来改善结果。 使用集成方法改善结果。 最终确定模型以备将来使用。 慢慢进行,并记录结果。 您使用什么型号?您得到了什么结果?在评论中让我知道。 结束! (看你走了多远) 你做到了。做得好! 花一点时间,回头看看你已经走了多远。 您最初对机器学习感兴趣,并强烈希望能够使用Python练习和应用机器学习。 您可能是第一次下载,安装并启动Python,并开始熟悉该语言的语法。 在许多课程中,您逐渐地,稳定地学习了预测建模机器学习项目的标准任务如何映射到Python平台上。 基于常见机器学习任务的配方,您使用Python端到端解决了第一个机器学习问题。 使用标准模板,您所收集的食谱和经验现在可以自行解决新的和不同的预测建模机器学习问题。 不要轻描淡写,您在短时间内就取得了长足的进步。 这只是您使用Python进行机器学习的起点。继续练习和发展自己的技能。 喜欢点下关注,你的关注是我写作的最大支持 本篇文章为转载内容。原文链接:https://blog.csdn.net/m0_37337849/article/details/104016531。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-07-11 10:04:06
92
转载
站内搜索
用于搜索本网站内部文章,支持栏目切换。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
rm -rf dir/*
- 删除目录下所有文件(慎用)。
推荐内容
推荐本栏目内的其它文章,看看还有哪些文章让你感兴趣。
2023-04-28
2023-08-09
2023-06-18
2023-04-14
2023-02-18
2023-04-17
2024-01-11
2023-10-03
2023-09-09
2023-06-13
2023-08-07
2023-03-11
历史内容
快速导航到对应月份的历史文章列表。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"