前端技术
HTML
CSS
Javascript
前端框架和UI库
VUE
ReactJS
AngularJS
JQuery
NodeJS
JSON
Element-UI
Bootstrap
Material UI
服务端和客户端
Java
Python
PHP
Golang
Scala
Kotlin
Groovy
Ruby
Lua
.net
c#
c++
后端WEB和工程框架
SpringBoot
SpringCloud
Struts2
MyBatis
Hibernate
Tornado
Beego
Go-Spring
Go Gin
Go Iris
Dubbo
HessianRPC
Maven
Gradle
数据库
MySQL
Oracle
Mongo
中间件与web容器
Redis
MemCache
Etcd
Cassandra
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Nacos
Consul
Tomcat
Nginx
Netty
大数据技术
Hive
Impala
ClickHouse
DorisDB
Greenplum
PostgreSQL
HBase
Kylin
Hadoop
Apache Pig
ZooKeeper
SeaTunnel
Sqoop
Datax
Flink
Spark
Mahout
数据搜索与日志
ElasticSearch
Apache Lucene
Apache Solr
Kibana
Logstash
数据可视化与OLAP
Apache Atlas
Superset
Saiku
Tesseract
系统与容器
Linux
Shell
Docker
Kubernetes
[Vue.js transition 组件...]的搜索结果
这里是文章列表。热门标签的颜色随机变换,标签颜色没有特殊含义。
点击某个标签可搜索标签相关的文章。
点击某个标签可搜索标签相关的文章。
Material UI
...,我们需要导入必要的组件,并创建一个新的SnackBar。然后,我们可以设置SnackBarContent的内容和样式。 jsx import React from 'react'; import { makeStyles } from '@material-ui/core/styles'; import Snackbar from '@material-ui/core/Snackbar'; import Button from '@material-ui/core/Button'; const useStyles = makeStyles({ snackbarContent: { backgroundColor: 'f5f5f5', borderRadius: 3, padding: '16px 18px', }, }); export default function CustomSnackbar() { const classes = useStyles(); const [open, setOpen] = React.useState(false); const handleClick = () => { setOpen(true); }; return ( Show Snackbar open={open} autoHideDuration={6000} onClose={() => setOpen(false)} ContentProps={ { 'aria-describedby': 'message-id', className: classes.snackbarContent, } } message={This is a custom styled snackbar.} /> ); } 在这个例子中,我们首先创建了一个名为useStyles的自定义样式的函数,其中包含了我们想要添加的样式。然后,在我们亲手捣鼓出的SnackBar里头,我们把这个自定义样式的类名,就像一个神秘礼物一样,塞进了ContentProps里的className属性中,这样SnackBarContent就能“穿上”我们给它准备的样式啦。 这样,我们就成功地在SnackBarContent中添加了自定义样式。接下来,让我们更深入地了解这些步骤。 3. 使用makeStyles 在Material-UI中,我们可以通过makeStyles来自定义组件的样式。makeStyles,这个听起来可能有点技术感的高阶函数,其实是个挺实用的小工具。它干的活儿就是接收一个对象作为参数,这个对象里的每一个小键值对,都代表着一条CSS样式规则。makeStyles这个小家伙,它干的活儿可有意思啦!当你调用它的时候,它会送你一个函数作为礼物。这个函数有点特别,它喜欢接收一个名叫theme的好朋友。然后呢,它就根据这位theme朋友的“心情”(也就是具体的主题样式),为你精心炮制出一套相应的CSS样式规则,就像魔法师一样神奇。 例如,上面的例子中,我们定义了一个名为snackbarContent的样式: jsx const useStyles = makeStyles({ snackbarContent: { backgroundColor: 'f5f5f5', borderRadius: 3, padding: '16px 18px', }, }); 这个样式包括了背景颜色、边框半径和内填充等属性。然后,我们在SnackBar的ContentProps中使用了这个样式的类名。 4. 结论 总的来说,我们可以在SnackBarContent中添加自定义样式的步骤是:首先,我们需要导入必要的组件并创建一个新的SnackBar;然后,我们可以使用makeStyles来定义自定义样式;最后,我们在SnackBar中将这个样式的类名作为ContentProps中的className属性传递给SnackBarContent。这样,我们就可以成功地在SnackBarContent中添加自定义样式了。 当然,这只是一个基本的示例,实际上我们还可以使用其他方式来调整SnackBarContent的样式,例如使用CSS类名或者媒体查询等。不管咋说,咱都得时刻记着这么个理儿:咱们的目标就是捣鼓出一款让用户称心如意,又能严丝合缝符合设计标准的应用程序。所以呢,咱们就得不断去摸索、学习和实践,好让自己能找到最对味的那个解决方案。就像探险家寻找宝藏那样,咱也得勇往直前,不断尝试,直到找到最适合自己的那条路子。
2023-10-21 13:18:01
264
百转千回-t
转载文章
...深入理解了Node.js项目中node_modules文件夹、package.json、开发依赖与项目依赖以及package-lock.json文件的关键作用后,延伸阅读可以关注以下几个方向: 1. NPM最新动态:近期,npm(Node包管理器)发布了其7.x版本的重大更新,引入了工作空间功能以更高效地管理多包项目,并优化了依赖解析速度和安全性。同时,npm团队也强调了package-lock.json文件对于锁定依赖版本的重要性,建议开发者在项目中始终维护并提交此文件。 2. Yarn 2 / Berry的零安装体验:作为npm的有力竞争者,Yarn在其2.x版本(Berry)中推出了Plug'n'Play特性,它尝试从根本上改变node_modules的工作方式,通过指向远程包的软链接来减少磁盘占用并提高性能。这为解决node_modules体积过大和依赖关系复杂的问题提供了新的思路。 3. Monorepo趋势下的依赖管理:随着Lerna、Nx等工具的流行,越来越多的企业采用Monorepo模式管理多个相关项目。这种模式下,如何合理划分项目依赖与开发依赖,如何借助改进后的package.json和lock文件有效同步和控制全局依赖版本,成为了开发者关注的新焦点。 4. 依赖管理最佳实践:针对依赖地狱问题,业界专家不断提出新的解决方案和最佳实践,如遵循“精确依赖原则”,及时更新过时依赖,利用Greenkeeper或Dependabot等自动化工具进行依赖更新监控等。这些方法论能够帮助开发者更好地管理和维护项目中的第三方模块,确保项目的稳定性和安全性。 5. 开源社区对依赖安全性的重视:鉴于近年来因第三方库引发的安全事件频发,开源社区正加强对包依赖安全性的审查。例如,Sonatype Nexus平台提供组件分析服务,可检测项目依赖链中的漏洞,确保项目所使用的第三方包均处于安全状态。此类服务与工具的运用有助于开发者在管理依赖的同时,增强项目整体的安全性保障。
2023-05-26 22:34:04
132
转载
转载文章
...此外,随着Node.js和浏览器环境对异步编程需求的提升,Promise与其他异步API如async/await的结合使用越来越普遍。通过async函数返回的Promise可以更简洁、直观地表达复杂的异步逻辑,并有助于减少回调地狱的问题。近期一篇名为《深入浅出async/await与Promise》的技术文章对此进行了深度解读,帮助开发者更好地理解和运用这些工具。 另外,在前端框架领域,React Hooks的广泛应用也离不开Promise的支持,尤其是在处理状态管理和数据获取时。利用useEffect配合Promise进行异步数据加载,使得组件生命周期管理更为灵活高效。有关这方面的实践案例和最佳实践,可参阅知名前端技术博客“State of the Art JavaScript”的相关文章。 综上所述,Promise不仅作为一种基础的异步编程工具,而且在不断发展演进中持续影响着现代Web和JavaScript生态系统的进步。深入研究Promise及其在各种场景下的应用,无疑将有助于我们编写出更加优雅且高效的代码。
2023-06-05 22:54:38
115
转载
ReactJS
ReactJS中的代码组织技巧 ReactJS是一款由Facebook公司开发的JavaScript库,用于构建用户界面。它的主要优点之一就是可以极大地提高代码的可读性和可维护性。在这篇帖子里,我打算和大伙儿分享一些我在捣鼓ReactJS时,偶然发现的一些超实用的代码管理小妙招。 一、组件化编程 ReactJS的一大特点是其强大的组件化能力。在React应用的世界里,组件就像积木块一样重要,它们把相关的HTML、CSS样式和JavaScript智慧打包在一起。这些小家伙们通过props这个传递信息的秘密通道,以及state这个内部状态黑匣子相互交流、协作,共同构建起丰富多彩的用户界面体验。一个好的组件应该是独立的,只处理自己的状态和行为,而不会干涉其他组件的状态和行为。 jsx // A simple component that displays the current time. function Clock() { const [time, setTime] = useState(() => new Date().toLocaleTimeString()); useEffect(() => { const intervalId = setInterval(() => { setTime(() => new Date().toLocaleTimeString()); }, 1000); return () => clearInterval(intervalId); }, []); return {time} ; } 在上面的例子中,Clock组件仅仅负责显示当前的时间,它并不关心时间是如何获取的,或者如何更新的。这种设计使得我们可以轻松地复用Clock组件,而且不容易出错。 二、高阶组件 如果你经常需要为多个组件添加相同的逻辑,那么你可以考虑使用高阶组件。高阶组件是一个函数,它接受一个组件作为参数,并返回一个新的组件。 jsx // A higher-order component that adds a prop called isHighlighted. const withHighlight = (WrappedComponent) => { return class extends React.Component { constructor(props) { super(props); this.state = { highlighted: false }; } toggleHighlight = () => { this.setState(prevState => ({ highlighted: !prevState.highlighted, })); }; render() { return ( Highlight Component ); } }; }; 在上面的例子中,withHighlight函数接受一个组件作为参数,并为其添加了一个新的highlighted prop。这个prop默认值为false,但可以通过点击按钮来改变。这样我们就可以轻松地将这个功能添加到任何组件上。 三、树形数据结构 在实际的应用中,我们通常会遇到树形的数据结构,如菜单、目录等。在这种情况下,咱们完全可以利用React的那个render方法,再加上递归这个小技巧,来一步步“爬”遍整个组件树。然后呢,针对每个节点的不同状态和属性,咱们就可以灵活地、动态地生成对应的DOM元素啦,就像变魔术一样! jsx // A component that represents a tree node. function TreeNode({ label, children }) { return ( {label} {children && ( {children.map(child => ( ))} )} ); } // A function that generates a tree from an array of nodes. function generateTree(nodes) { return nodes.reduce((acc, node) => { acc[node.id] = { ...node, children: generateTree(node.children || []) }; return acc; }, {}); } // An example tree with three levels. const treeData = generateTree([ { id: 1, label: "Root", children: [ { id: 2, label: "Level 1", children: [ { id: 3, label: "Level 2", children: [{ id: 4, label: "Leaf" }], }, ], }, ], }, ]); // Render the tree using recursion. function renderTree(treeData) { return Object.keys(treeData).map(id => { const node = treeData[id]; return ( key={id} label={node.label} children={node.children && renderTree(node.children)} /> ); }); } ReactDOM.render( {renderTree(treeData)} , document.getElementById("root")); 在上面的例子中,TreeNode组件表示树的一个节点,generateTree函数用于生成树的结构,renderTree函数则使用递归的方式遍历整个树,并根据每个节点的状态和属性动态生成DOM元素。 以上就是我在使用ReactJS过程中的一些心得和体会。希望这些内容能对你有所帮助。
2023-05-09 23:53:32
152
断桥残雪-t
AngularJS
...案 在AngularJS的世界中,我们常常会遇到与服务器进行异步交互的场景,而$http服务作为AngularJS的核心组件之一,承担着数据获取和提交的重要任务。然而,在我们处理那些跨域请求的时候,有时候会碰到这么个头疼的问题:尝试通过 $httpProvider.defaults.headers 设置跨域头,结果却不灵了。这无疑给咱们的开发工作添了不少堵,让人挺抓狂的。这篇文章咱们要一探这个问题的究竟,我不仅会跟你唠唠嗑理论,还会手把手地带你瞧瞧实例代码,一步步揭开事情背后的原因,顺便找出解决它的锦囊妙计。 1. $httpProvider.defaults.headers简介 在AngularJS中,$httpProvider 是一个提供全局配置$http服务的对象。喏,你知道吗,defaults.headers这个小特性可厉害了,它能让我们在所有$http请求里头预先设置默认的HTTP头信息。想象一下,如果你的应用经常需要给每一条请求都加上特定的HTTP头部信息,那有了这个功能,就简直太省事儿、太方便啦!例如,为了实现跨域资源共享(CORS),我们可能需要设置'Access-Control-Allow-Origin'等头部信息。 javascript angular.module('myApp', []).config(['$httpProvider', function($httpProvider) { $httpProvider.defaults.headers.common['Access-Control-Allow-Origin'] = ''; }]); 2. 跨域头设置为何失败? 尽管上面的代码看似合情合理,但实际应用中你会发现,通过$httpProvider.defaults.headers来设置Access-Control-Allow-Origin这样的跨域响应头是无效的。这是因为涉及到跨域的那些个“Access-Control-Allow-Origin”、“Access-Control-Allow-Methods”这些头信息呐,它们都是服务器端的大佬掌控着,然后发送给咱们客户端浏览器的。可不是咱们前端写JavaScript(包括AngularJS)的小哥能直接设置滴。 浏览器遵循同源策略,对于跨域请求,只有接收到服务器明确允许的相应头部信息后才会放行。因此,前端试图通过$httpProvider.defaults.headers设置这些跨域响应头的行为无法产生预期效果。 3. 解决方案 服务器端配置 既然前端无法直接设置跨域响应头,那正确的做法就是去服务器端进行相应的配置。以Node.js + Express为例: javascript const express = require('express'); const app = express(); // 允许来自任何域名的跨域请求 app.use((req, res, next) => { res.header('Access-Control-Allow-Origin', ''); res.header('Access-Control-Allow-Methods', 'GET, POST, OPTIONS, PUT, DELETE'); res.header('Access-Control-Allow-Headers', 'Content-Type, Authorization, X-Requested-With'); if (req.method === 'OPTIONS') { res.send(200); } else { next(); } }); // 这里是你的路由配置... 4. 客户端注意事项 虽然前端不能设置跨域响应头,但在发起带自定义请求头的跨域请求时,仍需在$httpProvider.defaults.headers中声明这些请求头,以便让服务器知道客户端希望携带哪些头部信息: javascript angular.module('myApp').config(['$httpProvider', function ($httpProvider) { $httpProvider.defaults.headers.common['X-Custom-Header'] = 'some-value'; }]); // 在$http请求中使用 $http({ method: 'POST', url: 'https://api.example.com/data', headers: {'Content-Type': 'application/json'}, data: { / ... / } }); 总结起来,虽然我们不能通过 $httpProvider.defaults.headers 来直接解决跨域问题,但它仍然是我们定制请求头部信息不可或缺的工具。要真正搞定跨域问题,关键得先摸清楚跨域策略的来龙去脉,然后在服务器那边儿把配置给整对了才行。在我们做前端开发这事儿的时候,千万要记牢这个小秘诀,这样一来,当咱们的AngularJS应用碰到跨域问题这块绊脚石时,就能轻松应对、游刃有余啦!
2023-09-21 21:16:40
397
草原牧歌
ReactJS
ReactJS:组件化开发的艺术(函数组件与类组件) 1. 引言 在前端开发的世界中,ReactJS无疑是一颗璀璨的明星。它的厉害之处,不只是那些高大上的虚拟DOM技术以及单向数据流的设计思路,更酷的是它独具匠心的“组件化”开发模式,就像搭积木一样,让编程变得更加灵活有趣。这种模式呢,就好比我们把一个看起来眼花缭乱的用户界面,像搭积木那样,拆解成一个个既方便重复使用、又能独立保养的小玩意儿——也就是组件啦。这篇文咱会用大白话,把ReactJS里的两大主角——函数组件和类组件,掰扯得明明白白。咱们不仅说透原理,还会甩出一堆鲜活的代码实例,实实在在让你瞧瞧它们在实战中的威力。 2. 函数组件 简洁高效的力量 2.1 函数组件简介 函数组件是最基础且最纯粹的React组件形式,它本质上就是一个纯函数,接收props作为输入,返回React元素作为输出: jsx // 函数组件示例 function Welcome(props) { return Hello, {props.name}! ; } // 使用组件 在这个简单的例子中,Welcome函数组件接收一个名为name的prop,然后将其渲染到一个h1标签内。这就是函数组件的基本运作原理:根据传入的props生成视图。 2.2 函数组件的优势 - 简洁性:无需涉及生命周期方法和state管理,使代码更为精简,易于阅读和理解。 - 性能优化:随着React Hooks的引入,函数组件也能实现状态管理和副作用处理,进一步提升性能表现。 3. 类组件 功能强大的选择 3.1 类组件简介 类组件是基于ES6类创建的React组件,它扩展了React.Component基类,可以拥有内部状态(state)和生命周期方法: jsx // 类组件示例 class Counter extends React.Component { constructor(props) { super(props); this.state = { count: 0 }; } increment() { this.setState(prevState => ({ count: prevState.count + 1 })); } render() { return ( Increment Count: {this.state.count} ); } } 在这个Counter类组件中,我们定义了一个内部状态count以及一个用于更新状态的方法increment,同时在render方法中返回了根据状态动态变化的UI。 3.2 类组件的优势 - 状态管理:类组件可以直接使用this.state和this.setState进行状态的存储和更新,适用于需要保持内部状态的复杂场景。 - 生命周期方法:提供了诸如componentDidMount、componentDidUpdate等生命周期钩子,允许开发者在特定时刻执行额外的操作,如数据获取、手动更新DOM等。 4. 函数组件与类组件的选择 在实际开发过程中,如何选择函数组件还是类组件?这完全取决于项目的具体需求。假如你的组件压根儿不需要处理什么内部状态,或者用Hook轻轻松松就能把状态管理得妥妥的,那选择函数组件绝对是个更明智的决定。当组件的逻辑变得绕来绕去,复杂得让人挠头,特别是需要对生命周期这块“难啃的骨头”进行精细把控的时候,类组件就像个超级英雄一样,能充分展示出它的独门绝技和过人之处。 不过,随着React Hooks的广泛应用,函数组件在功能上已经日趋完善,越来越多的场景下,即使是有状态的组件也可以优先考虑采用函数组件结合Hooks的方式来编写,以简化代码结构并提高代码复用性。 总的来说,无论你选择哪种组件类型,ReactJS的组件化思想都旨在帮助我们更好地组织代码,让我们的应用更加模块化、可维护、可测试。因此,在实践中不断探索、理解和运用组件化开发,无疑是每个React开发者必备的技能。
2023-07-12 15:20:11
74
蝶舞花间
Tesseract
...,npm(Node.js的包管理器)生态中一个名为“colors”的流行日志着色库进行了一次破坏性更新,由于其广泛的依赖关系,许多开发者在更新依赖时遭遇了意料之外的问题。 深入解读这一事件,我们可以看到即使是最小的基础组件变动也可能引发蝴蝶效应,影响到整个技术生态链。这也进一步强调了在项目开发与维护过程中,密切关注并及时更新依赖库版本、合理管理软件供应链安全的重要性。同时,为避免类似问题,业界正积极推动采用更严格的依赖锁定机制和更完善的开源组件生命周期管理策略。 此外,对于像zlib这样广泛使用的底层压缩库,其最新版本通常会包含性能优化、安全修复以及对新特性的支持。因此,定期检查并升级这些基础工具库是保持项目健壮性和安全性的重要一环。例如,近期发布的zlib 1.2.12版就包含了多个bug修复和潜在的安全改进,对于使用Tesseract OCR等依赖zlib的应用而言,及时跟进此类更新具有实际意义。
2023-05-05 18:04:37
90
柳暗花明又一村
Docker
...础上安装 Node.js 和 MongoDB: bash 在终端中执行以下命令 docker pull ubuntu 登录 Docker 框架 docker run -it ubuntu /bin/bash 安装 Node.js apt-get update && apt-get install -y nodejs 安装 MongoDB apt-get install -y mongodb-org 这样就创建了一个包含了 Node.js 和 MongoDB 的 Docker 镜像。 2.容器 当我们有了一个镜像后,就可以创建一个容器了。容器就像是Docker里实实在在跑应用的小天地,它就像乐高积木一样,可以从一个镜像构建出来。你随时可以对这个小天地进行启动、暂停、重启等各种操作,就像你在现实生活中管理你的小天地一样灵活自如。 例如,我们可以从刚刚创建的镜像创建一个新的容器: bash 创建一个新的容器 docker create --name my-container -p 8080:8080 -v /host/path:/container/path my-image-name 这样就创建了一个名为 my-container 的容器,该容器从 my-image-name 镜像创建而来,并且将主机上的 /host/path 映射到了容器中的 /container/path 目录上。 三、Docker的优势 使用 Docker 可以带来许多优势: 1.快速开发和部署 使用 Docker 可以快速地构建、测试和部署应用,因为它提供了一个一致性的环境,避免了在不同环境中可能出现的问题。 2.节省资源 使用 Docker 可以节省大量的资源,因为每个容器都是独立的,它们不会共享宿主机的资源。 3.提高可靠性 使用 Docker 可以提高应用的可靠性,因为每个容器都是独立的,即使某个容器崩溃,也不会影响其他容器。 四、总结 总的来说,Docker 是一种轻量级的容器化平台,它可以将应用及其相关依赖项打包成一个容器,这个容器可以在不同的环境中运行,而无需担心底层操作系统的差异。使用 Docker 可以带来许多优势,包括快速开发和部署、节省资源、提高可靠性等。 我是一个 AI,但我希望能为你提供有用的文章。嘿,我真心希望通过这篇文章,你能对Docker有个更接地气、更透彻的理解。要是你脑袋里蹦出了任何疑问或者困惑,别犹豫,就像和朋友聊天那样,随时向我抛过来吧!
2023-08-13 11:28:22
537
落叶归根_t
Javascript
...中引用了一个不存在的JS文件 在此例中,当浏览器尝试加载non_existent_script.js但找不到该文件时,就会出现“Script did not run”的错误提示。 2. 语法错误导致脚本无法执行 语法错误是初学者最常见的问题之一,也是引发“Script did not run”报错的原因。 javascript // 一个带有语法错误的示例 function test() { console.log("Hello, world!" } test(); // 缺少闭合括号,因此脚本无法执行 在上述例子中,由于函数体内的字符串没有正确闭合,JavaScript引擎在解析阶段就会抛出错误,从而导致整个脚本停止执行。 3. 脚本逻辑错误与异常处理不当 有时,即使脚本文件成功加载且语法无误,也可能因为内部逻辑错误或者异常未被捕获而触发“Script did not run”。 javascript // 逻辑错误示例,试图访问null对象的属性 let obj = null; console.log(obj.property); // 抛出TypeError异常,脚本在此处终止执行 // 异常处理改进方案: try { console.log(obj.property); } catch (error) { console.error('An error occurred:', error); } 在这个案例中,当尝试访问null对象的属性时,JavaScript会抛出TypeError异常。要是不处理这种异常情况,脚本就可能会被迫“撂挑子”,然后闹出个“脚本没运行起来”的状况。 4. 解决策略与思考过程 面对“Script did not run”的问题,我们的解决步骤可以归纳为以下几点: - 检查资源加载:确保所有引用的JavaScript文件都能正常加载,路径是否正确,文件是否存在。 - 审查语法:使用文本编辑器的语法高亮功能或IDE的错误提示,快速定位并修复语法错误。 - 调试逻辑:利用浏览器的开发者工具(如Chrome DevTools),通过断点、步进、查看变量值等方式,逐步排查程序逻辑中的问题。 - 善用异常处理:在可能出现错误的地方使用try...catch结构,对异常进行妥善处理,避免脚本因未捕获的异常而终止执行。 总的来说,“Script did not run”虽是一个看似简单的错误提示,但它背后隐藏的问题却需要我们根据具体情况进行细致入微的排查和解决。希望以上的代码实例和讨论能真正帮到你,让你对这个问题有个更接地气的理解,然后在实际操作时,能够迅速找到解题的“灵丹妙药”。在寻找答案、解决难题的过程中,咱们得拿出十足的耐心和细致劲儿,就像那侦探查案一样,得像剥洋葱那样一层层揭开谜团,最后,真相总会大白于天下。
2023-03-26 16:40:33
374
柳暗花明又一村
NodeJS
在深入理解Node.js内存管理的重要性与应对策略之后,进一步的“延伸阅读”可以关注近期JavaScript引擎的进步以及Node.js社区对于内存优化的最新实践和工具。 例如,V8引擎作为Chrome浏览器及Node.js的核心组件,其对垃圾回收机制的持续优化对JavaScript开发者至关重要。最近,V8团队发布了新版本更新,引入了更智能的内存管理策略和更高效的垃圾回收算法,这有助于减少内存泄漏的可能性,并提高大型应用程序的性能表现。 同时,Node.js社区也在不断推出新的工具和服务来帮助开发者更好地进行内存分析和优化。诸如Node.js内置的process.memoryUsage() API、第三方模块如memory-leak-detector等工具,可以帮助开发者实时监控应用内存使用情况,快速定位潜在的内存泄漏问题。 此外,针对Node.js的长期运行服务场景,有专家建议采用最新的架构模式,比如利用worker_threads或多进程模型避免长时间运行任务导致的内存积压,或结合容器化技术(如Docker)实现资源限制与自动重启策略,以从系统层面防止内存泄漏带来的影响。 综上所述,在实际开发中,紧跟JavaScript引擎的演进步伐,掌握并运用最新的内存管理工具与策略,将有助于我们打造更为健壮且高性能的Node.js应用。
2023-12-25 21:40:06
75
星河万里-t
HTML
...如renderer.js) const log = require('electron-log'); // 设置默认的日志级别,例如 'info' log.transports.file.level = 'info'; // 初始化,使其可以在渲染进程中工作 log.init({ showLogs: false, // 是否在控制台显示日志 electronRenderer: true, }); 2. 输出日志至文件 现在,我们可以开始在渲染进程中愉快地编写日志了! javascript // 假设在一个用户交互事件中需要记录操作日志 document.getElementById('myButton').addEventListener('click', () => { log.info('User clicked on the button!'); log.error('An unexpected error occurred during the click event!', new Error('Error details')); }); 上述代码中,我们分别用log.info()和log.error()记录了不同级别的信息。这些日志会自动乖乖地蹦进默认的日志文件里头,这个文件一般都藏在你电脑的AppData目录下,具体哪个小角落就得看你的操作系统啦。 3. 自定义日志文件路径及格式 如果你希望自定义日志文件的位置和名称,可以通过以下方式设置: javascript log.transports.file.getFile().path = path.join(app.getPath('userData'), 'custom-log.log'); 同时,electron-log也支持多种格式化选项,包括JSON、pretty-print等,可以根据需求调整: javascript log.transports.file.format = '{h}:{i}:{s} {level}: {text}'; 4. 思考与讨论 值得注意的是,虽然我们在渲染进程中直接调用了electron-log,但实际上所有的日志都通过IPC通信机制传递给主进程,再由主进程负责实际的写入文件操作。这么干,既能确保安全,防止渲染进程直接去摆弄磁盘,还能让日志管理变得简单省事儿多了。 在整个过程中,electron-log不仅充当了开发者的眼睛,洞察每一处可能的问题点,还像一本详尽的操作手册,忠实记录着应用运行的每一步足迹。这种实时、细致入微的日志系统,绝对是我们Electron应用背后的强大后盾,让我们的应用跑得既稳又强。 总的来说,通过electron-log,我们在 Electron 渲染进程中记录和输出日志变得轻松易行,大大提高了调试效率和问题定位的速度。每一个开发者都该好好利用这些工具,让咱们的应用程序像人一样“开口说话”,把它们的“心里话”都告诉我们。
2023-10-02 19:00:44
552
岁月如歌_
Docker
...建一个包含Node.js和Express框架的应用程序的Docker镜像: bash FROM node:12-alpine WORKDIR /app COPY package.json ./ RUN npm install COPY . . EXPOSE 3000 CMD [ "npm", "start" ] 这个Dockerfile定义了一个基于Node.js 12.0.0-alpine镜像的镜像,然后安装了项目所需的所有依赖项,并设置了端口映射为3000。最后,我们可以通过运行以下命令来构建这个Docker镜像: go docker build -t my-node-app . 这将生成一个名为my-node-app的Docker镜像,我们可以使用以下命令将其运行起来: css docker run -p 3000:3000 --name my-running-app my-node-app 现在,你可以通过访问http://localhost:3000来查看你的应用程序是否正常工作。 2. Docker的优点 Docker的主要优点包括: - 隔离:Docker容器是在宿主机上的进程,它们具有自己的网络、文件系统和资源限制,因此可以避免不同应用程序之间的冲突。 - 可移植性:由于Docker镜像是轻量级的,它们可以在任何支持Docker的平台上运行,无论该平台是在开发人员的本地计算机上还是在云服务器上。 - 快速部署:通过使用预构建的Docker镜像,可以快速地部署应用程序,而不需要担心底层基础设施的差异。 3. Docker的使用场景 Docker适用于许多不同的场景,包括但不限于: - 开发:Docker可以帮助开发人员在同一台机器上运行多个实例,每个实例都具有其特定的配置和依赖项。另外,Docker这小家伙还能在持续集成和持续部署(CI/CD)的流程里大显身手呢! - 测试:Docker可以模拟不同的操作系统和网络环境,以便进行兼容性和性能测试。 - 运行时:Docker可以用于在生产环境中运行应用程序,因为它的隔离特性可以确保应用程序不会影响其他应用程序。 - 基础设施即服务(IaaS):Docker可以与云平台(如AWS、Google Cloud、Azure等)集成,从而提供一种高度可扩展和灵活的基础架构解决方案。 4. Docker的最佳实践 虽然Docker提供了很多便利,但也有一些最佳实践需要遵循,以确保您的Docker容器始终处于最佳状态。这些最佳实践包括: - 使用轻量级的操作系统:选择轻量级的Docker镜像作为基础镜像,以减少镜像的大小和启动时间。 - 最小化运行时依赖项:只在容器内安装应用程序所需的必要组件,以防止潜在的安全漏洞。 - 使用端口映射:在Docker容器外部公开端口号,以便客户端可以连接到容器内的应用程序。 - 使用守护进程:如果应用程序需要持久运行,那么应该将其包装在一个守护进程中,这样即使容器关闭,应用程序仍然可以继续运行。 - 使用卷:如果应用程序需要持久存储数据,那么应该将其挂载到一个Docker卷中,而不是在容器内部存储数据。
2023-02-17 17:09:52
515
追梦人-t
ReactJS
...引言 随着ReactJS的发展和应用越来越广泛,我们越来越多地开始关注如何利用React构建可复用的动画库或组件。这篇文会手把手带你揭秘如何用React这个工具,捣鼓出一套既能炫又能复用的动画库或者组件,还会送上一些实打实的例子,让你能对照着学,包你一看就懂! 二、为什么需要可复用的动画库或组件? 首先,我们需要明确为什么需要可复用的动画库或组件。随着项目的不断扩大,我们会遇到越来越多复杂的动画效果需求。要是每次我们都要从头开始编写全新的动画效果代码,那铁定会让我们的工作量蹭蹭上涨,而且这样很容易就造成代码到处都是重复的部分,维护起来也会变得相当棘手。所以,如果我们能捣鼓出一套可重复使用的动画库或者组件,那就能超级省时省力,让我们的开发工作轻松不少。而且这样一来,代码的稳定性和一致性也能妥妥地得到保障,就像给程序加了保险一样。 三、如何利用React构建可复用的动画库或组件? 接下来,我们将介绍如何利用React构建可复用的动画库或组件。具体来说,我们需要遵循以下几个步骤: 步骤一:定义动画效果 首先,我们需要定义动画效果。这一步真的超级重要,要知道,动画效果做得好不好,那可是直接关系到整个APP用起来爽不爽的关键因素!比如,我们可以设计一个超酷的淡入动画效果,想象一下这样的情景:当你轻轻一点按钮,页面上的某个元素就像被施展了魔法一样,慢慢地、优雅地从隐形状态显现出来,给你带来意想不到的视觉惊喜。 步骤二:封装动画效果 接下来,我们需要封装动画效果。在做这个操作的时候,我们可以把动画效果单独打包成一个自定义的小部件或者函数,这样一来,你在其他任何需要的地方都能随时调用它,就像从工具箱里取出小工具一样方便。比如说,我们能创建一个名叫FadeIn的组件,这个小家伙呢,会接收一个props参数,这个参数的作用可大了,就是用来告诉我们它要让哪个元素逐渐显现出来,实现淡入效果。 步骤三:使用动画效果 最后,我们需要在应用程序中使用动画效果。在这个过程中,我们可以直接调用封装好的动画效果,而不必再次编写动画效果的代码。比如说,当你点击一个按钮的时候,我们可以在那个按钮的“事件响应小助手”里头,呼唤出一个叫FadeIn的小工具,让它帮忙让某个元素像魔术般慢慢显现出来,实现淡入的效果。 四、实战演示 现在,让我们来看一下如何利用React构建一个可复用的淡入动画库或组件。首先,我们需要定义动画效果。想在React项目里实现一个淡入动画效果?这里有个小窍门。首先,我们可以巧妙地利用React那个叫做useState的小工具来掌控状态的变化。然后呢,再搭配CSS动画的魔法,就能轻松把淡入效果玩转起来,让元素如同晨雾般自然显现。以下是代码示例: javascript import React, { useState } from 'react'; import './FadeIn.css'; const FadeIn = ({ children }) => { const [show, setShow] = useState(false); return ( {children} ); }; export default FadeIn; 在上述代码中,我们首先导入了useState钩子和相关的CSS文件。接下来,我们捣鼓出了一个名叫FadeIn的组件,这个小家伙有个特性,它可以接受一个叫children的属性,这个属性呢,就是用来告诉我们它要帮哪些内容慢慢变得可见,也就是淡入进来。在咱这组件里面,我们用了一个叫做useState的小玩意儿来捯饬"show"这个状态。简单来说,就是如果"show"这小家伙的值是true,那我们就把内容亮出来给大家瞅瞅;否则的话,就把它藏起来,不让大家看到。此外,我们还添加了一个CSS类名fade-in和hidden,用于控制淡入和隐藏的效果。 接下来,我们需要在应用程序中使用动画效果。以下是一个简单的示例,我们在点击按钮时,调用FadeIn组件来淡入某个元素: javascript import React, { useState } from 'react'; import FadeIn from './FadeIn'; function App() { const [showMessage, setShowMessage] = useState(false); const handleClick = () => { setShowMessage(true); }; return ( Click me {showMessage && {message} } ); } export default App; 在上述代码中,我们首先导入了FadeIn组件和useState钩子。然后,我们定义了一个App组件,这个组件包含一个按钮和一个FadeIn组件。当按钮被点击时,我们调用setShowMessage方法来改变showMessage的状态,从而触发FadeIn组件的淡入效果。
2023-03-14 20:38:59
105
草原牧歌-t
Tesseract
...系,并简化第三方库或组件的安装、更新和卸载过程。在现代软件工程实践中,包管理器有助于确保项目所需的所有依赖项都能得到正确安装和版本控制,从而避免因依赖缺失导致的问题,如文中提到的Tesseract OCR初始化失败的情况。例如,pipenv用于Python项目的依赖管理,npm适用于Node.js项目,而conda则常用于数据科学和机器学习项目中,支持多种编程语言的包管理。
2023-02-15 18:35:20
154
秋水共长天一色
转载文章
...lex项目,并支持以JSFL(JavaScript Flash库)的形式运行在现代浏览器上,结合最新的web开发技术如Angular、React等,继续为开发者提供高效构建企业级应用的解决方案。 深入到服务器端编程领域,Node.js、Python Flask/Django、Java Spring Boot等平台提供了丰富的API接口设计和开发工具,使得前后端的数据交换更为灵活高效。这些技术同样强调事件驱动和异步编程模型,与ActionScript 3.0中的网络通信原理不谋而合。 总的来说,尽管Flash的时代已经过去,但它所承载的技术思想和模式在现代web开发中得到了延续和升华。理解并掌握这些核心概念,无论是在学习新的前端技术栈还是优化现有系统的过程中,都将大有裨益。
2023-09-10 18:10:29
66
转载
RabbitMQ
...消息传递是一种关键的组件,帮助各个服务之间保持松耦合。RabbitMQ,这款开源的消息中间件,就因为它的超级能扩容、超灵活的特性,让众多开发者一见倾心,纷纷把它当作解决问题的首选手册。这篇文咱会好好唠唠,RabbitMQ是怎么巧妙支持HTTP、gRPC这些协议,实现消息的发布和订阅的。咱们还会揭开这背后的神秘面纱,看看这些集成方式都有哪些独特之处,以及在实际生活中怎么用得上。 2. RabbitMQ基础 首先,让我们回顾一下RabbitMQ的基本概念。RabbitMQ通过消息队列、交换机和路由键实现了发布/订阅模式。生产者(Producer)将消息发送到交换机,而交换机根据规则(如路由键)决定将消息路由到哪个或哪些队列,消费者(Consumer)则从队列中获取消息进行处理。这种架构使得消息的传输不受发送者和接收者之间网络连接的影响。 3. HTTP集成 HTTP API Gateway 为了支持HTTP请求,RabbitMQ可以与HTTP API Gateway集成。例如,我们可以使用amqplib库来编写Node.js代码,如下所示: javascript const amqp = require('amqplib'); async function publishHttpMessage(url) { const connection = await amqp.connect('amqp://localhost'); const channel = await connection.createChannel(); // 创建一个HTTP Exchange await channel.exchangeDeclare( 'http_requests', // Exchange name 'topic', // Exchange type (HTTP requests use topic) { durable: false } // Durable exchanges are not needed for HTTP ); // 发送HTTP请求消息 const message = { routingKey: 'http.request.', // Match all HTTP requests body: JSON.stringify({ url }), }; await channel.publish('http_requests', message.routingKey, Buffer.from(JSON.stringify(message))); console.log(Published HTTP request to ${url}); await channel.close(); await connection.close(); } // 调用函数并发送请求 publishHttpMessage('https://example.com/api/v1'); 这种方式允许API Gateway接收来自客户端的HTTP请求,然后将这些请求转化为RabbitMQ的消息,进一步转发给后端处理服务。 4. gRPC集成 gRPC-RabbitMQ Bridge 对于gRPC,我们可能需要一个中间件桥接器,如grpc-gateway和protobuf-rpc。例如,gRPC客户端可以通过gRPC Gateway将请求转换为HTTP请求,然后由RabbitMQ处理。这里有一个简化版的伪代码示例: python from google.api import service_pb2_grpc from grpc_gateway import services_pb2, gateway class RabbitMQGrpcHandler(service_pb2_grpc.MyServiceServicer): def UnaryCall(self, request, context): Convert gRPC request to RabbitMQ message rabbit_message = services_pb2.MyRequestToProcess(request.to_dict()) Publish the message to RabbitMQ with channel: channel.basic_publish( exchange='gRPC_Requests', routing_key=rabbit_message.routing_key, body=json.dumps(rabbit_message), properties=pika.BasicProperties(content_type='application/json') ) Return a response or acknowledge the call return services_pb2.MyResponse(status="Accepted") Start the gRPC server with the RabbitMQ handler server = grpc.server(futures.ThreadPoolExecutor(max_workers=10)) service_pb2_grpc.add_MyServiceServicer_to_server(RabbitMQGrpcHandler(), server) server.add_insecure_port('[::]:50051') server.start() 这样,gRPC客户端发出的请求经过gRPC Gateway的适配,最终被RabbitMQ处理,实现异步解耦。 5. 特点和应用场景 - 灵活性:HTTP和gRPC集成使得RabbitMQ能够适应各种服务间的通信需求,无论是API网关、微服务架构还是跨语言通信。 - 解耦:生产者和消费者不需要知道对方的存在,提高了系统的可维护性和扩展性。 - 扩展性:RabbitMQ的集群模式允许在高并发场景下轻松扩展。 - 错误处理:消息持久化和重试机制有助于处理暂时性的网络问题。 - 安全性:通过SSL/TLS可以确保消息传输的安全性。 6. 结论 RabbitMQ的强大之处在于它能跨越多种协议,提供了一种通用的消息传递平台。你知道吗,咱们可以像变魔术那样,把HTTP和gRPC这两个家伙灵活搭配起来,这样就能构建出一个超级灵动、随时能扩展的分布式系统,就跟你搭积木一样,想怎么拼就怎么拼,特别给力!当然啦,实际情况是会根据咱们项目的需求和手头现有的技术工具箱灵活调整具体实现方式,不过无论咋整,RabbitMQ都像是个超级靠谱的邮差,让各个服务之间的交流变得贼顺畅。
2024-02-23 11:44:00
92
笑傲江湖-t
Consul
...Ruby、Node.js 等语言都有对应的 Consul 客户端库。 然而,需要注意的是,虽然这些客户端库都是由社区维护的,但并不保证所有的特性和功能都得到了完全的支持。所以呢,当你准备挑选拿个 Consul 客户端库来用的时候,千万记得要根据实际情况,好好掂量掂量、比对比对,再做决定。 3. 总结 综上所述,Consul 主要支持 Java 和 Go 两种语言的客户端库。虽然市面上还有其他语言版本的客户端库可以选择,不过呢,由于各个语言得到官方和社区支持的程度参差不齐,我建议你在实际用起来的时候,最好优先考虑一下Java和Go这两种语言的库。就像是选餐厅一样,不仅要看菜品丰富,还得看看人气和服务,对吧?这两个家伙就像是“官方认证、群众口碑好”的那两家店,值得你优先考虑。另外,说到挑选哪个语言的客户端库,咱们得结合自己手头的需求和技术装备来一番深思熟虑,做决定的时候可不能含糊。
2023-08-15 16:36:21
442
月影清风-t
Mongo
...与硬件设备或其他系统组件之间的接口。在本文语境中,MongoDB驱动程序是指针对特定编程语言(如Node.js)编写的库,使得该语言的应用程序能够与MongoDB数据库进行交互,包括连接数据库、执行查询、更新数据等操作。例如,Node.js环境中的mongodb库就是一个实现了与MongoDB通信功能的驱动程序,它提供了API供开发者调用,实现异步地连接和操作MongoDB数据库。
2024-03-10 10:44:19
167
林中小径_
转载文章
... Angular, Vue it will just fall into place, right out of the box. X/Y Line & Smoothed line Area Column & Bar Scatter & Bubble Candlestick & OHLC Step (incl. w/ no-riser) Floating & Gantt Waterfall Error Stacked (regular or 100%) Heatmap … and any combination of the above Percent Pie & Donut Nested donut Funnel Pyramid Pictorial Geo maps Map chart Geo heat map Map combined with charts Maps is an add-on and requires separate license. Other Sankey diagram Chord, Chord directed, and Chord non-ribbon diagrams Pack Treemap Tree Sunburst Partition Force-directed tree Radar & Polar Word cloud Venn diagram Efficiency built-in Canvas rendering amCharts 5 uses browser’s Canvas API which in most cases is way faster than SVG. Less moving parts in the DOM tree, faster rendering. Layering Common element groups are isolated into separate independent canvases, so that heavily updated sections do not trigger expensive repaints in places that do not change. Fast data processing Data processing in amCharts 5 is designed to be as efficient as possible. Incremental updates, lack of repetitive aggregations, and lightweight data object use makes data processing fast and very memory-efficient. Faster dashboards amCharts 5 is capable of running scores of charts on the same page, without crippling the browser, due to its lightweight approach to data parsing and rendering. Tiny binaries We made amCharts 5 really small – the core functionality compiles to a file of only around 400KB. Each niche functionality is separated into files, so you load only what you really need. Users will surely appreciate faster load times. Better tree-shaking We also designed amCharts 5 to be extremely tree-shakable. If you are using Webpack or similar packager, only code that is really needed will be included into your final application. The most advanced chart package Classics with some new twists XY charts are now so powerful and flexible, you can plot any data on them. Number, date, duration, or category axes are supported, in all directions. Pie charts are now fully nestable, with support for custom start and end angles, to create half circles. New geo maps Our maps use GeoJSON format. Being open and widely accepted standard it opens up a lot of possibilities and sources for ready-made and custom maps. Furthermore, maps are now very flexible, with multi-series support, configurable down to the nut and bolt. (Maps is and add-on to amCharts 5: Charts which requires separate license) More about amCharts 5: Maps Pictorials Create multi-layer, multi-series pictorial charts. Any SVG path can be used as a shape for your chart. Sankey Diagrams Stunning flow diagrams, in horizontal and vertical. With draggable, fully configurable nodes. Enhanced radar charts With stacked column, bands, axes, and other dramatic enhancements, radar charts are now way more useful. Treemaps Completely zoomable, multi-level, highly configurable. Heatmaps Automatically build heat-maps, with custom axes, color ranges, and awesome new interactive Heat Legend. Create heatmaps using colors, or point size or both. Universal and flexible heat rules allow attaching any value in data to any property or properties on any element. Chord diagrams Visualize your 2-way relational data in a neat circular Chord diagrams. We do have different variations of the classic diagram: Chord, Chord directed, and Chord non-ribbon. True funnel charts amCharts 5 offers true Funnel charts the way they were meant to be. Slice’s area size represents the value, so each step’s influence on overall volume reduction is more prominent than with basic funnels. Trapezoid form can also be configured to further emphasize reduction. Complete it with other visual elements, like fully configurable slice lines, multiple series support, togglable legends, and many many more options. Customizable beauty built-in Powerful theme engine amCharts 5 comes with a bunch of beautiful themes as well as a super flexible theme engine, which you can use. We devised a CSS-like rule-based theme targeting system in themes. Using, creating, customizing themes or standalone rules has never been so easy. The new system allows applying defaults to elements based on their type, features, or position in a virtual element tree. Fresh new look Default looks designed to look fresh, like something out of tomorrow. Carefully selected color schemes and default settings were specifically chosen to make the charts stand out. Silk-smooth animations Every setting – colors, positions, sizes, opacity, and many more – is animatable to ensure smooth transitions. No choppy, stepped animations – everything is fluid, including zoom and toggling of series and other items. Flexibility Element templates Most elements are created using templates: a collection of default settings, events, and adapters. Changing template automatically propagates changes to actual elements, making it easy to do batch updates. Everything’s configurable Numerous configuration options allow inventive uses, bordering on new chart types. Angles, colors, positions, radii, a-n-y-t-h-i-n-g can be set to bend classic and new chart types exactly the way you need them. Element states Easily change how an element looks like under different circumstances, e.g. on some interaction, hover, click, or related to data (eg. column look if a value is down). The engine will automatically apply the required properties as needed, animating between old and new values smoothly. Create and apply custom states via the API. Multi-type multi-axis support Add any number of axes of any type. Create overlaid comparison of different time scales. Use any mix of dimensional values: numbers, dates, categories, or duration. Adapters “Adapters” functionality allows plugging in custom code to dynamically override just about any setting or data value. Text formatting All text labels – tooltips, axis labels, titles, etc. – now support rich text formatting options, like changing colors, font weight, or applying just about any styling option from the CSS arsenal. In addition to formatting support, labels can now contain in-line placeholders for real data, with the ability to apply custom formatting to values. Accessibility & Interactivity Accessibility Accessibility was riding shotgun when amCharts 5 was being developed. All interactive elements are TAB-selectable, with customizable roles, order, and screen-reader texts. Everything that can be moved by touch or mouse, can be moved by keyboard. Everything that can be clicked or toggled, can be interacted with with keyboard, too. Touch support Charts have been designed to work with touch devices out-of-the-box. They will work not only on phones or tablets, but also touch capable computers. Under the hood Built with TypeScript Supports strong type and error checking in TypeScript applications. Enjoy code completion, error checking and dynamic help popups in major IDEs. Full support for TypeScript and ES6 modules. 100% for JavaScript Can be fully used in any vanilla JavaScript application. amCharts 5 does not use or rely on globals, external frameworks or 3rd party libraries. Universal rendering engine Can be used to build dynamic, interactive Canvas-based interfaces and applications. Add various elements to the screen, make them interactive, with a few lines of code. Make them clickable, draggable, hoverable, using built-in interactivity functionality. Our universal layout engine will place, size and arrange elements according to set rules. 本篇文章为转载内容。原文链接:https://blog.csdn.net/john_dwh/article/details/127460821。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-09-17 18:18:34
351
转载
转载文章
...mlc/mxnet.js/blob/main/data/cat.png?raw=true" img_path = download_testdata(img_url, "cat.png", module="data")img_path = 'cat.png'img = Image.open(img_path).resize((224, 224)) Preprocess the image and convert to tensorfrom torchvision import transformsmy_preprocess = transforms.Compose([transforms.Resize(256),transforms.CenterCrop(224),transforms.ToTensor(),transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),])img = my_preprocess(img)img = np.expand_dims(img, 0) Import the graph to Relay ------------------------- Convert PyTorch graph to Relay graph. The input name can be arbitrary.input_name = "input0"shape_list = [(input_name, img.shape)]mod, params = relay.frontend.from_pytorch(scripted_model, shape_list) Relay Build ----------- Compile the graph to llvm target with given input specification.target = tvm.target.Target("llvm", host="llvm")dev = tvm.cpu(0)with tvm.transform.PassContext(opt_level=3):lib = relay.build(mod, target=target, params=params) Execute the portable graph on TVM --------------------------------- Now we can try deploying the compiled model on target.from tvm.contrib import graph_executordtype = "float32"m = graph_executor.GraphModule(lib["default"](dev)) Set inputsm.set_input(input_name, tvm.nd.array(img.astype(dtype))) Executem.run() Get outputstvm_output = m.get_output(0) Look up synset name ------------------- Look up prediction top 1 index in 1000 class synset. synset_url = "".join( [ "https://raw.githubusercontent.com/Cadene/", "pretrained-models.pytorch/master/data/", "imagenet_synsets.txt", ] ) synset_name = "imagenet_synsets.txt" synset_path = download_testdata(synset_url, synset_name, module="data") https://raw.githubusercontent.com/Cadene/pretrained-models.pytorch/master/data/imagenet_synsets.txtsynset_path = 'imagenet_synsets.txt'with open(synset_path) as f:synsets = f.readlines()synsets = [x.strip() for x in synsets]splits = [line.split(" ") for line in synsets]key_to_classname = {spl[0]: " ".join(spl[1:]) for spl in splits} class_url = "".join( [ "https://raw.githubusercontent.com/Cadene/", "pretrained-models.pytorch/master/data/", "imagenet_classes.txt", ] ) class_name = "imagenet_classes.txt" class_path = download_testdata(class_url, class_name, module="data") https://raw.githubusercontent.com/Cadene/pretrained-models.pytorch/master/data/imagenet_classes.txtclass_path = 'imagenet_classes.txt'with open(class_path) as f:class_id_to_key = f.readlines()class_id_to_key = [x.strip() for x in class_id_to_key] Get top-1 result for TVMtop1_tvm = np.argmax(tvm_output.numpy()[0])tvm_class_key = class_id_to_key[top1_tvm] Convert input to PyTorch variable and get PyTorch result for comparisonwith torch.no_grad():torch_img = torch.from_numpy(img)output = model(torch_img) Get top-1 result for PyTorchtop1_torch = np.argmax(output.numpy())torch_class_key = class_id_to_key[top1_torch]print("Relay top-1 id: {}, class name: {}".format(top1_tvm, key_to_classname[tvm_class_key]))print("Torch top-1 id: {}, class name: {}".format(top1_torch, key_to_classname[torch_class_key])) 2. 配置vscode 安装两个vscode远程连接所需的两个插件,具体如下图所示: 安装完成之后,在左侧工具栏会出现一个图标,点击图标进行ssh配置: ssh yourname@yourip -A 然后右键选择在当前窗口进行连接: 除此之外,还可以设置免费登录,具体可参考这篇文章。 当然,也可以使用windows本地的WSL2,vscode连接WSL还需要安装WSL和Dev Containers这两个插件。 在服务器端执行code .会自动安装vscode server,安装位置在用户的根目录下: 3. 安装FFI Navigator 由于TVM是由Python和C++混合开发,且大多数的IDE仅支持在同一种语言中查找函数定义,因此对于跨语言的FFI 调用,即Python跳转到C++或者C++跳转到Python,vscode是做不到的。虽然解决这个问题在技术上可能非常具有挑战性,但我们可以通过构建一个与FFI注册码模式匹配并恢复必要信息的项目特定分析器来解决这个问题,FFI Navigator就这样诞生了,作者仍然是陈天奇博士。 安装方式如下: 建议使用源码安装git clone https://github.com/tqchen/ffi-navigator.git 安装python依赖cd ffi-navigator/pythonpython setyp.py install vscode需要安装FFI Navigator插件,直接搜索安装即可(安装到服务器端)。 最后需要在.vscode/setting.json进行配置,内容如下: {"python.analysis.extraPaths": ["${workspaceFolder}/python"], // 添加额外导入路径, 告诉pylance自定义的python库在哪里"ffi_navigator.pythonpath": "/home/liyanpeng/anaconda3/envs/tvmenv/bin/python", // 配置FFI Navigator"python.defaultInterpreterPath": "/home/liyanpeng/anaconda3/envs/tvmenv/bin/python","files.associations": {"type_traits": "cpp","fstream": "cpp","thread": "cpp",".tcc": "cpp"} } 更详细内容可以参考项目链接。 结束语 对于vscode的使用技巧及C/C++相关的配置,这里不再详细的介绍了,感兴趣的小伙伴们可以了解下。 本篇文章为转载内容。原文链接:https://blog.csdn.net/qq_42730750/article/details/126723224。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-12-12 20:04:26
87
转载
转载文章
...ython 中文分词组件 “Jieba” (Chinese for “to stutter”) Chinese text segmentation: built to be the best Python Chinese word segmentation module. Scroll down for English documentation. 特点 支持四种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 paddle模式,利用PaddlePaddle深度学习框架,训练序列标注(双向GRU)网络模型实现分词。同时支持词性标注。paddle模式使用需安装paddlepaddle-tiny,pip install paddlepaddle-tiny==1.6.1。目前paddle模式支持jieba v0.40及以上版本。jieba v0.40以下版本,请升级jieba,pip install jieba --upgrade 。PaddlePaddle官网 支持繁体分词 支持自定义词典 MIT 授权协议 安装说明 代码对 Python 2/3 均兼容 全自动安装:easy_install jieba 或者 pip install jieba / pip3 install jieba 半自动安装:先下载 http://pypi.python.org/pypi/jieba/ ,解压后运行 python setup.py install 手动安装:将 jieba 目录放置于当前目录或者 site-packages 目录 通过 import jieba 来引用 如果需要使用paddle模式下的分词和词性标注功能,请先安装paddlepaddle-tiny,pip install paddlepaddle-tiny==1.6.1。 算法 基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图 (DAG) 采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合 对于未登录词,采用了基于汉字成词能力的 HMM 模型,使用了 Viterbi 算法 主要功能 分词 jieba.cut 方法接受四个输入参数: 需要分词的字符串;cut_all 参数用来控制是否采用全模式;HMM 参数用来控制是否使用 HMM 模型;use_paddle 参数用来控制是否使用paddle模式下的分词模式,paddle模式采用延迟加载方式,通过enable_paddle接口安装paddlepaddle-tiny,并且import相关代码; jieba.cut_for_search 方法接受两个参数:需要分词的字符串;是否使用 HMM 模型。该方法适合用于搜索引擎构建倒排索引的分词,粒度比较细 待分词的字符串可以是 unicode 或 UTF-8 字符串、GBK 字符串。注意:不建议直接输入 GBK 字符串,可能无法预料地错误解码成 UTF-8 jieba.cut 以及 jieba.cut_for_search 返回的结构都是一个可迭代的 generator,可以使用 for 循环来获得分词后得到的每一个词语(unicode),或者用 jieba.lcut 以及 jieba.lcut_for_search 直接返回 list jieba.Tokenizer(dictionary=DEFAULT_DICT) 新建自定义分词器,可用于同时使用不同词典。jieba.dt 为默认分词器,所有全局分词相关函数都是该分词器的映射。 代码示例 encoding=utf-8import jiebajieba.enable_paddle() 启动paddle模式。 0.40版之后开始支持,早期版本不支持strs=["我来到北京清华大学","乒乓球拍卖完了","中国科学技术大学"]for str in strs:seg_list = jieba.cut(str,use_paddle=True) 使用paddle模式print("Paddle Mode: " + '/'.join(list(seg_list)))seg_list = jieba.cut("我来到北京清华大学", cut_all=True)print("Full Mode: " + "/ ".join(seg_list)) 全模式seg_list = jieba.cut("我来到北京清华大学", cut_all=False)print("Default Mode: " + "/ ".join(seg_list)) 精确模式seg_list = jieba.cut("他来到了网易杭研大厦") 默认是精确模式print(", ".join(seg_list))seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造") 搜索引擎模式print(", ".join(seg_list)) 输出: 【全模式】: 我/ 来到/ 北京/ 清华/ 清华大学/ 华大/ 大学【精确模式】: 我/ 来到/ 北京/ 清华大学【新词识别】:他, 来到, 了, 网易, 杭研, 大厦 (此处,“杭研”并没有在词典中,但是也被Viterbi算法识别出来了)【搜索引擎模式】: 小明, 硕士, 毕业, 于, 中国, 科学, 学院, 科学院, 中国科学院, 计算, 计算所, 后, 在, 日本, 京都, 大学, 日本京都大学, 深造 添加自定义词典 载入词典 开发者可以指定自己自定义的词典,以便包含 jieba 词库里没有的词。虽然 jieba 有新词识别能力,但是自行添加新词可以保证更高的正确率 用法: jieba.load_userdict(file_name) file_name 为文件类对象或自定义词典的路径 词典格式和 dict.txt 一样,一个词占一行;每一行分三部分:词语、词频(可省略)、词性(可省略),用空格隔开,顺序不可颠倒。file_name 若为路径或二进制方式打开的文件,则文件必须为 UTF-8 编码。 词频省略时使用自动计算的能保证分出该词的词频。 例如: 创新办 3 i云计算 5凱特琳 nz台中 更改分词器(默认为 jieba.dt)的 tmp_dir 和 cache_file 属性,可分别指定缓存文件所在的文件夹及其文件名,用于受限的文件系统。 范例: 自定义词典:https://github.com/fxsjy/jieba/blob/master/test/userdict.txt 用法示例:https://github.com/fxsjy/jieba/blob/master/test/test_userdict.py 之前: 李小福 / 是 / 创新 / 办 / 主任 / 也 / 是 / 云 / 计算 / 方面 / 的 / 专家 / 加载自定义词库后: 李小福 / 是 / 创新办 / 主任 / 也 / 是 / 云计算 / 方面 / 的 / 专家 / 调整词典 使用 add_word(word, freq=None, tag=None) 和 del_word(word) 可在程序中动态修改词典。 使用 suggest_freq(segment, tune=True) 可调节单个词语的词频,使其能(或不能)被分出来。 注意:自动计算的词频在使用 HMM 新词发现功能时可能无效。 代码示例: >>> print('/'.join(jieba.cut('如果放到post中将出错。', HMM=False)))如果/放到/post/中将/出错/。>>> jieba.suggest_freq(('中', '将'), True)494>>> print('/'.join(jieba.cut('如果放到post中将出错。', HMM=False)))如果/放到/post/中/将/出错/。>>> print('/'.join(jieba.cut('「台中」正确应该不会被切开', HMM=False)))「/台/中/」/正确/应该/不会/被/切开>>> jieba.suggest_freq('台中', True)69>>> print('/'.join(jieba.cut('「台中」正确应该不会被切开', HMM=False)))「/台中/」/正确/应该/不会/被/切开 “通过用户自定义词典来增强歧义纠错能力” — https://github.com/fxsjy/jieba/issues/14 关键词提取 基于 TF-IDF 算法的关键词抽取 import jieba.analyse jieba.analyse.extract_tags(sentence, topK=20, withWeight=False, allowPOS=()) sentence 为待提取的文本 topK 为返回几个 TF/IDF 权重最大的关键词,默认值为 20 withWeight 为是否一并返回关键词权重值,默认值为 False allowPOS 仅包括指定词性的词,默认值为空,即不筛选 jieba.analyse.TFIDF(idf_path=None) 新建 TFIDF 实例,idf_path 为 IDF 频率文件 代码示例 (关键词提取) https://github.com/fxsjy/jieba/blob/master/test/extract_tags.py 关键词提取所使用逆向文件频率(IDF)文本语料库可以切换成自定义语料库的路径 用法: jieba.analyse.set_idf_path(file_name) file_name为自定义语料库的路径 自定义语料库示例:https://github.com/fxsjy/jieba/blob/master/extra_dict/idf.txt.big 用法示例:https://github.com/fxsjy/jieba/blob/master/test/extract_tags_idfpath.py 关键词提取所使用停止词(Stop Words)文本语料库可以切换成自定义语料库的路径 用法: jieba.analyse.set_stop_words(file_name) file_name为自定义语料库的路径 自定义语料库示例:https://github.com/fxsjy/jieba/blob/master/extra_dict/stop_words.txt 用法示例:https://github.com/fxsjy/jieba/blob/master/test/extract_tags_stop_words.py 关键词一并返回关键词权重值示例 用法示例:https://github.com/fxsjy/jieba/blob/master/test/extract_tags_with_weight.py 基于 TextRank 算法的关键词抽取 jieba.analyse.textrank(sentence, topK=20, withWeight=False, allowPOS=(‘ns’, ‘n’, ‘vn’, ‘v’)) 直接使用,接口相同,注意默认过滤词性。 jieba.analyse.TextRank() 新建自定义 TextRank 实例 算法论文: TextRank: Bringing Order into Texts 基本思想: 将待抽取关键词的文本进行分词 以固定窗口大小(默认为5,通过span属性调整),词之间的共现关系,构建图 计算图中节点的PageRank,注意是无向带权图 使用示例: 见 test/demo.py 词性标注 jieba.posseg.POSTokenizer(tokenizer=None) 新建自定义分词器,tokenizer 参数可指定内部使用的 jieba.Tokenizer 分词器。jieba.posseg.dt 为默认词性标注分词器。 标注句子分词后每个词的词性,采用和 ictclas 兼容的标记法。 除了jieba默认分词模式,提供paddle模式下的词性标注功能。paddle模式采用延迟加载方式,通过enable_paddle()安装paddlepaddle-tiny,并且import相关代码; 用法示例 >>> import jieba>>> import jieba.posseg as pseg>>> words = pseg.cut("我爱北京天安门") jieba默认模式>>> jieba.enable_paddle() 启动paddle模式。 0.40版之后开始支持,早期版本不支持>>> words = pseg.cut("我爱北京天安门",use_paddle=True) paddle模式>>> for word, flag in words:... print('%s %s' % (word, flag))...我 r爱 v北京 ns天安门 ns paddle模式词性标注对应表如下: paddle模式词性和专名类别标签集合如下表,其中词性标签 24 个(小写字母),专名类别标签 4 个(大写字母)。 标签 含义 标签 含义 标签 含义 标签 含义 n 普通名词 f 方位名词 s 处所名词 t 时间 nr 人名 ns 地名 nt 机构名 nw 作品名 nz 其他专名 v 普通动词 vd 动副词 vn 名动词 a 形容词 ad 副形词 an 名形词 d 副词 m 数量词 q 量词 r 代词 p 介词 c 连词 u 助词 xc 其他虚词 w 标点符号 PER 人名 LOC 地名 ORG 机构名 TIME 时间 并行分词 原理:将目标文本按行分隔后,把各行文本分配到多个 Python 进程并行分词,然后归并结果,从而获得分词速度的可观提升 基于 python 自带的 multiprocessing 模块,目前暂不支持 Windows 用法: jieba.enable_parallel(4) 开启并行分词模式,参数为并行进程数 jieba.disable_parallel() 关闭并行分词模式 例子:https://github.com/fxsjy/jieba/blob/master/test/parallel/test_file.py 实验结果:在 4 核 3.4GHz Linux 机器上,对金庸全集进行精确分词,获得了 1MB/s 的速度,是单进程版的 3.3 倍。 注意:并行分词仅支持默认分词器 jieba.dt 和 jieba.posseg.dt。 Tokenize:返回词语在原文的起止位置 注意,输入参数只接受 unicode 默认模式 result = jieba.tokenize(u'永和服装饰品有限公司')for tk in result:print("word %s\t\t start: %d \t\t end:%d" % (tk[0],tk[1],tk[2])) word 永和 start: 0 end:2word 服装 start: 2 end:4word 饰品 start: 4 end:6word 有限公司 start: 6 end:10 搜索模式 result = jieba.tokenize(u'永和服装饰品有限公司', mode='search')for tk in result:print("word %s\t\t start: %d \t\t end:%d" % (tk[0],tk[1],tk[2])) word 永和 start: 0 end:2word 服装 start: 2 end:4word 饰品 start: 4 end:6word 有限 start: 6 end:8word 公司 start: 8 end:10word 有限公司 start: 6 end:10 ChineseAnalyzer for Whoosh 搜索引擎 引用: from jieba.analyse import ChineseAnalyzer 用法示例:https://github.com/fxsjy/jieba/blob/master/test/test_whoosh.py 命令行分词 使用示例:python -m jieba news.txt > cut_result.txt 命令行选项(翻译): 使用: python -m jieba [options] filename结巴命令行界面。固定参数:filename 输入文件可选参数:-h, --help 显示此帮助信息并退出-d [DELIM], --delimiter [DELIM]使用 DELIM 分隔词语,而不是用默认的' / '。若不指定 DELIM,则使用一个空格分隔。-p [DELIM], --pos [DELIM]启用词性标注;如果指定 DELIM,词语和词性之间用它分隔,否则用 _ 分隔-D DICT, --dict DICT 使用 DICT 代替默认词典-u USER_DICT, --user-dict USER_DICT使用 USER_DICT 作为附加词典,与默认词典或自定义词典配合使用-a, --cut-all 全模式分词(不支持词性标注)-n, --no-hmm 不使用隐含马尔可夫模型-q, --quiet 不输出载入信息到 STDERR-V, --version 显示版本信息并退出如果没有指定文件名,则使用标准输入。 --help 选项输出: $> python -m jieba --helpJieba command line interface.positional arguments:filename input fileoptional arguments:-h, --help show this help message and exit-d [DELIM], --delimiter [DELIM]use DELIM instead of ' / ' for word delimiter; or aspace if it is used without DELIM-p [DELIM], --pos [DELIM]enable POS tagging; if DELIM is specified, use DELIMinstead of '_' for POS delimiter-D DICT, --dict DICT use DICT as dictionary-u USER_DICT, --user-dict USER_DICTuse USER_DICT together with the default dictionary orDICT (if specified)-a, --cut-all full pattern cutting (ignored with POS tagging)-n, --no-hmm don't use the Hidden Markov Model-q, --quiet don't print loading messages to stderr-V, --version show program's version number and exitIf no filename specified, use STDIN instead. 延迟加载机制 jieba 采用延迟加载,import jieba 和 jieba.Tokenizer() 不会立即触发词典的加载,一旦有必要才开始加载词典构建前缀字典。如果你想手工初始 jieba,也可以手动初始化。 import jiebajieba.initialize() 手动初始化(可选) 在 0.28 之前的版本是不能指定主词典的路径的,有了延迟加载机制后,你可以改变主词典的路径: jieba.set_dictionary('data/dict.txt.big') 例子: https://github.com/fxsjy/jieba/blob/master/test/test_change_dictpath.py 其他词典 占用内存较小的词典文件 https://github.com/fxsjy/jieba/raw/master/extra_dict/dict.txt.small 支持繁体分词更好的词典文件 https://github.com/fxsjy/jieba/raw/master/extra_dict/dict.txt.big 下载你所需要的词典,然后覆盖 jieba/dict.txt 即可;或者用 jieba.set_dictionary('data/dict.txt.big') 其他语言实现 结巴分词 Java 版本 作者:piaolingxue 地址:https://github.com/huaban/jieba-analysis 结巴分词 C++ 版本 作者:yanyiwu 地址:https://github.com/yanyiwu/cppjieba 结巴分词 Rust 版本 作者:messense, MnO2 地址:https://github.com/messense/jieba-rs 结巴分词 Node.js 版本 作者:yanyiwu 地址:https://github.com/yanyiwu/nodejieba 结巴分词 Erlang 版本 作者:falood 地址:https://github.com/falood/exjieba 结巴分词 R 版本 作者:qinwf 地址:https://github.com/qinwf/jiebaR 结巴分词 iOS 版本 作者:yanyiwu 地址:https://github.com/yanyiwu/iosjieba 结巴分词 PHP 版本 作者:fukuball 地址:https://github.com/fukuball/jieba-php 结巴分词 .NET(C) 版本 作者:anderscui 地址:https://github.com/anderscui/jieba.NET/ 结巴分词 Go 版本 作者: wangbin 地址: https://github.com/wangbin/jiebago 作者: yanyiwu 地址: https://github.com/yanyiwu/gojieba 结巴分词Android版本 作者 Dongliang.W 地址:https://github.com/452896915/jieba-android 友情链接 https://github.com/baidu/lac 百度中文词法分析(分词+词性+专名)系统 https://github.com/baidu/AnyQ 百度FAQ自动问答系统 https://github.com/baidu/Senta 百度情感识别系统 系统集成 Solr: https://github.com/sing1ee/jieba-solr 分词速度 1.5 MB / Second in Full Mode 400 KB / Second in Default Mode 测试环境: Intel® Core™ i7-2600 CPU @ 3.4GHz;《围城》.txt 常见问题 1. 模型的数据是如何生成的? 详见: https://github.com/fxsjy/jieba/issues/7 2. “台中”总是被切成“台 中”?(以及类似情况) P(台中) < P(台)×P(中),“台中”词频不够导致其成词概率较低 解决方法:强制调高词频 jieba.add_word('台中') 或者 jieba.suggest_freq('台中', True) 3. “今天天气 不错”应该被切成“今天 天气 不错”?(以及类似情况) 解决方法:强制调低词频 jieba.suggest_freq(('今天', '天气'), True) 或者直接删除该词 jieba.del_word('今天天气') 4. 切出了词典中没有的词语,效果不理想? 解决方法:关闭新词发现 jieba.cut('丰田太省了', HMM=False) jieba.cut('我们中出了一个叛徒', HMM=False) 更多问题请点击:https://github.com/fxsjy/jieba/issues?sort=updated&state=closed 修订历史 https://github.com/fxsjy/jieba/blob/master/Changelog jieba “Jieba” (Chinese for “to stutter”) Chinese text segmentation: built to be the best Python Chinese word segmentation module. Features Support three types of segmentation mode: Accurate Mode attempts to cut the sentence into the most accurate segmentations, which is suitable for text analysis. Full Mode gets all the possible words from the sentence. Fast but not accurate. Search Engine Mode, based on the Accurate Mode, attempts to cut long words into several short words, which can raise the recall rate. Suitable for search engines. Supports Traditional Chinese Supports customized dictionaries MIT License Online demo http://jiebademo.ap01.aws.af.cm/ (Powered by Appfog) Usage Fully automatic installation: easy_install jieba or pip install jieba Semi-automatic installation: Download http://pypi.python.org/pypi/jieba/ , run python setup.py install after extracting. Manual installation: place the jieba directory in the current directory or python site-packages directory. import jieba. Algorithm Based on a prefix dictionary structure to achieve efficient word graph scanning. Build a directed acyclic graph (DAG) for all possible word combinations. Use dynamic programming to find the most probable combination based on the word frequency. For unknown words, a HMM-based model is used with the Viterbi algorithm. Main Functions Cut The jieba.cut function accepts three input parameters: the first parameter is the string to be cut; the second parameter is cut_all, controlling the cut mode; the third parameter is to control whether to use the Hidden Markov Model. jieba.cut_for_search accepts two parameter: the string to be cut; whether to use the Hidden Markov Model. This will cut the sentence into short words suitable for search engines. The input string can be an unicode/str object, or a str/bytes object which is encoded in UTF-8 or GBK. Note that using GBK encoding is not recommended because it may be unexpectly decoded as UTF-8. jieba.cut and jieba.cut_for_search returns an generator, from which you can use a for loop to get the segmentation result (in unicode). jieba.lcut and jieba.lcut_for_search returns a list. jieba.Tokenizer(dictionary=DEFAULT_DICT) creates a new customized Tokenizer, which enables you to use different dictionaries at the same time. jieba.dt is the default Tokenizer, to which almost all global functions are mapped. Code example: segmentation encoding=utf-8import jiebaseg_list = jieba.cut("我来到北京清华大学", cut_all=True)print("Full Mode: " + "/ ".join(seg_list)) 全模式seg_list = jieba.cut("我来到北京清华大学", cut_all=False)print("Default Mode: " + "/ ".join(seg_list)) 默认模式seg_list = jieba.cut("他来到了网易杭研大厦")print(", ".join(seg_list))seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造") 搜索引擎模式print(", ".join(seg_list)) Output: [Full Mode]: 我/ 来到/ 北京/ 清华/ 清华大学/ 华大/ 大学[Accurate Mode]: 我/ 来到/ 北京/ 清华大学[Unknown Words Recognize] 他, 来到, 了, 网易, 杭研, 大厦 (In this case, "杭研" is not in the dictionary, but is identified by the Viterbi algorithm)[Search Engine Mode]: 小明, 硕士, 毕业, 于, 中国, 科学, 学院, 科学院, 中国科学院, 计算, 计算所, 后, 在, 日本, 京都, 大学, 日本京都大学, 深造 Add a custom dictionary Load dictionary Developers can specify their own custom dictionary to be included in the jieba default dictionary. Jieba is able to identify new words, but you can add your own new words can ensure a higher accuracy. Usage: jieba.load_userdict(file_name) file_name is a file-like object or the path of the custom dictionary The dictionary format is the same as that of dict.txt: one word per line; each line is divided into three parts separated by a space: word, word frequency, POS tag. If file_name is a path or a file opened in binary mode, the dictionary must be UTF-8 encoded. The word frequency and POS tag can be omitted respectively. The word frequency will be filled with a suitable value if omitted. For example: 创新办 3 i云计算 5凱特琳 nz台中 Change a Tokenizer’s tmp_dir and cache_file to specify the path of the cache file, for using on a restricted file system. Example: 云计算 5李小福 2创新办 3[Before]: 李小福 / 是 / 创新 / 办 / 主任 / 也 / 是 / 云 / 计算 / 方面 / 的 / 专家 /[After]: 李小福 / 是 / 创新办 / 主任 / 也 / 是 / 云计算 / 方面 / 的 / 专家 / Modify dictionary Use add_word(word, freq=None, tag=None) and del_word(word) to modify the dictionary dynamically in programs. Use suggest_freq(segment, tune=True) to adjust the frequency of a single word so that it can (or cannot) be segmented. Note that HMM may affect the final result. Example: >>> print('/'.join(jieba.cut('如果放到post中将出错。', HMM=False)))如果/放到/post/中将/出错/。>>> jieba.suggest_freq(('中', '将'), True)494>>> print('/'.join(jieba.cut('如果放到post中将出错。', HMM=False)))如果/放到/post/中/将/出错/。>>> print('/'.join(jieba.cut('「台中」正确应该不会被切开', HMM=False)))「/台/中/」/正确/应该/不会/被/切开>>> jieba.suggest_freq('台中', True)69>>> print('/'.join(jieba.cut('「台中」正确应该不会被切开', HMM=False)))「/台中/」/正确/应该/不会/被/切开 Keyword Extraction import jieba.analyse jieba.analyse.extract_tags(sentence, topK=20, withWeight=False, allowPOS=()) sentence: the text to be extracted topK: return how many keywords with the highest TF/IDF weights. The default value is 20 withWeight: whether return TF/IDF weights with the keywords. The default value is False allowPOS: filter words with which POSs are included. Empty for no filtering. jieba.analyse.TFIDF(idf_path=None) creates a new TFIDF instance, idf_path specifies IDF file path. Example (keyword extraction) https://github.com/fxsjy/jieba/blob/master/test/extract_tags.py Developers can specify their own custom IDF corpus in jieba keyword extraction Usage: jieba.analyse.set_idf_path(file_name) file_name is the path for the custom corpus Custom Corpus Sample:https://github.com/fxsjy/jieba/blob/master/extra_dict/idf.txt.big Sample Code:https://github.com/fxsjy/jieba/blob/master/test/extract_tags_idfpath.py Developers can specify their own custom stop words corpus in jieba keyword extraction Usage: jieba.analyse.set_stop_words(file_name) file_name is the path for the custom corpus Custom Corpus Sample:https://github.com/fxsjy/jieba/blob/master/extra_dict/stop_words.txt Sample Code:https://github.com/fxsjy/jieba/blob/master/test/extract_tags_stop_words.py There’s also a TextRank implementation available. Use: jieba.analyse.textrank(sentence, topK=20, withWeight=False, allowPOS=('ns', 'n', 'vn', 'v')) Note that it filters POS by default. jieba.analyse.TextRank() creates a new TextRank instance. Part of Speech Tagging jieba.posseg.POSTokenizer(tokenizer=None) creates a new customized Tokenizer. tokenizer specifies the jieba.Tokenizer to internally use. jieba.posseg.dt is the default POSTokenizer. Tags the POS of each word after segmentation, using labels compatible with ictclas. Example: >>> import jieba.posseg as pseg>>> words = pseg.cut("我爱北京天安门")>>> for w in words:... print('%s %s' % (w.word, w.flag))...我 r爱 v北京 ns天安门 ns Parallel Processing Principle: Split target text by line, assign the lines into multiple Python processes, and then merge the results, which is considerably faster. Based on the multiprocessing module of Python. Usage: jieba.enable_parallel(4) Enable parallel processing. The parameter is the number of processes. jieba.disable_parallel() Disable parallel processing. Example: https://github.com/fxsjy/jieba/blob/master/test/parallel/test_file.py Result: On a four-core 3.4GHz Linux machine, do accurate word segmentation on Complete Works of Jin Yong, and the speed reaches 1MB/s, which is 3.3 times faster than the single-process version. Note that parallel processing supports only default tokenizers, jieba.dt and jieba.posseg.dt. Tokenize: return words with position The input must be unicode Default mode result = jieba.tokenize(u'永和服装饰品有限公司')for tk in result:print("word %s\t\t start: %d \t\t end:%d" % (tk[0],tk[1],tk[2])) word 永和 start: 0 end:2word 服装 start: 2 end:4word 饰品 start: 4 end:6word 有限公司 start: 6 end:10 Search mode result = jieba.tokenize(u'永和服装饰品有限公司',mode='search')for tk in result:print("word %s\t\t start: %d \t\t end:%d" % (tk[0],tk[1],tk[2])) word 永和 start: 0 end:2word 服装 start: 2 end:4word 饰品 start: 4 end:6word 有限 start: 6 end:8word 公司 start: 8 end:10word 有限公司 start: 6 end:10 ChineseAnalyzer for Whoosh from jieba.analyse import ChineseAnalyzer Example: https://github.com/fxsjy/jieba/blob/master/test/test_whoosh.py Command Line Interface $> python -m jieba --helpJieba command line interface.positional arguments:filename input fileoptional arguments:-h, --help show this help message and exit-d [DELIM], --delimiter [DELIM]use DELIM instead of ' / ' for word delimiter; or aspace if it is used without DELIM-p [DELIM], --pos [DELIM]enable POS tagging; if DELIM is specified, use DELIMinstead of '_' for POS delimiter-D DICT, --dict DICT use DICT as dictionary-u USER_DICT, --user-dict USER_DICTuse USER_DICT together with the default dictionary orDICT (if specified)-a, --cut-all full pattern cutting (ignored with POS tagging)-n, --no-hmm don't use the Hidden Markov Model-q, --quiet don't print loading messages to stderr-V, --version show program's version number and exitIf no filename specified, use STDIN instead. Initialization By default, Jieba don’t build the prefix dictionary unless it’s necessary. This takes 1-3 seconds, after which it is not initialized again. If you want to initialize Jieba manually, you can call: import jiebajieba.initialize() (optional) You can also specify the dictionary (not supported before version 0.28) : jieba.set_dictionary('data/dict.txt.big') Using Other Dictionaries It is possible to use your own dictionary with Jieba, and there are also two dictionaries ready for download: A smaller dictionary for a smaller memory footprint: https://github.com/fxsjy/jieba/raw/master/extra_dict/dict.txt.small There is also a bigger dictionary that has better support for traditional Chinese (繁體): https://github.com/fxsjy/jieba/raw/master/extra_dict/dict.txt.big By default, an in-between dictionary is used, called dict.txt and included in the distribution. In either case, download the file you want, and then call jieba.set_dictionary('data/dict.txt.big') or just replace the existing dict.txt. Segmentation speed 1.5 MB / Second in Full Mode 400 KB / Second in Default Mode Test Env: Intel® Core™ i7-2600 CPU @ 3.4GHz;《围城》.txt 本篇文章为转载内容。原文链接:https://blog.csdn.net/yegeli/article/details/107246661。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-12-02 10:38:37
500
转载
JQuery插件下载
...集成并自定义此幻灯片组件,从而在网站上轻松创建出既现代又专业的幻灯片效果,提升网站的整体吸引力和互动性。 点我下载 文件大小:185.11 KB 您将下载一个JQuery插件资源包,该资源包内部文件的目录结构如下: 本网站提供JQuery插件下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2023-02-06 15:24:47
50
本站
站内搜索
用于搜索本网站内部文章,支持栏目切换。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
df -h
- 查看磁盘空间使用情况。
推荐内容
推荐本栏目内的其它文章,看看还有哪些文章让你感兴趣。
2023-04-28
2023-08-09
2023-06-18
2023-04-14
2023-02-18
2023-04-17
2024-01-11
2023-10-03
2023-09-09
2023-06-13
2023-08-07
2023-03-11
历史内容
快速导航到对应月份的历史文章列表。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"