前端技术
HTML
CSS
Javascript
前端框架和UI库
VUE
ReactJS
AngularJS
JQuery
NodeJS
JSON
Element-UI
Bootstrap
Material UI
服务端和客户端
Java
Python
PHP
Golang
Scala
Kotlin
Groovy
Ruby
Lua
.net
c#
c++
后端WEB和工程框架
SpringBoot
SpringCloud
Struts2
MyBatis
Hibernate
Tornado
Beego
Go-Spring
Go Gin
Go Iris
Dubbo
HessianRPC
Maven
Gradle
数据库
MySQL
Oracle
Mongo
中间件与web容器
Redis
MemCache
Etcd
Cassandra
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Nacos
Consul
Tomcat
Nginx
Netty
大数据技术
Hive
Impala
ClickHouse
DorisDB
Greenplum
PostgreSQL
HBase
Kylin
Hadoop
Apache Pig
ZooKeeper
SeaTunnel
Sqoop
Datax
Flink
Spark
Mahout
数据搜索与日志
ElasticSearch
Apache Lucene
Apache Solr
Kibana
Logstash
数据可视化与OLAP
Apache Atlas
Superset
Saiku
Tesseract
系统与容器
Linux
Shell
Docker
Kubernetes
[Neighbor2Neighbor模型在...]的搜索结果
这里是文章列表。热门标签的颜色随机变换,标签颜色没有特殊含义。
点击某个标签可搜索标签相关的文章。
点击某个标签可搜索标签相关的文章。
转载文章
在深入理解Neighbor2Neighbor自监督去噪算法后,我们发现其在图像处理领域具有广泛应用前景。近期,《Nature Communications》期刊上的一篇最新研究论文中,科研团队进一步探索了基于深度学习的图像复原技术,并展示了如何通过改进的自监督框架有效应对更复杂、更大尺寸的图像去噪问题,这与Neighbor2Neighbor算法的核心思想不谋而合。 同时,在计算机视觉国际顶级会议CVPR 2023上,一项名为“Unsupervised Image Denoising with Adaptive Noise Modeling”的工作引起了广泛关注。该研究提出了一种新型的自适应噪声建模方法,能够在无标签数据上实现高质量的图像去噪效果,这也为自监督去噪领域的研究提供了新的思路和方向。 此外,值得一提的是,开源社区中的PyTorch Lightning库最近发布了一个针对图像去噪任务优化的模块,其中包含了对UNet模型以及多种噪声模型(如高斯噪声、泊松噪声)的支持,开发者可以直接利用这些资源快速构建并训练自己的自监督去噪模型,大大降低了研究门槛和开发成本。 综上所述, Neighbor2Neighbor算法作为自监督图像去噪的典型代表,正随着深度学习和计算机视觉技术的发展不断得到丰富和完善,未来有望在医疗影像、遥感图像、艺术修复等多个领域发挥更大作用。而持续跟进最新的研究成果和技术动态,将有助于我们更好地掌握这一前沿技术,推动其实现更广泛的实际应用价值。
2023-06-13 14:44:26
128
转载
JQuery
...效果在现代前端中的新应用》 随着Web技术的不断发展,前端交互设计越来越注重用户体验。近年来,jQuery放大镜效果不再仅仅局限于静态展示,而是结合了现代前端技术,如响应式设计、WebVR、AR和3D图像处理,为用户提供更加丰富和沉浸式的视觉体验。 新闻热点方面,比如最近的AR电商应用,许多品牌开始利用增强现实技术,结合jQuery放大镜功能,让消费者在购物过程中可以实时查看商品细节,如同实体店铺一样,大大提高了线上购物的互动性和满意度。同时,响应式设计也使得放大镜能在不同设备上无缝切换,无论是在手机、平板还是电脑上,都能提供一致的浏览体验。 深入解读方面,一些开发者将jQuery放大镜与WebGL结合,实现了3D模型的精细查看,这在教育、游戏和工业设计等领域具有广泛的应用。另外,利用CSS3的transform和transition属性,可以实现平滑的放大效果,提升动画性能,使用户感觉更加流畅。 总的来说,jQuery放大镜效果在现代前端开发中得到了全新的生命力,它不再是单一的视觉增强,而是成为连接现实与虚拟、提升用户参与度的关键工具。随着Web技术的不断进步,我们可以期待更多创新的放大镜应用,进一步丰富我们的在线体验。
2024-05-05 15:34:33
295
键盘勇士
Tesseract
在图像识别领域中,尽管Tesseract等工具为文本行边界检测提供了有效的解决方案,但随着技术的快速发展,尤其在深度学习和人工智能领域的突破,我们正见证着更为先进且精准的文本行边界检测方法的涌现。近期,一项来自斯坦福大学的研究团队发表了一项成果,他们采用改进的Mask R-CNN模型结合自注意力机制,在复杂背景下的文本行检测任务上取得了显著提升,有效解决了因图像质量、字体大小、排版差异等因素导致的传统方法失效的问题。 同时,Google的开源项目“TensorFlow Text”也在不断优化其内置的文本行检测模块,通过集成最新的OCR技术和深度学习模型,提升了对非标准文本(如手写体、艺术字)的识别能力,使得在各种现实场景中的文本行边界检测更加准确高效。 此外,业界也正致力于研究多模态融合技术在文本行边界检测中的应用,比如结合光学字符识别与自然语言处理技术,以更全面的方式理解和解析图像中的文本信息。这种跨学科的技术融合,有望在未来进一步解决图像识别中的文本行边界难题,实现从单一文本行到全文段乃至篇章级的理解与分析。
2023-07-23 18:49:51
116
素颜如水-t
Python
...例如,深度学习算法在图像识别中的应用已取得了显著成果,如YOLO(You Only Look Once)系列实时对象检测系统,以及基于Mask R-CNN的实例分割技术,它们不仅可以精准地检测出图像中的各类形状,还能实现像素级别的分类。 近期,一项发表在《Pattern Recognition Letters》的研究提出了一种改进的边缘检测算法,结合卷积神经网络对图像进行预处理,有效提高了复杂背景下正方形等特定形状的检测精度。同时,Google研究人员也在不断优化其开源库TensorFlow Lite,使其能够在移动设备上高效运行复杂的形状识别模型,这对于智能家居、自动驾驶等领域具有重要意义。 此外,在实际应用场景中,正方形检测被广泛应用于二维码识别、建筑结构分析、无人机自主导航等诸多前沿技术。例如,利用深度学习进行二维码识别时,正方形定位是关键步骤之一;而在建筑BIM(建筑信息模型)技术中,自动检测墙体、门窗等正方形元素有助于提高建模效率和准确性。 总之,正方形检测作为基础的图像处理任务,其背后所依托的技术发展日新月异,并持续推动着相关行业领域的技术创新与应用拓展。对于广大开发者而言,紧跟前沿动态,深入理解并掌握这些先进的图像识别方法,将极大地提升自身在AI开发领域的竞争力。
2023-04-20 10:25:03
50
软件工程师
Tesseract
近期,OCR技术在图像识别领域的应用不断取得突破性进展。Tesseract作为一款开源的OCR引擎,在处理各类复杂图像文本时,尽管对比度问题对其识别效果产生了一定影响,但随着深度学习和AI技术的发展,新的解决方案正在涌现。 就在今年,Google发布了全新的OCR模型,该模型利用深度学习中的Transformer架构,显著提升了对高对比度、低对比度以及背景复杂图片中文字的识别准确率。这一革新不仅解决了传统OCR工具如Tesseract面临的一些局限性,也预示着未来OCR技术将更好地服务于文档数字化、自动驾驶车牌识别、历史档案资料检索等诸多领域。 此外,有研究团队结合超分辨率技术和自适应对比度调整算法,开发出一套能够自动优化图像质量以适应OCR识别流程的新系统。这套系统能根据图像内容动态调整对比度,有效缓解了因对比度过高或过低带来的识别难题。 综上所述,针对Tesseract在处理不同对比度图像时的问题,业界正以前沿科技为驱动,积极探寻更优解决方案,持续推动OCR技术的进步与发展。我们有理由相信,在不久的将来,无论面对何种复杂场景,OCR都将展现出更为出色的表现力与实用性。
2023-09-16 20:45:02
119
寂静森林-t
Python
...on在车辆检测领域的应用之后,我们了解到其在交通监控、违章行为识别和交通安全维护等方面的重要作用。实际上,近年来人工智能和计算机视觉技术的飞速发展正在深刻改变着交通管理行业的面貌。 最近的一则新闻报道显示,2022年,北京市公安局交管局与科技公司合作,在城市主要干道部署了基于Python和深度学习的智能交通管理系统。该系统不仅能实时进行车辆检测和追踪,还能精准识别驾驶员的行为,如不系安全带、开车打电话等违规行为,极大地提高了交通执法效率及准确性。 此外,一项由麻省理工学院(MIT)的研究团队发表的最新论文也揭示了他们如何利用Python编写程序,结合先进的卷积神经网络(CNN)模型对复杂环境下的车辆检测进行了优化。通过预训练模型和自定义级联分类器,不仅提升了车辆检测精度,而且在低光照、恶劣天气条件下的表现亦有显著改善。 进一步阅读,读者可以关注国内外各大研究机构和科技公司在这一领域的最新研究成果和技术动态,了解Python编程语言在智能交通、自动驾驶等前沿领域中的具体实践与挑战。同时,学习并掌握Python在图像处理和机器学习算法上的应用,将有助于紧跟时代步伐,参与到未来智慧交通系统的建设与发展之中。
2023-12-14 13:35:31
42
键盘勇士
Tesseract
...别,是一种通过扫描、图像处理和模式识别等技术,将图像中的印刷体或手写文本转换为可编辑的结构化文本格式的计算机技术。在本文中,OCR是解决字体识别问题的核心技术,其中Tesseract OCR是一款开源且强大的实现此技术的工具。 Tesseract , Tesseract是一个由HP实验室研发并现由Google维护的开源OCR引擎。它能够识别多种语言的文字,并支持自定义训练以提升对特定字体或场景的识别能力。在实际应用中,用户可能遇到“使用的字体不在支持范围内”的问题,此时可以通过更换其他OCR工具、进行自定义字体训练或者联系Tesseract开发者寻求解决方案。 自定义字体训练 , 在OCR领域中,自定义字体训练是指针对特定字体或风格设计的专门训练过程。当现有OCR工具(如Tesseract)无法有效识别某种特定字体时,用户可以提供包含该字体的样本数据,利用相关算法和技术对其进行学习和训练,从而扩展OCR工具对该特定字体的识别能力。在本文中,如果Tesseract无法识别特定字体,用户可以尝试进行自定义字体训练以解决这一问题。
2023-04-18 19:54:05
392
岁月如歌-t
Tesseract
...欢迎的OCR工具,在图像文字识别领域发挥了重要作用。然而,值得注意的是,尽管Tesseract在处理常规场景下的文本识别表现出色,但在处理复杂背景、模糊字迹或特殊字体时,其准确度仍有待提高。 近年来,诸如阿里云、百度、腾讯等科技巨头都在OCR技术研发上取得突破性进展,推出了更精准高效的云端OCR服务,如阿里云的“通用印刷体识别”服务、百度大脑的OCR技术和腾讯云的智能文档识别方案等。这些服务不仅支持多语言、多场景下的文字识别,还针对特定场景如证件照、票据、表格等进行了优化,有效解决了遮挡文字、扭曲变形等问题。 此外,对于进一步提升OCR技术在复杂情况下的表现,研究者们正积极尝试结合深度学习框架如TensorFlow、PyTorch等训练自定义的OCR模型。例如,使用卷积神经网络(CNN)进行图像预处理以增强特征提取能力,或者利用循环神经网络(RNN)对识别出的文字序列进行上下文理解与纠错。 总的来说,虽然Tesseract在提取遮挡文字信息方面具有实用价值,但随着技术发展,我们有更多先进且针对性强的解决方案可以选择。在实际应用中,用户可根据具体需求和场景选择最适合的OCR工具或服务,并关注最新研究成果和技术动态,以便更好地解决实际问题并尊重知识产权。
2024-01-15 16:42:33
84
彩虹之上-t
Tesseract
...索Tesseract处理多页图像文本识别挑战的过程中,我们认识到尽管开源工具为OCR技术带来了巨大进步,但针对复杂文档结构和图像质量差异的适应性优化仍然任重道远。近期,Google AI团队持续更新和完善Tesseract引擎,以提升其对多页文档和特殊排版格式的支持。 事实上,在2021年,Tesseract发布5.0版本时引入了对PDF文档原生支持的新特性,使得用户可以直接对多页PDF进行识别,并保持页面顺序和结构的完整性。此外,研究者们也在不断尝试结合深度学习方法优化Tesseract,比如通过训练自定义模型来解决特定领域的排版和字体识别难题,显著提升了在医疗报告、历史档案等专业文档中的识别准确率。 同时,值得深入探究的是,与Tesseract协同工作的其他开源项目如Ocular、PDFMiner等也在不断迭代升级,它们在预处理图像、解析PDF结构等方面提供了有力支持,共同构建起更为完善的文档自动识别解决方案。 综上所述,OCR技术的发展日新月异,实际应用中应对多页图像文本识别挑战不仅依赖于核心工具如Tesseract的持续优化,也离不开相关领域前沿研究成果的融入以及跨技术平台的整合创新。对于开发者而言,紧跟最新动态并灵活运用这些技术和策略,将有助于更高效地解决实际业务场景下的复杂识别问题。
2024-01-12 23:14:58
121
翡翠梦境
Tesseract
如何处理Tesseract识别的错误和异常情况? 在计算机视觉与光学字符识别(OCR)领域,Tesseract作为一款开源且功能强大的工具,被广泛应用。然而,在实际使用过程中,我们可能会遇到一些识别错误或异常情况,这时如何正确地理解和处理这些问题呢?本文将带你一起深入探讨,并通过实例代码来具体展示。 1. 理解Tesseract的局限性 首先,我们需要认识到即使是Tesseract这样的优秀OCR引擎,也无法做到100%准确。其性能受到图片质量、字体样式、背景复杂度等因素的影响。所以,当遇到识别出岔子的时候,咱首先别急着满世界找解决办法,而是要先稳住心态,理解和欣然接受这个实际情况。接下来,咱就可以对症下药,要么琢磨着优化一下输入的照片,要么灵活调整一下参数设定,这样就对啦! python import pytesseract from PIL import Image 假设我们有一张较为复杂的图片需要识别 img = Image.open('complex_image.png') text = pytesseract.image_to_string(img) 如果输出的text有误,那可能是因为原始图片的质量问题 2. 图像预处理 为了提高识别准确性,对输入图像进行预处理是至关重要的一步。例如,我们可以进行灰度化、二值化、降噪、边界检测等操作。 python 对图片进行灰度化和二值化处理 img = img.convert('L').point(lambda x: 0 if x < 128 else 255, '1') 再次尝试识别 improved_text = pytesseract.image_to_string(img) 3. 调整识别参数 Tesseract提供了一系列丰富的可调参数以适应不同的场景。比如语言模型、是否启用特定字典、识别模式等。针对特定场景下的错误,可以通过调整这些参数来改善识别效果。 python 使用英语+数字的语言模型,同时启用多层识别 custom_config = r'--oem 3 --psm 6 -l eng' more_accurate_text = pytesseract.image_to_string(img, config=custom_config) 4. 结果后处理 即便进行了以上优化,识别结果仍可能出现瑕疵。这时候,我们可以灵活运用自然语言处理技术对结果进行深加工,比如纠错、分词、揪出关键词这些操作,这样一来,文本的实用性就能噌噌噌地往上提啦! python import re from nltk.corpus import words 创建一个简单的英文单词库 english_words = set(words.words()) 对识别结果进行过滤,只保留英文单词 filtered_text = ' '.join([word for word in improved_text.split() if word.lower() in english_words]) 5. 针对异常情况的处理 当Tesseract抛出异常时,应遵循常规的异常处理原则。例如,捕获Image.open()可能导致的IOError,或者pytesseract.image_to_string()可能引发的RuntimeError等。 python try: img = Image.open('nonexistent_image.png') text = pytesseract.image_to_string(img) except IOError: print("无法打开图片文件!") except RuntimeError as e: print(f"运行时错误:{e}") 总结来说,处理Tesseract的错误和异常情况是一项涉及多个层面的工作,包括理解其内在局限性、优化输入图像、调整识别参数、结果后处理以及有效应对异常。在这个过程中,耐心调试、持续学习和实践反思都是非常关键的。让我们用人类特有的情感化思考和主观能动性去驾驭这一强大的工具,让Tesseract更好地服务于我们的需求吧!
2023-07-17 18:52:17
85
海阔天空
Tesseract
...技术的不断发展,模糊图像识别领域也取得了不少突破。例如,2023年9月,一篇发表在《IEEE Transactions on Pattern Analysis and Machine Intelligence》上的论文提出了一种基于生成对抗网络(GAN)的新型模糊图像处理算法,该算法能够显著提升模糊图像的识别准确率。研究人员通过大量的训练数据,使得模型能够在保持图像真实感的同时,增强图像的清晰度和细节表现力。这一技术的应用范围广泛,不仅限于文本识别,还包括人脸识别、物体检测等多个领域。 此外,另一项值得关注的研究来自加州大学伯克利分校,研究团队开发了一种名为“DeepZoom”的深度学习框架,专门用于处理模糊图像。该框架利用多尺度卷积神经网络(CNN)来捕捉图像中的细微特征,从而在不损失图像质量的情况下,大幅提升模糊图像的识别效果。这一技术已经在医疗影像诊断中得到了初步应用,特别是在处理X光片和MRI图像时,显示出了巨大的潜力。 除了学术研究,商业界也在积极投入资源,开发适用于模糊图像处理的软件和工具。例如,Adobe公司近期推出了一款名为“Deblur AI”的插件,专门用于提升模糊图像的质量。这款插件采用了先进的机器学习算法,能够在几秒钟内自动修复模糊图像,使得图像恢复到接近原始状态的清晰度。这对于摄影师和设计师来说,无疑是一个巨大的福音。 这些最新的研究成果和技术进展,不仅展示了模糊图像识别领域的巨大潜力,也为相关行业的应用提供了更多可能性。未来,随着技术的不断成熟,我们有理由相信模糊图像识别将变得更加精准和高效。
2024-10-23 15:44:16
137
草原牧歌
Mahout
...挖掘工具包,可以用来处理大量的数据和进行复杂的计算。 在实际应用中,我们可能会遇到一些问题,比如数据量过大导致处理速度变慢,或者算法复杂度过高使得计算时间增加等。这些问题不仅仅拖慢了我们的工作效率,还可能悄无声息地让最终结果偏离靶心,变得不那么准确。那么,如何解决这些问题呢?这就需要我们了解并掌握一些优化技巧。 二、准备工作 在开始之前,我们需要先了解一下Mahout的一些基础知识。首先,你得先下载并且安装Mahout这个家伙,接下来,为了试试它的水深,咱们可以创建一个简简单单的小项目来跑跑看。这里,我推荐你使用Java作为编程语言,因为Java是Mahout的主要支持语言。 三、性能优化策略 1. 选择合适的算法 在Mahout中,有许多种不同的算法可以选择。每种算法都有其优缺点,因此选择合适的算法是非常重要的。通常来说,我们挑选算法时,就像去超市选商品那样,可以根据数据的不同“口味”——比如文本、图像、音频这些类型;还有问题的“属性”——像是分类、回归、聚类这些不同的需求;当然啦,性能要求也是咱们的重要考量因素,就像是挑水果要看新鲜度一样。 例如,如果我们正在处理大量文本数据,并且想要进行主题建模,那么我们可以选择Latent Dirichlet Allocation (LDA)算法。这是因为LDA是一种专门用于文本数据分析的主题模型算法,能够有效地从大量文本数据中提取出主题信息。 2. 数据预处理 在实际应用中,数据通常会包含很多噪声和冗余信息,这不仅会降低算法的效率,也会影响结果的准确性。因此,对数据进行预处理是非常重要的。 例如,我们可以使用Apache Commons Math库中的FastMath类来进行数值计算,以提高计算速度。同时,咱们还可以借助像Spark这类大数据处理神器,来搞分布式的计算,妥妥地应对那些海量数据。 3. 使用GPU加速 对于一些计算密集型的算法,如深度学习,我们可以考虑使用GPU进行加速。在Mahout中,有一些内置的算法可以直接使用GPU进行计算。 例如,我们可以使用Mahout的SVM(Support Vector Machine)算法,并通过添加一个后缀.gpu来启用GPU加速: java double[] labels = new double[points.size()]; labels[0] = -1; labels[1] = 1; MultiLabelClfDataModel model = new MultiLabelClfDataModel(points, labels); SVM svm = new SVM(model); svm.setNumIterations(500); svm.setMaxWeight(1.0e+8); svm.setEps(1.0e-6); svm.setNumLabels(2); svm.useGpu(); 4. 使用MapReduce 对于一些大数据集,我们可以使用MapReduce框架来进行分布式计算。在Mahout中,有一些内置的算法可以直接使用MapReduce进行计算。 例如,我们可以使用Mahout的KMeans算法,并通过添加一个后缀.mr来启用MapReduce: java Job job = Job.getInstance(conf); job.setJarByClass(KMeans.class); job.setMapperClass(MapKMeans.class); job.setReducerClass(ReduceKMeans.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(DoubleWritable.class); job.setInputFormatClass(SequenceFileInputFormat.class); job.setOutputFormatClass(SequenceFileOutputFormat.class); job.setNumReduceTasks(numClusters); job.waitForCompletion(true); 总结 以上就是我分享的一些关于如何优化Mahout算法性能的建议。总的来说,优化性能主要涉及到选择合适的算法、进行数据预处理、使用GPU加速和使用MapReduce等方面。希望这些内容能对你有所帮助。如果你还有其他问题,欢迎随时与我交流!
2023-05-04 19:49:22
129
飞鸟与鱼-t
转载文章
...圾分类-数据分析和预处理 代码结构 resnext101网络架构 垃圾分类-训练 垃圾分类-评估 垃圾分类-在线预测 1. 你是什么垃圾? 2. 告诉你,你是什么垃圾 3. 使用它告诉你,你是啥垃圾 AI垃圾分类 产品描述 如何进行垃圾分类已经成为居民生活的灵魂拷问,然而AI在垃圾分类的应用可以成为居民的得力助手。 针对目前业务需求,我们设计一款APP,来支撑我们的业务需求,主要提供文本,语音,图片分类功能。AI智能垃圾分类主要通过构建基于深度学习技术的图像分类模型,实现垃圾图片类别的精准识别重点处理图片分类问题。 采用深圳市垃圾分类标准,输出该物品属于可回收物、厨余垃圾、有害垃圾和其他垃圾分类。 垃圾分类-数据分析和预处理 整体数据探测 分析数据不同类别分布 分析图片长宽比例分布 切分数据集和验证集 数据可视化展示(可视化工具 pyecharts,seaborn,matplotlib) 代码结构 ├── data│ ├── garbage-classify-for-pytorch│ │ ├── train│ │ ├── train.txt│ │ ├── val│ │ └── val.txt│ └── garbage_label.txt├── analyzer│ ├── 01 垃圾分类_一级分类 数据分布.ipynb│ ├── 02 垃圾分类_二级分类 数据分析.ipynb│ ├── 03 数据加载以及可视化.ipynb│ ├── 03 数据预处理-缩放&裁剪&标准化.ipynb│ ├── garbage_label_40 标签生成.ipynb├── models│ ├── alexnet.py│ ├── densenet.py│ ├── inception.py│ ├── resnet.py│ ├── squeezenet.py│ └── vgg.py├── facebook│ ├── app_resnext101_WSL.py│ ├── facebookresearch_WSL-Images_resnext.ipynb│ ├── ResNeXt101_pre_trained_model.ipynb├── checkpoint│ ├── checkpoint.pth.tar│ ├── garbage_resnext101_model_9_9547_9588.pth├── utils│ ├── eval.py│ ├── json_utils.py│ ├── logger.py│ ├── misc.py│ └── utils.py├── args.py├── model.py├── transform.py├── garbage-classification-using-pytorch.py├── app_garbage.py data: 训练数据和验证数据、标签数据 checkpoint: 日志数据、模型文件、训练过程checkpoint中间数据 app_garbage.py:在线预测服务 garbage-classification-using-pytorch.py:训练模型 models:提供各种pre_trained_model ,例如:alexlet、densenet、resnet,resnext等 utils:提供各种工具类,例如;重新flask json 格式,日志工具类、效果评估 facebook: 提供facebook 分类器神奇的分类预测和数据预处理 analyzer: 数据分析和数据预处理模块 transform.py:通过pytorch 进行数据预处理 model.py: resnext101 模型集成以及调整、模型训练和验证函数封装 resnext101网络架构 pre_trained_model resnext101 网络架构原理 基于pytorch 数据处理、resnext101 模型分类预测 在线服务API 接口 垃圾分类-训练 python garbage-classification-using-pytorch.py \--model_name resnext101_32x16d \--lr 0.001 \--optimizer adam \--start_epoch 1 \--epochs 10 \--num_classes 40 model_name 模型名称 lr 学习率 optimizer 优化器 start_epoch 训练过程断点重新训练 num_classes 分类个数 垃圾分类-评估 python garbage-classification-using-pytorch.py \--model_name resnext101_32x16d \--evaluate \--resume checkpoint/checkpoint.pth.tar \--num_classes 40 model_name 模型名称 evaluate 模型评估 resume 指定checkpoint 文件路径,保存模型以及训练过程参数 垃圾分类-在线预测 python app_garbage.py \--model_name resnext101_32x16d \--resume checkpoint/garbage_resnext101_model_2_1111_4211.pth model_name 模型名称 resume 训练模型文件路径 模型预测 命令行验证和postman 方式验证 举例说明:命令行模式下预测 curl -X POST -F file=@cat.jpg http://ip:port/predict 最后,我们从0到1教大家掌握如何进行垃圾分类。通过本学习,让你彻底掌握AI图像分类技术在我们实际工作中的应用。 1. 你是什么垃圾? 2. 告诉你,你是什么垃圾 3. 使用它告诉你,你是啥垃圾 本篇文章为转载内容。原文链接:https://blog.csdn.net/shenfuli/article/details/103008003。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-02-10 23:48:11
517
转载
转载文章
...解。实际上,FFT的应用远不止于此,它在信号处理、图像处理、数据压缩等领域都有着广泛而深入的应用。 近日,在科学计算领域,《自然》杂志报道了一项利用FFT算法优化能源传输网络的研究成果。科研团队成功运用FFT分析了电网中各个节点间的电力波动情况,通过对大量实时数据进行快速卷积计算,精准预测并优化了电能分配策略,极大地提高了能源传输效率和稳定性,这再次验证了FFT在实际工程问题中的强大作用。 此外,深度学习领域的研究者也在探索如何结合FFT与卷积神经网络(CNN),以提升模型训练速度和推理效率。一项发表于《IEEE Transactions on Neural Networks and Learning Systems》的论文中,研究人员创新性地提出了一种基于FFT的卷积操作方法,可以显著减少CNN中的计算量,尤其在处理大规模图像识别任务时效果尤为明显。 总的来说,从日常生活中的情侣手环亮度调整问题到关乎国计民生的能源传输优化,再到前沿的人工智能技术突破,快速傅里叶变换始终以其独特的数学魅力和高效的计算性能发挥着关键作用。随着科学技术的发展,我们有理由相信FFT将在更多领域带来革命性的解决方案。
2023-01-20 17:51:37
524
转载
转载文章
...展,类神经网络被广泛应用于图像识别、文字辨识等领域,使得机器能够更准确地识别经过扭曲、旋转等复杂处理的验证码图片。例如,在最新的研究中,科研人员尝试将生成对抗网络(GANs)应用于验证码破解与生成,通过训练模型模拟真实用户行为,有效提升了验证码的安全阈值。 近期,一项发表在《计算机安全》期刊的研究揭示了新型动态变形验证码的设计方案,它不仅结合了随机旋转角度的方法,还引入了像素扰动、局部变形等手段,极大地增加了自动破解工具的识别难度。同时,研究人员强调了验证码设计时兼顾用户体验的重要性,提倡使用无障碍设计以方便视障人士及其他特殊群体进行验证。 此外,对于ClearType字体渲染优化问题,微软等公司也在不断探索改进方案,力求在保证验证码安全性的前提下提升显示效果,减少毛边现象,提供更为平滑清晰的文字显示。而在实际应用中,如银行、社交平台等高安全需求场景,则纷纷开始采用多模态验证码,结合图形、语音等多种方式,构建更为立体全面的安全防护体系。 总之,验证码技术的演进充分体现了AI与安全领域的交叉融合,未来将进一步发展为智能、高效且人性化的身份验证机制,持续抵御自动化攻击,保障用户的网络安全。
2023-05-27 09:38:56
249
转载
Impala
...别能力和预测能力,在图像处理、语音识别、自然语言处理等领域取得了显著成就。然而,深度学习的应用往往依赖于大量的训练数据和复杂的模型结构,这在数据量庞大的商业环境中显得尤为重要。与此同时,传统的SQL查询作为一种高效的数据检索手段,已经广泛应用于大数据分析中,但其在复杂数据分析和预测任务上的局限性日益凸显。 深度学习与SQL查询的融合 面对这一挑战,研究人员开始探索将深度学习技术与SQL查询相结合的可能性,以期在保持SQL查询高效性的同时,增强其在复杂数据分析和预测任务上的能力。这种融合不仅限于简单的集成,而是涉及到深度学习模型的构建、优化以及与SQL查询系统的无缝对接。例如,通过使用SQL查询来预处理数据,提取特征,然后将这些特征输入到深度学习模型中进行训练和预测,从而实现高效的数据分析流程。 案例分析:深度学习辅助SQL查询优化 一项研究表明,结合深度学习的SQL查询优化策略能够显著提高查询性能和响应速度。研究团队通过构建深度强化学习模型,用于预测SQL查询的执行路径和最佳执行计划,以此来减少查询执行时间。该模型通过对历史查询日志的学习,自动识别出常见的查询模式和执行瓶颈,从而动态调整查询计划,以适应不同规模和复杂性的数据集。 行业应用与展望 这一融合趋势已经在多个行业中展现出巨大潜力。例如,在金融领域,深度学习辅助的SQL查询优化可以帮助银行快速处理大量交易数据,提高风险评估的准确性和效率;在医疗健康领域,结合深度学习的SQL查询技术能够加速病例数据的分析,支持个性化治疗方案的制定。此外,随着物联网设备的普及,海量实时数据的处理成为亟待解决的问题,深度学习与SQL查询的融合有望在此领域发挥重要作用。 结论 深度学习与SQL查询的融合是数据分析领域的一大创新方向,它不仅能够提升传统SQL查询系统的性能,还能够拓宽数据分析的边界,促进人工智能与传统数据库技术的深度融合。未来,随着技术的不断进步和应用场景的拓展,这一融合趋势将为各行各业带来更加智能、高效的数据分析解决方案,推动整个社会向智能化转型。 深度学习与SQL查询的融合,不仅是技术层面的创新,更是数据分析方式的根本变革,预示着未来数据驱动型决策将成为常态,而数据分析师的角色也将因此变得更加重要。
2024-08-19 16:08:50
71
晚秋落叶
转载文章
...前言 一、数字识别的模型训练 1.下载训练集 2.对数据进行调整 2.1 将ubyte格式转为jpg格式 2.2 将图片按照标签分类到具体文件夹 2.3 数据存在的缺陷 2.4 优化建议(核心) 二、模型训练 三、项目实现 1. 代码实现 2. 采用器件 2. 注意事项 总结 前言 第一次接触OpenMV也是第一次将理论用于实践,是老师让我实现的一个小测验,这几天完成后决定写下完整的过程。本文主要是当缝合怪,借鉴和参考了其他人的代码再根据我个人设备进行了一定的调整,此外还包括了我自身实践过程中的一些小意外。 !!!一定要根据个人器件型号和个人设备来参考 一、数字识别的模型训练 1.下载训练集 研究期间,我发现大部分人以及官网教程采用的都是自己拍摄照片再进行网络训练,存在的缺陷就是数据集较小不全面、操作繁琐。个人认为如果是对标准的数字进行识别,自己手动拍取照片进行识别足够了。但想要应用于更广泛的情况,应该寻找更大的数据集,所以我找到了国外手写数字的数据集MNIST。建议四个文件都下载 数据链接:MINIST数据集 2.对数据进行调整 2.1 将ubyte格式转为jpg格式 代码参考链接:python将ubyte格式的MNIST数据集转成jpg图片格式并保存 import numpy as npimport cv2import osimport structdef trans(image, label, save):image位置,label位置和转换后的数据保存位置if 'train' in os.path.basename(image):prefix = 'train'else:prefix = 'test'labelIndex = 0imageIndex = 0i = 0lbdata = open(label, 'rb').read()magic, nums = struct.unpack_from(">II", lbdata, labelIndex)labelIndex += struct.calcsize('>II')imgdata = open(image, "rb").read()magic, nums, numRows, numColumns = struct.unpack_from('>IIII', imgdata, imageIndex)imageIndex += struct.calcsize('>IIII')for i in range(nums):label = struct.unpack_from('>B', lbdata, labelIndex)[0]labelIndex += struct.calcsize('>B')im = struct.unpack_from('>784B', imgdata, imageIndex)imageIndex += struct.calcsize('>784B')im = np.array(im, dtype='uint8')img = im.reshape(28, 28)save_name = os.path.join(save, '{}_{}_{}.jpg'.format(prefix, i, label))cv2.imwrite(save_name, img)if __name__ == '__main__':需要更改的文件路径!!!!!!此处是原始数据集位置train_images = 'C:/Users/ASUS/Desktop/train-images.idx3.ubyte'train_labels = 'C:/Users/ASUS/Desktop/train-labels.idx1.ubyte'test_images ='C:/Users/ASUS/Desktop/t10k-images.idx3.ubyte'test_labels = 'C:/Users/ASUS/Desktop/t10k-labels.idx1.ubyte'此处是我们将转化后的数据集保存的位置save_train ='C:/Users/ASUS/Desktop/MNIST/train_images/'save_test ='C:/Users/ASUS/Desktop/MNIST/test_images/'if not os.path.exists(save_train):os.makedirs(save_train)if not os.path.exists(save_test):os.makedirs(save_test)trans(test_images, test_labels, save_test)trans(train_images, train_labels, save_train) 2.2 将图片按照标签分类到具体文件夹 文章参考链接:python实现根据文件名自动分类转移至不同的文件夹 注意:为了适合这个数据集和我的win11系统对代码进行了一点调整,由于数据很多如果只需要部分数据一定要将那些数据单独放在一个文件夹。 导入库import osimport shutil 当前文件夹所在的路径,使用时需要进行修改current_path = 'C:/Users/ASUS/Desktop/MNIST/test'print('当前文件夹为:' + current_path) 读取该路径下的文件filename_list = os.listdir(current_path) 建立文件夹并且进行转移 假设原图片名称 test_001_2.jpgfor filename in filename_list:name1, name2, name3 = filename.split('_') name1 = test name2 = 001 name3 = 2.jpgname4, name5 = name3.split('.') name4 = 2 name5 = jpgif name5 == 'jpg' or name5 == 'png':try:os.mkdir(current_path+'/'+name4)print('成功建立文件夹:'+name4)except:passtry:shutil.move(current_path+'/'+filename, current_path+'/'+name4[:])print(filename+'转移成功!')except Exception as e:print('文件 %s 转移失败' % filename)print('转移错误原因:' + e)print('整理完毕!') 2.3 数据存在的缺陷 数据集内的图片数量很多,由于后面介绍的云端训练的限制,只能采用部分数据(本人采用的是1000张,大家可以自行增减数目)。 数据集为国外的数据集,很多数字写的跟我们不一样。如果想要更好的适用于我们国内的场景,可以对数据集进行手动的筛选。下面是他们写的数字2: 可以看出跟我们的不一样,不过数据集中仍然存在跟常规书写的一样的,我们需要进行人为的筛选。 2.4 优化建议(核心) 分析发现,部分数字精度不高的原因主要是国外手写很随意,我们可以通过调整网络参数(如下)、人为筛选数据(如上)、增大数据集等方式进行优化。 二、模型训练 主要参考文章:通过云端自动生成openmv的神经网络模型,进行目标检测 !!!唯一不同的点是我图像参数设置的是灰度而不是上述文章的RGB。 下面是我模型训练时的参数设置(仅供参考): 通过混淆矩阵可以看出,主要的错误在于数字2、6、8。我们可以通过查看识别错误的数字来分析可能的原因。 三、项目实现 !!!我们需要先将上述步骤中导出文件中的所有内容复制粘贴带OpenMV中自带的U盘中。然后将其中的.py文件名称改为main 1. 代码实现 本人修改后的完整代码展示如下,使用的是OpenMV IDE(官网下载): 数字识别后控制直流电机转速from pyb import Pin, Timerimport sensor, image, time, os, tf, math, random, lcd, uos, gc 根据识别的数字输出不同占比的PWM波def run(number):if inverse == True:ain1.low()ain2.high()else:ain1.high()ain2.low()ch1.pulse_width_percent(abs(number10)) 具体参数调整自行搜索sensor.reset() 初始化感光元件sensor.set_pixformat(sensor.GRAYSCALE) set_pixformat : 设置像素模式(GRAYSCALSE : 灰色; RGB565 : 彩色)sensor.set_framesize(sensor.QQVGA2) set_framesize : 设置处理图像的大小sensor.set_windowing((128, 160)) set_windowing : 设置提取区域大小sensor.skip_frames(time = 2000) skip_frames :跳过2000ms再读取图像lcd.init() 初始化lcd屏幕。inverse = False True : 电机反转 False : 电机正转ain1 = Pin('P1', Pin.OUT_PP) 引脚P1作为输出ain2 = Pin('P4', Pin.OUT_PP) 引脚P4作为输出ain1.low() P1初始化低电平ain2.low() P4初始化低电平tim = Timer(2, freq = 1000) 采用定时器2,频率为1000Hzch1 = tim.channel(4, Timer.PWM, pin = Pin('P5'), pulse_width_percent = 100) 输出通道1 配置PWM模式下的定时器(高电平有效) 端口为P5 初始占空比为100%clock = time.clock() 设置一个时钟用于追踪FPS 加载模型try:net = tf.load("trained.tflite", load_to_fb=uos.stat('trained.tflite')[6] > (gc.mem_free() - (641024)))except Exception as e:print(e)raise Exception('Failed to load "trained.tflite", did you copy the .tflite and labels.txt file onto the mass-storage device? (' + str(e) + ')') 加载标签try:labels = [line.rstrip('\n') for line in open("labels.txt")]except Exception as e:raise Exception('Failed to load "labels.txt", did you copy the .tflite and labels.txt file onto the mass-storage device? (' + str(e) + ')') 不断的进行运行while(True):clock.tick() 更新时钟img = sensor.snapshot().binary([(0,64)]) 抓取一张图像以灰度图显示lcd.display(img) 拍照并显示图像for obj in net.classify(img, min_scale=1.0, scale_mul=0.8, x_overlap=0.5, y_overlap=0.5): 初始化最大值和标签max_num = -1max_index = -1print("\nPredictions at [x=%d,y=%d,w=%d,h=%d]" % obj.rect())img.draw_rectangle(obj.rect()) 预测值和标签写成一个列表predictions_list = list(zip(labels, obj.output())) 输出各个标签的预测值,找到最大值进行输出for i in range(len(predictions_list)):print('%s 的概率为: %f' % (predictions_list[i][0], predictions_list[i][1]))if predictions_list[i][1] > max_num:max_num = predictions_list[i][1]max_index = int(predictions_list[i][0])run(max_index)print('该数字预测为:%d' % max_index)print('FPS为:', clock.fps())print('PWM波占空比为: %d%%' % (max_index10)) 2. 采用器件 使用的器件为OpenMV4 H7 Plus和L298N以及常用的直流电机。关键是找到器件的引脚图,再进行简单的连线即可。 参考文章:【L298N驱动模块学习笔记】–openmv驱动 参考文章:【openmv】原理图 引脚图 2. 注意事项 上述代码中我用到了lcd屏幕,主要是为了方便离机操作。使用过程中,OpenMV的lcd初始化时会重置端口,所有我们在输出PWM波的时候一定不要发生引脚冲突。我们可以在OpenMV官网查看lcd用到的端口: 可以看到上述用到的是P0、P2、P3、P6、P7和P8。所有我们输出PWM波时要避开这些端口。下面是OpenMV的PWM资源: 总结 本人第一次自己做东西也是第一次使用python,所以代码和项目写的都很粗糙,只是简单的识别数字控制直流电机。我也是四处借鉴修改后写下的大小,这篇文章主要是为了给那些像我一样的小白们提供一点帮助,减少大家查找资料的时间。模型的缺陷以及改进方法上述中已经说明,如果我有写错或者大家有更好的方法欢迎大家告诉我,大家一起进步! 本篇文章为转载内容。原文链接:https://blog.csdn.net/weixin_57100435/article/details/130740351。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2024-01-10 08:44:41
282
转载
转载文章
...照生成背景 2.3 图像分割算法 3.调用阿里云API进行证件照生成实例 3.1 准备工作 3.2 实验代码 3.3 实验结果与分析 参考(可供参考的链接和引用文献) 1. 作者介绍 王逸腾,男,西安工程大学电子信息学院,2022级硕士研究生 研究方向:三维手部姿态和网格估计 电子邮件:2978558373@qq.com 路治东,男,西安工程大学电子信息学院,2022级研究生,张宏伟人工智能课题组 研究方向:机器视觉与人工智能 电子邮件:2063079527@qq.com 2. 算法介绍 2.1 阿里云介绍 阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录 阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本 猿辅导、中泰证券、小米、媛福达、Soul和当贝,这些我们耳熟能详的APP或企业中,阿里云给他们提供了性能强大、安全、稳定的云产品与服务。 计算,容器,存储,网络与CDN,安全、中间件、数据库、大数据计算、人工智能与机器学习、媒体服务、企业服务与云通信、物联网、开发工具、迁移与运维管理和专有云等方面,阿里云都做的很不错。 2.2 证件照生成背景 传统做法:通常是人工进行P图,不仅费时费力,而且效果也很难保障,容易有瑕疵。 机器学习做法:通常利用边缘检测算法进行人物轮廓提取。 深度学习做法:通常使用分割算法进行人物分割。例如U-Net网络。 2.3 图像分割算法 《BiHand: Recovering Hand Mesh with Multi-stage Bisected Hourglass Networks》里的SeedNet网络是很经典的网络,它把分割任务转变成多个任务。作者的思想是:尽可能的通过多任务学习收拢语义,这样或许会分割的更好或姿态估计的更好。其实这个模型就是多阶段学习网络的一部分,作者想通过中间监督来提高网络的性能。 我提取bihand网络中的SeedNet与训练权重,进行分割结果展示如下 我是用的模型不是全程的,是第一阶段的。为了可视化出最好的效果,我把第一阶段也就是SeedNet网络的输出分别采用不同的方式可视化。 从左边数第一张图为原图,第二张图为sigmoid后利用plt.imshow(colored_mask, cmap=‘jet’)进行彩色映射。第三张图为网络输出的张量经过sigmoid后,二色分割图,阀闸值0.5。第四张为网络的直接输出,利用直接产生的张量图进行颜色映射。第五张为使用sigmoid处理张量后进行的颜色映射。第六张为使用sigmoid处理张量后进行0,1分割掩码映射。使用原模型和网络需要添加很多代码。下面为修改后的的代码: 下面为修改后的net_seedd代码: Copyright (c) Lixin YANG. All Rights Reserved.r"""Networks for heatmap estimation from RGB images using Hourglass Network"Stacked Hourglass Networks for Human Pose Estimation", Alejandro Newell, Kaiyu Yang, Jia Deng, ECCV 2016"""import numpy as npimport torchimport torch.nn as nnimport torch.nn.functional as Ffrom skimage import io,transform,utilfrom termcolor import colored, cprintfrom bihand.models.bases.bottleneck import BottleneckBlockfrom bihand.models.bases.hourglass import HourglassBisectedimport bihand.utils.func as funcimport matplotlib.pyplot as pltfrom bihand.utils import miscimport matplotlib.cm as cmdef color_mask(output_ok): 颜色映射cmap = plt.cm.get_cmap('jet') 将张量转换为numpy数组mask_array = output_ok.detach().numpy() 创建彩色图像cmap = cm.get_cmap('jet')colored_mask = cmap(mask_array)return colored_mask 可视化 plt.imshow(colored_mask, cmap='jet') plt.axis('off') plt.show()def two_color(mask_tensor): 将张量转换为numpy数组mask_array = mask_tensor.detach().numpy() 将0到1之间的值转换为二值化掩码threshold = 0.5 阈值,大于阈值的为白色,小于等于阈值的为黑色binary_mask = np.where(mask_array > threshold, 1, 0)return binary_mask 可视化 plt.imshow(binary_mask, cmap='gray') plt.axis('off') plt.show()class SeedNet(nn.Module):def __init__(self,nstacks=2,nblocks=1,njoints=21,block=BottleneckBlock,):super(SeedNet, self).__init__()self.njoints = njointsself.nstacks = nstacksself.in_planes = 64self.conv1 = nn.Conv2d(3, self.in_planes, kernel_size=7, stride=2, padding=3, bias=True)self.bn1 = nn.BatchNorm2d(self.in_planes)self.relu = nn.ReLU(inplace=True)self.maxpool = nn.MaxPool2d(2, stride=2)self.layer1 = self._make_residual(block, nblocks, self.in_planes, 2self.in_planes) current self.in_planes is 64 2 = 128self.layer2 = self._make_residual(block, nblocks, self.in_planes, 2self.in_planes) current self.in_planes is 128 2 = 256self.layer3 = self._make_residual(block, nblocks, self.in_planes, self.in_planes)ch = self.in_planes 256hg2b, res1, res2, fc1, _fc1, fc2, _fc2= [],[],[],[],[],[],[]hm, _hm, mask, _mask = [], [], [], []for i in range(nstacks): 2hg2b.append(HourglassBisected(block, nblocks, ch, depth=4))res1.append(self._make_residual(block, nblocks, ch, ch))res2.append(self._make_residual(block, nblocks, ch, ch))fc1.append(self._make_fc(ch, ch))fc2.append(self._make_fc(ch, ch))hm.append(nn.Conv2d(ch, njoints, kernel_size=1, bias=True))mask.append(nn.Conv2d(ch, 1, kernel_size=1, bias=True))if i < nstacks-1:_fc1.append(nn.Conv2d(ch, ch, kernel_size=1, bias=False))_fc2.append(nn.Conv2d(ch, ch, kernel_size=1, bias=False))_hm.append(nn.Conv2d(njoints, ch, kernel_size=1, bias=False))_mask.append(nn.Conv2d(1, ch, kernel_size=1, bias=False))self.hg2b = nn.ModuleList(hg2b) hgs: hourglass stackself.res1 = nn.ModuleList(res1)self.fc1 = nn.ModuleList(fc1)self._fc1 = nn.ModuleList(_fc1)self.res2 = nn.ModuleList(res2)self.fc2 = nn.ModuleList(fc2)self._fc2 = nn.ModuleList(_fc2)self.hm = nn.ModuleList(hm)self._hm = nn.ModuleList(_hm)self.mask = nn.ModuleList(mask)self._mask = nn.ModuleList(_mask)def _make_fc(self, in_planes, out_planes):bn = nn.BatchNorm2d(in_planes)conv = nn.Conv2d(in_planes, out_planes, kernel_size=1, bias=False)return nn.Sequential(conv, bn, self.relu)def _make_residual(self, block, nblocks, in_planes, out_planes):layers = []layers.append( block( in_planes, out_planes) )self.in_planes = out_planesfor i in range(1, nblocks):layers.append(block( self.in_planes, out_planes))return nn.Sequential(layers)def forward(self, x):l_hm, l_mask, l_enc = [], [], []x = self.conv1(x) x: (N,64,128,128)x = self.bn1(x)x = self.relu(x)x = self.layer1(x)x = self.maxpool(x) x: (N,128,64,64)x = self.layer2(x)x = self.layer3(x)for i in range(self.nstacks): 2y_1, y_2, _ = self.hg2b[i](x)y_1 = self.res1[i](y_1)y_1 = self.fc1[i](y_1)est_hm = self.hm[i](y_1)l_hm.append(est_hm)y_2 = self.res2[i](y_2)y_2 = self.fc2[i](y_2)est_mask = self.mask[i](y_2)l_mask.append(est_mask)if i < self.nstacks-1:_fc1 = self._fc1[i](y_1)_hm = self._hm[i](est_hm)_fc2 = self._fc2[i](y_2)_mask = self._mask[i](est_mask)x = x + _fc1 + _fc2 + _hm + _maskl_enc.append(x)else:l_enc.append(x + y_1 + y_2)assert len(l_hm) == self.nstacksreturn l_hm, l_mask, l_encif __name__ == '__main__':a = torch.randn(10, 3, 256, 256) SeedNetmodel = SeedNet() output1,output2,output3 = SeedNetmodel(a) print(output1,output2,output3)total_params = sum(p.numel() for p in SeedNetmodel.parameters())/1000000print("Total parameters: ", total_params)pretrained_weights_path = 'E:/bihand/released_checkpoints/ckp_seednet_all.pth.tar'img_rgb_path=r"E:\FreiHAND\training\rgb\00000153.jpg"img=io.imread(img_rgb_path)resized_img = transform.resize(img, (256, 256), anti_aliasing=True)img256=util.img_as_ubyte(resized_img)plt.imshow(resized_img)plt.axis('off') 关闭坐标轴plt.show()''' implicit HWC -> CHW, 255 -> 1 '''img1 = func.to_tensor(img256).float() 转换为张量并且进行标准化处理''' 0-mean, 1 std, [0,1] -> [-0.5, 0.5] '''img2 = func.normalize(img1, [0.5, 0.5, 0.5], [1, 1, 1])img3 = torch.unsqueeze(img2, 0)ok=img3print(img.shape)SeedNetmodel = SeedNet()misc.load_checkpoint(SeedNetmodel, pretrained_weights_path)加载权重output1, output2, output3 = SeedNetmodel(img3)mask_tensor = torch.rand(1, 64, 64)output=output2[1] 1,1,64,64output_1=output[0] 1,64,64output_ok=torch.sigmoid(output_1[0])output_real=output_1[0].detach().numpy()直接产生的张量图color_mask=color_mask(output_ok) 显示彩色分割图two_color=two_color(output_ok)显示黑白分割图see=output_ok.detach().numpy() 使用Matplotlib库显示分割掩码 plt.imshow(see, cmap='gray') plt.axis('off') plt.show() print(output1, output2, output3)images = [resized_img, color_mask, two_color,output_real,see,see]rows = 1cols = 4 创建子图并展示图像fig, axes = plt.subplots(1, 6, figsize=(30, 5)) 遍历图像列表,并在每个子图中显示图像for i, image in enumerate(images):ax = axes[i] if cols > 1 else axes 如果只有一列,则直接使用axesif i ==5:ax.imshow(image, cmap='gray')else:ax.imshow(image)ax.imshowax.axis('off') 调整子图之间的间距plt.subplots_adjust(wspace=0.1, hspace=0.1) 展示图像plt.show() 上述的代码文件是在bihand/models/net_seed.py中,全部代码链接在https://github.com/lixiny/bihand。 把bihand/models/net_seed.p中的代码修改为我提供的代码即可使用作者训练好的模型和进行各种可视化。(预训练模型根据作者代码提示下载) 3.调用阿里云API进行证件照生成实例 3.1 准备工作 1.找到接口 进入下面链接即可快速访问 link 2.购买试用包 3.查看APPcode 4.下载代码 5.参数说明 3.2 实验代码 !/usr/bin/python encoding: utf-8"""===========================证件照制作接口==========================="""import requestsimport jsonimport base64import hashlibclass Idphoto:def __init__(self, appcode, timeout=7):self.appcode = appcodeself.timeout = timeoutself.make_idphoto_url = 'https://idp2.market.alicloudapi.com/idphoto/make'self.headers = {'Authorization': 'APPCODE ' + appcode,}def get_md5_data(self, body):"""md5加密:param body_json::return:"""md5lib = hashlib.md5()md5lib.update(body.encode("utf-8"))body_md5 = md5lib.digest()body_md5 = base64.b64encode(body_md5)return body_md5def get_photo_base64(self, file_path):with open(file_path, 'rb') as fp:photo_base64 = base64.b64encode(fp.read())photo_base64 = photo_base64.decode('utf8')return photo_base64def aiseg_request(self, url, data, headers):resp = requests.post(url=url, data=data, headers=headers, timeout=self.timeout)res = {"status_code": resp.status_code}try:res["data"] = json.loads(resp.text)return resexcept Exception as e:print(e)def make_idphoto(self, file_path, bk, spec="2"):"""证件照制作接口:param file_path::param bk::param spec::return:"""photo_base64 = self.get_photo_base64(file_path)body_json = {"photo": photo_base64,"bk": bk,"with_photo_key": 1,"spec": spec,"type": "jpg"}body = json.dumps(body_json)body_md5 = self.get_md5_data(body=body)self.headers.update({'Content-MD5': body_md5})data = self.aiseg_request(url=self.make_idphoto_url, data=body, headers=self.headers)return dataif __name__ == "__main__":file_path = "图片地址"idphoto = Idphoto(appcode="你的appcode")d = idphoto.make_idphoto(file_path, "red", "2")print(d) 3.3 实验结果与分析 原图片 背景为红色生成的证件照 背景为蓝色生成的证件照 另外尝试了使用柴犬照片做实验,也生成了证件照 原图 背景为红色生成的证件照 参考(可供参考的链接和引用文献) 1.参考:BiHand: Recovering Hand Mesh with Multi-stage Bisected Hourglass Networks(BMVC2020) 论文链接:https://arxiv.org/pdf/2008.05079.pdf 本篇文章为转载内容。原文链接:https://blog.csdn.net/m0_37758063/article/details/131128967。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-07-11 23:36:51
131
转载
转载文章
...4天 Python是应用机器学习发展最快的平台之一。 在本小课程中,您将发现如何在14天内使用Python入门,建立准确的模型以及自信地完成预测建模机器学习项目。 这是重要的职位。您可能要为其添加书签。 在我的新书中,通过16个循序渐进的教程,3个项目和完整的python代码,探索如何用熊猫准备数据,使用scikit-learn拟合和评估模型,以及更多内容。 让我们开始吧。 2016年10月更新:更新了sklearn v0.18的示例。 2018年2月更新:更新Python和库版本。 2018年3月更新:增加了备用链接以下载一些数据集,因为原始文件似乎已被删除。 2019年5月更新:修复了scikit-learn最新版本的警告消息。 Dave Young的 Python机器学习迷你课程 照片,保留一些权利。 迷你课程面向谁? 在开始之前,请确保您在正确的位置。 下面的列表提供了有关本课程针对谁的一些一般指导。 如果您没有完全匹配这些点,请不要惊慌,您可能只需要在一个或另一个区域刷牙以跟上。 知道如何编写一些代码的开发人员。这意味着,一旦您了解基本语法,就可以选择像Python这样的新编程语言,这对您来说并不重要。这并不意味着您是一名向导编码员,而是可以毫不费力地遵循基本的类似于C的语言。 懂一点机器学习的开发人员。这意味着您了解机器学习的基础知识,例如交叉验证,一些算法和偏差方差折衷。这并不意味着您是机器学习博士,而是您知道地标或知道在哪里查找。 这门迷你课程既不是Python的教科书,也不是机器学习的教科书。 从一个懂一点机器学习的开发人员到一个可以使用Python生态系统获得结果的开发人员,Python生态系统是专业机器学习的新兴平台。 在Python机器学习方面需要帮助吗? 参加我为期2周的免费电子邮件课程,发现数据准备,算法等(包括代码)。 单击立即注册,并获得该课程的免费PDF电子书版本。 立即开始免费的迷你课程! 迷你课程概述 该微型课程分为14节课。 您可以每天完成一堂课(推荐),也可以在一天内完成所有课程(核心!)。这实际上取决于您有空的时间和您的热情水平。 以下是14个课程,可帮助您入门并提高使用Python进行机器学习的效率: 第1课:下载并安装Python和SciPy生态系统。 第2课:深入了解Python,NumPy,Matplotlib和Pandas。 第3课:从CSV加载数据。 第4课:了解具有描述性统计信息的数据。 第5课:通过可视化了解数据。 第6课:通过预处理数据准备建模。 第7课:使用重采样方法进行算法评估。 第8课:算法评估指标。 第9课:现场检查算法。 第10课:模型比较和选择。 第11课:通过算法调整提高准确性。 第12课:利用集合预测提高准确性。 第13课:完成并保存模型。 第14课:Hello World端到端项目。 每节课可能需要您60秒钟或最多30分钟。花点时间按照自己的进度完成课程。提出问题,甚至在以下评论中发布结果。 这些课程希望您能开始学习并做事。我会给您提示,但每节课的重点是迫使您学习从哪里寻求有关Python平台的帮助(提示,我直接在此博客上获得了所有答案,请使用搜索特征)。 在早期课程中,我确实提供了更多帮助,因为我希望您树立一些信心和惯性。 挂在那里,不要放弃! 第1课:下载并安装Python和SciPy 您必须先访问平台才能开始使用Python进行机器学习。 今天的课程很简单,您必须在计算机上下载并安装Python 3.6平台。 访问Python主页并下载适用于您的操作系统(Linux,OS X或Windows)的Python。在计算机上安装Python。您可能需要使用特定于平台的软件包管理器,例如OS X上的macports或RedHat Linux上的yum。 您还需要安装SciPy平台和scikit-learn库。我建议使用与安装Python相同的方法。 您可以使用Anaconda一次安装所有内容(更加容易)。推荐给初学者。 通过在命令行中键入“ python”来首次启动Python。 使用以下代码检查所有您需要的版本: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Python version import sys print('Python: {}'.format(sys.version)) scipy import scipy print('scipy: {}'.format(scipy.__version__)) numpy import numpy print('numpy: {}'.format(numpy.__version__)) matplotlib import matplotlib print('matplotlib: {}'.format(matplotlib.__version__)) pandas import pandas print('pandas: {}'.format(pandas.__version__)) scikit-learn import sklearn print('sklearn: {}'.format(sklearn.__version__)) 如果有任何错误,请停止。现在该修复它们了。 需要帮忙?请参阅本教程: 如何使用Anaconda设置用于机器学习和深度学习的Python环境 第2课:深入了解Python,NumPy,Matplotlib和Pandas。 您需要能够读写基本的Python脚本。 作为开发人员,您可以很快选择新的编程语言。Python区分大小写,使用哈希(#)进行注释,并使用空格指示代码块(空格很重要)。 今天的任务是在Python交互环境中练习Python编程语言的基本语法和重要的SciPy数据结构。 练习作业,在Python中使用列表和流程控制。 练习使用NumPy数组。 练习在Matplotlib中创建简单图。 练习使用Pandas Series和DataFrames。 例如,以下是创建Pandas DataFrame的简单示例。 1 2 3 4 5 6 7 8 dataframe import numpy import pandas myarray = numpy.array([[1, 2, 3], [4, 5, 6]]) rownames = ['a', 'b'] colnames = ['one', 'two', 'three'] mydataframe = pandas.DataFrame(myarray, index=rownames, columns=colnames) print(mydataframe) 第3课:从CSV加载数据 机器学习算法需要数据。您可以从CSV文件加载自己的数据,但是当您开始使用Python进行机器学习时,应该在标准机器学习数据集上进行练习。 今天课程的任务是让您轻松地将数据加载到Python中并查找和加载标准的机器学习数据集。 您可以在UCI机器学习存储库上下载和练习许多CSV格式的出色标准机器学习数据集。 练习使用标准库中的CSV.reader()将CSV文件加载到Python 中。 练习使用NumPy和numpy.loadtxt()函数加载CSV文件。 练习使用Pandas和pandas.read_csv()函数加载CSV文件。 为了让您入门,下面是一个片段,该片段将直接从UCI机器学习存储库中使用Pandas来加载Pima Indians糖尿病数据集。 1 2 3 4 5 6 Load CSV using Pandas from URL import pandas url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] data = pandas.read_csv(url, names=names) print(data.shape) 到现在为止做得很好!等一下 到目前为止有什么问题吗?在评论中提问。 第4课:使用描述性统计数据理解数据 将数据加载到Python之后,您需要能够理解它。 您越了解数据,可以构建的模型就越精确。了解数据的第一步是使用描述性统计数据。 今天,您的课程是学习如何使用描述性统计信息来理解您的数据。我建议使用Pandas DataFrame上提供的帮助程序功能。 使用head()函数了解您的数据以查看前几行。 使用shape属性查看数据的维度。 使用dtypes属性查看每个属性的数据类型。 使用describe()函数查看数据的分布。 使用corr()函数计算变量之间的成对相关性。 以下示例加载了皮马印第安人糖尿病发病数据集,并总结了每个属性的分布。 1 2 3 4 5 6 7 Statistical Summary import pandas url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] data = pandas.read_csv(url, names=names) description = data.describe() print(description) 试试看! 第5课:通过可视化了解数据 从昨天的课程继续,您必须花一些时间更好地了解您的数据。 增进对数据理解的第二种方法是使用数据可视化技术(例如,绘图)。 今天,您的课程是学习如何在Python中使用绘图来单独理解属性及其相互作用。再次,我建议使用Pandas DataFrame上提供的帮助程序功能。 使用hist()函数创建每个属性的直方图。 使用plot(kind ='box')函数创建每个属性的箱须图。 使用pandas.scatter_matrix()函数创建所有属性的成对散点图。 例如,下面的代码片段将加载糖尿病数据集并创建数据集的散点图矩阵。 1 2 3 4 5 6 7 8 9 Scatter Plot Matrix import matplotlib.pyplot as plt import pandas from pandas.plotting import scatter_matrix url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] data = pandas.read_csv(url, names=names) scatter_matrix(data) plt.show() 样本散点图矩阵 第6课:通过预处理数据准备建模 您的原始数据可能未设置为最佳建模形式。 有时您需要对数据进行预处理,以便最好地将问题的固有结构呈现给建模算法。在今天的课程中,您将使用scikit-learn提供的预处理功能。 scikit-learn库提供了两个用于转换数据的标准习语。每种变换在不同的情况下都非常有用:拟合和多重变换以及组合的拟合与变换。 您可以使用多种技术来准备数据以进行建模。例如,尝试以下一些方法 使用比例和中心选项将数值数据标准化(例如,平均值为0,标准偏差为1)。 使用范围选项将数值数据标准化(例如,范围为0-1)。 探索更高级的功能工程,例如Binarizing。 例如,下面的代码段加载了Pima Indians糖尿病发病数据集,计算了标准化数据所需的参数,然后创建了输入数据的标准化副本。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Standardize data (0 mean, 1 stdev) from sklearn.preprocessing import StandardScaler import pandas import numpy url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = pandas.read_csv(url, names=names) array = dataframe.values separate array into input and output components X = array[:,0:8] Y = array[:,8] scaler = StandardScaler().fit(X) rescaledX = scaler.transform(X) summarize transformed data numpy.set_printoptions(precision=3) print(rescaledX[0:5,:]) 第7课:使用重采样方法进行算法评估 用于训练机器学习算法的数据集称为训练数据集。用于训练算法的数据集不能用于为您提供有关新数据的模型准确性的可靠估计。这是一个大问题,因为创建模型的整个思路是对新数据进行预测。 您可以使用称为重采样方法的统计方法将训练数据集划分为子集,一些方法用于训练模型,而另一些则被保留,并用于估计看不见的数据的模型准确性。 今天课程的目标是练习使用scikit-learn中可用的不同重采样方法,例如: 将数据集分为训练集和测试集。 使用k倍交叉验证来估计算法的准确性。 使用留一法交叉验证来估计算法的准确性。 下面的代码段使用scikit-learn通过10倍交叉验证来评估Pima Indians糖尿病发作的Logistic回归算法的准确性。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Evaluate using Cross Validation from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.linear_model import LogisticRegression url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] kfold = KFold(n_splits=10, random_state=7) model = LogisticRegression(solver='liblinear') results = cross_val_score(model, X, Y, cv=kfold) print("Accuracy: %.3f%% (%.3f%%)") % (results.mean()100.0, results.std()100.0) 您获得了什么精度?在评论中让我知道。 您是否意识到这是中间点?做得好! 第8课:算法评估指标 您可以使用许多不同的指标来评估数据集上机器学习算法的技能。 您可以通过cross_validation.cross_val_score()函数在scikit-learn中指定用于测试工具的度量,默认值可用于回归和分类问题。今天课程的目标是练习使用scikit-learn软件包中可用的不同算法性能指标。 在分类问题上练习使用“准确性”和“ LogLoss”度量。 练习生成混淆矩阵和分类报告。 在回归问题上练习使用RMSE和RSquared指标。 下面的代码段演示了根据Pima Indians糖尿病发病数据计算LogLoss指标。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Cross Validation Classification LogLoss from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.linear_model import LogisticRegression url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] kfold = KFold(n_splits=10, random_state=7) model = LogisticRegression(solver='liblinear') scoring = 'neg_log_loss' results = cross_val_score(model, X, Y, cv=kfold, scoring=scoring) print("Logloss: %.3f (%.3f)") % (results.mean(), results.std()) 您得到了什么日志损失?在评论中让我知道。 第9课:抽查算法 您可能无法事先知道哪种算法对您的数据效果最好。 您必须使用反复试验的过程来发现它。我称之为现场检查算法。scikit-learn库提供了许多机器学习算法和工具的接口,以比较这些算法的估计准确性。 在本课程中,您必须练习抽查不同的机器学习算法。 对数据集进行抽查线性算法(例如线性回归,逻辑回归和线性判别分析)。 抽查数据集上的一些非线性算法(例如KNN,SVM和CART)。 抽查数据集上一些复杂的集成算法(例如随机森林和随机梯度增强)。 例如,下面的代码片段对Boston House Price数据集上的K最近邻居算法进行了抽查。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 KNN Regression from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.neighbors import KNeighborsRegressor url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/housing.data" names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV'] dataframe = read_csv(url, delim_whitespace=True, names=names) array = dataframe.values X = array[:,0:13] Y = array[:,13] kfold = KFold(n_splits=10, random_state=7) model = KNeighborsRegressor() scoring = 'neg_mean_squared_error' results = cross_val_score(model, X, Y, cv=kfold, scoring=scoring) print(results.mean()) 您得到的平方误差是什么意思?在评论中让我知道。 第10课:模型比较和选择 既然您知道了如何在数据集中检查机器学习算法,那么您需要知道如何比较不同算法的估计性能并选择最佳模型。 在今天的课程中,您将练习比较Python和scikit-learn中的机器学习算法的准确性。 在数据集上相互比较线性算法。 在数据集上相互比较非线性算法。 相互比较同一算法的不同配置。 创建比较算法的结果图。 下面的示例在皮马印第安人发病的糖尿病数据集中将Logistic回归和线性判别分析进行了比较。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Compare Algorithms from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.linear_model import LogisticRegression from sklearn.discriminant_analysis import LinearDiscriminantAnalysis load dataset url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] prepare models models = [] models.append(('LR', LogisticRegression(solver='liblinear'))) models.append(('LDA', LinearDiscriminantAnalysis())) evaluate each model in turn results = [] names = [] scoring = 'accuracy' for name, model in models: kfold = KFold(n_splits=10, random_state=7) cv_results = cross_val_score(model, X, Y, cv=kfold, scoring=scoring) results.append(cv_results) names.append(name) msg = "%s: %f (%f)" % (name, cv_results.mean(), cv_results.std()) print(msg) 哪种算法效果更好?你能做得更好吗?在评论中让我知道。 第11课:通过算法调整提高准确性 一旦找到一种或两种在数据集上表现良好的算法,您可能希望提高这些模型的性能。 提高算法性能的一种方法是将其参数调整为特定的数据集。 scikit-learn库提供了两种方法来搜索机器学习算法的参数组合。在今天的课程中,您的目标是练习每个。 使用您指定的网格搜索来调整算法的参数。 使用随机搜索调整算法的参数。 下面使用的代码段是一个示例,该示例使用网格搜索在Pima Indians糖尿病发病数据集上的Ridge回归算法。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Grid Search for Algorithm Tuning from pandas import read_csv import numpy from sklearn.linear_model import Ridge from sklearn.model_selection import GridSearchCV url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] alphas = numpy.array([1,0.1,0.01,0.001,0.0001,0]) param_grid = dict(alpha=alphas) model = Ridge() grid = GridSearchCV(estimator=model, param_grid=param_grid, cv=3) grid.fit(X, Y) print(grid.best_score_) print(grid.best_estimator_.alpha) 哪些参数取得最佳效果?你能做得更好吗?在评论中让我知道。 第12课:利用集合预测提高准确性 您可以提高模型性能的另一种方法是组合来自多个模型的预测。 一些模型提供了内置的此功能,例如用于装袋的随机森林和用于增强的随机梯度增强。可以使用另一种称为投票的合奏将来自多个不同模型的预测组合在一起。 在今天的课程中,您将练习使用合奏方法。 使用随机森林和多余树木算法练习装袋。 使用梯度增强机和AdaBoost算法练习增强合奏。 通过将来自多个模型的预测组合在一起来练习投票合奏。 下面的代码段演示了如何在Pima Indians糖尿病发病数据集上使用随机森林算法(袋装决策树集合)。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Random Forest Classification from pandas import read_csv from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score from sklearn.ensemble import RandomForestClassifier url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] num_trees = 100 max_features = 3 kfold = KFold(n_splits=10, random_state=7) model = RandomForestClassifier(n_estimators=num_trees, max_features=max_features) results = cross_val_score(model, X, Y, cv=kfold) print(results.mean()) 你能设计出更好的合奏吗?在评论中让我知道。 第13课:完成并保存模型 找到有关机器学习问题的良好模型后,您需要完成该模型。 在今天的课程中,您将练习与完成模型有关的任务。 练习使用模型对新数据(在训练和测试过程中看不到的数据)进行预测。 练习将经过训练的模型保存到文件中,然后再次加载。 例如,下面的代码片段显示了如何创建Logistic回归模型,将其保存到文件中,之后再加载它以及对看不见的数据进行预测。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 Save Model Using Pickle from pandas import read_csv from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression import pickle url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe = read_csv(url, names=names) array = dataframe.values X = array[:,0:8] Y = array[:,8] test_size = 0.33 seed = 7 X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=test_size, random_state=seed) Fit the model on 33% model = LogisticRegression(solver='liblinear') model.fit(X_train, Y_train) save the model to disk filename = 'finalized_model.sav' pickle.dump(model, open(filename, 'wb')) some time later... load the model from disk loaded_model = pickle.load(open(filename, 'rb')) result = loaded_model.score(X_test, Y_test) print(result) 第14课:Hello World端到端项目 您现在知道如何完成预测建模机器学习问题的每个任务。 在今天的课程中,您需要练习将各个部分组合在一起,并通过端到端的标准机器学习数据集进行操作。 端到端遍历虹膜数据集(机器学习的世界) 这包括以下步骤: 使用描述性统计数据和可视化了解您的数据。 预处理数据以最好地揭示问题的结构。 使用您自己的测试工具抽查多种算法。 使用算法参数调整来改善结果。 使用集成方法改善结果。 最终确定模型以备将来使用。 慢慢进行,并记录结果。 您使用什么型号?您得到了什么结果?在评论中让我知道。 结束! (看你走了多远) 你做到了。做得好! 花一点时间,回头看看你已经走了多远。 您最初对机器学习感兴趣,并强烈希望能够使用Python练习和应用机器学习。 您可能是第一次下载,安装并启动Python,并开始熟悉该语言的语法。 在许多课程中,您逐渐地,稳定地学习了预测建模机器学习项目的标准任务如何映射到Python平台上。 基于常见机器学习任务的配方,您使用Python端到端解决了第一个机器学习问题。 使用标准模板,您所收集的食谱和经验现在可以自行解决新的和不同的预测建模机器学习问题。 不要轻描淡写,您在短时间内就取得了长足的进步。 这只是您使用Python进行机器学习的起点。继续练习和发展自己的技能。 喜欢点下关注,你的关注是我写作的最大支持 本篇文章为转载内容。原文链接:https://blog.csdn.net/m0_37337849/article/details/104016531。 该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。 作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。 如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。
2023-07-11 10:04:06
92
转载
JQuery插件下载
...单易用且高度可定制的图像处理体验。Cropper不仅适用于桌面浏览器,还对触摸屏设备进行了优化支持,确保用户在各种环境下都能流畅地进行图片裁剪操作。该插件允许用户通过简单的拖拽、缩放和旋转等交互方式来精确裁剪上传或已存在的图片,同时具备放大缩小功能以确保细节调整的精准性。Cropper利用HTML5Canvas技术实现高性能渲染,确保了在不同浏览器下的兼容性和性能表现。此外,Cropper能够生成符合跨浏览器标准的数据,便于与后端服务集成,将用户裁剪后的图片内容无缝保存至服务器或者数据库中。因其强大的功能集和灵活的API设计,Cropper成为了众多Web应用中不可或缺的前端图片处理工具,广泛应用于头像上传、产品编辑、设计工具等多个场景。 点我下载 文件大小:490.55 KB 您将下载一个JQuery插件资源包,该资源包内部文件的目录结构如下: 本网站提供JQuery插件下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2023-08-08 23:21:57
310
本站
JQuery插件下载
...商务网站的商品展示、图像画廊或细节丰富的图像浏览场景下尤为适用。jZoom插件的核心优势在于其轻量化设计,不仅加载速度快,而且对浏览器资源占用少,确保了页面性能的高效稳定。此外,它具有良好的兼容性和可扩展性,使得开发者能够灵活设置放大镜的外观样式(如大小、形状等)以及功能表现,轻松实现与不同网页布局及设计风格的无缝融合。总结来说,jZoom作为一个轻巧且强大的jQuery图片放大镜插件,旨在简化开发流程,提供高质量的图片交互体验,是网页前端图像处理工具库中的一个有力补充。 点我下载 文件大小:298.07 KB 您将下载一个JQuery插件资源包,该资源包内部文件的目录结构如下: 本网站提供JQuery插件下载功能,旨在帮助广大用户在工作学习中提升效率、节约时间。 本网站的下载内容来自于互联网。如您发现任何侵犯您权益的内容,请立即告知我们,我们将迅速响应并删除相关内容。 免责声明:站内所有资源仅供个人学习研究及参考之用,严禁将这些资源应用于商业场景。 若擅自商用导致的一切后果,由使用者承担责任。
2023-12-28 10:18:31
259
本站
CSS
...一种现代化的网页布局模型,它可以简便、高效地处理复杂的网页布局问题。在本文语境下,通过给.container容器设置display:flex属性,可以使其子元素(.item图片项)根据容器空间自动调整自身尺寸并实现水平排列,从而达到轮播图横向铺满的效果。 Scroll Snap-type , 在CSS3中,Scroll Snap-type属性用于定义滚动容器内的元素在用户滚动时如何捕捉或对齐。在文中,通过为.container容器设置scroll-snap-type: x mandatory,实现了当用户滚动时,每张.item图片会强制性地沿着x轴(即水平方向)进行滚动,并且确保每次滚动停止时,某一图片能够精准对齐到容器的起始位置,以形成流畅的轮播效果。 Scroll Snap-align , 作为CSS3 Scroll Snap的一部分,scroll-snap-align属性决定了滚动容器内的子元素在滚动 snap 时的对齐方式。在本篇文章的上下文中,为.item图片项设置scroll-snap-align: start意味着每当滚动到下一个“snap点”时,当前显示的图片将会与容器的起始位置对齐,确保了在轮播过程中,每张图片都能够完整且准确地展示在整个容器宽度内,提高了用户体验和视觉效果的一致性。
2023-01-15 14:17:14
469
算法侠
站内搜索
用于搜索本网站内部文章,支持栏目切换。
推荐的热门搜索词条:
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
journalctl [-u service_name]
- 查看系统日志(适用于systemd系统)。
推荐内容
推荐本栏目内的其它文章,看看还有哪些文章让你感兴趣。
2023-04-28
2023-08-09
2023-06-18
2023-04-14
2023-02-18
2023-04-17
2024-01-11
2023-10-03
2023-09-09
2023-06-13
2023-08-07
2023-03-11
历史内容
快速导航到对应月份的历史文章列表。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"