https://api.vvhan.com/api/avatar/boy

技术博客分享

SMOTE过采样实现过程详解

摘要:SMOTE是一种处理类别不平衡的方法,通过在少数类样本间插值生成新样本。代码oversampler=SMOTE(random_state=0)初始化SMOTE,设置随机种子保证结果可复现;fit_resample()方法分析类别分布后,为每个少数类样本找到k近邻并生成合成样本,最终合并返回平衡数据集。SMOTE避免简单复制导致的过拟合,但可能产生噪声样本,建议结合数据探索和参数调整使用。

功能强大的PDF工具箱-PDF补丁丁,v1.1.0.4657新版本,免费无广告,开箱即用版

PDF补丁丁是一款功能强大的免费PDF工具箱,最新版本v1.1.0.4657提供便携版。该软件支持文本编辑(修改字体、颜色等属性)、图像编辑(替换、优化图片)、页面调整(大小、方向、边距)、安全保护(密码、数字签名)等功能,并具有批量处理多文件和强兼容性(支持PDF 1.0-2.0版本)的特点。提供多个下载渠道,包括迅雷、夸克和UC网盘。

Elasticsearch精准匹配与全文检索对比

Elasticsearch中精准匹配(Term Query)和全文检索(Match Query)是两种核心查询方式,主要区别在于:精准匹配直接匹配原始值,不分词,适合精确查找ID、状态等;全文检索会先分词再匹配,采用TF-IDF算法计算相关性,适合自然语言文本搜索。精准匹配对大小写敏感,全文检索可控制匹配逻辑。典型应用场景包括:精准匹配用于筛选特定类目或IP,全文检索用于商品描述或日志内容搜索。使用时需注意字段类型和分词规则,避免误用。两者可组合使用,如先用精准匹配过滤,再用全文检索排序,以实现高效检索。

从零开始的-Docker-之旅

REPOSITORY 和 TAG 标签 均为<none> 的镜像被称为虚悬镜像,一般来说,虚悬镜像已经失去了存在的价值,是可以随意删除的。造成虚悬镜像的原因:原因一:原本有镜像名和标签的镜像,发布了新版本后,重新 docker pull *** 时,旧的镜像名被转移到了新下载的镜像身上,而旧的镜像上的这个名称则被取消;原因二:docker build 同样可以导致这种现象。

Apache-Shiro基本使用指南

在Java Web开发中,安全框架的选择一直是开发者关注的重点。Spring Security功能强大但配置复杂,而Apache Shiro则以其简单易用、功能完整而受到广大开发者的喜爱。今天我们就来详细了解Shiro的基本使用,看看如何快速上手这个优秀的安全框架。Apache Shiro是一个功能强大且易于使用的Java安全框架,它可以帮助我们完成认证、授权、加密、缓存和会话管理等安全相关的功能。在实际项目中,我们通常需要从数据库获取用户信息,这时就需要自定义Realm。/**

python中生成器

1. 调用read_file_by_line时候,函数不会立即执行,而是返回一个生成器对象,此时文件一行都没读。3. 生成器函数从上次暂停的yield处继续执行,读取文件的下一行,yield返回这行数据,然后立即暂停。它不会一次性把所有数据都计算出来并存储在内存中,而是“需要的时候才计算,每次只给你一个”。列表会尝试将所有文件内容加载到内存中,如果文件极大,会消耗巨量内存甚至导致程序崩溃。生成器是根据算法生成数据的一种机制,每次调用生成器只生成一个值,可以节省大量内存。生成器的核心思想是​。

PortSwigger靶场之Blind-SQL-injection-with-out-of-band-interaction通关秘籍

本文分析了实验室存在的盲SQL注入漏洞,重点介绍了带外SQL注入技术。文章首先概述了SQL注入的三种主要类型:带内注入、推断注入和带外注入,并详细说明了通过DNS请求实现带外注入的原理。针对不同数据库系统(Oracle、SQLServer、PostgreSQL、MySQL),提供了具体的注入语句示例,解释其工作机制。最后分享了在Oracle数据库上的实际测试过程,成功利用EXTRACTVALUE函数触发DNS查询完成漏洞验证。文章为学习高级SQL注入技术提供了实用参考。