https://api.vvhan.com/api/avatar/boy

技术博客分享

深度学习subword分词BPE

BPE:这是一种流行分词算法,可以有效的平衡词汇表大小和步数,分词采用共现性。步骤:1.准备足够大的训练语料2.确定期望的subword词表大小(超参)3.将单词拆分为字符序列并在末尾添加后缀"",这样就可以统计单词频率。比如一开始有一个l字母,现在编程l5,就说明出现了五次。停止符的意义在于表示subword是词后缀。每次合并后词表可能出现三种变化:+1:表明加入合并后的新字词,同时原来在的2个子词还保留;0:如果一个字词不是单独出现的,就被消解;

LeetCode-1447-最简分数

核心逻辑:双重循环遍历分母和分子,通过 GCD 判断互质。优化方向:欧拉函数预处理适合大规模数据,减少重复 GCD 计算。易错点:边界条件(n=1 时返回空)、分子分母范围的严格控制。适用场景当 n≤1000 时,暴力法足够高效(LeetCode 实测 n=1000 时耗时约 2ms)。当 n>10^4 时,建议使用欧拉函数优化。欧几里得算法的实际应用数论中互质的判断方法算法优化的常见思路(空间换时间)

Java数据结构第二十二期Map与Set的高效应用之道一

上面的TreeMap传给了m,m是NavigableMap类型的,而NavigableMap又继承了Map,我们再来看add方法,里面的e接收了key,PRESENT接收了value,而这个PRESENT又是一个Object类。对有n个结点的⼆叉搜索树,若每个元素查找的概率相等,则⼆叉搜索树平均查找⻓度是结点在⼆叉搜 索树的深度的函数,即结点越深,则比较次数越多。如果相等,直接返回这个结点。Map是⼀个接⼝类,该类没有继承⾃Collection,该类中存储的是结构的键值对,并且K⼀定是唯一的,不能重复。

在-JDK-1.8-的-ConcurrentHashMap-中,为什么存在两种插入方式

中,之所以对“容器为空”和“计算位置为空”采取不同的处理方式,主要是因为。,需要遍历该链表或红黑树进行替换或追加。,这就是它不同情况下采用不同方式的原因。,并不会在构造时就初始化所有桶(:当第一次插入元素时,会先判断。位置已经有元素了,可能会遇到。操作来保证线程安全的初始化。在 JDK 1.8 的。

ArcGIS-Pro-行政区划数据处理拆分与提取方法详解

本文详细介绍了如何在 ArcGIS Pro 中拆分及提取行政区划的方法,包括拆分全国省界为单个文件以及提取四川省的市界数据等具体案例。通过这些方法,用户能够根据实际需求灵活地处理行政区划数据,为后续的地理信息分析和地图制作等任务提供精准的数据支持。在实际操作中,用户应根据数据的特点和具体需求,合理选择按属性分割、按属性选择或按范围裁剪等工具和方法,以高效地完成行政区划数据的拆分与提取工作。

重生之我在学Vue-第8天-Vue-3-UI-框架Element-Plus

UI框架是提升开发效率和视觉统一性的利器,Element Plus作为Vue 3最流行的组件库之一,能让我们快速构建专业级界面。今日重点是在项目中集成Element Plus,并为任务管理系统注入现代化视觉体验。Element Plus 官方文档组件 | Element PlusVue3 官方文档传送点简介 | Vue.jsVue3 的中文官方文档学习笔记很全还有练习场,推荐去官网学习Vue 前端成仙之路_野生的程序媛的博客-CSDN博客Go 后端成神之路_野生的程序媛的博客-CSDN博客设计系统思维。