集合进阶二（Set Map Steam流）

张开发

• 2026/4/9 12:01:58 • 15 分钟阅读

分享文章

一.Set集合1.特点注意无序不是每次执行出来的结果都是不一样的-------------默认升序2.HashSet集合的底层原理基于哈希表1哈希表eg.冲突是必然的只能去降低冲突率1哈希冲突的避免1常见哈希函数设计2*负载因子调节哈希冲突的根本原因是哈希函数的设计和负载因子没有必然的 “一定冲突” 关系负载因子只影响冲突的概率。负载因子 α1 只是说明元素数量等于容量不代表新元素的哈希值一定会和已有元素的哈希值重复只是冲突的概率极高但不是 “一定”。更重要的是对于拉链式哈希桶是无限扩展的不存在 “桶满” 的情况冲突只和哈希函数有关和负载因子无关。2哈希冲突的解决1闭散列线性探测二次探测2开散列3hashcodehashCode()为对象返回一个整数哈希值用于在哈希表中快速定位对象。核心作用配合equals()一起决定对象在哈希集合中的唯一性和存储位置。哈希表通过hashCode()计算桶下标用equals()验证桶内元素是否相等大幅提升查找效率从 O(n) 降到 O(1) 平均hashCode()的 5 条核心约定一致性同一对象多次调用hashCode()必须返回相同整数前提是对象未被equals()比较的属性修改。相等性如果a.equals(b) true则a.hashCode()必须等于b.hashCode()。不等性如果a.equals(b) falsea.hashCode()不强制要求不同但尽量不同减少哈希冲突提升性能。不可变性不要用可变字段计算hashCode()否则对象修改后哈希值变化会导致哈希集合中「找不到」该对象。性能哈希值应尽量均匀分布避免大量对象哈希值相同极端情况会让哈希表退化成链表时间复杂度 O(n)。hashCode()与equals()的绑定关系只要重写了equals()就必须重写hashCode()否则违反上述约定 2导致哈希集合异常。Override public int hashCode() { // 传入参与 equals 比较的所有字段 return Objects.hash(id, name, age); }常见面试考点hashCode()和equals()的关系答equals()相等的对象hashCode()必须相等hashCode()相等的对象equals()不一定相等哈希冲突。重写equals()必须重写hashCode()。为什么重写equals()必须重写hashCode()答违反 Java 规范导致哈希集合如HashSet、HashMap无法正确识别相等对象出现逻辑错误。hashCode()可以返回固定值吗答语法上可以但会导致所有对象哈希值相同哈希表退化成链表时间复杂度 O(n)性能极差绝对不推荐。String、Integer等包装类的hashCode()是怎么实现的String用字符串内容计算哈希值缓存结果避免重复计算Integer直接返回int值本身Long返回(int)(value ^ (value 32))Double用Double.doubleToLongBits()转换后计算哈希值Objects.hash()和手动计算的区别答Objects.hash()内部会对数组做哈希计算自动处理null代码更简洁手动计算性能略高但容易出错推荐用Objects.hash()。两步定位法第一步定位桶通过hashCode()当你调用map.put(key, value)时JVM 会先调用key.hashCode()计算出一个哈希值。通过这个哈希值计算出数组下标桶的位置。目的把不同的对象分散到不同的桶里实现 “分桶”。第二步确认元素通过equals()定位到桶后如果桶里有多个元素链表 / 树结构JVM 会遍历这些元素调用key.equals(element)来逐个比对直到找到完全一致的那个。目的在同一个桶内精确锁定目标元素。扩容的时候需要注意什么扩容后也要重新哈希每个值4哈希桶完整代码// key-value 模型 public class HashBucket { private static class Node { private int key; private int value; Node next; public Node(int key, int value) { this.key key; this.value value; } } private Node[] array; private int size; // 当前的数据个数 private static final double LOAD_FACTOR 0.75; private static final int DEFAULT_SIZE 8; // 默认桶的大小 // 构造方法 public HashBucket() { array new Node[DEFAULT_SIZE]; size 0; } // 插入/更新 key-value返回旧 value不存在返回 -1 public int put(int key, int value) { // 1. 计算下标 int index key % array.length; // 保证下标非负 index index 0 ? -index : index; // 2. 遍历链表看 key 是否已经存在 Node cur array[index]; while (cur ! null) { if (cur.key key) { // key 已存在更新 value返回旧值 int oldVal cur.value; cur.value value; return oldVal; } cur cur.next; } // 3. key 不存在头插法插入新节点 Node newNode new Node(key, value); newNode.next array[index]; array[index] newNode; size; // 4. 判断是否需要扩容 if (loadFactor() LOAD_FACTOR) { resize(); } return -1; } // 扩容2倍扩容重新哈希 private void resize() { // 新数组是原来的 2 倍 Node[] newArray new Node[array.length * 2]; // 遍历每个桶 for (int i 0; i array.length; i) { Node cur array[i]; // 遍历每个节点重新计算下标插入新数组 while (cur ! null) { Node next cur.next; // 保存下一个节点 int index cur.key % newArray.length; index index 0 ? -index : index; // 头插法插入新数组 cur.next newArray[index]; newArray[index] cur; cur next; } } // 替换成新数组 array newArray; } // 获取 key 对应的 value不存在返回 -1 public int get(int key) { int index key % array.length; index index 0 ? -index : index; Node cur array[index]; while (cur ! null) { if (cur.key key) { return cur.value; } cur cur.next; } return -1; } // 计算负载因子 private double loadFactor() { return size * 1.0 / array.length; } }5只出现一次的数字class Solution { public int singleNumber(int[] nums) { HashSetInteger hashsetnew HashSet(); //使集合中的数字都只出现一次 for(int i0;inums.length;i){ if(!hashset.contains(nums[i])){ hashset.add(nums[i]); }else{ hashset.remove(nums[i]); } } //判断哪个是集合中的数字 for(int i0;inums.length;i){ if(hashset.contains(nums[i])){ return nums[i]; } } return -1; } }6宝石与石头public int numJewelsInStones(String jewels, String stones) { HashSetCharacter hashsetnew HashSet(); //将所有的宝石放进hashset集合 for(int i0;ijewels.length;i){ char chjewels.charAt(i); hashset.add(ch); } //遍历stones 寻找在宝石集合的元素 int count0; for(int i0;istones.length;i){ char chstones.charAt(i); if(hashset.contains(ch)){ count; } } return count; }7随机链表的复制第一次遍历第二次遍历class Solution { public Node copyRandomList(Node head) { if(headnull){ return null; } HashMapNode,Node hashmapnew HashMap(); //第一次遍历 Node curhead; while(cur!null){ Node newNodenew Node(cur.val); hashmap.put(cur,newNode); curcur.next; } //修改next和random的值 curhead; while(cur!null){ hashmap.get(cur).nexthashmap.get(cur.next); hashmap.get(cur).randomhashmap.get(cur.random); curcur.next; } return hashmap.get(head); } }8坏键盘打字public static void main(String[] args) { Scanner scanner new Scanner(System.in); // 1. 读取输入期望字符串、实际字符串 String expected scanner.nextLine(); String actual scanner.nextLine(); // 2. 构建好键集合实际出现的字符统一转大写去重 SetCharacter goodKeys new HashSet(); for (char c : actual.toCharArray()) { // 字母转大写其他字符数字、下划线保持不变 char upperC Character.toUpperCase(c); goodKeys.add(upperC); } // 3. 遍历期望字符串找坏键按发现顺序去重 SetCharacter printed new HashSet(); // 记录已经输出过的坏键 StringBuilder result new StringBuilder(); for (char c : expected.toCharArray()) { char upperC Character.toUpperCase(c); // 条件不在好键集合且未输出过 → 是坏键 if (!goodKeys.contains(upperC) !printed.contains(upperC)) { result.append(upperC); printed.add(upperC); // 标记为已输出避免重复 } } // 4. 输出结果 System.out.println(result); }2底层原理{占满12个就会扩容至原数组的两倍}---------------------------------------------------------------------------------------------------------------------------直接在生成里面选择3.LinkedHashSet集合的底层原理基于哈希表双链表4.TreeSet集合基于红黑树法一法二二.Map集合1.概述发现重复的键后面的数据会覆盖前面的2.常用方法注意类型也要准确Set集合无序不重复Collection集合包含list有序可重复Set无序不可重复queue队列通常可重复倒入的元素会覆盖原有的元素(相同时3.遍历方法1.键找值2.键值对其中增强for循环元素类型就是map.entry类型ctrlaltv 自动补全为3.Lambda表达式4.Map集合案例-统计投票人数5.HashMap键相同的时候才是新的覆盖旧的这里是不同的键计算得到了相同的哈希值Map 只比较 key不比较 value1. 计算 key.hashCode() → 找到数组下标2. 去到对应位置遍历链表/红黑树3. 对每个节点的 key 调用 key.equals(要找的key)4. 若返回 true → 认为是同一个key → 覆盖value5. 若返回 false → 继续找 / 新增节点发现前两个蜘蛛精都出现了要想去重在学生类中重写equalsand hashcode方法自带重写的方法6.LinkedHashMap7.TreeMap同时重写了equals和hashcode或者8.集合的嵌套-案例省和市使用Collections工具类调用addAll而不用具体实现类ArrayList面向接口编程通过使用Collections.addAll()或接口方法代码不依赖于具体的实现类如ArrayList而是依赖于更高级的接口如List或Collection。这使得代码更加通用可以轻松地切换不同的实现类例如从ArrayList切换到LinkedList而无需修改依赖这些接口的代码。如果需要操作集合优先考虑Collections工具类而不是直接调用具体实现类的方法。三.Steam流1.认识Stream--原始方法结合lambda表达式这两个lambda表达式也可以用合并一个(像淡黄色行代码可以set.stream后点击CtrlAltv自动补全由于直接调用steam方法是Collection提供的 Map不支持所以可以就键值键值对而言也可以连续调用方法2.Stream的常用方法1.Steam流常见的中间方法比较器比较小数时需要使用Double.compare(double a, double b)的方法来避免浮点数比较的陷阱Double.compare(double a, double b)的返回值负整数如果a小于b。零如果a等于b。正整数如果a大于b此处map函数相当于将Student对象全部映射成其名字当需要合并的两个steam流类型不一样时则allst的类型为Object。2.Steam流常见的终结方法用get方法得到最终结果max()方法返回的是一个OptionalT对象而不是直接返回流中的元素 get()是Optional的方法用于直接提取值但如果流为空会抛出异常。

更多文章

前端开发 2026/4/9 11:57:19

基于深度学习的动物姿态行为识别动物关键点识别 YOLO11动物姿态估计与姿态检测牛马狗猫39关键点检测(代码+模型+数据集+gui界面)

YOLO11动物姿态估计：牛马狗猫39关键点检测在计算机视觉领域，动物姿态估计是一个具有挑战性的任务，涉及到通过图像或视频识别和定位动物身体的各个关键点。随着深度学习技术的发展，基于卷积神经网络（CNN）的…

Phi-3-Mini-128K服务器运维实战：利用Linux命令进行模型服务监控与日志管理把AI模型部署到服务器上，看着它跑起来，这只是万里长征第一步。真正考验人的，是模型上线之后——它跑得稳不稳？资源吃得凶不凶？出…

张开发

前端开发 2026/4/9 11:37:41

终极WWDC学习方案：如何利用开源笔记库提升开发技能

终极WWDC学习方案：如何利用开源笔记库提升开发技能【免费下载链接】WWDC You dont have the time to watch all the WWDC session videos yourself? No problem me and many contributors extracted the gist for you 🥳 项目地址: https://gitcode.…

张开发

集合进阶二（Set Map Steam流）

最新文章

基于C++实现的（控制台）酒店管理系统

开源工具猫抓：你的浏览器资源侦探，如何让视频音频下载不再求人？

从「投稿难」到「录用快」：Paperxie 期刊论文智能写作，解锁学术发表新效率

GitHub 25k Star！这款开源录屏工具，免费无水印可商用，彻底告别付费

【智能方案】彻底解决B站视频本地化难题：开源BilibiliDown实战决策指南

终极指南：如何用PoeCharm中文版轻松规划你的《流放之路》角色构建

推荐文章

OpenClaw云端集成Skill流程：2026年部署、配置大模型百炼APIKey、接入钉钉/QQ/飞书/微信

Python flask django高校餐饮档口管理系统的设计与实现

超实用指南：3步打造可移植版waifu2x-caffe

Go语言的JSON处理技巧

2025届毕业生推荐的AI科研平台推荐榜单

前端性能监控吐槽：别再让你的网站慢得像蜗牛！

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

基于深度学习的动物姿态行为识别动物关键点识别 YOLO11动物姿态估计与姿态检测牛马狗猫39关键点检测(代码+模型+数据集+gui界面)

wvp-GB28181-pro企业级部署与高可用架构实践指南

终极Min浏览器标签页预览指南：提升多任务处理效率的10个实用技巧

需求澄清的艺术：测试工程师的防反复指南

StructBERT文本相似度WebUI实操手册：从健康检查到日志排查全流程

Wan2.1 VAE创意作品展：基于提示词工程生成的超现实主义图集

5步构建：如何通过OpenProject API实现工作流自动化

Competitive Companion实战指南：高效解析算法竞赛题目的浏览器扩展

7805和7812参数对比

GLM-OCR环境部署避坑指南：Anaconda虚拟环境配置详解

Phi-3-Mini-128K服务器运维实战：利用Linux命令进行模型服务监控与日志管理

终极WWDC学习方案：如何利用开源笔记库提升开发技能

集合进阶二 （Set Map Steam流）

最新文章

基于C++实现的（控制台）酒店管理系统

开源工具猫抓：你的浏览器资源侦探，如何让视频音频下载不再求人？

从「投稿难」到「录用快」：Paperxie 期刊论文智能写作，解锁学术发表新效率

GitHub 25k Star！这款开源录屏工具，免费无水印可商用，彻底告别付费

【智能方案】彻底解决B站视频本地化难题：开源BilibiliDown实战决策指南

终极指南：如何用PoeCharm中文版轻松规划你的《流放之路》角色构建

推荐文章

OpenClaw云端集成Skill流程：2026年部署、配置大模型百炼APIKey、接入钉钉/QQ/飞书/微信

Python flask django高校餐饮档口管理系统的设计与实现

超实用指南：3步打造可移植版waifu2x-caffe

Go语言的JSON处理技巧

2025届毕业生推荐的AI科研平台推荐榜单

前端性能监控吐槽：别再让你的网站慢得像蜗牛！

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台 植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

集合进阶二（Set Map Steam流）

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统