第一个微调训练模型
🚀 从 0 到 1:基于 QLoRA 微调你的第一个考试题库 AI 专家 本教程记录了如何利用轻量级的 Qwen1.5-1.8B-Chat 模型和 QLoRA 技术,在有限的 GPU 资源(如 6GB 显存的 RTX 3060 Laptop)上,成功微调出一个能够精确、专业地回答特定领域题库的 AI 专家。 🎯 一、项目目标与技术选型1. 目标将一个通用的大型语言模型(LLM)定制化,使其能够像专业的教师或题库系统一样,以结构化、高准确率的方式回答我们提供的 几千道特定领域的考试题目。 2. 技术选型 基础模型 (Base Model): Qwen/Qwen1.5-1.8B-Chat。 原因: 体积小(18亿参数),对 VRAM 友好;基于 Qwen 结构,中文处理能力强,同时支持 Chat 功能。 微调方法 (Fine-tuning): QLoRA (Quantized Low-Rank Adaptation)。 原因: 在 4-bit 量化模型上进行 LoRA 训练,极大地降低了 VRAM 占用,使 6GB 显存的 GPU 也能进行训练。 🛠️ ...
图片分析工具
众所周知,我不太喜欢起那么惊天动地的标题,所以若是你看到了这个页面,那你就看到了一个非常有用的工具。 这是一个用于图像标注和分析的 Python 脚本的详细分析,该脚本名为 image_annotator_ollama_fixed_v2.py。它是一个使用 PyQt6 构建的图形用户界面(GUI)工具,核心功能是利用本地运行的 Ollama 平台上的 llava:13b 视觉-语言模型来批量分析图像,并支持结果的存储、搜索、统计和多语言翻译。 🎨 图像分析工具:image_annotator_ollama_fixed_v2.py 深度解析这个 Python 脚本是一个功能强大的、高度本地化的图像批处理工具。它巧妙地结合了最新的本地 AI 模型(Ollama/LLaVA)、稳健的并发处理和用户友好的 GUI 界面,实现了图片分析的全程离线操作。 🌟 核心特性概览 真正的离线 AI (True Local AI): 所有图像分析请求都通过 localhost:11434 发送给本地运行的 Ollama 服务,确保数据安全和离线可用性。 并发处理优化: 使用 线程...
Java并发
✅AQS的同步队列和条件队列原理?典型回答同步队列和条件队列是AQS中的两种不同队列,同步队列主要用于实现锁机制,而条件队列用于线程间的协调和通信。(本文代码为经典的JDK 1.8) 同步队列同步队列主要用于实现锁的获取和释放。如我们常用的ReentrantLock,就是基于同步队列来实现的。 我们在介绍AQS的时候介绍过,它是一个FIFO队列,节点类型为AQS内部的Node类。当一个线程尝试获取锁失败时,它会被封装成一个Node节点加入到队列的尾部(每个节点(Node)代表一个等待的线程)。当锁被释放时,头节点的线程会被唤醒,尝试再次获取锁。 12345678910static final class Node { // 前驱和后继节点,构成双向链表 Node prev; Node next; // 线程本身 Thread thread; // 状态信息,表示节点在同步队列中的等待状态 int waitStatus; // ...} 同步的队列的实现原理比较简单: 当一个线程尝试获取锁并失败时,AQS会...
关于某能公司的培训局/About a Training Scam by a Certain Neng Company
📢 About a Training Scam by a Certain Neng CompanyTitle: An extremely detailed and thought-provoking experience. What I encountered is a typical scheme that uses “internship” or “recruitment” as a pretext for “high-priced training.” 🧐 Experience Summary and Structure LayoutTitle: Student Job Search & Internship Experience: Uncovering the Training Trap Behind “High-Paying Internships” Structural Module Title/Key Point Content Extraction and Refinement I. Background Job Search St...
全栈开发面试总结
JavaScript js的数组遍历类:forEach、map、filter、reduce都有何区别 简短回答: forEach - 只遍历,不返回新数组 map - 遍历并返回新数组(一一对应) filter - 过滤元素,返回符合条件的子数组 reduce - 累积计算,返回单个汇总值 一句话总结: forEach:单纯遍历 map:变换数组 filter:筛选数组 reduce:聚合数组举例说明: 123456789101112131415161718const numbers = [1, 2, 3, 4, 5];// 1. forEach - 只遍历,不返回numbers.forEach(num => console.log(num * 2));// 输出:2, 4, 6, 8, 10// 返回:undefined// 2. map - 返回新数组(一一对应)const doubled = numbers.map(num => num * 2);// doubled: [2, 4, 6, 8, 10]// 3. filter - 返回符合条件的...
Java基础面试-2
✅泛型中上下界限定符extends 和 super有什么区别?典型回答extends <? extends T> 表示类型的上界,表示参数化类型的可能是T 或是 T的子类 123456// 定义一个泛型方法,接受任何继承自Number的类型public <T extends Number> void processNumber(T number) { // 在这个方法中,可以安全地调用Number的方法 double value = number.doubleValue(); // 其他操作...} 举个例子,假设我们有一个基本类 Animal 和两个子类 Dog 和 Cat: 1234567891011class Animal { public void makeSound() {}}class Dog extends Animal { public void bark() {}}class Cat extends An...
Java基础面试
✅Arrays.sort是使用什么排序算法实现的?典型回答Arrays.sort是Java中提供的对数组进行排序的方法,根据参数类型不同,它提供了很多重载方法: 1234public static void sort(Object[] a) ;public static void sort(byte[] a)public static void sort(float[] a)public static void sort(int[] a) 而针对不同的参数类型,采用的算法也不尽相同,首先,对于比较常见的基本数据类型(如int、double、char等)的数组,就是采用JDK 1.7中引入的**“双轴快速排序”(Dual-Pivot QuickSort)**: 123public static void sort(int[] a) { DualPivotQuicksort.sort(a, 0, a.length - 1, null, 0, 0);} 这里的DualPivotQuicksort.sort就是双轴快速排序的具体实现。 双轴快速排序是对...
育能科技试岗学习日志
📅 实习周报:2025年10月27日 - 2025年10月31日 🏢 公司背景速览 属性 内容 公司名称 辽宁育能科技有限公司 领域 信息传输、软件和信息技术服务业 规模 少于50人 地址 辽宁省沈阳市浑南区金科街7-3号303室 ✨ 单位简介:数字人才生态的构建者辽宁育能科技有限公司是一家致力于构建政、产、学、研、用一体化数字人才发展生态的高科技企业。公司拥有完备的基础设施,包括 7 个现代化培训教室、大型赛事中心和辽宁省最大的国际VUE考试中心,具备承接大型活动和国际认证考试的能力。 公司正积极发挥辽宁在产业数字化和数字产业化方面的优势,投资建设了数字人才基地,计划打造面向数字经济领域的 7 大实训板块,旨在成为一流的数字人才全流程孵化高地,以解决传统行业和新兴产业对复合型高素质人才的需求,助力“数字辽宁、智造强省”战略。 在业务拓展方面,公司聚焦“数字人才”和“产教融合”模式,计划培养一批“数字工匠”。在对外合作方面,辽宁育能已与华为(取得授权培训中心称号)、中天科技集团、金蝶云公司等行业巨头建立了合作关系,共同进行人才培养、专业共建、实训课程...
中英起名
“文化气质、自由理想、不随波逐流、独立意识、不颓废、积极向上、游历世界” 文心·古意(取自古文言词语,蕴含书卷气) 风月·天光(自然意象,带有诗性与哲思) 山海·行旅(自由、漂泊与理想主义) 琢玉·心志(精神修养与自我超越) 星尘·远航(未来主义、浪漫与宇宙感) 一、文心·古意(典出文言,气质典雅) 中文名 含义 英文名 昭质 光明本质 Lysander 清砚 如清水之砚,心明如镜 Lucien 宸羲 天光与智慧 Aurelian 靖修 安定而自修 Silvan 允恒 坚定诚实 Ethaniel 泽宸 恩泽天下 Adrian 琢言 言辞如玉,温润有度 Evander 瑾瑜 君子之德 Julian 玄尘 超然尘外 Alaric 沐岑 清净如山 Elias 子寰 心怀天下 Theon 昶渊 长久而深远 Orion 文岚 如风中之墨香 Lucius 书晗 晨光映书 Cedric 翯言 高洁之语(翯:洁白) Lior 令璟 明德之光 Arlen 容渊 内敛如潭 Nathaniel 昀和 日光与和气 So...
Ubuntu24可以做的事情
“Kubuntu 24 完整玩法清单” 活动类别(开发/娱乐/创作/系统优化等) 具体玩法 难度(低/中/高) 资源消耗(低/中/高) 硬件利用率(CPU/GPU/内存/存储) 所需软件/工具 活动类别 具体玩法 难度 资源消耗 硬件利用率 所需软件/工具 系统管理 KDE Plasma/Hyprland 深度定制主题、图标、窗口动画 中 低 CPU低 / GPU低 KDE System Settings, Latte Dock, KWin Scripts 系统优化 监控 CPU/GPU/内存、优化功耗 中 中 CPU中 / GPU中 KSysGuard, htop, glances, nvidia-smi 自动化 Bash/Python 脚本自动化日常任务 中 低 CPU低 Bash, Python, Cron, systemd 开发环境搭建 Java/Python...
UML类图存储与转换分析报告
UML图有很多种,但是并非必须掌握所有的UML图,才能完整系统分析和设计工作。一般说来,在UML图中,只要掌握类图、用例图、时序图的使用,就能完成大部分的工作。也就是说,掌握UML的20%,就能做80%的事情。 类图中具体类、抽象、接口和包的表示法UML类图中具体类、抽象类、接口和包有不同的表示方法。 1)在UML类图中表示具体类具体类在类图中用矩形框表示,矩形框分为三层:第一层是类名字。第二层是类的成员变量;第三层是类的方法。成员变量以及方法前的访问修饰符用符号来表示: “+”表示 public;“-”表示 private;“#”表示 protected;不带符号表示 default。 2)在UML类图中表示抽象类抽象类在UML类图中同样用矩形框表示,但是抽象类的类名以及抽象方法的名字都用斜体字表示,如图2所示。 3)在UML类图中表示接口接口在类图中也是用矩形框表示,但是与类的表示法不同的是,接口在类图中的第一层顶端用构造型 <>表示,下面是接口的名字,第二层是方法,如图3所示。此外,接口还有另一种表示法,俗称棒棒糖表示法,就是类上面的一根棒棒糖(圆圈+实线)。...
KUbuntu24睡眠后掉帧的问题分析
前情提要 我的Kubuntu24在使用一段时间后165hz的刷新率会掉帧到很低,就是明显的感觉到页面动画卡顿,除了我经常使用sleep休眠以外,没有关过机以外,没什么其他的操作,反而是我重启后掉帧就消失了,所以我来分析一下原因。 🧩 一、问题特征总结 描述的情况: 165Hz 高刷屏幕 使用 Kubuntu 24(基于 KDE Plasma 6) RTX 3060(NVIDIA)独显 经常使用 Sleep/休眠,几乎不关机 一段时间后页面动画掉帧、系统卡顿明显 重启后恢复正常 这说明:✅ 并非 CPU 或内存泄漏问题(重启能恢复)❌ 很可能是 GPU 驱动或桌面合成器(KWin)状态异常。 ⚙️ 二、可能的原因(从高到低概率)1️⃣ NVIDIA 驱动的功耗管理 Bug(最常见) NVIDIA 的 Linux 驱动在高刷显示器和动态功耗切换(PowerMizer)时,常出现 GPU 频率锁定过低的问题。 症状: 正常时 GPU core clock 能上 1000MHz+,掉帧时锁定在 210MHz 或 405MHz。 这通常在休眠恢复后最容易出现。 2...
Vmware-Exsi笔记本运行可行性报告
前情提要 Vmware Exsi,可以安装在物理机上的虚拟机系统,可以在此基础上虚拟化很多子虚拟机,所以我想在我的Dell G15上安装,然后安装win+linux虚拟机,这样就可以无缝实现双系统或者多系统切换了,但是我现在有几个可行性的问题需要了解,1.exsi是否支持win上的休眠功能,可以保证在没有外接电源的情况下挂载内存关机,2.exsi是否免费使用,3.exsi是否支持我的想法以及有哪些平替软件。所以我在这里做一个详细的可行性报告 可行性报告 — Dell G15(i7-12700H / 32GB / 1TB / RTX3060)上用 VMware ESXi 做多系统虚拟化的可行性与替代方案结论 ESXi 本身不建议也不可靠地作为笔记本的“休眠主机”来实现断电/断电池时自动把内存挂起保留状态。 虽然 ESXi 有 “suspend VM”(将单个 VM 的内存状态写到磁盘) 和某些版本的 “suspend to memory” 功能用于特定维护场景,但 把整台笔记本主机(运行 ESXi)在无外接电源时进入休眠/挂起并...
常用浏览器对比
常见浏览器比较报告 — Chrome / Brave / Firefox / Tor Browser(详尽对比:安全、隐私、易用性、目标用户等)下面把四款常见浏览器按关键维度做系统性对比——并给出适用人群与实用建议。结论基于官方说明与近期权威综述(引用见文末)。我先给一个快速概览表,再逐项拆解重点与实操建议。 维度 / 浏览器 Google Chrome Brave Mozilla Firefox Tor Browser 默认安全性(沙箱、网站隔离、恶意检测) ★★★★★(强)。沙箱、站点隔离、钓鱼/恶意检测等官方强化。(safety.google) ★★★★☆(良好) — 基于Chromium,继承许多安全特性,同时默认屏蔽追踪。(Brave) ★★★★☆(良好) — 主动推送安全功能(HTTPS-only、DoH 等);更新频繁。(Mozilla 支持) ★★★☆☆(专注匿名) — 安全性强,但为匿名路由流量可能牺牲某些浏览器层面的性能/功能。(privacytools.io) 隐私保护(默认追踪阻断...
微信聊天记录提取与模型训练
前情提要 我计划把微信聊天记录导出来,然后想训练一个模型,根据我的DellG15 5520 32G+1T RTX3060 6G的设备上能够训练那种模型呢?以及我如何拿聊天记录制作一个分析总结. 导出的JSON,CSV等格式的数据可以用来训练大语言模型,已经有网友成功利用自己的聊天记录训练chatglm3,做出一个数字化的自己. 🧩 一、我的硬件能训练什么模型? 模型类型 参数规模 是否可在你电脑上训练 说明 Embedding / 分类模型 <100M ✅ 轻松 可用于情感分析、关键词提取、话题分类 微调 LoRA 小型语言模型 1B~7B ⚠️ 可行(推荐 3B~6B) 通过LoRA、QLoRA、PEFT等低显存微调技术 全参数训练(from scratch) >1B ❌ 不现实 训练成本太高,显存不足 ChatGLM3-6B / Qwen1.5-4B / Gemma-2B 等微调 2B~6B ✅ 适合 可以基于你微信聊天数据微调,做“数字化自己” Embedding + RAG 检索增强生成(不训练) —...
第一章-白月光与汉堡包
第一章 白月光与汉堡包1九月的沈城,空气里还残留着夏日最后的溽热,但早晚已透出初秋的清爽。林晚星坐在驶向沈阳工业大学的动车上,窗外的景物飞速向后掠去,如同她此刻难以捕捉的心绪。她刚刚结束了专升本的漫长征程,如愿考入了这所理想的大学,开启人生的新篇章。本该是纯粹的喜悦与期待,可心底某个角落,总有一丝若有若无的惘然,像窗玻璃上呵出的白气,清晰片刻,又迅速模糊。 她低头,打开随身携带的帆布包,里面除了一本村上春树的《挪威的森林》,还有一个用干净手帕仔细包好的汉堡。这习惯是什么时候开始的?好像就是从那个暑假,和他——陈序——正式在一起之后。他总笑她,说是“汉堡爱好者晚期”,她却理直气壮:“汉堡多好啊,层次丰富,一口下去,面包的软、肉排的香、蔬菜的脆,全都有了,是很有幸福感的东西。” 想到陈序,林晚星的嘴角不自觉微微上扬。那个高高瘦瘦,眉眼干净,带着几分少年特有的清冽和笨拙的男孩。他们的重逢,始于高中毕业两年后一次极其普通的同学群里的寒暄,然后顺理成章地加了微信,从“老同学,最近怎么样?”开始,到分享日常的琐碎,再到某个深夜,隔着屏幕,谁先捅破了那层暧昧的窗户纸……一切都自然得像是早已写好...
