参考资料:Qwen3-8B-LoRA 及 SwanLab 可视化记录 需要下载资料:https://github.com/datawhalechina/self-llm/blob/master/dataset/huanhuan.json 环境配置 # 换清华镜像源 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/s…
Leave a Comment分类: AIGC
一份面向实战的 Claude 提示工程学习笔记。涵盖基础结构、角色设定、变量模板、输出格式化、思维链、Few-shot、降低幻觉、复杂提示编排,以及提示链、工具调用与检索增强等进阶主题。 0. 教程使用指南 使用 Messages API(推荐)进行对话,基本参数:model、max_tokens、messages,可选:system、temperature。 建议设置 temperature=0…
Leave a Comment你是否也遇到了这样的困境:满怀信心地搭建了一个基于ChromaDB的向量数据库,将宝贵的企业内部知识文档灌入其中,期望它能成为一个智能的“企业大脑”。然而,当你真正开始查询时,却发现结果牛头不对马嘴,检索效果一塌糊涂。 别灰心,你不是一个人在战斗。这几乎是所有团队在初探RAG(检索增强生成)和向量搜索时都会踩的“坑”。问题通常不在于向量数据库本身,而在于我们喂给它的“原料”和指挥它工作的“大脑”出…
Leave a Comment在人工智能(AI)的世界里,机器需要一种方式来“理解”我们人类的语言、图片甚至声音。但计算机本质上只懂数字,它们如何理解“热情”与“冷漠”之间的情感差异,或是“苹果公司”与“苹果水果”之间的天壤之别? 答案就藏在一个神奇的概念里——Embedding。 你可以把Embedding模型想象成一个“宇宙翻译器”,它不只是做字面翻译,更是将世间万物(文本、图片、音频等)都转换成一种通用的数学语言——向量…
Leave a Comment在处理机器学习问题时,我们接触到的数据多种多样,不仅有数值型的连续数据,还有类别丰富的离散数据,比如性别、年级、城市等。然而,大多数机器学习模型都偏爱“吃”数值型数据,对于文本类别的特征常常感到“消化不良”。为了让模型能理解这些类别信息,我们需要对它们进行预处理,而独热编码(One-Hot Encoding)就是其中最常用、最重要的一种技术。 为什么需要独热编码? 想象一下,我们有这样一个关于学生…
Leave a Comment在人工智能和机器学习的奇妙世界里,我们每天都在处理各种各样的数据:文字、图片、声音、视频……但机器并不能像人类一样直接“理解”这些信息。它们需要一个共同的语言——数值。 这就是我们今天要探讨的两个核心概念:向量化 (Vectorization) 和 嵌入 (Embedding)。它们是数据从“人类语言”翻译成“机器语言”的关键步骤,是构建任何智能系统的基石。 💡 为什么要将数据变成向量? 想象一下…
Leave a Comment译者序 本文翻译自 2024 年 Google 团队的一份 Agents 白皮书, 作者 Julia Wiesinger, Patrick Marlow, Vladimir Vuskovic。 Agent 可以理解为是一个扩展了大模型出厂能力的应用程序。 工具的使用,是人类区别于动物的标志 —— 也是 Agent 区别于大模型的标志。 本文转载自:https://arthurchiao.…
Leave a Comment这是一篇关于 AI Agent 的学习笔记,内容总结自一个从零打造简化版 Claude Code 的视频教程。本文将整理和归纳教程中的核心概念,包括 Agent 是什么、最主流的 ReAct 构建模式,以及一种更高级的 Plan-and-Execute 模式。 一、 什么是 AI Agent? 1. 从大模型 (LLM) 的局限性说起 我们熟悉的大语言模型(如 GPT-4o)虽然逻辑和回答能力很强…
Leave a Comment你是否感觉当下的AI Agent技术听起来很厉害,但实际使用时却常常“掉链子”,尤其是在处理复杂任务时容易半途而废?你可能会认为这是模型能力不足。然而,业内的共识是:多数AI Agent的失败,并非模型能力的失败,而是上下文工程(Context Engineering)的失败。 那么,这个听起来高大上的“上下文工程”究竟是什么?它和我们熟悉的提示词工程(Prompt Engineering)、检索…
Leave a Comment在人工智能领域,我们经常将大语言模型(LLM)比作一个功能强大的“黑箱”函数:你给它输入,它给你输出。但决定这个“黑箱”输出质量的关键,不仅仅是模型本身,更在于我们如何精心设计它的输入。 最近,一个名为 Context Engineering(上下文工程) 的概念在AI领域迅速升温。它到底是什么?它解决了哪些核心问题?我们又该如何实践?这篇教程将为你一一解答。 一、 核心概念:Context 与 …
Leave a Comment