Qwen3.5-2B模型实战:从零构建一个人工智能助手Agent

张开发
2026/5/5 5:49:45 15 分钟阅读
Qwen3.5-2B模型实战:从零构建一个人工智能助手Agent
Qwen3.5-2B模型实战从零构建一个人工智能助手Agent1. 为什么需要AI助手Agent想象一下你正在开发一个智能客服系统。用户可能会问帮我查下北京到上海的航班选价格最低的然后计算一下如果两个人一起买能省多少钱。传统AI模型只能生成文字回复但真正的智能助手应该能自动完成这些操作——查询航班、筛选结果、计算优惠最后把完整答案呈现给用户。这就是AI Agent的价值所在。Qwen3.5-2B作为一款轻量级开源大模型特别适合构建这类智能体应用。它不仅支持多模态输入能同时理解文字和图片还能通过工具调用完成实际任务。下面我们就来实战搭建这样一个会动手做事的AI助手。2. 智能助手的三层架构设计2.1 核心认知层Qwen3.5-2B模型这个7B参数的轻量级模型承担着大脑角色。我们主要用到它的三项能力多模态理解能同时处理用户发送的文字和图片比如用户上传一张商品图询问价格意图识别判断用户是想获取信息、进行计算还是需要执行某个操作决策生成决定是否需要调用外部工具以及如何调用from transformers import AutoModelForCausalLM, AutoTokenizer model AutoModelForCausalLM.from_pretrained(Qwen/Qwen3.5-2B) tokenizer AutoTokenizer.from_pretrained(Qwen/Qwen3.5-2B)2.2 工具调用层LangChain集成让AI学会使用工具就像给人配备瑞士军刀。我们通过LangChain框架集成常用工具from langchain.tools import Tool from langchain.utilities import GoogleSearchAPIWrapper search GoogleSearchAPIWrapper() tools [ Tool( nameSearch, funcsearch.run, description当需要查询实时信息时使用 ), # 可以继续添加计算器、天气查询等工具 ]2.3 记忆管理层对话历史跟踪好的助手应该记得之前的对话。我们用简单的向量数据库存储对话历史from langchain.vectorstores import FAISS from langchain.embeddings import HuggingFaceEmbeddings embeddings HuggingFaceEmbeddings() memory FAISS.from_texts([], embeddings) # 初始化空记忆3. 完整工作流程实现3.1 处理用户输入首先解析用户发来的内容可能是纯文本、图片或混合内容def process_input(user_input, imageNone): if image: # 处理图片逻辑 image_desc model.describe_image(image) prompt f用户输入{user_input}\n图片描述{image_desc} else: prompt user_input return prompt3.2 决策与工具调用模型决定是否需要调用工具以及如何调用def decide_action(prompt): response model.generate( f请判断是否需要调用工具{prompt}\n 只需回答是或否若需要工具请说明工具名和查询内容 ) if 是 in response: tool_name, query parse_tool_request(response) result call_tool(tool_name, query) return model.generate(f根据工具返回结果回答问题{result}\n用户原问题{prompt}) else: return model.generate(prompt)3.3 记忆更新与响应每次交互后更新对话历史保持上下文连贯def update_memory(question, answer): memory.add_texts([fQ:{question}\nA:{answer}])4. 实际应用场景演示让我们看几个这个智能助手能处理的典型案例场景1旅行规划用户帮我找三亚评分4.5以上的酒店预算每晚800以内Agent动作调用搜索工具获取酒店列表筛选后返回结果场景2购物比价用户上传商品图片并问这个包在淘宝和京东上分别卖多少钱Agent动作识别图片中的商品分别查询两个平台价格并对比场景3办公辅助用户把昨天我们讨论的项目时间表做成表格关键节点标红Agent动作检索对话历史找到时间信息生成表格格式回复5. 效果优化与问题排查在实际使用中你可能会遇到这些典型问题及解决方法问题1工具调用不准确现象该用计算器时却调用了搜索解决在prompt中更明确地定义工具使用条件例如添加示例当问题包含计算、多少等关键词时优先使用计算器问题2多轮对话混乱现象对话超过5轮后开始答非所问解决设置对话历史摘要机制定期用模型生成对话摘要替代完整历史问题3图片理解偏差现象将红色手提包识别为行李箱解决在图片描述prompt中添加具体要求请用不超过20个词客观描述图片中的主要物品及其特征6. 进一步开发建议现在你已经有了一个基础版智能助手可以考虑在这些方向继续完善增加验证机制对于涉及支付、重要操作等场景添加用户确认步骤支持私有工具接入企业内部API比如CRM系统查询客户信息个性化学习根据用户历史行为调整回复风格和工具使用偏好性能优化对常用工具的结果进行缓存减少重复调用延迟这个项目最有趣的部分是你能真切地感受到AI从能说到会做的转变。虽然现在的实现还比较简单但已经能处理很多日常工作场景。随着工具库的丰富和提示工程的优化这个助手的实用性会越来越强。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章