零基础入门EmbeddingGemma-300M：5分钟本地部署Ollama嵌入模型实战

张开发

• 2026/5/6 2:16:00 • 15 分钟阅读

分享文章

零基础入门EmbeddingGemma-300M5分钟本地部署Ollama嵌入模型实战1. 为什么选择EmbeddingGemma-300M文本嵌入技术正在改变我们处理和理解文字的方式。想象一下你有一堆文档想要快速找到与某个主题相关的所有内容或者想自动将相似的文章归类到一起。传统的关键词搜索已经不够用了这时候就需要文本嵌入模型。EmbeddingGemma-300M是谷歌最新推出的轻量级嵌入模型只有3亿参数却能在普通电脑上流畅运行。它能把任何一段文字转换成1024维的数字向量这些向量就像文字的指纹通过比较这些指纹我们就能实现智能搜索、自动分类等功能。最棒的是借助Ollama框架我们可以在5分钟内完成本地部署完全免费不需要云端API所有数据都在本地处理既安全又高效。2. 快速部署指南2.1 安装OllamaOllama是一个让大模型在本地运行变得简单的工具。安装它就像安装普通软件一样容易访问Ollama官网(https://ollama.ai/)根据你的操作系统(Windows/macOS/Linux)下载安装包运行安装程序一路点击下一步即可安装完成后打开终端(Windows上是PowerShell或CMDmacOS/Linux上是Terminal)输入以下命令验证安装ollama --version如果看到版本号输出说明安装成功。2.2 下载并运行EmbeddingGemma-300M只需要一行命令就能启动模型服务ollama run embeddinggemma:300m第一次运行时会自动下载模型文件(约1.2GB)下载完成后会自动启动服务。你会看到终端出现提示符这时按CtrlC退出即可服务会在后台继续运行。默认情况下Ollama的API服务运行在http://localhost:11434。你可以在浏览器中访问这个地址如果看到Ollama的欢迎页面说明一切正常。3. 基础使用生成你的第一个文本向量现在我们来试试把文字转换成向量。下面是一个简单的Python脚本示例import requests import json # 设置API地址 url http://localhost:11434/api/embeddings # 准备请求数据 data { model: embeddinggemma:300m, prompt: 深度学习是人工智能的一个重要分支 } # 发送请求 response requests.post(url, jsondata) # 处理响应 if response.status_code 200: result response.json() vector result[embedding] print(f向量长度: {len(vector)}) print(f前5个值: {vector[:5]}) else: print(请求失败:, response.text)运行这个脚本你会看到类似这样的输出向量长度: 1024 前5个值: [0.023, -0.045, 0.012, 0.067, -0.089]这个1024维的列表就是句子深度学习是人工智能的一个重要分支的数字表示。相同的输入永远会得到相同的输出向量。4. 实战应用构建简易语义搜索系统4.1 创建小型文档库让我们用Python创建一个包含几段文本的小型文档库documents [ Python是一种流行的编程语言广泛用于数据科学和机器学习, Java是一种面向对象的编程语言运行在JVM虚拟机上, 深度学习需要强大的GPU进行计算加速, 人工智能正在改变医疗、金融等多个行业, TensorFlow和PyTorch是两大主流深度学习框架 ]4.2 为所有文档生成嵌入向量def get_embedding(text): response requests.post( http://localhost:11434/api/embeddings, json{model: embeddinggemma:300m, prompt: text} ) return response.json()[embedding] # 为所有文档生成向量 document_vectors [get_embedding(doc) for doc in documents]4.3 实现语义搜索功能import numpy as np from numpy.linalg import norm def cosine_similarity(a, b): 计算余弦相似度 return np.dot(a, b) / (norm(a) * norm(b)) def search(query, documents, document_vectors, top_k3): 语义搜索函数 query_vec get_embedding(query) # 计算查询与所有文档的相似度 similarities [ cosine_similarity(query_vec, doc_vec) for doc_vec in document_vectors ] # 获取相似度最高的几个文档 most_similar sorted( zip(documents, similarities), keylambda x: x[1], reverseTrue )[:top_k] return most_similar4.4 测试搜索功能# 搜索与机器学习相关的文档 results search(机器学习, documents, document_vectors) print(搜索结果:) for doc, score in results: print(f相似度: {score:.3f} | 内容: {doc})输出可能类似于搜索结果: 相似度: 0.782 | 内容: Python是一种流行的编程语言广泛用于数据科学和机器学习相似度: 0.621 | 内容: TensorFlow和PyTorch是两大主流深度学习框架相似度: 0.543 | 内容: 人工智能正在改变医疗、金融等多个行业5. 性能优化与实用技巧5.1 批量处理提高效率如果需要处理大量文本逐个请求会很慢。可以使用多线程来加速from concurrent.futures import ThreadPoolExecutor def batch_get_embeddings(texts, max_workers4): 批量获取嵌入向量 with ThreadPoolExecutor(max_workersmax_workers) as executor: return list(executor.map(get_embedding, texts)) # 使用示例 large_documents [...] # 假设有很多文档 vectors batch_get_embeddings(large_documents)5.2 使用向量数据库对于大量数据建议使用专门的向量数据库来存储和检索。以下是使用ChromaDB的示例import chromadb # 创建客户端 client chromadb.Client() # 创建集合(相当于表) collection client.create_collection(my_documents) # 添加文档和向量 collection.add( embeddingsdocument_vectors, documentsdocuments, ids[fid{i} for i in range(len(documents))] ) # 查询 results collection.query( query_embeddings[get_embedding(机器学习)], n_results3 ) print(results[documents])6. 总结通过本教程你已经学会了使用Ollama在本地一键部署EmbeddingGemma-300M嵌入模型将文本转换为向量表示的基本方法构建一个简单的语义搜索系统优化性能的批量处理技巧使用向量数据库管理大量嵌入向量EmbeddingGemma-300M Ollama的组合为个人开发者和小型团队提供了一个强大而易于使用的文本嵌入解决方案。它消除了使用云端API的成本和隐私顾虑让先进的NLP技术变得触手可及。你可以基于这个基础开发更复杂的应用如个人知识管理系统文档自动分类工具智能聊天机器人内容推荐系统获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章

前端开发 2026/4/29 20:53:30

StructBERT中文句子相似度工具：3步搞定文本去重与内容查重

StructBERT中文句子相似度工具：3步搞定文本去重与内容查重 1. 为什么需要中文句子相似度工具？ 在日常工作和内容创作中，我们经常遇到需要判断两段文字相似程度的场景。比如编辑需要检查投稿文章是否存在抄袭，老师要核对学生作业…

如何参与rms-support-letter.github.io签名：3种简单方法完整指南【免费下载链接】rms-support-letter.github.io An open letter in support of Richard Matthew Stallman being reinstated by the Free Software Foundation 项目地址: https://gitcode.com/gh_m…

张开发

前端开发 2026/4/20 6:55:34

youlai-mall移动端开发：uni-app跨平台电商应用构建

youlai-mall移动端开发：uni-app跨平台电商应用构建【免费下载链接】youlai-mall 🚀基于 Spring Boot 3、Spring Cloud & Alibaba 2022、SAS OAuth2 、Vue3、Element-Plus、uni-app 构建的开源全栈商城。项目地址: https://gitcode.com/gh_mirror…

张开发

零基础入门EmbeddingGemma-300M：5分钟本地部署Ollama嵌入模型实战

最新文章

EF Core 10向量搜索扩展仅支持.NET 8+？不！这3种降级兼容方案已被头部金融客户验证上线

从Kaggle竞赛到工业落地：MATLAB环境下XGBoOST调参的实战避坑指南

保姆级教程：用Python和LQR从零实现自动驾驶横向控制（附MATLAB代码对比）

别再自己搭文件服务器了！Spring Boot整合阿里云OSS，5分钟搞定图片上传功能

高德/百度地图API实战：如何用AOI数据给你的POI打上“商圈”标签？

架构师视角：vue-office在企业级文档预览系统中的技术实现与优化策略

推荐文章

相关文章

分享文章

更多文章

StructBERT中文句子相似度工具：3步搞定文本去重与内容查重

AWPortrait-Z WebUI二次开发亮点：历史记录折叠面板+实时进度反馈设计

终极指南：如何用vue-axios-github实现完整的登录状态管理与token持久化

如何快速将Obsidian笔记导出为专业PDF：终极完整指南

【程序员写的诗】《悔思践》日期：2017-05-20 作者：橙附：AI豆包点评和解释

手机号码精准定位工具：一键查询归属地与地图标记的完整解决方案

Wifi-Hacking开发者手册：如何扩展新功能和攻击向量

终极指南：解决Shairport Sync编译警告的10个实用技巧

第 31 课：任务列表视图模式切换与本地持久化

SQL和NOSQL数据库对比

如何参与rms-support-letter.github.io签名：3种简单方法完整指南

youlai-mall移动端开发：uni-app跨平台电商应用构建