Google 的 Gemini Embedding 文本模型 gemini-embedding-001现已通过 Gemini API 和 Google AI Studio 向开发者开放,为更广泛的 AI 生态系统带来强大的多语言和灵活的文本表示功能。
多语言支持和维度灵活性
- 支持 100 多种语言:Gemini Embedding 针对全球应用进行了优化,可支持一百多种语言,是具有多样化语言需求的项目的理想解决方案。
- Matryoshka 表征学习:该架构利用 Matryoshka 表征学习,允许开发人员 高效地扩展嵌入向量 ——从默认的 3072 个维度中选择,或者缩小到 1536 或 768 个维度,具体取决于应用程序在准确性和性能之间的权衡 。这种适应性结构可让您在减少矢量大小的同时优化速度、成本和存储,同时最大程度地减少质量损失。
技术规格和模型性能
- 输入容量:每个输入最多处理 2048 个令牌,建议未来的更新可能会进一步扩展此限制。
- 基准测试领导者:自早期推出以来,gemini-embedding-001 在海量文本嵌入基准 (MTEB) 多语言排行榜上取得了最高分 ,超越了之前的 Google 模型以及科学、法律和编码等领域的外部产品。
- 统一架构:整合以前需要多个专门模型的功能,简化搜索、检索、聚类和分类任务的工作流程。
Gemini Embedding 与其他商用专有模型的比较:

主要特点
- 默认嵌入维度为 3072 (支持截断为 1536 或 768)
- 向量归一化, 与余弦相似度和向量搜索框架兼容
- 维度降低,性能下降最小
- 增强了与流行矢量数据库(例如 Pinecone、ChromaDB、Qdrant、Weaviate)和 Google 数据库(AlloyDB、Cloud SQL)的兼容性
| 指标/任务 | Gemini Embedding-001 | 旧版 Google 模型 | Cohere v3.0 | OpenAI-3-large |
|---|---|---|---|---|
| MTEB(多语言)平均值(Task) | 68.37 | 62.13 | 61.12 | 58.93 |
| MTEB(多语言)平均值(TaskType) | 59.59 | 54.32 | 53.23 | 51.41 |
| 双语挖掘 | 79.28 | 70.73 | 70.50 | 62.17 |
| 分类 | 71.82 | 64.64 | 62.95 | 60.27 |
| 聚类 | 54.59 | 48.47 | 46.89 | 46.89 |
| 即时检索 | 5.18 | 4.08 | -1.89 | -2.68 |
| 多标签分类 | 29.16 | 22.8 | 22.74 | 22.03 |
| 配对分类 | 83.63 | 81.14 | 79.88 | 79.17 |
| 重新排序 | 65.58 | 61.22 | 64.07 | 63.89 |
| 检索 | 67.71 | 59.68 | 59.16 | 59.27 |
| STS(语义文本相似度) | 79.4 | 76.11 | 74.8 | 71.68 |
| MTEB(英语,v2) | 73.3 | 69.53 | 66.01 | 66.43 |
| 平均无用工作量 (代码,v1) | 76 | 65.4 | 51.94 | 58.95 |
| XOR-Retrieve | 90.42 | 65.67 | — | 68.76 |
| XTREME-UP | 64.33 | 34.97 | — | 18.80 |
实际应用
集成与生态系统
- API 访问:在 Gemini API、Google AI Studio 和 Vertex AI 中使用 gemini-embedding-001。
- 无缝集成:兼容领先的矢量数据库解决方案和基于云的人工智能平台,可轻松部署到现代数据管道和应用程序中。
定价和迁移
| 层级 | 定价 | Notes |
|---|---|---|
| 免费 | 限制使用 | 适合原型设计和实验 |
| 付费 | 每 100 万个代币 0.15 美元 | 满足生产需求 |
- 弃用时间表:
gemini-embedding-exp-03-07:2025 年 8 月 14 日弃用- 早期模型(embedding-001、text-embedding-004):弃用至 2026 年初
- 迁移:建议迁移到 gemini-embedding-001, 以受益于持续的改进和支持。
展望未来
- 批处理:Google 宣布即将支持批处理 API,以实现 大规模异步且经济高效的嵌入生成。
- 多模态嵌入:未来的更新可能允许统一嵌入,不仅适用于文本,还适用于代码和图像,从而扩大 Gemini 应用的广度。
结论
gemini-embedding-001 的正式发布标志着 Google AI 工具包的重大进步,它为开发者提供了强大、灵活且多语言的文本嵌入解决方案,能够适应广泛的应用需求。凭借其可扩展的维度、一流的多语言性能以及与热门 AI 和向量搜索生态系统的无缝集成,该模型能够帮助团队构建更智能、更快速、更具全球相关性的应用程序。随着 Google 不断在批处理和多模态支持等功能方面进行创新,gemini-embedding-001 为 AI 语义理解的未来奠定了坚实的基础。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/59776.html