Gemini Embedding-001 现已推出:通过 Google API 实现多语言 AI 文本嵌入

Google 的 Gemini Embedding 文本模型 gemini-embedding-001现已通过 Gemini API 和 Google AI Studio 向开发者开放,为更广泛的 AI 生态系统带来强大的多语言和灵活的文本表示功能

多语言支持和维度灵活性

  • 支持 100 多种语言:Gemini Embedding 针对全球应用进行了优化,可支持一百多种语言,是具有多样化语言需求的项目的理想解决方案
  • Matryoshka 表征学习:该架构利用 Matryoshka 表征学习,允许开发人员 高效地扩展嵌入向量 ——从默认的 3072 个维度中选择,或者缩小到 1536 或 768 个维度,具体取决于应用程序在准确性和性能之间的权衡 。这种适应性结构可让您在减少矢量大小的同时优化速度、成本和存储,同时最大程度地减少质量损失。

技术规格和模型性能

  • 输入容量:每个输入最多处理 2048 个令牌,建议未来的更新可能会进一步扩展此限制
  • 基准测试领导者:自早期推出以来,gemini-embedding-001 在海量文本嵌入基准 (MTEB) 多语言排行榜上取得了最高分 ,超越了之前的 Google 模型以及科学、法律和编码等领域的外部产品。
  • 统一架构:整合以前需要多个专门模型的功能,简化搜索、检索、聚类和分类任务的工作流程

Gemini Embedding 与其他商用专有模型的比较:

Gemini Embedding-001 现已推出:通过 Google API 实现多语言 AI 文本嵌入
图片来自googleblog

主要特点

  • 默认嵌入维度为 3072  (支持截断为 1536 或 768)
  • 向量归一化, 与余弦相似度和向量搜索框架兼容
  •  维度降低,性能下降最小
  • 增强了与流行矢量数据库(例如 Pinecone、ChromaDB、Qdrant、Weaviate)和 Google 数据库(AlloyDB、Cloud SQL)的兼容性
指标/任务Gemini Embedding-001旧版 Google 模型Cohere v3.0OpenAI-3-large
MTEB(多语言)平均值(Task)68.3762.1361.1258.93
MTEB(多语言)平均值(TaskType)59.5954.3253.2351.41
双语挖掘79.2870.7370.5062.17
分类71.8264.6462.9560.27
聚类54.5948.4746.8946.89
即时检索5.184.08-1.89-2.68
多标签分类29.1622.822.7422.03
配对分类83.6381.1479.8879.17
重新排序65.5861.2264.0763.89
检索67.7159.6859.1659.27
STS(语义文本相似度)79.476.1174.871.68
MTEB(英语,v2)73.369.5366.0166.43
平均无用工作量 (代码,v1)7665.451.9458.95
XOR-Retrieve90.4265.6768.76
XTREME-UP64.3334.9718.80

实际应用

  • 语义搜索和检索:改进跨语言的文档和段落匹配
  • 分类和聚类:强大的文本分类和文档分组
  • 检索增强生成 ( RAG ):增强 LLM 支持应用程序的检索准确性
  • 跨语言和多语言应用程序:轻松管理国际化内容

集成与生态系统

  1. API 访问:在 Gemini API、Google AI Studio 和 Vertex AI 中使用 gemini-embedding-001
  2. 无缝集成:兼容领先的矢量数据库解决方案和基于云的人工智能平台,可轻松部署到现代数据管道和应用程序中

定价和迁移

层级定价Notes
免费限制使用适合原型设计和实验
付费每 100 万个代币 0.15 美元满足生产需求
  • 弃用时间表
    • gemini-embedding-exp-03-07:2025 年 8 月 14 日弃用
    • 早期模型(embedding-001、text-embedding-004):弃用至 2026 年初
  • 迁移:建议迁移到 gemini-embedding-001, 以受益于持续的改进和支持。

展望未来

  • 批处理:Google 宣布即将支持批处理 API,以实现 大规模异步且经济高效的嵌入生成。
  • 多模态嵌入:未来的更新可能允许统一嵌入,不仅适用于文本,还适用于代码和图像,从而扩大 Gemini 应用的广度

结论

gemini-embedding-001 的正式发布标志着 Google AI 工具包的重大进步,它为开发者提供了强大、灵活且多语言的文本嵌入解决方案,能够适应广泛的应用需求。凭借其可扩展的维度、一流的多语言性能以及与热门 AI 和向量搜索生态系统的无缝集成,该模型能够帮助团队构建更智能、更快速、更具全球相关性的应用程序。随着 Google 不断在批处理和多模态支持等功能方面进行创新,gemini-embedding-001 为 AI 语义理解的未来奠定了坚实的基础。

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/59776.html

(0)

相关推荐

发表回复

登录后才能评论