在2025年的文章推荐场景下文本嵌入模型性能对比中,我们评估了本文嵌入模型在相似推荐上的表现。在文章发布之后的半年内,阿里云和谷歌相继推出了新一代的开源本文嵌入模型,分别是阿里云的qwen3-embedding和谷歌的embeddinggemma。最近gorse-cli工具也新增了文本嵌入模型的基准测试功能,本文将使用gorse-cli和playground数据集,对热门的开源本文嵌入模型进行一次全面的评测。
3/1/26大约 5 分钟
在2025年的文章推荐场景下文本嵌入模型性能对比中,我们评估了本文嵌入模型在相似推荐上的表现。在文章发布之后的半年内,阿里云和谷歌相继推出了新一代的开源本文嵌入模型,分别是阿里云的qwen3-embedding和谷歌的embeddinggemma。最近gorse-cli工具也新增了文本嵌入模型的基准测试功能,本文将使用gorse-cli和playground数据集,对热门的开源本文嵌入模型进行一次全面的评测。
向量嵌入技术可以将图片、文字等信息转换为高维向量,从而能够在搜素推荐等场景下,通过计算向量之间的距离来计算图片、文本等原始内容之间的相关性。其中本文嵌入用到最多,市面上主要的AI服务商都会为他们的用户提供本文嵌入API,另外也有很多开源文本嵌入模型可供自行部署使用。目前主流的文本嵌入模型的评估标准为MTEB,但是MTEB并没有评估文本嵌入模型在推荐系统中的能力,而本文将尝试评估文本嵌入模型在推荐场景下的表现。