品玩5月11日消息,据The Coders Blog报道,Google宣布升级Gemini API,正式推出支持多模态的文件搜索功能,这一举措将改变传统开发模式,降低多模态应用构建门槛。
Google此次升级Gemini API,重点在于推出支持多模态的文件搜索功能。该功能旨在打破数据孤岛,利用Gemini Embedding 2模型实现文本与图像的语义统一索引。
新功能彻底改变了传统检索增强生成(RAG)的开发模式。开发者可将PDF、图片等多种格式文件上传至统一存储库,系统会自动进行智能分块与向量化处理。
其核心优势是支持跨模态查询,比如能根据图表内容检索相关文档,还提供页级引用,增强了结果的可验证性与可信度。
这一升级显著降低了构建复杂多模态应用的门槛,为开发者提供了更便捷的开发环境,有望推动多模态应用的发展。
编辑观点:Google升级Gemini API是科技领域的重要一步,多模态文件搜索功能将激发更多创新应用,推动行业向多模态方向发展。