托管RAG可提高开发者生产力
新服务实现嵌入、索引和连接器自动化,助力开发者专注构建AI应用,而非维护数据管道。对众多开发者而言,构建AI应用的难点已从模型转向保持应用知识更新。检索增强生成(RAG)虽成为结合AI应用与企业数据的流行技术,却带来持续运维工作,如更新嵌入和索引、同步数据源及调整检索性能等。AWS新推出的托管服务Bedrock Managed Knowledge Base,旨在减轻开发者大部分负担。该服务可自动处理企业AI应用背后的检索层。AWS高级解决方案架构师Daniel Abib在博客文章中提到:“默认情况下,该服务会自动为你选择并管理默认的嵌入模型、重排序模型和基础模型,让你无需自行挑选或维护,即可快速上手。”Abib还表示,为在不构建和管理自定义集成的情况下维护数据管道,该服务配备六个企业数据源的原生连接器,包括Amazon S3、SharePoint、Confluence、Google Drive、OneDrive和网页内容。
提升检索准确性
Pareekh Consulting首席分析师Pareekh Jain称,对于开发团队,自动管理基础设施的能力能立即提升生产力。“企业花费大量时间构建数据连接器、管理文档摄入和索引、调整检索质量、实施访问控制以及维护向量数据库,常使RAG基础设施比AI应用本身更复杂。有了这个服务,开发者可专注于构建应用。”Jain表示,“这将加快部署进度,降低维护成本,让团队专注于业务成果。”除减轻基础设施管理负担,Managed Knowledge Base还致力于提高检索准确性。Abib指出,该服务具备Smart Parsing和Agentic Retriever等功能,旨在提高不同内容类型和来源的检索准确性,这在跨越多个存储库的RAG管道和查询中常是难题。Jain认为,对于想将AI项目从实验推进到生产阶段的组织,提高检索质量尤为重要。“这是企业普遍面临的挑战,因为业务数据分散在多个系统中。随着组织从AI试点转向生产,检索质量对用户信任至关重要,使RAG基础设施成为主要瓶颈,常导致部署延迟。”Jain说道。AWS还将Managed Knowledge Base定位为智能代理应用的构建模块。Jain表示,这类应用对企业知识和检索系统要求更高。据AWS称,该服务与Bedrock AgentCore集成,减少将企业知识源连接到AI代理所需的代码和配置,同时提供内置的监控、评估和访问管理功能。
对RAG工具生态系统的影响
Jain认为,这种集成方式可能影响更广泛的RAG工具生态系统。“像Bedrock Managed Knowledge Base这样的托管服务,可能降低对独立RAG编排和检索框架的需求,包括LangChain和LlamaIndex等工具,以及一些向量数据库、摄入管道和检索服务的自定义组合。”Jain指出。不过,Jain也提醒,集成方式带来便利的同时存在权衡,可能增加客户对单一云提供商的依赖,限制AI基础设施的组装和管理灵活性。Amazon Bedrock Managed Knowledge Base目前已在北弗吉尼亚、俄勒冈、悉尼、东京、都柏林、法兰克福、伦敦和AWS GovCloud(美国西部)等地区推出。该服务采用基于使用量的定价模式,费用与存储的索引数据量和处理的检索请求量相关。