ReAct 之前:
“纯思考” 型:思维链 (Chain-of-Thought)优点: 引导模型进行复杂的逻辑推理 缺点: 无法与外部世界交互,容易产生幻觉。
“纯行动” 型:模型直接输出要执行的动作, 缺乏规划和纠错能力
ReAct范式:
认识到思考与行动是相辅相成,【思考指导行动,而行动的结果又反过来修正思考】
实现:
通过特殊的提示工程来引导模型,使其每一步的输出都遵循一个固定的轨迹
Thought (思考):这是智能体的"内心独白"。分析当前情况、分解任务、制定下一步计划,或者反思上一步的结果。
Action (行动):这是智能体决定采取的具体动作,根据当前阶段的上下文采取行动,补充需要填充的上下文信息。
Observation (观察):这是执行Action后对上下文产生更新后的动作,评估当前阶段的信息是否足够支撑完成任务,并且规划下一步输出
智能体将不断重复这个 Thought -> Action -> Observation 的循环,将新的观察结果追加到历史记录中,形成一个不断增长的上下文,直到它在Thought中认为已经找到了最终答案,然后输出结果。这个过程形成了一个强大的协同效应:推理使得行动更具目的性,而行动则为推理提供了事实依据。
例子:
用户输入:长沙适合今天天气的景点推荐
React 智能体执行流程:
第一步:
观察:上下文只有输入的问题 [长沙适合今天天气的景点推荐]
智能体根据问题拆解并作出行动:
拆解(思考):首先获取今天天气
行动:使用工具获取天气信息,并且更新上下文信息
思考: 用户询问长沙适合今天天气的景点推荐。要回答这个问题,我需要先了解长沙今天的天气情况,然后根据天气特点推荐合适的景点。因此,我需要使用搜索工具来获取长沙今天的天气信息。 🎬 行动: Search[长沙今天天气] 正在使用【SerApi】搜索: 长沙今天天气 👀 观察: [1] 长沙雷达图 23日(今天). 小雨. 7℃. <3级 · 24日(明天). 小雨. 9℃/7℃. <3级 · 25日(后天). 阴转多云. 12℃/1℃. <3级 · 26日(周五). 多云. 11℃/2℃. <3级 · 27日(周六). 多云. 14℃/4℃. <3级 ... [2] 长沙黄花 - 中国气象局-天气预报-城市预报 星期二 12/23. 小雨. 北风 ; 星期三 12/24. 小雨. 北风 ; 星期四 12/25. 阴. 北风 ; 星期五 12/26. 多云. 东北风 ; 星期六 12/27. 多云. 北风. [3] 长沙市-天气预报 11:00 · 8.7℃. 3.3m/s. 东北风. 1022.1hPa ; 14:00 · 11.7℃. 3.1m/s. 东风. 1018.3hPa ; 17:00 · 10.6℃. 3.2m/s. 东北风. 1017.6hPa.第二步:
观察:上下文信息已经有了 [问题+天气信息]
思考:获取天气[雨天] + 需求[景点推荐]
行动:调用工具查询 [长沙 雨天 景点] , 并更新上下文信息
--- 运行第 2 步 --- 正在调用LLM模型... 思考: 用户的问题是“长沙适合今天天气的景点推荐”。从历史记录中,我已经通过搜索得知了长沙今天的天气情况:今天(12月23日)是小雨,气温7℃,风力小于3级。这是一个阴雨、气温较低的天气。因此,我需要推荐一些适合在这种天气下游览的景点。适合小雨天气的景点通常是室内景点,或者即使下雨也能提供良好体验的场所。例如,博物馆、美术馆、室内商业街、温泉、茶馆、咖啡馆,或者有遮蔽的古典园林/历史街区。我需要搜索“长沙 室内景点”或“长沙 雨天 景点推荐”来获取具体信息。 🎬 行动: Search[长沙 雨天 景点推荐] 正在使用【SerApi】搜索: 长沙 雨天 景点推荐 👀 观察: [1] ️雨中漫步长沙,探索雨季的别样风情 - you.ctrip.com - 携程 雨中漫步橘子洲头:橘子洲头是长沙的标志性景点,雨中的湘江别有一番韵味。漫步在洲头,感受雨滴轻敲江面的宁静,欣赏雨中江景,别有一番风味。🏞️. [2] 长沙室内游玩去哪里好?8大室内游玩好去处推荐 湖南省地质博物馆长沙最大的自然博物馆;湖南美术馆长沙宝藏展馆之一;茶颜悦色楼兰店入店仿佛身临于楼兰古国的城堡;长沙宜家喜欢家居人的天堂;长沙海底 ... [3] 来长沙旅游下雨怎么办?!我总结了5个室内好去处赶快与小 ... 来长沙旅游下雨怎么办?!我总结了5个室内好去处赶快与小伙伴约起来吧! 就爱吃螺蛳粉_-. 相关推荐. 查看更多. 长沙懒人版旅游攻略来啦~主打一个不绕路!第三步 :
观察:上下文信息已经有了 [问题+天气信息 + 长沙 雨天 景点]
思考:获取天气[雨天] + 需求[景点推荐] + 第二步新增信息 [长沙 雨天 景点] , 可以完成用户需求解答
行动:生成最终答案
--- 运行第 3 步 --- 正在调用LLM模型... 思考: 用户的问题是“长沙适合今天天气的景点推荐”。根据之前的对话历史,我已经搜索了“长沙今天天气”,得知今天(12月23日)长沙的天气是小雨,气温7℃。随后,我搜索了“长沙 雨天 景点推荐”,得到了一些结果,包括雨中游览橘子洲头的建议和一些室内游玩地点的推荐。现在,我需要综合这些信息,为用户提供一个适合今天小雨天气的长沙景点推荐。考虑到天气状况,推荐应该侧重于室内景点,或者那些在雨天也适合游览、别有风味的户外景点(如橘子洲头)。我需要从搜索结果中提取关键信息,整理成一个清晰、有用的回答。 🎉 最终答案: answer="根据天气预报,长沙今天(12月23日)有小雨,气温7℃。在这种天气下,推荐您考虑以下类型的景点: 1. **雨中别有风味的户外景点**: * **橘子洲头**:作为长沙的标志性景点,雨中的湘江和橘子洲别有一番宁静和诗意。您可以漫步洲头,欣赏雨滴轻敲江面的景色(参考携程推荐)。 2. **室内游玩好去处**(避免淋雨,活动更舒适): * **湖南省地质博物馆**:长沙最大的自然博物馆,适合对自然科学感兴趣的朋友。 * **湖南美术馆**:可以欣赏各类艺术展览,感受文化氛围。 * **茶颜悦色(特定主题店,如楼兰店)**:在品尝特色饮品的同时,还能体验独特的店内装修风格。 * **长沙宜家**:适合喜欢家居设计或需要购物休闲的游客。 * **长沙海底世界/相关海洋馆**:在室内探索海洋生物(搜索结果中提及了“长沙海底”)。 * 其他室内娱乐场所,如大型商场、电影院、室内游乐场等也是不错的选择。 建议您根据个人兴趣选择。如果选择户外景点如橘子洲头,请务必携带雨具,注意防滑和保暖。如果希望完全避开雨水,室内场馆是更稳妥的选择。祝您在长沙游玩愉快!"如何学习AI大模型?
如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!
第一阶段:从大模型系统设计入手,讲解大模型的主要方法;
第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
100套AI大模型商业化落地方案
大模型全套视频教程
200本大模型PDF书籍
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
LLM面试题合集
大模型产品经理资源合集
大模型项目实战合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓