基于MCP协议构建Gemini联网搜索工具：架构、集成与优化实践-深圳市維司達科技有限公司

1. 项目概述：当AI研究员遇上“万能工具箱”

最近在折腾AI智能体（Agent）和工具调用（Tool Calling）的朋友，可能都绕不开一个名字：MCP（Model Context Protocol）。简单来说，它就像给大语言模型（LLM）定义了一套标准的“工具使用说明书”。无论底层模型是GPT、Claude还是Gemini，只要工具按照MCP的格式“包装”好，模型就能理解并调用它。这解决了AI应用开发中一个核心痛点：工具生态的碎片化。

今天要拆解的这个项目——capyBearista/gemini-researcher-mcp，就是一个非常典型的MCP Server实现。它的核心目标很明确：为Google的Gemini系列模型，封装一个强大的联网搜索与研究工具。项目名里的“Researcher”已经点明了它的身份：一个专为信息检索、资料搜集和初步分析而生的AI助手。

想象一下这个场景：你正在开发一个基于Gemini的客服机器人，用户问了一个非常实时的问题，比如“今天某科技公司发布了什么新产品？价格是多少？”。Gemini本身的知识可能截止到某个时间点，无法回答。这时，如果你集成了这个gemini-researcher-mcp，你的AI助手就能自动调用背后的搜索工具，获取最新网页信息，提炼总结后回答用户。这瞬间将模型的“静态知识库”升级为了“动态信息库”。

这个项目由开发者capyBearista创建，它不是一个独立的应用程序，而是一个即插即用的服务组件。它的价值在于，让任何基于MCP客户端（比如Claude Desktop、各类AI应用框架）的应用，都能轻松获得由Gemini驱动的联网研究能力。接下来，我们就深入它的内部，看看它是如何工作的，以及如何把它用起来。

2. 核心架构与设计思路拆解

要理解gemini-researcher-mcp，我们必须先搞懂MCP的基本工作模式。MCP协议定义了两个核心角色：Client（客户端）和Server（服务器）。Client通常是最终用户使用的AI应用（如聊天界面），它内置了一个MCP客户端，负责与用户交互并向Server请求工具。Server则是像本项目这样的后台服务，它向Client“宣告”自己拥有哪些工具（Tools）、能提供哪些资源（Resources）。

2.1 为什么选择MCP架构？

开发者选择为Gemini实现一个MCP Server，而非直接写一个脚本，背后有深刻的考量：

解耦与标准化：将“研究能力”封装成独立的Server，意味着任何支持MCP协议的Client都能使用它，无论是Claude Desktop、Cursor编辑器还是自研的AI平台。这避免了为每一个客户端重复开发相同的搜索功能。
专注于核心能力：Server只需要关心一件事——如何用好Gemini模型进行搜索和研究。它不必处理用户界面、对话历史管理或其它业务逻辑，职责单一，更容易维护和优化。
利用成熟生态：MCP协议由Anthropic牵头，正在快速发展并得到广泛支持。使用MCP意味着项目能天然接入一个不断增长的工具生态，未来可以方便地与其它MCP Server（如数据库查询、代码执行工具）协同工作。

2.2 项目核心组件分析

根据项目名称和常见模式，我们可以推断出gemini-researcher-mcp的核心组件至少包括：

MCP Server 骨架：基于某个MCP SDK（如TypeScript的@modelcontextprotocol/sdk）搭建的服务器框架，负责处理来自Client的SSE（Server-Sent Events）连接，解析请求，并按照MCP协议格式返回响应。
Gemini 模型客户端：集成Google AI的Gemini API SDK。这是项目的大脑，负责理解Client传来的研究任务（query），并决定搜索策略。关键点在于，它需要调用的是支持函数调用（Function Calling）的Gemini模型版本（如gemini-1.5-pro），这样才能将“搜索”这个动作转化为模型可以执行的工具调用。
搜索工具执行器：这是项目的“手”和“脚”。当Gemini模型决定要进行搜索时，Server需要真正地去执行网络请求。这里通常会集成一个或多个搜索引擎的API或爬虫工具，例如：
- Serper API：一个专门为AI设计的谷歌搜索API，返回结构化的JSON数据，干净且高效。
- Tavily AI：另一个面向AI的搜索API，专注于提供准确、可靠的答案，并附上来源。
- 自定义爬虫：对于某些特定网站或需要深度提取的内容，可能会结合playwright或puppeteer这样的无头浏览器库。
提示词（Prompt）工程模块：这是项目的“操作手册”。如何让Gemini模型更好地完成研究任务？这需要精心设计的系统提示词（System Prompt），指导模型：
- 如何拆解复杂问题。
- 如何评估搜索结果的可靠性。
- 如何综合多来源信息进行总结，并严格引用来源。
- 在信息不足或矛盾时如何应对。

注意：MCP Server向Client声明的工具（Tools）可能不止一个。除了核心的search或research工具，可能还会有search_with_follow_up（跟进搜索）、get_page_content（获取页面正文）等，以提供更精细的控制。

2.3 技术栈选择考量

语言选择：项目使用TypeScript/JavaScript的概率极高。因为MCP生态的官方SDK和示例多以TypeScript为主，且Node.js环境在集成各种API和进行异步网络操作时非常方便。
Gemini模型选型：首选肯定是gemini-1.5-pro或更新版本。因为1.5系列在长上下文、函数调用和推理能力上更加出色，非常适合需要多步思考、规划搜索策略的研究型任务。gemini-1.5-flash作为更经济快速的选项，也可能被用于对响应速度要求极高的场景。
搜索后端选择：使用Serper或Tavily这类付费API，而非直接爬取谷歌，是出于可靠性、法律合规性和开发效率的考虑。这些API处理了反爬虫、结果解析、法律风险等问题，返回即用的结构化数据，让开发者能专注于核心的研究逻辑。

3. 环境配置与依赖安装实操

假设我们想要在本地运行或基于此项目模式进行二次开发，以下是详细的准备步骤。请注意，以下配置是基于对同类项目的通用实践推断，具体细节需以项目官方README为准。

3.1 前置条件准备

Node.js 环境：确保系统已安装Node.js（版本18或以上，推荐LTS版本）。这是运行TypeScript/JavaScript项目的基础。
```
node --version
```
包管理工具：使用npm或yarn或pnpm。项目根目录下应有package.json文件。
API密钥准备：这是最关键的一步，你需要准备两个“钥匙”：
- Google AI API Key：用于调用Gemini模型。
  1. 访问 Google AI Studio 。
  2. 登录你的Google账号。
  3. 在API密钥页面，创建新的API密钥并妥善保存。
- 搜索API Key（如Serper或Tavily）：
  - Serper：前往 serper.dev 注册，免费套餐通常提供少量额度，足够测试。
  - Tavily：前往 tavily.com 注册获取API密钥。

3.2 项目初始化与依赖安装

通常，你需要先将项目代码克隆到本地：

git clone https://github.com/capyBearista/gemini-researcher-mcp.git cd gemini-researcher-mcp

然后安装项目依赖：

npm install # 或 yarn install # 或 pnpm install

安装完成后，查看package.json中的dependencies，你大概率会看到以下核心依赖：

@modelcontextprotocol/sdk：MCP官方SDK，用于构建Server。
@google/generative-ai：Google官方的Gemini API客户端库。
axios或node-fetch：用于向搜索API发送HTTP请求。
dotenv：用于从.env文件加载环境变量。
zod：用于参数验证，确保从Client传来的工具调用参数符合预期格式。

3.3 环境变量配置

在项目根目录下，你需要创建一个.env文件（注意：这个文件通常被.gitignore排除，切勿提交到代码仓库）。文件内容模板如下：

# Google Gemini API 配置 GEMINI_API_KEY=your_google_ai_api_key_here # 建议明确指定模型，例如 gemini-1.5-pro GEMINI_MODEL=gemini-1.5-pro # 搜索API配置 (以Serper为例) SERPER_API_KEY=your_serper_api_key_here # 或者使用Tavily # TAVILY_API_KEY=your_tavily_api_key_here # 服务器配置（可选） PORT=3000 HOST=localhost

实操心得：环境变量是管理敏感信息的标准做法。在部署到生产环境时（如VPS、云函数），应使用平台提供的环境变量配置功能，而非硬编码在代码中。对于本地开发，.env文件非常方便。

3.4 运行与测试

根据项目设计，启动MCP Server的方式通常有两种：

直接运行：如果项目提供了启动脚本，例如在package.json中定义了"start": "node dist/index.js"，那么在构建后可以直接运行：
```
npm run build # 如果是TypeScript项目，需要先编译 npm start
```
作为Stdio Server运行：这是MCP Server更常见的运行方式。Client（如Claude Desktop）会以子进程的方式启动Server，并通过标准输入（stdin）和标准输出（stdout）与它通信。项目主入口文件（如src/index.ts）会调用McpServer的run()方法。你可以通过直接运行该文件来测试：
```
npx tsx src/index.ts # 或者 npm run dev
```

服务器启动后，它不会像Web服务器那样监听HTTP端口，而是等待来自stdin的协议消息。要测试它是否正常工作，你需要一个MCP Client。

4. 核心工具实现与工作流解析

这是项目的核心。我们深入看看一个典型的research工具是如何从接收到请求到返回结果的。

4.1 工具定义与注册

在Server启动时，它需要向Client“广告”自己具备的能力。以下是一个简化的工具定义示例：

import { McpServer } from "@modelcontextprotocol/sdk/server/mcp.js"; const server = new McpServer({ name: "gemini-researcher", version: "1.0.0", }); // 注册一个名为 `web_search` 的工具 server.tool( "web_search", { query: { type: "string", description: "The search query to execute on the web.", }, max_results: { type: "number", description: "Maximum number of search results to return (default: 5).", optional: true, }, search_depth: { type: "string", enum: ["basic", "advanced"], description: "Depth of the search (default: 'basic').", optional: true, } }, async ({ query, max_results = 5, search_depth = "basic" }) => { // 工具的实现逻辑将在这里编写 // 1. 调用Gemini规划搜索 // 2. 执行搜索API调用 // 3. 整理并返回结果 return { content: [{ type: "text", text: `Research results for: ${query}`, }], }; } );

这个定义告诉Client：“我有一个叫web_search的工具，它需要一个字符串类型的query参数，还可以可选地接受max_results和search_depth参数。”

4.2 完整工作流分步详解

当Client调用web_search工具时，Server内部会触发一个复杂的多步流程：

第一步：任务分析与搜索规划Server不会直接把用户的查询扔给搜索引擎。它首先会将查询和系统提示词一起发送给Gemini模型。系统提示词可能类似这样：

“你是一个专业的研究助手。请将用户的复杂问题分解成2-4个最有效的搜索关键词或短语。考虑问题的不同方面。请只返回一个JSON数组，包含这些关键词。”

例如，用户查询是：“比较Python的FastAPI和Node.js的Express在构建高性能REST API方面的优缺点”。Gemini可能会返回：["FastAPI performance REST API", "Express.js performance REST API", "FastAPI vs Express scalability", "Python FastAPI async vs Node.js Express event loop"]。

第二步：并行搜索执行Server拿到这些关键词后，会并发地向搜索API（如Serper）发起多个请求。使用并发可以显著减少总等待时间。代码上会使用Promise.all。

第三步：结果获取与初步过滤搜索API返回的通常是结构化数据，包含每个结果的标题、链接、摘要（snippet）。Server需要对这些结果进行初步去重（基于链接），并可能根据相关性（关键词在标题和摘要中的出现频率）进行简单排序。

第四步：深度内容提取与综合对于“advanced”深度搜索或当摘要信息不足时，Server可能需要抓取排名靠前的几个网页的完整内容。这里会用到无头浏览器或简单的HTML解析器（如cheerio）来提取正文，去除广告和导航栏。然后，将所有获取到的原始信息（摘要、全文）再次喂给Gemini模型，并附上一个更强的总结提示词：

“你是一名技术分析师。以下是关于‘[原问题]’从多个网络来源收集的信息。请综合这些信息，生成一份结构化的报告。报告应包括：概述、主要优点对比、主要缺点对比、适用场景建议。对于每一个关键事实或观点，必须注明其来源的编号（如[1], [2]）。确保回答客观、全面。”

第五步：格式化返回最后，Gemini生成的这份带有引用的结构化报告，被包装成MCP协议规定的格式，返回给Client。Client（如Claude Desktop）会将其优雅地呈现给用户。

4.3 核心代码片段示例

以下是一个高度简化的、展示核心逻辑的伪代码片段，帮助理解上述流程如何编码实现：

async function executeResearchTool(params: { query: string, max_results: number }) { // 1. 初始化Gemini const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY!); const model = genAI.getGenerativeModel({ model: process.env.GEMINI_MODEL! }); // 2. 让Gemini规划搜索关键词 const planningPrompt = `...`; // 系统提示词 const planningResult = await model.generateContent([planningPrompt, params.query]); const searchQueries: string[] = JSON.parse(planningResult.response.text()); // 3. 并发执行搜索 const searchPromises = searchQueries.map(q => callSearchAPI(q, params.max_results)); const allResults = await Promise.all(searchPromises); const flattenedResults = allResults.flat(); // 4. 去重与排序 const uniqueResults = removeDuplicates(flattenedResults); const topResults = rankAndSelect(uniqueResults, 10); // 取前10个最相关的进行深度分析 // 5. 提取网页正文 (可选，深度模式) const contents = await fetchPageContents(topResults.map(r => r.link)); // 6. 让Gemini综合信息并撰写报告 const synthesisPrompt = `...`; // 综合报告提示词 const context = formatForModel(topResults, contents); // 将搜索结果和内容格式化成模型输入 const finalResult = await model.generateContent([synthesisPrompt, context]); // 7. 返回MCP格式的结果 return { content: [{ type: "text", text: finalResult.response.text(), }], }; }

5. 与主流MCP客户端的集成实战

让这个Server发挥价值的关键，是把它连接到你能直接交互的客户端上。这里以最流行的Claude Desktop和Cursor IDE为例。

5.1 集成到 Claude Desktop

Claude Desktop 是官方支持MCP的标杆客户端。集成方式是通过修改其配置文件。

定位配置文件：
- macOS:~/Library/Application Support/Claude/claude_desktop_config.json
- Windows:%APPDATA%\Claude\claude_desktop_config.json
- Linux:~/.config/Claude/claude_desktop_config.json
编辑配置文件：在配置文件的mcpServers部分添加一个新的Server配置。你需要指定Server的启动命令。假设你的项目在本地，并且可以通过npm start启动。
```
{ "mcpServers": { "gemini-researcher": { "command": "node", "args": [ "/ABSOLUTE/PATH/TO/YOUR/gemini-researcher-mcp/build/index.js" ], "env": { "GEMINI_API_KEY": "your_key_here", "SERPER_API_KEY": "your_key_here" } } } }
```
关键点：
- command：必须是node，因为这是一个Node.js脚本。
- args：第一个参数必须是编译后的JavaScript入口文件的绝对路径。不能是TypeScript源文件路径。
- env：在这里直接传递环境变量是最直接的方式，比依赖外部的.env文件更可靠，尤其是对于打包分发的应用。
重启Claude Desktop：保存配置文件后，完全退出并重启Claude Desktop应用。
验证集成：重启后，在Claude的输入框里，你应该能看到一个新的工具图标（通常是个小螺丝刀或加号）。点击它，如果能看到web_search或类似工具，说明集成成功。现在你就可以在对话中直接让Claude使用这个工具了，例如：“请用联网搜索工具查一下今天比特币的价格。”

5.2 集成到 Cursor IDE

Cursor 作为一款AI驱动的代码编辑器，也内置了MCP客户端支持，让AI助手（通常是Claude 3.5 Sonnet）能使用你配置的工具。

全局安装MCP Server（推荐）：为了让Cursor方便地找到，你可以将你的Server安装到全局，或者通过npx直接指向它。但更常见的是配置本地路径。
修改Cursor配置：在Cursor中，打开命令面板（Cmd/Ctrl + Shift + P），搜索并打开Cursor: Open MCP Configuration。

编辑配置文件：配置文件通常是~/.cursor/mcp.json。添加如下配置：

{ "mcpServers": { "gemini-researcher": { "command": "node", "args": ["/ABSOLUTE/PATH/TO/YOUR/gemini-researcher-mcp/build/index.js"], "env": { "GEMINI_API_KEY": "your_key_here", "SERPER_API_KEY": "your_key_here" } } } }

配置格式与Claude Desktop非常相似。

重启Cursor：保存配置，并重启Cursor IDE。
使用工具：在Cursor的AI聊天框中，当你输入需要最新信息的问题时，AI助手会自动提示或询问是否要使用可用的搜索工具。

5.3 集成到自定义应用

如果你在构建自己的AI应用，可以使用官方的MCP客户端SDK。以Node.js环境为例：

import { Client } from '@modelcontextprotocol/sdk/client/index.js'; import { StdioClientTransport } from '@modelcontextprotocol/sdk/client/stdio.js'; import { spawn } from 'child_process'; async function connectToResearcher() { // 1. 创建MCP客户端 const client = new Client( { name: 'my-ai-app', version: '1.0.0' }, { capabilities: {} } ); // 2. 创建传输层：启动Server子进程 const serverProcess = spawn('node', ['/path/to/server/index.js'], { env: { ...process.env, GEMINI_API_KEY: 'xxx', SERPER_API_KEY: 'yyy' } }); const transport = new StdioClientTransport(serverProcess); // 3. 连接 await client.connect(transport); // 4. 获取可用工具列表 const { tools } = await client.listTools(); console.log('Available tools:', tools); // 5. 调用工具 const result = await client.callTool({ name: 'web_search', arguments: { query: '最新React版本发布了哪些新特性？' } }); console.log('Search result:', result.content); // 6. 断开连接 await client.close(); serverProcess.kill(); }

这种方式给了你最大的灵活性，可以将研究能力无缝嵌入到你的聊天机器人、自动化工作流或任何Node.js应用中。

6. 性能优化与高级配置指南

一个基础的MCP Server能跑起来，但要让它在生产环境中稳定、高效、经济地运行，还需要考虑以下方面。

6.1 成本控制与速率限制

使用Gemini API和第三方搜索API都是按量计费的。无节制的调用会导致高昂的成本。

缓存策略：对相同的搜索查询结果进行缓存（如使用node-cache或Redis）。可以设置一个合理的TTL（例如10分钟），在TTL内相同的查询直接返回缓存结果，极大减少API调用。

import NodeCache from 'node-cache'; const cache = new NodeCache({ stdTTL: 600 }); // 缓存10分钟 async function searchWithCache(query: string) { const cached = cache.get(query); if (cached) return cached; const freshResult = await callSearchAPI(query); cache.set(query, freshResult); return freshResult; }

用户级配额限制：如果你的Server面向多用户，需要实现简单的配额系统。例如，每个IP地址或API令牌每分钟/每天最多调用N次研究工具。可以使用express-rate-limit中间件的思想，但应用于MCP的Tool调用层面。
优化提示词，减少Token消耗：提示词越长，Gemini API调用越贵。精炼你的系统提示词，移除不必要的指令。在综合信息阶段，可以设定一个Token上限，只将最相关的文本片段传递给模型进行总结。

6.2 搜索质量与可靠性提升

多搜索引擎聚合：不要只依赖一个搜索API。可以同时配置Serper和Tavily（或DuckDuckGo、Bing等），并行请求，然后去重、交叉验证结果。这能提高信息的全面性和准确性，特别是在一个引擎结果不佳时。
来源可信度评估：在提示词中指导Gemini评估来源。例如，“优先参考权威媒体（如BBC、Reuters）、官方网站（.gov, .edu）和技术社区（Stack Overflow, GitHub官方文档）的信息。对个人博客或论坛内容保持审慎。”
失败重试与降级：网络请求可能失败。对API调用实现指数退避重试机制。如果主要搜索API失败，可以降级到备用API，甚至降级到简单的、不带深度分析的直接搜索返回。

6.3 安全性增强

输入净化与验证：对Client传来的query参数进行严格的验证和净化，防止注入攻击。使用zod库定义详细的schema，过滤掉异常字符或过长的查询。
环境变量管理：切勿在代码或配置文件中硬编码API密钥。使用.env文件（开发）和安全的密钥管理服务（生产，如AWS Secrets Manager, Azure Key Vault）。
访问控制：如果Server暴露在网络上（如作为HTTP Server运行，虽然MCP Stdio模式不常见），必须实施身份验证和授权，例如要求Client提供有效的API令牌。

6.4 可观测性与日志

为了调试和监控，需要完善的日志记录。

结构化日志：使用winston或pino库记录结构化日志，包含请求ID、工具名称、查询内容、耗时、使用的Token数、搜索API调用次数等。

logger.info('Tool invoked', { tool: 'web_search', query, userId }); logger.debug('Gemini planning step completed', { searchQueries, planningTokens }); logger.warn('Search API rate limit approached', { api: 'serper' });

性能监控：记录每个工具调用的端到端延迟，并拆分为“规划耗时”、“搜索耗时”、“综合耗时”。这有助于发现性能瓶颈。
错误追踪：将所有未捕获的异常和预期的API错误记录到错误追踪服务（如Sentry），便于及时发现问题。

7. 常见问题排查与调试技巧

在实际部署和使用过程中，你几乎一定会遇到一些问题。以下是一些常见问题的排查思路。

7.1 客户端无法发现或调用工具

问题现象	可能原因	排查步骤
Claude Desktop/Cursor 中看不到工具图标。	1. MCP Server启动失败。 2. 配置文件路径或格式错误。 3. Server未正确声明工具。	1.检查Server日志：在终端直接运行Server启动命令，看是否有错误输出（如缺少环境变量、API密钥无效）。 2.验证配置文件：使用JSON验证器检查`claude_desktop_config.json`或`mcp.json`格式是否正确。确保路径是绝对路径。 3.使用MCP Inspector：这是一个官方调试工具。运行`npx @modelcontextprotocol/inspector node /path/to/your/server.js`，它会启动一个本地Web界面，显示Server声明的所有工具和资源，这是验证Server是否正常工作的最佳方式。
能看到工具，但调用时失败或超时。	1. 工具执行过程中出错（如API调用异常）。 2. 网络问题。 3. 工具执行时间过长，客户端超时。	1.查看Server端日志：确保Server代码中有详细的错误捕获和日志输出。超时通常是内部某个步骤（如网页抓取）卡住导致的。 2.简化测试：尝试一个最简单的查询（如“今天的天气”），排除复杂查询导致的问题。 3.调整超时设置：某些客户端可能有默认超时。在Server端，优化代码性能；在复杂任务中，可以考虑实现进度通知或分步结果返回。

7.2 API密钥与网络问题

问题现象	可能原因	排查步骤
Server启动报错：`Invalid API Key`或`403`。	1. 环境变量未正确加载。 2. API密钥本身无效或已禁用。 3. 密钥有使用限制（如IP限制）。	1.确认环境变量：在Server启动脚本中打印`process.env.GEMINI_API_KEY`的前几位（切勿打印完整密钥），确认其已正确读取。 2.测试API密钥：使用`curl`或 Postman 直接调用对应的API（如Google AI API），验证密钥是否有效。 3.检查配额：前往Google AI Studio或Serper控制台，查看配额是否用尽或项目是否被禁用。
搜索无结果或结果质量差。	1. 搜索API服务异常。 2. 查询词构造不佳。 3. 地区限制。	1.检查搜索API状态：访问服务商的状态页面。 2.优化提示词：调整给Gemini的“规划搜索词”提示词，使其生成更具体、有效的关键词。 3.手动测试：将Server生成的搜索关键词直接拿到搜索引擎里搜，看结果是否理想。

7.3 内容生成相关问题

问题现象	可能原因	排查步骤
Gemini返回的内容不引用来源或引用错误。	提示词指令不够明确，或模型在长上下文中“遗忘”了指令。	1.强化提示词：在综合信息的提示词中，用加粗、单独段落等方式强调引用要求。例如：“你必须为报告中的每一个关键事实、数据或观点，注明其来源编号，格式如 [1], [2]。” 2.结构化输入：在将搜索结果喂给模型时，将每个来源的内容清晰地用分隔符隔开，并标上醒目的编号，降低模型混淆的概率。
报告冗长或偏离主题。	模型过度发挥，或喂给模型的原始信息过多、噪音大。	1.设置生成配置：调用Gemini API时，设置`temperature`为较低值（如0.2），减少随机性；设置`maxOutputTokens`限制回答长度。 2.优化信息过滤：在将网页内容传递给模型前，先进行一轮简单的文本清洗和摘要，只保留核心段落。

7.4 部署与进程管理

当你想在服务器上长期运行这个MCP Server时，需要解决进程管理问题。

使用进程守护工具：不要直接用node index.js在后台运行，进程崩溃后无法自启。使用pm2或systemd。

PM2示例：

npm install -g pm2 pm2 start ecosystem.config.cjs

其中ecosystem.config.cjs文件配置环境变量和日志路径：

module.exports = { apps: [{ name: 'gemini-researcher-mcp', script: './build/index.js', env: { GEMINI_API_KEY: 'your_key', SERPER_API_KEY: 'your_key', NODE_ENV: 'production' }, log_file: './logs/combined.log', error_file: './logs/err.log', out_file: './logs/out.log', time: true }] };

日志轮转：使用pm2-logrotate或配置logrotate工具，防止日志文件无限增大占满磁盘。

这个项目代表了一个非常清晰的趋势：将强大的基础模型（Gemini）与专项能力（联网搜索）通过标准化协议（MCP）封装成可复用的工具。它降低了为AI应用添加高级研究功能的门槛。无论是集成到现有产品，还是作为学习MCP协议的绝佳范例，capyBearista/gemini-researcher-mcp都提供了宝贵的实践路径。在实际使用中，持续优化提示词、做好错误处理和成本监控，是让它从“能跑”到“好用”的关键。

基于MCP协议构建Gemini联网搜索工具：架构、集成与优化实践