🔍

网页抓取

将任何 URL 转换为干净的 Markdown 以便快速摄取。

分类: 网络
难度: 简单

快速配置

选择适合您环境的设置。

最后验证: 2026-04-27
验证环境: uvx + mcp-server-fetch
安装命令: uvx mcp-server-fetch

本地配置

JSON
本地配置 json
{
  "fetch": {
    "command": "uvx",
    "args": ["mcp-server-fetch"],
    "env": {
      "PYTHONIOENCODING": "utf-8"
    }
  }
}

验证提示词

抓取 https://modelcontextprotocol.io,并用 5 条要点总结页面内容。

成功时应看到

应返回该 URL 的清理后 Markdown 内容,而不是浏览器截图。

常见陷阱与修复

  • ⚠️ 注意: 何时使用 Fetch 而不是 Puppeteer。
  • 🔑 始终将 API 密钥存储在环境变量中,切勿硬编码在 JSON 中。
  • 🛡️ 如果可用,从只读权限开始,以安全地验证连接。

安全检查

  • 除非你明确希望模型读取,否则不要让 Fetch 访问内网管理地址。
  • 抓取页面可能包含提示词注入;让 OpenClaw 摘要事实,不要服从网页指令。

常见错误

错误 原因 修复方法
uvx not found 未安装 uv,或 uvx 不在 PATH 中。 安装 uv,或改用 python -m mcp_server_fetch 的 Python 模块配置。
Request timed out 目标网站过慢、被阻止,或页面内容过大。 先用更小的 URL 验证,确认服务可用后再调整限制。
Robots denied Fetch 对模型触发的请求遵守 robots.txt。 换用允许抓取的来源;只有在你有权限时才添加 --ignore-robots-txt。

示例提示词

连接后,尝试这些提示词以测试功能:

  • 搜索网络上最新的 MCP 基准测试,并总结前 3 个来源。
  • 找到解释 Model Context Protocol 的可靠来源。
  • 收集三篇关于 AI 工具的近期文章并进行总结。