网页 API 文档与端点目录
网页 API 部分涵盖了通用爬取端点,用于将公共页面获取为原始 HTML、浏览器渲染的 HTML 或清理后的 Markdown。
当您需要页面提取、监控、元数据收集或 LLM 就绪的内容管道,而不依赖 Google SERP 特定端点时,请使用这些端点。
可用 API
| 接口 | 方法 | 说明 |
|---|---|---|
| 抓取网页(HTML) API | GET | 获取网页抓取数据,包括返回完整的原始HTML内容,快速且经济高效,针对静态页面抓取优化,用于爬取、元数据提取和页面结构分析。 |
| 抓取网页(渲染后的 HTML) API | GET | 获取网页抓取数据,包括返回完整的原始渲染 HTML 内容,快速且成本低廉,针对静态页面抓取进行了优化,适用于爬取、元数据提取和页面结构分析。 |
| 抓取网页(Markdown) API | GET | 获取网页抓取数据,包括去除样板内容,用于可读提取、文档工作流和LLM输入。 |
