get_a_web_page
工作流概述
这是一个包含4个节点的中等工作流,主要用于自动化处理各种任务。
工作流源代码
{
"id": "7DPLpEkww5Uctcml",
"meta": {
"instanceId": "75d76ac1fb686d403c2294ca007b62282f34c3e15dc3528cc1dbe36a827c0c6e"
},
"name": "get_a_web_page",
"tags": [
{
"id": "7v5QbLiQYkQ7zGTK",
"name": "tools",
"createdAt": "2025-01-08T16:33:21.887Z",
"updatedAt": "2025-01-08T16:33:21.887Z"
}
],
"nodes": [
{
"id": "290cc9b8-e4b1-4124-ab0e-afbb02a9072b",
"name": "Execute Workflow Trigger",
"type": "n8n-nodes-base.executeWorkflowTrigger",
"position": [
-460,
-100
],
"parameters": {},
"typeVersion": 1
},
{
"id": "f256ed59-ba61-4912-9a75-4e7703547de5",
"name": "FireCrawl",
"type": "n8n-nodes-base.httpRequest",
"position": [
-220,
-100
],
"parameters": {
"url": "https://api.firecrawl.dev/v1/scrape",
"method": "POST",
"options": {},
"jsonBody": "={
\"url\": \"{{ $json.query.url }}\",
\"formats\": [
\"markdown\"
]
} ",
"sendBody": true,
"sendHeaders": true,
"specifyBody": "json",
"authentication": "genericCredentialType",
"genericAuthType": "httpHeaderAuth",
"headerParameters": {
"parameters": [
{}
]
}
},
"credentials": {
"httpHeaderAuth": {
"id": "RoJ6k6pWBzSVp9JK",
"name": "Firecrawl"
}
},
"typeVersion": 4.2
},
{
"id": "a28bdbe6-fa59-4bf1-b0ab-c34ebb10cf0f",
"name": "Edit Fields",
"type": "n8n-nodes-base.set",
"position": [
-20,
-100
],
"parameters": {
"options": {},
"assignments": {
"assignments": [
{
"id": "1af62ef9-7385-411a-8aba-e4087f09c3a9",
"name": "response",
"type": "string",
"value": "={{ $json.data.markdown }}"
}
]
}
},
"typeVersion": 3.4
},
{
"id": "fcd26213-038a-453f-80e5-a3936e4c2d06",
"name": "Sticky Note",
"type": "n8n-nodes-base.stickyNote",
"position": [
-480,
-340
],
"parameters": {
"width": 620,
"height": 200,
"content": "## Send URL got Crawl
This can be reused by Ai Agents and any Workspace to crawl a site. All that Workspace has to do is send a request:
```json
{
\"url\": \"Some URL to Get\"
}
```"
},
"typeVersion": 1
}
],
"active": false,
"pinData": {
"Execute Workflow Trigger": [
{
"json": {
"query": {
"url": "https://en.wikipedia.org/wiki/Linux"
}
}
}
]
},
"settings": {
"executionOrder": "v1"
},
"versionId": "396f46a7-3120-42f9-b3d5-2021e6e995b8",
"connections": {
"FireCrawl": {
"main": [
[
{
"node": "Edit Fields",
"type": "main",
"index": 0
}
]
]
},
"Execute Workflow Trigger": {
"main": [
[
{
"node": "FireCrawl",
"type": "main",
"index": 0
}
]
]
}
}
}
功能特点
- 自动检测新邮件
- AI智能内容分析
- 自定义分类规则
- 批量处理能力
- 详细的处理日志
技术分析
节点类型及作用
- Executeworkflowtrigger
- Httprequest
- Set
- Stickynote
复杂度评估
配置难度:
维护难度:
扩展性:
实施指南
前置条件
- 有效的Gmail账户
- n8n平台访问权限
- Google API凭证
- AI分类服务订阅
配置步骤
- 在n8n中导入工作流JSON文件
- 配置Gmail节点的认证信息
- 设置AI分类器的API密钥
- 自定义分类规则和标签映射
- 测试工作流执行
- 配置定时触发器(可选)
关键参数
| 参数名称 | 默认值 | 说明 |
|---|---|---|
| maxEmails | 50 | 单次处理的最大邮件数量 |
| confidenceThreshold | 0.8 | 分类置信度阈值 |
| autoLabel | true | 是否自动添加标签 |
最佳实践
优化建议
- 定期更新AI分类模型以提高准确性
- 根据邮件量调整处理批次大小
- 设置合理的分类置信度阈值
- 定期清理过期的分类规则
安全注意事项
- 妥善保管API密钥和认证信息
- 限制工作流的访问权限
- 定期审查处理日志
- 启用双因素认证保护Gmail账户
性能优化
- 使用增量处理减少重复工作
- 缓存频繁访问的数据
- 并行处理多个邮件分类任务
- 监控系统资源使用情况
故障排除
常见问题
邮件未被正确分类
检查AI分类器的置信度阈值设置,适当降低阈值或更新训练数据。
Gmail认证失败
确认Google API凭证有效且具有正确的权限范围,重新进行OAuth授权。
调试技巧
- 启用详细日志记录查看每个步骤的执行情况
- 使用测试邮件验证分类逻辑
- 检查网络连接和API服务状态
- 逐步执行工作流定位问题节点
错误处理
工作流包含以下错误处理机制:
- 网络超时自动重试(最多3次)
- API错误记录和告警
- 处理失败邮件的隔离机制
- 异常情况下的回滚操作