请微信联系客服获取 skill 文件
wcplusPro-data
├── SKILL.md
├── references
│ ├── batch-import.md
│ ├── examples.md
│ ├── read-queries.md
│ ├── task-operations.md
│ └── troubleshooting.md
└── scripts
├── batch_import_gzh.py
└── check_env.sh
能力解读
基于 wcplusPro-data/SKILL.md, wcpluspro-webserver-data skill 能做的事情可以分为 5 类:
1) 读数据(只查询,不改状态)
- 查询公众号总数、文章总数、分页列表:
GET /api/gzh/list - 按关键词搜索已入库公众号:
GET /api/gzh/search - 在可导入候选里搜索公众号:
GET /api/search_gzh/search - 查询单个公众号的文章列表(可按时间/阅读/点赞排序):
GET /api/report/gzh_articles - 查询全库文章列表(支持时间范围):
GET /api/article/all_articles - 查询单篇文章正文内容:
GET /api/article/content - 按标题搜索文章:
GET /api/article/search_title - 全文索引搜索(关键词、范围、排序):
GET /api/search/search - 查询阅读数据报表:
GET /api/report/reading_data - 查询统计报表:
GET /api/report/statistic_data - 查询文章对应公众号信息:
GET /api/article/gzh - 其他可选读接口:
GET /api/like_article/get_all、GET /api/req_data/get_gzh
2) 任务操作(会改系统状态)
- 创建单个公众号采集任务:
POST /api/task/new - 支持三类
crawlerType:gzh_article_link、article、reading_data - 批量创建任务:
POST /api/batch_task/create_task - 启动任务队列:
POST /api/task/control,body{"command":"run"} - 查询未完成任务用于监控:
GET /api/task/all - 清理
ready/error批量任务:POST /api/batch_task/delete_task
3) 批量导入公众号昵称
- 把昵称列表写入
list.txt后,运行内置脚本:scripts/batch_import_gzh.py - 自动执行“搜索公众号 + 创建
gzh_article_link任务” - 生成成功/失败清单:
search_success.txt、search_faild.txt - 严格“昵称精确匹配”规则:
item.nickname == keyword
4) 执行方式与工程化约束
- 默认用本地 Python 调本地 wcplusPro 服务,不依赖沙箱网络可达
- 使用
WCPLUSPRO_BASE_URL,默认http://127.0.0.1:5001 - 调用前先跑环境检查:
scripts/check_env.sh - 缺依赖会提示安装(如
requests) - 不能直接执行时,会给可直接运行的
python3 - <<'PY' ... PY命令
5) 安全与失败处理规则
POST必须显式 JSON bodyarticle/reading_data任务通常要求先有文章链接数据/任务- 批量创建任务时建议每次请求间隔
2-3s - 若后端返回
not_max_version或unactivated,会原样返回,不会掩盖 - 若队列启动失败,会优先检查
/api/task/control返回状态
指令模板
下面给你一组可直接复制的指令模板(把占位符替换掉即可):
通用占位符
{biz}、{nickname}、{article_id}、{keyword}、{offset}、{num}、{start_ts}、{end_ts}
-
[只读] 统计当前已采集公众号总数,并返回文章总数。 -
[只读] 列出最近更新的 20 个公众号(按 updated_at 倒序)。 -
[只读] 查询公众号:keyword={keyword},返回前 20 条。 -
[只读] 查询公众号 {nickname}(biz={biz})的最新 20 篇文章。 -
[只读] 查询公众号 {nickname}(biz={biz})阅读数据报告。 -
[只读] 查询公众号 {nickname}(biz={biz})统计数据报告。 -
[只读] 获取文章正文:nickname={nickname}, id={article_id}。 -
[只读] 在全库中按标题搜索:keyword={keyword},limit=20。 -
[只读] 全文检索文章:keyword={keyword},offset=0,num=10。 -
[只读] 查询全库文章列表:offset={offset}, num={num}, 按 p_date 倒序。 -
[只读] 查询时间区间文章:start_p_date={start_ts}, end_p_date={end_ts}。 -
[只读] 查询当前未完成任务列表,并汇总 ready/running/error 数量。 -
[会改状态] 为 {nickname}(biz={biz})创建 gzh_article_link 任务,articleListType=all。 -
[会改状态] 为 {nickname}(biz={biz})创建文章正文采集任务 crawlerType=article。 -
[会改状态] 为 {nickname}(biz={biz})创建阅读数据采集任务 crawlerType=reading_data。 -
[会改状态] 批量创建任务(符合条件的公众号),参数 articleListType=amount, articleListAmount=20。 -
[会改状态] 启动任务队列(POST /api/task/control, command=run)。 -
[会改状态] 清理批量任务中 ready/error 状态任务。 -
[会改状态] 创建任务后每 10 秒轮询一次任务列表,直到队列清空。 -
[会改状态] 批量导入以下公众号并创建链接任务:\nA\nB\nC -
[会改状态] 批量导入公众号(去重后执行):\n{name1}\n{name2}\n{name3} -
[会改状态] 批量导入后立即启动队列,并返回成功/失败名单文件内容。 -
[排障] 先运行环境检查脚本 check_env.sh,再继续执行我的请求。 -
[排障] 接口访问失败时,检查 WCPLUSPRO_BASE_URL 与 5001 端口可用性,并给出修复建议。
你可以直接回我模板编号(例如 13 + 17 + 19),我就按这个组合直接执行。