● PROCESS · 端到端跑通 · 2026-06-09 首次完整记录

卫星 Agent 10 步
端到端数据流

X 推文抓取飞书通知, 把生产链 10 步逐个跑一遍, 每步带 "做什么 / 怎么跑 / 决策点 / 输出 / 已知坑"。SKILL.md 是 SOP,本 HTML 是浏览器索引页 + 关键数字概览。

trigger
"逐步跑一遍整个数据处理流程"
耗时 最快
~15s 跳过 scrape + 无 LLM
耗时 全量
~65min 含 47 账号 scrape + LLM compare
输出
6 份 md → walkthrough-2026-06-09/

5 段 data flow

SCRAPE → INGEST → ANALYZE × 3 → ADVICE → DELIVER
SCRAPE
Step 1
INGEST
Step 2
ANALYZE × 4
Step 3–6
ADVICE
Step 7
DELIVER
Step 8–9

Step 10 是沉淀本 skill 本身 — 不属于运行时数据流。

10 步 逐项

每步左边数字是 task id, 命令复制即可执行
STEP 1 · SCRAPE
X 推文抓取
expert/X/x_agent scrape — twikit + cookies, 47 家种子公司
/Users/john/InvesResearch/agent/scripts/\
  run_x_scrape.sh --only SpaceX \
  --tweets-per-account 30
耗时 19sSpaceX 55→57
⚠ elonmusk 不在 SEED_COMPANIES, 静默忽略不报错
STEP 2 · INGEST
抓取入库
x.sqlite3 → ontology 分类 → agent.db.events
X_SQLITE_PATH=/Users/john/InvesResearch/expert\
/X/data/x.sqlite3 \
python3 -m satellite_agent.cli job run \
  x-ingest-daily
fetched 500filtered 147ingested 0dup 353
⚠ fetch CLI 不支持 x-sqlite, 只能走 job 间接调
STEP 3 · DECISION
决策周报 (CEO + 投资)
Phase 3a 双视角周报, 规则版 V1.1
python3 -m satellite_agent.cli decision \
  --view both --window 7 --format md
窗口事件 05 主线全 观察
⚠ 窗口空时所有 Δ=0 — 是窗口现实不是 bug
STEP 4 · THESIS
主线评分 baseline
5 主线 thesis_state 表 baseline (建议 30 天)
python3 -m satellite_agent.cli thesis \
  --refresh --window 30
核心网 3.25芯片 1.2终端 0.95
⚠ 必须先跑 thesis --refresh, Step 8 报告才有非 0 分
STEP 5 · DEBATE
多 agent 辩论
Bull/Bear/Judge × N 主线, 规则版 / LLM 版
python3 -m satellite_agent.cli debate \
  --thread 核心网 --window 30 --format md
核心网 看多 ×1.30终端 看多 ×1.12芯片 分歧 ×0.96
⚠ bear=0 时无脑看多顶到 1.3 上限
STEP 6 · TRIGGER + ALERT
阈值触发 + 风险预警
trigger set/check + alerts 查询
python3 -m satellite_agent.cli trigger set \
  --thread 核心网 \
  --type thread_sentiment_below \
  --params '{"thread":"核心网",\
  "threshold":1.0,"window":7}'
30 天 alerts 2
⚠⚠⚠ thread_sentiment_below 用窗口 sentiment 不是 thesis_state.score, 窗口空必假警报
STEP 7 · VALIDATE
ADVICE D V1 对照
corpus v2.0 (96 sample), 4 字段 exact/partial/mismatch
python3 -m satellite_agent.cli validate \
  --format md
overall 27%threads 37%impact 55%
⚠ 规则版 baseline, 留待 D V2 真 LLM compare 拉升
STEP 8 · REPORT
周报
7 天投研周报, 5 主线 + 关键事件 + 风险 + 跟踪清单
python3 -m satellite_agent.cli report \
  --window 30 --format md
事件 8风险 2被点名 6 家
STEP 9 · NOTIFY
飞书通知
EH-3 飞书 webhook 送达验证
python3 -m satellite_agent.cli notify-test \
  --webhook 'https://open.feishu.cn/\
  open-apis/bot/v2/hook/XXX' --card
本次 跳过实发
⚠ webhook URL 是机密, 走 .env, 不写仓库
STEP 10 · 沉淀
skill + 文档
本 SKILL.md + 本 HTML + 6 份 walkthrough md
ls agent/reports/walkthrough-2026-06-09/
ls skills/data-pipeline-walkthrough/
归档 6 mdskill SKILL.md + skill.html

关键 数字

本次 walkthrough 跑出的硬数据,与 cron 历史对齐
X.SQLITE3
3138 推文
95 账号 · scrape 后
AGENT.DB EVENTS
376
本次无新增 (dup=353)
THESIS 核心网
3.25
30 天 baseline, 全主线第一
DEBATE 核心网
×1.30
规则版上限 · 看多
ADVICE OVERALL
27%
corpus v2.0 / 96 sample
REPORT 30D
8 events
2 风险 · 6 公司被点名

ADVICE D V1 对照表

2026-06-09 baseline, 规则版无 LLM 兜底
字段exactpartialmismatchn/aexact rate
threads2616292537%
thesis_impact53043055%
strategy51045053%
thread_in_focus330362748%
overall ≥ 3 字段 exact26/9627%

本次发现 + follow-up

跑通过程中暴露的真问题, 不在本 skill 解决, 进 NEXT-STEPS

⚠ 5 个候选 bug / 优化项

  1. Step 1 elonmusk 静默忽略--only 不在 SEED_COMPANIES 时无 warn 日志。10 行代码 follow-up。
  2. Step 2 fetch CLI 不支持 x-sqlite — 只能走 job run。可加 --source x-sqlite
  3. ⚠⚠⚠ Step 6 trigger 假警报 (重要)thread_sentiment_below 看窗口 sentiment 而非 thesis_state.score, 窗口空 (无新 events) 必触发, 即使 thesis 在 3.25。建议改读 thesis_state 或加 min_events 兜底。
  4. Step 9 飞书 webhook 无签名 — notify.py 当前只支持无签名模式, 接 sign 模式提升安全。
  5. Step 7 ADVICE 27% baseline — 规则版盲点已暴露, 留 D V2 真 LLM compare follow-up。