巡检全程 · 卫星 Agent 端到端 10 步

STEP 1 · SCRAPEX 推文抓取 (expert/X/x_agent)19 sec

做什么

expert/X/x_agent scrape 用 cookies 抓 47 家种子公司最新推文进 x.sqlite3。撞 X 429 后 sleep 900s, 全量 30-60 分钟。launchd 是 daily 但只调 ingest, scrape 由 operator 手动触发。

决策点

Step 1 · X 抓取要怎么跑?

试水 2 个高产账号 (推荐) — 3-5 分钟跑完, 能完整演示 scrape→x.sqlite3 链路, 不卡 session

全量 47 账号后台跑 — 30-60 分钟 wall time, 不阻塞

跳过 scrape, 直接 ingest — 用现有 3138 推文

全量 47 账号前台跑 — 锁住 session 30-60 分钟, 不推荐

命令

# 试水: SpaceX + elonmusk, 每账号 30 条
/Users/john/InvesResearch/agent/scripts/run_x_scrape.sh \
  --only SpaceX elonmusk --tweets-per-account 30

结果

账号	跑前推文	跑后推文	增量	最新
SpaceX	55	57	+2	2026-06-03 17:49
elonmusk	—	—	N/A	不在 SEED

判断与洞察

judgement

scrape 链路通了, +2 新推文够走 Step 2 验证增量。SpaceX 最新到 06-03, 说明 X 本身这几天可能也没有大动作。--only 只匹配 SEED_COMPANIES, elonmusk 不在 list (那是公司账号清单) 被静默忽略 — 这是个产品级 follow-up #1。

elonmusk 不在 SEED_COMPANIES 时, log 不报错也不警告 — 用户会以为跑了。10 行代码就能加 warn。

STEP 2 · INGEST抓取入库 (job x-ingest-daily)1 sec

做什么

从 x.sqlite3 流式读最近 500 条推文 → reply/retweet 过滤 → ontology 词典 103 词匹配打 thread+impact → 按 event_id 哈希去重 → 写 agent.db.events。这一段就是 launchd 03:00 daily 跑的链路。

决策点

Step 2 · ingest 怎么跑?

跑全量 (推荐) — 复现生产 cron 行为, 看真实判重

--since 7d 增量 — 输出更干净但与生产链路径不同

--dry-run 预览 — 不写库, 适合检查 ontology 命中

命令

# 完全等价 cron (job 内部封装 x-sqlite source)
X_SQLITE_PATH=/Users/john/InvesResearch/expert/X/data/x.sqlite3 \
  /usr/bin/python3 -m satellite_agent.cli job run x-ingest-daily

结果

指标	值	说明
fetched_rows	500	从 sqlite 拉了 500 行
filtered_reply	19	reply 过滤
filtered_retweet	128	retweet 过滤
emitted	353	喂给 classifier
ingested	0	新写入 events
duplicates	353	event_id 哈希命中
events 总数	376 → 376	无变化

判断与洞察

judgement

SpaceX +2 那两条要么命中过去已入库的 event_id 哈希被判重, 要么不是 original。生产链路验证通过 — 输出和 06-08 / 06-09 cron 完全同形。ingested=0 / duplicates=N 不是 bug, 是 "x.sqlite3 没新增" 的真实信号。

fetch --source CLI 不支持 x-sqlite, 只能走 job run x-ingest-daily 间接调 — 这是 follow-up #2。

STEP 3 · DECISION双视角决策周报 (CEO + 投资)2 sec

做什么

Phase 3a 双视角决策周报。规则版 V1.1 baseline。CEO 视角: 主线评分变化 + 战略建议 + 反方矛盾 + 证伪触发 + Quality Check。投资人视角: 主线相对热度 + 公司位势矩阵 + 仓位调节信号。

决策点

Step 3 · decision 怎么跑?

both 双视角 md (推荐) — 默认 7 天窗口 + 4 周基线, CEO + 投资两份

html 导出到文件 — 浏览器可看的报告

30 天窗口拉长 — 信号饱和但陪干扰高

命令

/usr/bin/python3 -m satellite_agent.cli decision \
  --view both --window 7 --format md

结果

项	值
窗口	2026-06-02 → 06-09 (7 天)
窗口内事件数	0 · 最近事件都在 6/2 之前
5 主线本周评分	全 +0.00 (窗口空)
上周回看	核心网 +2.25 / 运营支撑 +1.00 / 芯片 -0.80 / 终端 -0.10
仓位调节	核心网/运营支撑=减, 终端/芯片/运载=持
公司位势矩阵	完整 4 主线 × 12 公司 composite 排名

判断与洞察

judgement

决策规则版 V1.1 跑通, 但窗口空 — 暴露真实数据节奏: scrape 即使有 +2 也未必能进当前 7 天决策窗口。这不是 bug 是窗口现实。如果想看 events 真正驱动决策, Step 8 报告里用 30 天窗口就能看到。

归档 → agent/reports/walkthrough-2026-06-09/03-decision-both-7d.md · 148 行

STEP 4 · THESIS主线评分 baseline 刷新1 sec

做什么

thesis --refresh 重算 5 主线 thesis_state baseline 并写库。建议 30 天窗口建初始 baseline, 否则 7 天太短常为 0。

命令

/usr/bin/python3 -m satellite_agent.cli thesis --refresh --window 30

结果

主线	thesis 分	资金净流(亿)	事件数	方向
核心网	3.25	+2.4	4	增强
终端	0.95	+3.8	5	增强
芯片	1.20	0.0	3	增强
运营支撑	0.05	0.0	2	增强
运载发射	0.00	0.0	0	—

判断与洞察

judgement

thesis_state 表已写入 baseline, 下次 decision 7 天窗口会用这个对比基准。运载发射 0 事件 — 06-08 刚加进 SEED_COMPANIES 33→47 的 14 家火箭/制造类公司还没事件流进来, 符合预期。核心网 3.25 是 4 主线最确凿的, 这个数字会在 Step 5 debate 和 Step 8 report 中反复出现。

STEP 5 · DEBATE多 agent 辩论 (Bull / Bear / Judge)3 sec

做什么

对指定主线跑 Bull/Bear/Judge 三方辩论。规则版从 events 抽 evidence 评分; --llm 版走 LiteLLM 调真模型。本次无 .env 走规则版。

决策点

Step 5 · debate 跑哪条主线?

核心网 — thesis 分最高 3.25, 4 事件多空都能抽 evidence

终端 — 事件最多 (5), 资金最高 (+3.8 亿)

运营支撑 — 事件最少 (2), 暴露 evidence 不足信号

三条都跑 (输出长) — 逐个跑核心网/终端/芯片三份辩论供对比

命令

# 30 天窗口跑 3 条
for t in 核心网 终端 芯片; do
  /usr/bin/python3 -m satellite_agent.cli debate \
    --thread "$t" --window 30 --format md
done

结果

主线	事件	Bull	Bear	margin	裁决	置信度 ×
核心网	4	5.65	0.00	+5.65	看多	1.30
终端	5	6.50	2.75	+3.75	看多	1.12
芯片	3	2.00	1.30	+0.70	分歧	0.96

判断与洞察

judgement

核心网 bear=0 意味着规则版从 events 里抽不到任何 bear evidence → 无脑看多, 置信度顶到上限 1.3。这是规则版的"缺反方"信号,提示需要 LLM 版来补齐反方论点。芯片 margin=0.7 落在分歧区间, 置信度 0.96 < 1, 与 thesis 1.2 有张力 — debate 是独立第二意见, 不读 thesis_state.score。

STEP 6 · TRIGGER + ALERT硬阈值触发 + 风险预警发现 bug

做什么

trigger set/check 给主线挂硬阈值, 命中即写 alerts 表; alerts 查询窗口内已有警报(风险维度 events + trigger 写的)。本次现场挂一个 demo trigger 走完整链路, 跑完即删避免污染生产。

决策点

Step 6 · 要不要现场挂一个示例 trigger?

挂示例后 check + alerts (推荐) — 给核心网 thread_sentiment_below=1.0 完整链

跳挂设, 只跑 alerts — 不能演示 check_triggers 写 alerts

玩 trigger 生命周期 — 挂会触发的阈值演示 alerts 表产出

命令

# 挂 → check → alerts → delete
satagent trigger set --thread 核心网 --type thread_sentiment_below \
  --params '{"thread":"核心网","threshold":1.0,"window":7}' --severity med

satagent trigger check    # 立即扫描
satagent alerts --window 30
satagent trigger delete --thread 核心网 --type thread_sentiment_below

结果

项	值
trigger	核心网 thread_sentiment_below threshold=1.0
check 触发	本窗口 sentiment +0.00 < 1.00 → 触发 ⚠ 假警报
alerts 30 天	2 条历史风险事件 (id=5 海格芯片推迟, id=7 海事供应商被调查)
清理	trigger delete ✓ · 已清空

判断与洞察 ⚠⚠⚠

PRODUCT BUG CANDIDATE

这次跑暴露了一个真实问题: thread_sentiment_below 看的是 7 天窗口内 events 实时 sentiment, 而 不是 thesis_state.score。窗口空 (无新 events) 时 sentiment=0 必触发, 即使 thesis_state.score = 3.25 (核心网真实状态健康)。生产环境如果挂了这个 trigger, 每天 03:00 cron 跑一次, 窗口一空就报警一次 — 完全是噪声。

建议: 改成读 thesis_state.score(持久化的主线判断)或加 min_events 兜底(窗口内事件数 < N 时不触发)。已纳入 follow-up #3 [最高优先级]。

STEP 7 · VALIDATEADVICE D V1 对照 (corpus v2.0 / 96 sample)5 sec

做什么

跑 corpus v2.0 (96 样本) 对照, 4 字段 (threads / thesis_impact / strategy / thread_in_focus) exact/partial/mismatch 矩阵 + 反推 top-3 盲点。这是 ADVICE D V2 真 LLM compare 的天然 baseline。

命令

/usr/bin/python3 -m satellite_agent.cli validate --format md

结果 · 4 字段总览

字段	exact	partial	mismatch	n/a	exact_rate	partial_score
threads	26	16	29	25	37%	48%
thesis_impact	53	0	43	0	55%	55%
strategy	51	0	45	0	53%	53%
thread_in_focus	33	0	36	27	48%	48%
Overall (≥3 字段 exact)	26 / 96	—	—	—	27%	V1 目标 ≥ 50%

反推 top-3 盲点

排名	字段	次数	agent → gt	hint
1	strategy	×18	观察 → 进入	启发式太保守
2	thesis_impact	×17	中性 → 增强	漏判正向
3	thesis_impact	×17	增强 → 中性	错判正向

判断与洞察

judgement

跑通完美对齐 memory 06-09 baseline。规则版盲点已凿实: strategy 太保守 和 impact 双向误判。这两个盲点正是下一轮 ADVICE D V2 真 LLM compare 的攻击目标 — 如果 LLM 能把 overall 从 27% 拉到 50%+, 就证明 LLM 兜底有价值。

归档 → agent/reports/walkthrough-2026-06-09/07-validate.md · 详细 96 行对照表

STEP 8 · REPORT投研周报 (30 天窗口)1 sec

做什么

出投研周报 (默认 7 天 / 本次用 30 天看到更多 events)。结构: 5 主线评分矩阵、thesis 变化、关键事件分线、风险预警、被点名公司、下周跟踪清单。

命令

/usr/bin/python3 -m satellite_agent.cli report --window 30

结果

项	值
窗口	2026-05-10 → 06-09 (30 天)
事件数	8
5 主线净分	核心网 3.25 / 芯片 1.20 / 终端 0.95 / 运营支撑 0.05 / 运载发射 0.0
风险预警	2 条 (海格芯片推迟 + 海事终端被调查)
被点名公司	6 家 (中国卫通 / 震有 / 上海瀚讯 / 华力创通 / 海格 / 复旦微电)
下周跟踪清单	9 项 (D2C 标准 / 信关站招标 / 射频芯片量产 / ...)

判断与洞察

judgement

周报完整、结构清晰。Step 4 thesis 30 天 refresh 写入的 score 在这里直接复用, 5 主线净分一致 — 验证了 thesis_state 是跨命令的共享状态层。如果 Step 4 不跑, 这里 thesis 一栏会全 0。

STEP 9 · NOTIFY飞书 webhook 推送测试跳过实发

做什么

notify-test --webhook ... --card 发测试卡片到飞书自定义机器人 webhook。验证 EH-3 飞书送达链路。卡片底部强制带"不构成投资建议"免责声明。

决策点

Step 9 · 飞书 webhook 怎么办?

跳过实发 (推荐) — 在 skill 里记完整用法, 用户填 webhook 随时可跑

现场贴 webhook URL — 风险: shell history + 仓库 log 会留底

看 notify.py 代码不跑 — 描述 card 结构 + retry / timeout

命令模板 (skill 中保留)

satagent notify-test \
  --webhook 'https://open.feishu.cn/open-apis/bot/v2/hook/XXX' \
  --card

判断

judgement

webhook URL 是机密, 不应进入仓库或 shell history。最安全做法: 放 .env (gitignored) → 程序 readenv → 注入。notify.py 当前不支持签名模式, 是 follow-up #4。

STEP 10 · 沉淀写成 skill + 归档 + 写本网页手工

做什么

把这趟巡检沉淀成可复用产物: skills/data-pipeline-walkthrough/SKILL.md (383 行 SOP) + skill.html (321 行 skill 介绍页) + agent/reports/walkthrough-2026-06-09/ 6 份 md (硬证据) + 本网页 walkthrough.html (用户视角全程门户)。

归档清单

skills/data-pipeline-walkthrough/ ├── SKILL.md 383 行 · 10 步 SOP + trigger 清单 + 已知坑 + 时间预算 + 跨节点回归测试 └── skill.html 321 行 · skill 介绍 + 10 步 + bug 候选 + 数字概览 agent/reports/walkthrough-2026-06-09/ ├── 03-decision-both-7d.md 148 行 · CEO + 投资双视角输出 ├── 05-debate-核心网.md 看多 ×1.30 ├── 05-debate-终端.md 看多 ×1.12 ├── 05-debate-芯片.md 分歧 ×0.96 ├── 07-validate.md 详细 96 sample 对照表 ├── 08-report-30d.md 8 events + 风险 + 跟踪清单 ├── 10-c-route-harnessfarm-source.md 续 7 · 103 行 · 第 5 源 jsonl +125 events ├── 11-d-route-shock-events-source.md 续 8 · 168 行 · 第 6 源 csv +20 events ├── 12-vendor-collectors.md 续 11 · vendor 4 工具进 expert/collectors/ └── 13-route-a-investor-manifest.md 续 14 · 第 7 源 3 schema 通杀 5 manifest +334 /(根目录) └── walkthrough.html 本页 · 第 6 视角门户

把生产链,
一步一步跑给你看

5 段 data flow 总图

10 步逐项实跑记录

ADVICE 对照表 baseline · 27%

为什么 27% 是有意义的 baseline

本次沉淀产物

1) Skill 主体 · `skills/data-pipeline-walkthrough/`

2) 归档硬证据 · `agent/reports/walkthrough-2026-06-09/`

3) 用户视角门户 · 本页

新生 skill · data-pipeline-walkthrough

这是什么 skill

怎么调起

时间预算

跨节点回归用法

本次发现 · 5 个 follow-up

#1 Step 1 · X-SQLite occurred_at ✅ 续 13 已修

#2 Step 2 · ingest CLI 中

#3 Step 6 · trigger 假警报 ⚠⚠⚠ 最高 · 未做

#4 Step 9 · 飞书无签名中 · 未做

#5 Step 7 · ADVICE 27% baseline 已排期 · 未做

关联资源

7 视角门户

核心文档

5 段 data flow 总图

10 步 逐项 实跑记录

ADVICE 对照表 baseline · 27%

为什么 27% 是有意义的 baseline

本次 沉淀产物

1) Skill 主体 · skills/data-pipeline-walkthrough/

2) 归档硬证据 · agent/reports/walkthrough-2026-06-09/

3) 用户视角门户 · 本页

新生 skill · data-pipeline-walkthrough

这是什么 skill

怎么调起

时间预算

跨节点回归用法

本次发现 · 5 个 follow-up

#1 Step 1 · X-SQLite occurred_at ✅ 续 13 已修

#2 Step 2 · ingest CLI 中

#3 Step 6 · trigger 假警报 ⚠⚠⚠ 最高 · 未做

#4 Step 9 · 飞书无签名 中 · 未做

#5 Step 7 · ADVICE 27% baseline 已排期 · 未做

关联 资源

7 视角门户

核心文档

10 步逐项实跑记录

本次沉淀产物

1) Skill 主体 · `skills/data-pipeline-walkthrough/`

2) 归档硬证据 · `agent/reports/walkthrough-2026-06-09/`

#4 Step 9 · 飞书无签名中 · 未做

关联资源