Phase 1 done · rules v1 · 真实集 64% 三项全过 · 2026-06-02

事件判断
全流程一页可检

这一页把 抓取 → 分类 → 入库 → 判断 → 决策 的端到端流程, 加上当前完成度、真实数据回归基线、失败 case 根因、roadmap 时间线、schema 演进、决策层输出 mockup, 全部图示化。用于人工检查整个流程是否对齐 PRD 的双视角定位

主线4 条 真实集25 条新闻 三项全过64.0% macro F10.875 pytest18 / 18
§ 1 · 双视角定位

Agent 服务两类决策者, 输出两类周报

这不是"自动分类 + 自动文档"的工具, 是"产业决策辅助系统"。决策由人来下, agent 把核心变量摆清楚、把信号提炼到位。

CEO 视角

识别主驱动变量, 调整业务策略

产业公司决策者 · 战略 / 产品 / 商务负责人
典型问题
"现在到底是哪个变量在推动整个产业? 是 D2C 商用、是频轨资源、是 5G NTN 标准, 还是终端价格? 我的产品应该卡在哪一节?"
期待输出
  • 本周期主驱动变量(top-3)+ 强度评分
  • 主线评分变化(本周 vs 上周)+ 归因到具体事件
  • 战略建议: 进入 / 等待 / 退出 / 加速 + 触发条件
  • 风险预警 + 下周跟踪清单
投资视角

量化市场体量, 给出仓位调节信号

二级市场分析师 · 基金经理 · 投资总监
典型问题
"卫星互联网 4 条主线现在哪一条最热? 同一主线下 A 公司和 B 公司谁的相对位势在改善? 我应该加仓终端还是减仓核心网?"
期待输出
  • 主线相对热度排名(本周 vs 4 周均值)
  • 公司相对位势矩阵(同主线内排序)
  • 仓位调节信号: 各主线 加 / 减 / 持 + 证据链
  • 异常告警: 超预期订单 / 监管事件 / 业绩反转
§ 2 · 端到端数据流

5 层管道, 颜色代表完成状态

从左到右: 抓取层 → 输入侧 → 持久化 → 判断层 → 决策层。每个方块的颜色对应是否已交付(绿)、进行中(金)、未启动(蓝)。

L1 · 抓取 L2 · 输入侧 L3 · 持久化 L4 · 判断层 L5 · 决策层 公司公告抓取 P2 · 待启动 工信部 / 政策抓取 P2 · 待启动 行业 RSS / 媒体 P2 · 待启动 数字字段解析 订单/capex/客户 手工灌入 samples / CLI · 已用 rules classifier P1 · 词典 v1 公司反哺 P1 · 待弱化 LLM 兜底 P2.1 · conf<0.55 极性 + 反义对 P1 · 4 对 v1 加 4 events P1 done + numeric_fields P2 companies P1 done · 6 seed + orders/peer_rank P2 market_model P1 · 84 占位数 动态修正 P3 主线评分 基础版 P1 → 含变化 P3a 主驱动变量识别 P3a · 待启动 公司相对位势 P3b · 待启动 估值映射 P3b · DCF / PE CEO 双周报 主驱动变量 + 战略建议 进入 / 等待 / 退出 / 加速 P3a · 待启动 投资双周报 公司位势 + 仓位信号 加 / 减 / 持 + 证据链 P3b · 待启动 DOCX / Excel / PPT P3c · 分发载体 · 附属 不是产品价值本身 下周跟踪指标 / 抓取重点回路 下游用户 · CEO · 分析师 · 基金经理 · 政府 / 园区
DONEPhase 1 已交付 · 实测验证
NOWPhase 2 进行中 · 关键路径
LATERPhase 3 待启动 · 决策层
§ 3 · 当前状态地图

三阶段进度, 一眼看完

Phase 1 完成的是 PRD §3.1 输入侧。Phase 2 是 LLM 兜底 + schema 扩展 + 抓取(关键路径)。Phase 3 是双视角决策层。

P1
Done

Research Agent · 输入侧

关键词规则 + 公司反哺 + SQLite 落盘。合成集 100%, 真实集 64% 三项全过, macro F1 0.875。
  • 本体 4 主线 / 6 场景 / 6 维度 / Thesis 三态
  • rules classifier + 词典 v1 (~150 关键词)
  • events / companies / market_model / thesis_state schema
  • 种子 84 市场模型 + 6 公司
  • 周报 markdown / JSON 渲染
  • CLI 9 子命令 + FastAPI 8 端点
  • 合成集 30 条 + 真实集 25 条回归
  • 18 pytest 全通过
P2
Now

Tracking · LLM 兜底 + Schema

把 9 条剩余失败 case 用 LLM 兜底拉回, schema 扩字段为 P3 决策层备料。先做 schema 再做抓取, 否则数据进库就错。
  • 真实数据盲测 25 条 (2026-06-02)
  • 词典扩展 rules v1 (40% → 64%)
  • PRD / 路线图双视角对齐
  • LLM 兜底 (conf<0.55 / threads≥3)
  • 公司反哺改弱信号 + confidence 折扣
  • events 加 numeric_fields(订单/capex)
  • companies 加 orders / peer_rank
  • 抓取层 + 金额解析
P3
Later

Decision · 决策辅助

不是文档自动化, 是 CEO 战略 + 投资仓位的判断输出。DOCX/Excel/PPT 是分发载体, 不是产品价值本身。
  • ·3a CEO · 主驱动变量识别 + 强度评分
  • ·3a CEO · 战略建议(进入/等待/退出/加速)
  • ·3a CEO · 主线评分变化 + 归因
  • ·3b 投资 · 市场模型用真实数字滚动修正
  • ·3b 投资 · 公司相对位势矩阵
  • ·3b 投资 · 仓位调节信号 + 证据链
  • ·3b 投资 · 公司估值映射 DCF / PE
  • ·3c · DOCX / Excel / PPT 分发载体
§ 4 · 本体可视化

4 主线 × 6 场景 × 6 维度 × Thesis 三态

本体是分类器的唯一真实来源。改分类规则只动 ontology.py 一个文件。每条主线下面是它的代表关键词与真实集 F1。

核心网
CORE_NETWORK
5G NTN · 信关站 · 馈电链路 · 星地融合 · 透明转发 · 星座 · 低轨 · 地面站
P / R / F10.64 / 1.00 / 0.78
终端
TERMINAL
手持终端 · D2C · 手机直连卫星 · 车载终端 · 船载终端 · 机载终端
P / R / F10.86 / 1.00 / 0.92
芯片
CHIP
基带芯片 · 射频芯片 · RFIC · FPGA · 流片 · 毫米波 · 功放 · TR 组件
P / R / F11.00 / 1.00 / 1.00
运营支撑
OPERATIONS
经营许可 · 业务许可 · 频谱 · 频率许可 · BSS · 卫星通信服务 · 牌照
P / R / F10.73 / 0.89 / 0.80

6 场景

低空 车载 海事航空 工业 IoT 应急 具身智能

6 影响维度

技术 产品 市场空间 商业模式 公司竞争力 风险

Thesis 三态

增强 strengthen 削弱 weaken 中性 neutral

极性词典 (v1)

POS · 73 词 NEG · 56 词 反义对 · 12 对
§ 5 · 分类器内部

纯函数 + 关键词命中 + 极性裁决

输入是一段中文文本, 输出是 threads / scenarios / dimensions / thesis_impact / confidence + evidence。无状态, 无 DB 依赖, 可被任意层调用。

① 主线 / 场景 / 维度 命中

for thread in THREAD_KEYWORDS:
    if any kw in text:
        threads.append(thread)
  • 命中即追加, 不算频次
  • "卫星互联网" 故意不入主线词典(产业泛词)
  • "频段" 太泛, 换成"频率许可" / "频段使用许可"

② 极性 POS - NEG → thesis

pos = count(POS_HITS)
neg = count(NEG_HITS)
for (neg_phrase, pos_substr) in _NEGATION_PAIRS:
    if neg_phrase in text and pos_substr in text:
        pos -= 1
  • pos > neg → 增强
  • neg > pos → 削弱
  • pos == neg → 中性 (RISK 维度命中 → 翻转为削弱)
  • v1 反义对: 未发布→发布 · 招标失败→中标 · 未取得→获得 · 未签订→签订

③ 公司反哺(后处理)

companies = match_companies(conn, text)
extra_threads = company_threads(conn, companies)
threads += extra_threads # 当前: 无条件追加
# P2.1: confidence *= 0.85 折扣
  • 命中公司 → 把公司本业主线追加到 threads
  • "中国卫通" (OPERATIONS) 反哺过度耦合 → P2.1 改弱信号
  • evidence.company_threads 记录哪条是反哺来的

④ confidence 计算

signal = 2*len(threads) + len(dims)
    + 0.5*len(scens) + 1.5*max(pos,neg)
conf = min(1.0, signal / 10.0)
if not threads: conf *= 0.4
  • 主线是最强信号(权重 2)
  • 主线零命中: confidence 大幅打折(× 0.4)
  • P2.1 阈值: confidence < 0.55 → 触发 LLM 兜底
  • P2.1 补充触发: len(threads) ≥ 3 → 强制 LLM 复核(防 over-fire)
§ 6 · 真实数据回归基线

v0 词典扩展前 → v1 词典扩展后

25 条真实公开新闻 / 公告 / 政策, 每条带 source_url 可追溯。v0 是首轮无调整的基线, v1 是补充词典 + 反义对后的成绩。合成集 30 条在 v1 下保持 100% / 1.000 不退化

三项全过通过率
40.0%64.0%
+24 pp
thesis 准确率
64.0%92.0%
+28 pp
macro F1
0.8220.875
+0.053
confidence in band
84.0%100.0%
+16 pp
threadTPFPFNPrecisionRecallF1 (v1)vs v0
核心网7400.641.000.78持平
终端12200.861.000.92持平
芯片2001.001.001.00持平
运营支撑8310.730.890.80+0.21
§ 7 · 失败 case 根因

v1 残留 9 条, 全部归 LLM 兜底

v1 失败的 9 条按根因分三类: thread over-fire(关键词漂移)、对冲句(POS/NEG 主从不识别)、召回边界(标注主观性)。词典扩展无法再修, 必须 LLM 语义理解。

5
Thread Over-Fire

关键词漂移导致多挂主线

"手机直连卫星" / "信关站" / "三大运营商" 这类词在政策文 / 终端订单的背景描述里出现时, 会触发主线命中, 但实际本意是别的主线。
n002 震有科技中标 5G NTN 模拟系统(核心网) → "手机直连卫星" 提到背景 → 误挂"终端"
→ LLM 触发条件: len(threads) ≥ 3
2
Hedge Sentence

对冲句无主从识别

"营收增长 + 净利润下滑" / "下滑超100% + 在手订单充足" — POS 和 NEG 同时命中, 规则算法投票平局, 但人类能判断主句是负面。
n017 净利润下滑超100% + 在手订单充足 → POS:1 NEG:0 → 误判增强
→ LLM 触发条件: confidence < 0.55
2
Recall Edge

主线召回的边界 case

监管警示 / 卫星物联网试点这类事件, 标注上归"运营支撑", 但词典里没有强匹配关键词, 或者上下文里有更强的其他主线词导致漂移。
n020 工信部颁发卫星物联网试点 → "天启星座" 触发"星座" → 误挂核心网
→ LLM 触发条件: 同 confidence 阈值
§ 8 · 路线时间线

Phase 2 / 3 关键里程碑

按"完成 / 进行中 / 未启动"三态, 标出依赖与关键路径。schema 扩展是 Phase 3 启动前的硬卡点, 不是 LLM 兜底。

真实数据盲测 25 条
2026-06-02 · Phase 2 启动验证 · samples/labeled_real.jsonl
25 条公开新闻 / 公告 / 政策, 每条带 source_url。验证 rules baseline 落在哪。结论: 三项全过 40%, macro F1 0.822, 适合做"召回 + 海选", 不适合做"终判"。
词典扩展 rules v1
2026-06-02 · POS +14 / NEG +14 / OPS +9 / RISK +6 / NEG_PAIRS +4
补"上线 / 颁发 / 印发"等政策正面词、"下滑 / 承压 / 警示"等财报负面词、"卫星通信服务 / 经营许可"等运营支撑词。实测: 三项全过 64%, thesis 92%, macro F1 0.875。"下滑"一个词修了 3 条 case。
PRD / 路线图双视角对齐
2026-06-02 · PRD §3 重组 · Phase 3 重定义
原 PRD 把 Phase 3 写成"DOCX/Excel/PPT 自动化"是错的——文档只是载体。重写为"决策辅助":3a CEO 视角 + 3b 投资视角 + 3c 分发载体。events / companies schema 加 numeric_fields / orders / peer_rank。
events / companies schema 扩展关键路径瓶颈
P2 · 1-2 天 · 不做这个, Phase 3 没米下锅
events 加 numeric_fields (订单金额 / capex / opex / 客户)、companies 加 orders / revenue_mapping / peer_rank / position_signal必须先于抓取层动手, 否则抓回数据要二次回填。
LLM 兜底 + 公司反哺弱信号化
P2.1 · 3-5 天 · DeepSeek-V3 / Qwen2.5-32B
触发条件 confidence < 0.55 len(threads) ≥ 3。后者捕捉 over-fire 类(本身 confidence 高所以纯阈值漏)。同步把公司反哺改为"反哺挂上 → confidence *= 0.85"弱信号化。目标真实集三项全过 ≥ 85%。
·
抓取最小化 + 金额解析
P2 · 1-2 周 · 沪深交易所公告 API → 工信部 → 行业 RSS
选 1 个最稳定的数据源(沪深交易所公告 API), 跑通"抓 → 金额解析 → 分类 → 入库 → 周报"闭环。金额解析是新增子步骤(正则 + LLM 兜底), 不能跳过——这是 Phase 3 仓位信号的原料。
·
Phase 3a · CEO 视角双周报
P3a · 7-10 天 · 主驱动变量识别 + 战略建议
本周期主驱动变量 top-3 排名 + 强度评分 + 战略建议(进入 / 等待 / 退出 / 加速)+ 触发条件。MVP 用规则 + LLM 混合, 不用估值模型
·
Phase 3b · 投资视角仓位信号
P3b · 2-3 周 · 公司位势 + 仓位调节 + 估值映射
同主线公司相对位势矩阵 + 仓位调节信号(主线 加 / 减 / 持)+ 证据链 + 公司估值映射(订单 / 收入 → DCF / PE)。市场模型用真实 capex / 订单数字滚动修正。
·
Phase 3c · 分发载体
P3c · 1 周 · DOCX / Excel / PPT 双版本
CEO 简报 + 投资详报两个模板。这是附属, 不是产品价值本身——价值在 3a / 3b 的判断, 文档只是包装。
§ 9 · Schema 演进

events / companies 表的字段地图

金色字段是 Phase 2 待扩, 都是 Phase 3 决策层的硬依赖。schema 扩 → 抓取层填字段 → 判断层读字段 → 决策层产仓位信号

events 表 → satellite_agent/db.py

P1 已有字段

idINT PK自增
title / contentTEXT事件原文
source / urlTEXT来源 / 链接
occurred_atTEXTISO8601
threadsJSON主线集合
scenarios / dimensionsJSON场景 / 维度
thesis_impactTEXT增强 / 削弱 / 中性
confidenceREAL0.0-1.0
companiesJSON命中公司

P2 待扩字段

numeric_fieldsJSON订单金额 / capex / opexNEW
time_window_start/endTEXT事件涉及时间窗NEW
quality_flagTEXT原文 / 二手 / 推算NEW

companies 表 → satellite_agent/db.py

P1 已有字段

nameUNIQUE公司名
threadTEXT所属主线(反哺)
products / customersJSON产品 / 客户
aliasesJSON公司名别名(匹配)
moat / riskTEXT护城河 / 风险
revenue_mappingTEXT收入映射(占位)
scoreREAL综合评分

P2 待扩字段 · 决策层依赖

ordersJSON已披露订单清单NEW
revenue_actualJSON财报口径收入拆分NEW
peer_rankJSON同主线 peer 排名NEW
position_signalTEXT仓位信号 加 / 减 / 持NEW
§ 10 · 决策层输出 Mockup

Phase 3a / 3b 双周报样板

Phase 3 还未启动, 这里是目标产出的样板, 用于在动手前对齐"做出来应该长这样"。数据是用本周新闻样本反推的示意, 仅作格式演示。

Phase 3a 样板

CEO 双周报 · 2026 W22

本周期主驱动变量 top-3
手机直连卫星商用节奏 9.2
中国移动 / 联通牌照配齐 7.8
车载 D2C 前装定点加速 6.4
主线评分变化(本周 vs 上周)
核心网7.2 → 7.5↑ +0.3
终端6.8 → 7.6↑ +0.8
芯片5.5 → 5.5— 0.0
运营支撑6.0 → 7.1↑ +1.1
战略建议
加速D2C 终端线产品发布节奏。三大运营商牌照 30 天内全部配齐, 三星 S26 Ultra 国行已支持天通, 触发条件 1 (运营商 ≥ 2 家上线天通通话)已满足。
等待低轨核心网新一轮设备投资。千帆星座两次招标失败, 天龙三号首飞失利, 信关站建设进度仍滞后, 等到 GW 星座下次密集发射节奏确认后再动手。
退出纯整星制造的低毛利业务方向。中国卫星 Q1 亏损放大, 行业整体毛利率持续低位, 整星制造的资本密集型特征短期难改善。
Phase 3b 样板

投资双周报 · 2026 W22

主线相对热度(本周 vs 4 周均值)
终端本周 9.1 · 4w 均 7.2+26%
运营支撑本周 8.4 · 4w 均 6.8+24%
核心网本周 6.7 · 4w 均 7.5-11%
芯片本周 5.2 · 4w 均 5.5-5%
公司相对位势(终端主线 peer 排名)
华力创通订单 +12% · thesis 增强 ×3↑ #1
海格通信净利下滑 -100% · thesis 削弱↓ #3
复旦微电FPGA 上车 · 在轨验证↑ #2
仓位调节信号
终端D2C 上车 + 牌照配齐 + W22 订单同环比双升
运营支撑三大运营商业务全开 · 国电高科 IoT 试点
核心网投资节奏受发射推迟影响 · 待 GW 星座密集发射
芯片海格基带流片推迟 · 国产替代节奏整体偏慢
本周异常告警
异常上交所对电科数字商业航天信息披露不准确发出监管警示, 短期板块情绪承压。建议过滤"商业航天概念但无主业关联"的标的。
§ 11 · 关键路径

为什么 schema 扩展是瓶颈, 不是 LLM 兜底?

关键路径上的真正瓶颈是 events.numeric_fields

LLM 兜底很重要, 但它只改善"输入侧分类准确率"——这条线优化到 85% 三项全过, Phase 3 决策层仍然没法启动, 因为仓位信号必须基于真实的订单金额 / capex / 客户主体数据, 而 events 表当前根本没有这些字段

因此正确的依赖链是:

schema 扩展 抓取层填字段 判断层读字段 Phase 3 决策层产仓位信号

schema 扩展只需 1-2 天, 是最低工作量 / 最高解锁价值的下一步。LLM 兜底可以与 schema 扩展并行, 但 schema 必须先到位才能启动 Phase 3。

§ 12 · 源文档索引

本页所有判断的文字溯源

本页是图示层, 文字论述与代码细节请回到对应 markdown。