InvesResearch DocsAgent路线图 · Phase 1/2/3
Roadmap · docs/roadmap.md

Phase 1 ✅ · Phase 2 ⏳ · Phase 3 ⏳

每阶段的「完成定义」沿用 PRD §5 边界, 不蔓延。Phase 1 已交付 rules-based MVP, 30 条合成集 100% / F1 1.000, 25 条真实集三项全过 64% / F1 0.875。Phase 2 抓取必须解析数字字段——这是 Phase 3 决策层的前置依赖。Phase 3 是决策辅助, 不是文档自动化。

§0 总览

三阶段时间轴

每条 bar 的宽度代表相对工作量, 非绝对周数。Phase 1 已完成, Phase 2 正在启动, Phase 3 等待 Phase 2 schema 扩展。

阶段
Q1
Q2
Q3
Q4
+1
+2
Phase 1DONE
Research Agent · Rules MVP
Phase 2NOW
Tracking + LLM 兜底 + 数字字段
Phase 3LATER
Decision Agent · 双视角输出
Phase 1 Done
Phase 2 In progress
Phase 3 Planned
§1 Phase 1 (Done)

已交付 · Research Agent

从原始事件文本到结构化分类到聚合周报, 本地能闭环跑通。30 条 labeled regression 100% 三项全过, per-thread macro F1 1.000。

本体 ontology
ontology.py 4 主线 / 6 场景 / 6 维度 / Thesis 三态 + 关键词词典
✓ Done
Rules 分类器
classifier.py 含负向反义 + RISK fallback + dedupe 防护
✓ Done
SQLite schema
db.py events / companies / market_model / thesis_state 4 表
✓ Done
CRUD + 反哺
repository.py enrich_with_company_threads
✓ Done
种子数据
seed.py 84 条市场模型 + 6 家代表公司
✓ Done
周报生成
report.py markdown + JSON 双格式
✓ Done
回归评测
regress.py 整体 + per-thread P/R/F1 + 失败列表
✓ Done
CLI
cli.py 9 个子命令
✓ Done
FastAPI
api.py 8 个业务端点 + /health
✓ Done
测试
tests/ 18 个 test, 含 30 条样本回归
✓ Done
§2 Phase 2 (TODO)

Tracking Agent · LLM 兜底 + 抓取

抓取 schema 必须为 Phase 3 决策层准备好数字字段——这是本阶段的核心约束。与 PRD §3.1 / §3.2.2 对齐。

10 个 story

完成度: 2/10 (P0 ×5 · P1 ×3 · P2 ×1)
真实新闻 20-50 条盲测 + 回归基线再评
M
✓ 完成
见 regression-real.md
词典扩展 (rules v1)
S
✓ 完成
三项全过 40% → 64%
LLM 兜底分类(conf<0.55 或 thread≥3)
L
P0
目标真实集三项全过 ≥85%
公司反哺改 弱信号 + confidence 折扣
S
P0
与 LLM 兜底同批
events 表 schema 扩展(订单金额 / capex / opex / 客户主体)
M
P0
决策层依赖, 不做 P3 没米下锅
公司卡片字段扩展(orders / revenue_mapping / peer_rank)
M
P0
同上
接 RSS / 公司公告抓取 + 金额解析
L
P1
抓取必须解析金额
自动归类入库(复用 ingest pipeline)
S
P1
Thesis impact 实时评分 → thesis_state 表
M
P1
风险预警推送(置信度 + 主线 + 订阅)
M
P2
§3 Phase 3 (TODO)

Decision Agent · 决策辅助

从「看清楚」到「判清楚」, 输出双视角决策建议 —— CEO 看战略, 投资人看仓位。不是自动生成 DOCX / Excel / PPT(那只是分发载体)。本阶段对齐 PRD §3.3 决策层。

3a · CEO 视角(产业决策)

主驱动变量 + 战略建议
主驱动变量识别 + 强度评分(本周期 top-3)
L
P0
输入: P2 事件分布 + 数字字段
主线评分(本周 vs 上周变化 + 驱动归因)
M
P0
每条主线评分变化, 归因到具体事件
战略建议生成(进入/等待/退出/加速)+ 触发条件
L
P0
建议挂在变量上, 带阈值
风险预警 + 下周跟踪清单
S
P1
沿用 P2 alerts

3b · 投资视角(二级市场)

仓位调节 + 估值映射
市场模型动态更新(用真实 capex / opex / 订单修正)
L
P0
替代 seed.py 占位数
同主线公司相对位势矩阵
M
P0
估值 × 订单变化 × thesis 影响 → 排序
仓位调节信号(主线级 加/减/持)+ 证据链
L
P0
必须带 evidence: 近 N 周驱动力变化
公司估值映射(订单 / 收入 → DCF / PE)
XL
P1
接入 3a 主驱动变量作为情景假设
异常告警(超预期订单 / 监管事件 / 业绩反转)
M
P1
触发后立即写仓位信号

3c · 分发载体(附属, 非产品价值本身)

DOCX · Excel · PPT
DOCX 自动生成 (python-docx)
M
P2
包装 3a + 3b 输出
Excel 自动生成 (openpyxl + pivot)
M
P2
仓位矩阵 + 公司排名
PPT 自动生成 (python-pptx + 模板)
M
P2
CEO / 投资双版本
多 agent 辩论编排(参考 web/app.html)
L
P2
辩论反哺仓位置信度
§5 优先级建议

按 ROI 排序的下一步

通常 4 → 5 → 6 → 7 → 8 是最自然的顺序。关键路径上的瓶颈是 5 (schema 扩展), 不是 4 (LLM 兜底) —— 5 没做完, 7 没法启动。

1
真实数据盲测
25 条公开新闻, 三项全过 40%, macro F1 0.822
✓ 2026-06-02
2
Phase 2.0 词典扩展
rules v1 真实集三项全过升到 64%, thesis 92%, 运营支撑 F1 0.80
✓ 2026-06-02
3
PRD / 路线图双视角对齐
PRD §3 重组为三层, Phase 3 重定义为「决策辅助」
✓ 2026-06-02
4
Phase 2.1 LLM 兜底 + 公司反哺弱信号化
conf<0.55 或 thread≥3 触发, 廉价模型即可, 目标真实集三项全过 ≥85%
3-5 天
5
events / companies 表 schema 扩展
加 numeric_fields / orders / revenue_mapping / peer_rank · P3 前置依赖
1-2 天
6
Phase 2 抓取最小化
选 1 个最稳定数据源(沪深公告 API)跑通抓→分类→入库→周报闭环, 必须解析订单金额
7
Phase 3a · 双视角周报原型
主驱动变量识别 + 主线评分变化 + 仓位调节信号(规则 + LLM 混合)
7-10 天
8
前端打通
把 web/app.html 工作台模拟数据切换到真实 API, 仓位信号订阅
§4 Cross-phase

横向每阶段都顾

这些不与单个 Phase 绑定, 但每阶段都要顾着。

真实数据
现状: 25 条盲测
文档
现状: 7 份 MD + 11 份 HTML
可观测
现状:
部署
现状: 本地
鉴权
现状:
多语
现状: 中文为主