InvesResearch Docs › Agent › 路线图 · Phase 1/2/3

Roadmap · docs/roadmap.md

Phase 1 ✅ · Phase 2 ⏳ · Phase 3 ⏳

每阶段的「完成定义」沿用 PRD §5 边界, 不蔓延。Phase 1 已交付 rules-based MVP, 30 条合成集 100% / F1 1.000, 25 条真实集三项全过 64% / F1 0.875。Phase 2 抓取必须解析数字字段——这是 Phase 3 决策层的前置依赖。Phase 3 是决策辅助, 不是文档自动化。

§0 总览

三阶段时间轴

每条 bar 的宽度代表相对工作量, 非绝对周数。Phase 1 已完成, Phase 2 正在启动, Phase 3 等待 Phase 2 schema 扩展。

阶段

Phase 1DONE

Research Agent · Rules MVP

Phase 2NOW

Tracking + LLM 兜底 + 数字字段

Phase 3LATER

Decision Agent · 双视角输出

Phase 1 Done
Phase 2 In progress
Phase 3 Planned

§1 Phase 1 (Done)

已交付 · Research Agent

从原始事件文本到结构化分类到聚合周报, 本地能闭环跑通。30 条 labeled regression 100% 三项全过, per-thread macro F1 1.000。

本体 ontology

ontology.py 4 主线 / 6 场景 / 6 维度 / Thesis 三态 + 关键词词典

✓ Done

Rules 分类器

classifier.py 含负向反义 + RISK fallback + dedupe 防护

✓ Done

SQLite schema

db.py events / companies / market_model / thesis_state 4 表

✓ Done

CRUD + 反哺

repository.py enrich_with_company_threads

✓ Done

种子数据

seed.py 84 条市场模型 + 6 家代表公司

✓ Done

周报生成

report.py markdown + JSON 双格式

✓ Done

回归评测

regress.py 整体 + per-thread P/R/F1 + 失败列表

✓ Done

CLI

cli.py 9 个子命令

✓ Done

FastAPI

api.py 8 个业务端点 + /health

✓ Done

测试

tests/ 18 个 test, 含 30 条样本回归

✓ Done

§2 Phase 2 (TODO)

Tracking Agent · LLM 兜底 + 抓取

抓取 schema 必须为 Phase 3 决策层准备好数字字段——这是本阶段的核心约束。与 PRD §3.1 / §3.2.2 对齐。

10 个 story

完成度: 2/10 (P0 ×5 · P1 ×3 · P2 ×1)

真实新闻 20-50 条盲测 + 回归基线再评

✓ 完成

见 regression-real.md

词典扩展 (rules v1)

✓ 完成

三项全过 40% → 64%

LLM 兜底分类(conf<0.55 或 thread≥3)

目标真实集三项全过 ≥85%

公司反哺改 弱信号 + confidence 折扣

与 LLM 兜底同批

events 表 schema 扩展(订单金额 / capex / opex / 客户主体)

决策层依赖, 不做 P3 没米下锅

公司卡片字段扩展(orders / revenue_mapping / peer_rank)

同上

接 RSS / 公司公告抓取 + 金额解析

抓取必须解析金额

自动归类入库(复用 ingest pipeline)

—

Thesis impact 实时评分 → thesis_state 表

—

风险预警推送(置信度 + 主线 + 订阅)

—

§3 Phase 3 (TODO)

Decision Agent · 决策辅助

从「看清楚」到「判清楚」, 输出双视角决策建议 —— CEO 看战略, 投资人看仓位。不是自动生成 DOCX / Excel / PPT(那只是分发载体)。本阶段对齐 PRD §3.3 决策层。

3a · CEO 视角(产业决策)

主驱动变量 + 战略建议

主驱动变量识别 + 强度评分(本周期 top-3)

输入: P2 事件分布 + 数字字段

主线评分(本周 vs 上周变化 + 驱动归因)

每条主线评分变化, 归因到具体事件

战略建议生成(进入/等待/退出/加速)+ 触发条件

建议挂在变量上, 带阈值

风险预警 + 下周跟踪清单

沿用 P2 alerts

3b · 投资视角(二级市场)

仓位调节 + 估值映射

市场模型动态更新(用真实 capex / opex / 订单修正)

替代 seed.py 占位数

同主线公司相对位势矩阵

估值 × 订单变化 × thesis 影响 → 排序

仓位调节信号(主线级加/减/持)+ 证据链

必须带 evidence: 近 N 周驱动力变化

公司估值映射(订单 / 收入 → DCF / PE)

接入 3a 主驱动变量作为情景假设

异常告警(超预期订单 / 监管事件 / 业绩反转)

触发后立即写仓位信号

3c · 分发载体(附属, 非产品价值本身)

DOCX · Excel · PPT

DOCX 自动生成 (python-docx)

包装 3a + 3b 输出

Excel 自动生成 (openpyxl + pivot)

仓位矩阵 + 公司排名

PPT 自动生成 (python-pptx + 模板)

CEO / 投资双版本

多 agent 辩论编排(参考 web/app.html)

辩论反哺仓位置信度

§5 优先级建议

按 ROI 排序的下一步

通常 4 → 5 → 6 → 7 → 8 是最自然的顺序。关键路径上的瓶颈是 5 (schema 扩展), 不是 4 (LLM 兜底) —— 5 没做完, 7 没法启动。

真实数据盲测

25 条公开新闻, 三项全过 40%, macro F1 0.822

✓ 2026-06-02

Phase 2.0 词典扩展

rules v1 真实集三项全过升到 64%, thesis 92%, 运营支撑 F1 0.80

✓ 2026-06-02

PRD / 路线图双视角对齐

PRD §3 重组为三层, Phase 3 重定义为「决策辅助」

✓ 2026-06-02

Phase 2.1 LLM 兜底 + 公司反哺弱信号化

conf<0.55 或 thread≥3 触发, 廉价模型即可, 目标真实集三项全过 ≥85%

3-5 天

events / companies 表 schema 扩展

加 numeric_fields / orders / revenue_mapping / peer_rank · P3 前置依赖

1-2 天

Phase 2 抓取最小化

选 1 个最稳定数据源(沪深公告 API)跑通抓→分类→入库→周报闭环, 必须解析订单金额

—

Phase 3a · 双视角周报原型

主驱动变量识别 + 主线评分变化 + 仓位调节信号(规则 + LLM 混合)

7-10 天

前端打通

把 web/app.html 工作台模拟数据切换到真实 API, 仓位信号订阅

—

§4 Cross-phase

横向每阶段都顾

这些不与单个 Phase 绑定, 但每阶段都要顾着。

真实数据

现状: 25 条盲测

Phase 2 抓取扩到 ≥ 100 条

文档

现状: 7 份 MD + 11 份 HTML

每加 1 个模块同步

可观测

现状: 无

加 OTel / metric 端点

部署

现状: 本地

Docker compose 化

鉴权

现状: 无

API 加 token, Phase 2 起

多语

现状: 中文为主

英文 LM 模型时考虑