路线图 v1.0 · 2026-05-29

从演示站,到可运行的
智能体投研系统

站点与交互 demo 已上线,后端从 0 起步。这是工程 PRD 六里程碑的可执行版本:24 周、6 个里程碑、Sprint Zero day-by-day、风险与决策卡。

时间窗24 周 里程碑M1–M6 + Stage 3 最小团队6 人 关键路径20 周
§0 · 状态盘点

对外形象已就位,产品本体待建

把"已完成"和"待开发"摆清楚,后面的所有排期才有锚点。

已交付 SHIPPED

网站、demo、文档、部署 pipeline
  • 落地页 index.html(含架构图导航)22 KB
  • 交互投研工作台 app.html(纯前端 + mock data)90 KB
  • 4 张架构 SVG(总览 / 数据 / 编排 / Skills+MCP)52 KB
  • 3 份 PRD(产品 / 工程 / 架构说明)82 KB
  • GitHub + Cloudflare Pages 部署 pipelinelive
对外材料完成度100%

待开发 TO BUILD

完整后端 / 真实数据 / Agent 编排
  • 数据层 L1(适配器 / 路由 / 熔断 / 4 层缓存)M1
  • MCP server + Skills 包 + 工具实现M2
  • LangGraph 编排 / 多空辩论 / HITLM3
  • RAG / 舆情 / 量化筛选M4
  • 报告生成 + 前端真实联调M5
  • 三市场 + 私有化 + eval CIM6
系统本体完成度0%
§1 · 总体节奏

24 周三阶段时间线

M1 是地基必须独立跑通;M3/M4 可并行;M5 是第一个对外发布锚点;M6 横向扩展三市场与私有化。

里程碑
Stage 1 · MVP(W01-W08)
Stage 2 · 差异化(W09-W16)
Stage 3 · 生态化(W17-W24)
M1 数据层
W01-W04
M2 单 Agent + MCP
W03-W06
M3 多 Agent 编排
W07-W10
M4 RAG + 舆情
W07-W10
M5 报告 + 前端
W11-W14
M6 三市场 + 私有化
W15-W20
Stage 3 生态化
W21-W24
数据层
能力封装
编排
RAG 舆情
报告与前端
多市场私有化
生态开源
§2 · 里程碑详解

六个里程碑,各有可验收的边界

每张卡片是一个 PR 串、一组验收标准、一段独立工时。点开详细规划见 roadmap.md

M1
W01–W04 · 4w

数据层地基

在不稳定的免费源之上,做出可用率 > 99% 的统一数据服务。后续一切的前提。
工时1 BE + 0.5 SRE
验收命中率 > 80%
依赖无(地基)
风险HIGH
TushareAKShareCircuitBreaker 4 层缓存PydanticPostgres+Timescale
M2
W03–W06 · 4w

单 Agent + MCP 工具

单 agent 通过 MCP 拿数据、做基本面调研、产出 schema-valid 结果,全链路 trace。
工时1 BE
验收Skill 成功率 > 90%
依赖M1
风险MID
FastMCPPydantic AIget_financials run_dcfLangfuse凭证代理
M3
W07–W10 · 4w

多 Agent 辩论编排

5 分析师并行 + 多空辩论循环 + HITL 估值假设 + Postgres checkpointer。
工时1 BE + 1 AI Eng
验收P95 ≤ 10 分钟
依赖M2
风险MID
LangGraphSendinterrupt PostgresSaverLiteLLMcost_guard
M4
W07–W10 · 4w

RAG + 舆情

向量库 + 研报检索 + 新闻情绪 + 量化筛选,把非结构化信号纳入辩论。
工时1 AI + 1 Data
验收F1 ≥ 0.78
依赖M2(可与 M3 并行)
风险MID
pgvectoredgartoolsFinNLP QlibAlpha101Playwright
M5
W11–W14 · 4w

报告生成 + 前端联调

Demo 切真数据;两段式报告 harness;PDF/DOCX 导出;Next.js 重构 + SSE 实时流。
工时1 FE + 1 BE
验收10 分钟出 PDF
依赖M3 + M4
风险MID
Next.js 14SSEWeasyPrint python-docxReact Query报告库
M6
W15–W20 · 6w

三市场扩展 + 私有化

港股 + 美股路由;复权 / 币种统一;vLLM 私有部署;eval CI;安全加固。
工时全员(5+ 人)
验收三市场覆盖
依赖M1–M5
风险MID
edgartoolsvLLMQwen2.5 DeepSeekBraintrustOWASP MCP
§3 · 关键路径

依赖关系一图说清

M1 → M2 → M3 → M5 → M6 是 20 周的关键路径,M4 与 M3 并行。M1 是单点风险:任何延期向后全程传导。

M1 数据层 M2 MCP + Skill M3 编排辩论 M4 RAG 舆情 M5 报告 + 前端 M6 三市场 ━━━ 关键路径(20 周) · - - - 并行路径
关键路径M1 → M2 → M3 → M5 → M6,总长 20 周,对应 Stage 1+2 完成。
并行编组M2 完成后,M3(编排)与 M4(RAG)由不同团队并行推进,节省 4 周。
单点风险M1 任何延期会向后全程传导;Day 1 必须同步申请 Tushare 积分。
首个对外锚点M5(W14)demo 切真数据,作为 Stage 2 末尾的对外发布节点。
§5 · Sprint Zero

第 1-2 周 day-by-day

把"第一天能干什么"拆到天。Sprint Zero 结束时,数据层雏形可演示。

01MON
Monorepo 初始化
apps/ packages/* · ruff/mypy · 提交 Tushare 积分
02TUE
本地栈拉起
Postgres+TS / Redis 7 · Docker Compose · .env
03WED
Pydantic schema
Security / DailyBar / Financials / Filing + 单测
04THU
Provider 抽象
Tushare provider 完整实现(daily_bar)
05FRI
Tushare 财务
financials 接口 + 健康检查 + 单测
06MON
AKShare provider
同接口实现 · 跨源校验单测(差异 > 10%)
07TUE
容灾组件
CircuitBreaker 三态 + tenacity + Redis 令牌桶
08WED
四层缓存
LRU → Redis(分布式锁)→ DuckDB → Postgres
09THU
DataFetcherManager
ROUTING_TABLE 装配 · market-aware dispatch
10FRI
集成压测
30 支 A 股 × 24 小时 · 可用率 / 命中率基线
11MON
Langfuse 部署
自托管 + OpenLLMetry 埋点
12TUE
监控 dashboard
Grafana · 可用率 / P95 / 命中率 / 熔断事件
13WED
M1 sprint review
demo + README + ADR-04/05 落档
14THU
M2 启动会
MCP server 设计评审 · Skills 包目录约定
§6 · 风险与待决策

需要被持续盯住的事

高风险登记每周更新;四个决策卡有截止周次,过期未拍板会阻塞对应里程碑。

高风险登记

Tushare 积分申请未通过影响 M1 主路径阻塞 · 缓解:Day 1 提交 + baostock 兜底
HIGH
免费源被反爬封禁影响数据可用率 · 缓解:代理池 + 双源 + 付费源应急脚本
HIGH
LLM 成本超 $0.5/次影响商业模式 · 缓解:Model routing + 缓存提升 + Haiku
MID
MCP/Skills spec 演进破坏兼容缓解:锁定 stable + 包装层隔离
MID
前端 vanilla → Next.js 拖延影响 M5 延期 · 缓解:W09 启动迁移 spike
MID
辩论变"双方各说各话"缓解:强约束 prompt + LLM judge 检查反驳率
LOW
W04

商业模式与定价

按次 / 订阅 / 开源+企业版?直接影响成本护栏严格度和付费源迁移时机。

W08

私有化部署优先级

是否必须 Stage 2 完成?决定 M6 是否提前 + 是否启动 vLLM 路径。

W12

免费数据源合规边界

法务对"研究用途"与"商业再分发"的界定。影响 Stage 3 能否开源。

W07

DCF 系统建议值责任

默认假设导致决策失误的责任归属,关系到 HITL 强度与免责设计。

这是规划,不是答案

路线图基于今天的 PRD 与团队设想,任何里程碑、工时、决策窗口都会随实际情况调整。下一步等四个决策卡里的答案。