2026-06-03 · 30 份文档 · 23 个代码模块 · 下一步 4 条 P0-P3

所有文档与代码,一页可

InvesResearch 仓库里有两个产品:卫星互联网产业的决策辅助 Agent(agent/),和二级市场的多 Agent 调研工作台(web/)。本页面是它们的文档与代码模块统一总览 —— 把仓库里所有 markdown / HTML 与 Python 模块逐个列清楚, 标注哪些已写文档、哪些是新增、哪些有可视化, 一页可达, 便于人工检查整个工程的现状。最新两个加进来的是:下一步开发计划(md / html)和 数据流转图(html)。

仓库根5 份 Agent 文档13 份 Web 文档11 份 代码模块23 个 最近 sync15 commits
Repo root · 仓库根入口

仓库(3 份)

github.com/zhanglunet/InvesResearch 进来第一眼能看见的三个文件:一份说明、一份文档总览、一份跳转页。

仓库根

顶层入口 · 3 份

  • R1
    README.md · 仓库说明 说明
    解释仓库里为何并存 agent/web/ 两个独立项目 · 两者的目录布局、关系、共享视觉语言而不共享代码 · 免责声明
  • R2
    docs.html · 全文档总览 (本页) 本页
    所有 markdown / HTML / 代码模块的统一索引 · 按 仓库根 → Agent → Web → 代码模块 → 角色入口 5 段组织 · 每份文档标注用途、可视化形式、对应源码位置
  • R3
    index.html · 项目首页 门户 new
    仓库根门户 · 4 层 progressive disclosure: 三条最快路径(slides / agent flow / web demo) → 三块面板(docs / data-flow / next-steps) → 18 份 PRD+路线图(md/html 一对) → 入口辅助。访问 / 时第一眼看到的就是它。
  • R4
    data-flow.html · 数据流转逻辑图 流程 new
    以数据为中心 · 从哪里来 / 怎么处理 / 到哪里去 · 5 类源 + 7 步管线 + 4 张表 + 7 个分析模块 + 5 种出口 + 一条端到端追踪
  • R5
    NEXT-STEPS · 下一步开发计划 面板 new
    2026-06-03 sync 后的下一轮 4 条 P0-P3 任务 · 现状 + 任务拆解 + 风险 + 验收 + 时间线 · 含 PRD 索引(9 份 md+html 一对) · markdown + 网页同步
  • R6
    slides.html · 12 张 PPT 网页版 面板 new
    PPT 风格的一页全景介绍 · 12 张幻灯片覆盖问题 / 答案 / 方法 / 数据流 / 关键技术 / 结果 / 样例输出 / 下一步 / 远期 / 入口 · 方向键 / 空格 / PageUp-Down 翻页 · scroll-snap 全屏
Two products

两个产品 · 一棵文档树

Agent 端解决产业决策(卫星互联网四主线),Web 端解决调研工作流(A股/港股/美股多市场)。两者共享同一套视觉语言与文档约定,各自有独立 flow.html 作为端到端总览,本页是它们之上的总入口。

agent/ · Python · SQLite · FastAPI · 实仓 · 64 tests

卫星互联网 · 决策辅助 Agent

把政策 / 订单 / 公告 / 产品事件,映射到核心网 / 终端 / 芯片 / 运营支撑四条主线,在此之上回答两个问题:本周期主驱动变量是什么?如何据此调整行动?Phase 1 规则版输入侧已交付, Phase 2.1 LLM 兜底 + Phase 3a 决策层 + Phase 3b PE 估值 + Phase 3c 多格式导出已落盘。

CEO view
变量 + 策略
识别主驱动变量, 输出战略建议(进入/等待/退出/加速)
Investor view
仓位 + 证据
量化主线热度 + 公司相对位势, 输出 加/减/持 信号
打开端到端流程图
web/ · LangGraph · MCP · Skills · 纯静态站

二级市场 · 调研工作台

面向专业投资人 / 分析师的多市场智能体深度调研系统。把一家公司或一个行业的深度调研, 从数天压缩到分钟级。Skills + MCP 双层 + LangGraph 多 Agent 编排 + 多空辩论。当前仓库内是对外网站 + 模拟数据交互 demo, 后端尚未落地。

Stage 1 MVP
4 周
数据层 + 单 Agent + MCP + 基础报告
Stage 2 GA
20 周
多 Agent 辩论 + RAG + 前端联调 + 三市场
打开端到端架构图
Agent · 卫星互联网决策辅助

Agent 文档(13 份)

左栏是顶层入口与既有总览页(README / PRD / flow / dashboard),右栏是按主题展开的 8 份子页(每份对应一个 markdown 源 + 同名 *-viz.html 可视化版)。所有 markdown 都用统一的可视化形式承载:流程 / Gantt / 矩阵 / 面板。

顶层入口 + 总览

5 份 · README / PRD / 总览

  • A1
    agent/README.md 说明
    快速开始 · 安装 / CLI 示例 / FastAPI 端点列表 / Docker 一键起 / 目录结构 / MVP 边界 / 后续路线 — 上手第一站
  • A2
    agent/PRD.md · 产品定位 面板
    CEO + 投资双视角 · 输入侧/判断层/决策层三层 · MVP 范围 · Phase 1/2/3 关键路线 — 全部判断的源头
  • A3
    docs/README.md · 文档索引
    agent 文档地图 + 「按主题深读」表 + 与代码的对应表 — 进入 docs/ 后的分流页
  • A4
    flow.html · 端到端流程 流程
    单页全流程图示 · 双视角 + 输入侧/判断层/决策层 + 真实数据基线 + roadmap + schema · 12 节, 一页可检
  • A5
    dashboard.html · 设计看板 面板
    Phase 1 设计哲学 · 模块图 · 三阶段路线图 · 当前进度看板 — 工程评审用
按主题展开 (md + viz)

8 份子页 · 每份一种可视化

  • A6
    架构 · 模块 + 数据流 流程
    三层模块图 · ingest 与 weekly report pipeline · 4 关键决策 · 数据模型 schema · 已同步到 Phase 2 + Phase 3a 交付状态
  • A7
    本体词典 · ontology 矩阵
    4 主线 × 关键词词典 / 6 场景 / 6 维度 / 极性词典(45 正 + 35 负) / 反义对 / 维护原则
  • A8
    API · CLI + REST 矩阵
    9+ CLI 子命令 / 14+ REST 端点(含 /thesis/state · /alerts · /valuation · /debate · /metrics · /market-model/dynamic 新增) / 错误码 / 3 个典型工作流
  • A9
    路线图 · Phase 1/2/3 Gantt
    Phase 1 已交付 · Phase 2 抓取 ✅ · Phase 2.1 LLM 兜底 ✅ · Phase 3a 决策层 ✅ · Phase 3b 估值 ✅ · Phase 3c 导出 ✅ · 当前优先级建议
  • A10
    回归 · 合成集 矩阵
    30 条合成样本 · 三项独立指标 · per-thread P/R/F1 · round 1 复盘 · 阈值断言
  • A11
    回归 · 真实集(25 条公开新闻) 矩阵
    v0 vs v1 词典扩展前后对比 · 三项全过 40% → 64% (rules) · LLM 兜底离线 stub 验证 64% → 80% · 失败 case 三类根因
  • A12
    数据视角 · schema · 种子 · 样本 · 缺口 矩阵
    4+ 张表(含 thesis_state / market_model_dynamic) / 84 行市场模型 / 6 家公司 / 25 条真实样本 / 365 词词典 / Phase 3 决策层数据缺口
  • A13
    PRD 可视化版 面板
    PRD.md 的图示版 · 双视角 + 三层 + 决策层输出 mockup — A2 的可视化映射
  • A14
    数据字典 · 字段级 schema 唯一参考 矩阵
    2026-06-03 新增 · events / companies / market_model / thesis_state 四表逐字段 + Phase 2 数字字段(order_amount / capex / opex / time_window / customer)的硬要求 · 维护原则
Web · 二级市场调研工作台

Web 文档(11 份)

Web 侧由「对外网站文件」+「设计文档」两部分组成。左栏是站点入口(index / app / 404 / roadmap 等可直接打开的 HTML),右栏是 docs/ 下的设计文档(产品 PRD / 工程 PRD / 架构说明 / 路线图 + 已有 flow.html)。

站点入口 · HTML

6 份 + 部署 · 直接打开

  • W1
    web/README.md 说明
    网站说明 · 在线体验入口 · 目录结构 · 技术说明(纯前端 + Google Fonts) · 模拟数据声明 · 部署链接
  • W2
    web/DEPLOY.md · 部署指南 指南
    面向不使用命令行的读者 · 全程在 GitHub + Cloudflare 网站点击完成 · 约 15 分钟 · 自动重新发布
  • W3
    index.html · 落地首页
    产品介绍 + 架构 + 文档导航 · web/ 站点根
  • W4
    app.html · 投研工作台 demo
    完整可交互前端 · 模拟数据闭环 · 五层接口示例 — Web 侧的核心产物
  • W5
    roadmap.html · 路线图入口
    24 周三阶段路线图 · 顶层导航 entry · web/docs/roadmap.md 的可视化映射
  • W6
    404.html · 找不到页提示
    友好 404 提示页 + 回首页链接
  • W7
    devlog/README.md · 开发自动日志
    .claude/hooks/ 4 个脚本自动维护 · 按日期 + session 分段的活动日志 · transcripts 本地保留
设计文档 · docs/

10 份文档 + 1 份 flow

  • W8
    flow.html · 端到端架构 流程
    单页全流程图示 · 五层架构 + 6 里程碑 + M1 数据层关键路径 + 技术栈 + 待决策 + 风险 · 全角色一页可检
  • W9
    产品 PRD · 用户与功能 面板
    3 类用户画像 / 5 个典型场景 / 22 项功能 P0-P2 优先级矩阵 / 3 阶段里程碑
  • W10
    工程 PRD · 分层与契约 流程
    3 层解耦(Harness/Agent/Capability) / 8 个子系统 / Pydantic schema / 10 项 ADR / 11 项 NFR
  • W11
    架构说明 · 4 张图逐图详解 流程
    系统总览(5 层) / 数据层(请求生命周期 + 熔断) / 编排(LangGraph 状态机) / Skills+MCP 双层 · 配套 4 张 SVG/PNG(web/assets/diagrams/)
  • W12
    24 周路线 · 6 里程碑 + Sprint Zero Gantt
    W01-W24 三阶段 / M1-M6 详细拆解(2026-06-03 叠加 M3.5) / 关键路径 / Sprint Zero D1-D14 / 6 项风险登记 / 4 项待决策
  • W13
    增强 PRD · EH-1~EH-7 七条增强主线 面板
    2026-06-03 新增 · 把"常驻 agent + 活工作区 + 主动推送 + 沙箱抓数 + 自定义 Skill + 复杂任务拆解 + 个性化"前移到 Stage 1/2 · 配同名 html 单文件
  • W14
    架构决策 · "为什么是这套架构" 流程
    2026-06-03 新增 · 与 W11 架构图说明互补,5 层分层 + 8 子系统 + 关键 ADR 决策记录 · 可独立阅读的决策摘要
  • W15
    系统设计文档 · 组件契约 + 时序 + 部署 流程
    2026-06-03 新增 · 工程 PRD 与架构决策之间的结构参考 · 组件分解 / 关键时序 / 部署拓扑 / 故障模式
  • W16
    开源调研 · 16 个金融 Agent 项目对比
    2026-06-03 新增 · 支撑产品 PRD §1 的差异化论断(深度调研是空白)· TradingAgents / FinRL / Qlib / OpenBB / gpt-researcher 等场景归类
  • W17
    Harness 最佳实践 · 工程 PRD 的方法论底稿
    2026-06-03 新增 · Harness 与 agent 解耦 / 8 子系统来源 / 上下文工程四手段 / LangGraph 选型依据 / 模型路由成本控制
Code modules · agent/satellite_agent/

Agent 代码模块(23 个)

Agent 侧的全部 Python 模块。按职责分四层:L1 数据底座(schema / 仓储 / 种子) · L2 输入侧(本体 / 分类 / 抓取 / 抽取) · L3 判断+决策层(LLM / 决策 / 估值 / 市场模型 / thesis / 辩论) · L4 接口与边角(CLI / API / 报告 / 导出 / 回归 / observability)。标 NEW 的 7 个模块是 2026-06-03 同步进来的, 其中 5 个尚无独立文档,仅在 README / roadmap 提及。

db.py
L1 · 数据底座
SQLite schema + migrate_schema() 幂等迁移 · events / companies / thesis_state / market_model_dynamic 全部表定义在此
文档: data.md / architecture.md
repository.py
L1 · 数据底座
events / companies / thesis_state CRUD · 唯一与 SQL 直接打交道的层
文档: data.md / architecture.md
seed.py
L1 · 数据底座
2025-2031 × 4 主线 × 3 情景市场模型种子 + 6 家公司卡片占位 · MVP 演示用, 接实盘需替换
文档: data.md
ontology.py
L2 · 输入侧
4 主线 + 6 场景 + 6 维度 + 关键词词典(365 词) + 极性词典(45 正 + 35 负) + 反义对
文档: ontology.md (1:1 镜像)
classifier.py
L2 · 输入侧
rules-based 分类器 · 关键词匹配 + 置信度计算 · 真实集 64% 三项全过
文档: architecture.md / regression-real.md
extract.py
L2 · 输入侧
Phase 2 中文金额提取(亿 / 万自动换算) + 时间窗 + 客户主体识别
文档: architecture.md (Phase 2 节)
ingest_pipeline.py
L2 · 输入侧
Phase 2 抓取管线编排:Source → classify → 公司反哺 → LLM 收口 → 入库 · 顺序保证 LLM 能纠正反哺引入的 over-fire
文档: architecture.md / api.md (fetch CLI)
sources/base.py
L2 · 输入侧
Source ABC · 定义 fetch() → Iterable[RawEvent] 契约 · 所有源实现的基类
文档: architecture.md
sources/jsonl.py
L2 · 输入侧
JSONL 文件源 · 逐行解析 · 离线 demo 起点 (samples/events.jsonl)
文档: architecture.md
sources/text.py
L2 · 输入侧
纯文本文件源 · 单事件文档 → RawEvent
文档: architecture.md
sources/rss.py NEW
L2 · 输入侧
通用 RSS/Atom HTTP 源 · publisher-agnostic · UA + 重试 · 可用 fixture XML 离线测试 · CLI: satagent fetch --source rss --url ...
文档: README 提及, 无独立文档
llm.py NEW
L3 · 判断 / 决策
Phase 2.1 LLM 兜底层 · provider 可插拔(OpenAI 兼容 + Claude/Anthropic) · 触发门 confidence<0.55 或 ≥3 thread · 无 key 时优雅降级为 no-op
文档: README 路线节 · regression-real.md
decision.py
L3 · 判断 / 决策
Phase 3a 决策层规则版 · CEO 主驱动变量 top-3 + 战略建议 · 投资公司位势矩阵 + 仓位信号 加/减/持 + 证据链
文档: architecture.md Phase 3 节 / PRD.md
valuation.py NEW
L3 · 判断 / 决策
Phase 3b 透明 PE-based 公司估值映射 · 假设可覆盖 · 占位默认 · 不构成投资建议 · API: /valuation
文档: README 提及, roadmap.md 列入
market_model.py NEW
L3 · 判断 / 决策
市场模型动态视图 · seed 基准 + 窗口实测 capex / 订单覆盖 + 证据链 · API: /market-model/dynamic
文档: README 提及, roadmap.md 列入
thesis.py NEW
L3 · 判断 / 决策
thesis 实时评分 · 各主线增强 / 削弱事件计分 · thesis_state 表 · API: /thesis/state · /alerts
文档: README 提及, 无独立文档
debate.py NEW
L3 · 判断 / 决策
多 agent 辩论编排 skeleton · Bull / Bear / Judge 三角色 · 裁决 + 置信度乘数 · 当前为骨架 (143 行)
文档: README 提及, 无独立文档
report.py
L4 · 接口 / 边角
周报聚合 + markdown 渲染 · Phase 1 输出形式
文档: architecture.md / api.md
export.py NEW
L4 · 接口 / 边角
Phase 3c 决策简报多格式导出 · HTML / CSV 零依赖 · DOCX / PPTX 走可选 .[export] extra
文档: README 提及, 无独立文档
observability.py NEW
L4 · 接口 / 边角
零依赖 observability · Prometheus /metrics 端点 + stats CLI · 事件 / 主线 / thesis 评分计数
文档: README 提及, 无独立文档
regress.py
L4 · 接口 / 边角
回归评测器 · 合成集 + 真实集双跑 · per-thread P/R/F1 · CLI: satagent regress
文档: regression.md / regression-real.md
cli.py
L4 · 接口 / 边角
satagent CLI 入口 · 13+ 子命令 · click-based · 涵盖 init / ingest / classify / fetch / report / decision / valuation / debate / regress / stats 等
文档: api.md (CLI 矩阵)
api.py
L4 · 接口 / 边角
FastAPI app · 14+ REST 端点 · 可选 Bearer token 鉴权 (SATAGENT_API_TOKEN) · 自动 OpenAPI 文档 (/docs)
文档: api.md (REST 矩阵)
Visualization grammar

四种可视化形式

不同的文档内容映射到不同的可视化形式。流程图适合 pipeline,Gantt 适合时间表,矩阵适合数据对比,面板适合决策视角。这 4 种形式贯穿全部可视化页面,视觉语言完全统一。

F
Flow
端到端 pipeline · 架构 · 数据流 · 时序
G
Gantt
路线图 · Phase / Milestone · 时间维度
M
Matrix
关键词词典 · API 端点 · 回归指标
P
Panel
PRD · 决策视角 · 信号面板 · 仪表盘
Human inspection

怎么人工检查?

建议按下面三个角色的视角进入文档与代码树。每个角色有不同的关注点, 对应不同的入口路径与检查清单。

PM · 产品检查

需求 / 优先级 / 路线图是否对齐

  1. 先看 顶层入口(本页),掌握 agent + web 两个产品的双视角定位
  2. agent/PRD 可视化, 重点看「输入侧 → 判断层 → 决策层」三层, 验证 Phase 3 是「决策辅助」而非「文档自动化」
  3. web/产品 PRD 可视化, 比对 3 类用户与 22 项功能优先级
  4. roadmap 可视化, 看 Phase / Milestone 时间轴; 注意 agent 端 Phase 2.1 / 3a / 3b / 3c 都已交付
  5. 检查代码模块清单里 5 个 NEW · 无独立文档 的模块, 拍板是否要补 doc
工程师 · 技术检查

模块 / 契约 / 容灾是否扎实

  1. 先看 agent/flow.htmlweb/flow.html, 建立端到端心智模型
  2. 深入 架构可视化(模块图 + 数据流 + 关键决策)
  3. 对 web/, 深入 工程 PRD 可视化(三层解耦 + Pydantic 契约 + ADR)
  4. 代码模块清单 的 L1→L4 分层, 验证模块边界与责任分配
  5. 检查 API 可视化(CLI + REST 是否覆盖所有用例 · 已加 thesis / alerts / valuation / debate / metrics 等新端点)
QA / 算法 · 质量检查

回归 / 评测 / 失败 case 是否充分

  1. 回归(合成集)可视化, 确认 30 条样本三项全过 100%, per-thread F1 1.000
  2. 回归(真实集)可视化, rules 基线 64%, LLM 兜底 stub 验证 80%, 目标 ≥ 85%
  3. 逐条检查 失败 case 根因, 验证 LLM 兜底覆盖路径
  4. 对 web/, 检查 工程 PRD 验收标准(Given-When-Then 必须可测试)
  5. 本地跑 cd agent && pytest -q · 当前 64 tests 通过