今天刚与远端完成 15-commit fast-forward sync · Phase 2.1 LLM 兜底 / Phase 3a 决策层 / Phase 3b PE 估值 / Phase 3c 多格式导出 / 多 Agent 辩论 skeleton / observability / 鉴权 / Docker / CI 全部已落盘。原 4 条菜单(A/B/D)已交付, 仅 C 前端打通 留下。本页把它和后续 3 条新增项重新排序成 P0-P3, 每条给出现状 / 任务 / 风险 / 验收。
展开下面 4 张状态卡看 Phase 进度;再看下方表格看每个阶段对应的代码模块。这是规划下一步的锚点 —— 任何"再做一遍"的提议都应该先在这里被排除。
64 tests 通过web/index.html + web/app.html + 4 张架构 SVG + 3 份 PRD + Cloudflare Pages 部署 pipeline| 阶段 | 已交付 | 主要模块 |
|---|---|---|
| ✅ Phase 1 | rules-based 输入侧 + 周报 + 30 条合成集回归 100% / 25 条真实集 64% | classifier.py · ontology.py · report.py · regress.py |
| ✅ Phase 2 | Source 抽象 + JSONL/Text/RSS · 中文金额提取 · 抓取管线 | sources/{base,jsonl,text,rss}.py · extract.py · ingest_pipeline.py |
| ✅ Phase 2.1 | LLM 兜底层 · OpenAI/Claude 兼容 · 触发门 conf<0.55 或 ≥3 thread · stub 验证 64%→80% | llm.py |
| ✅ Phase 3a | 双视角决策周报(CEO 主驱动+战略 / 投资位势+仓位信号) | decision.py |
| ✅ Phase 3b | PE 估值映射(透明可覆盖)+ 市场模型动态视图 | valuation.py · market_model.py |
| ✅ Phase 3c | HTML/CSV 零依赖导出 + DOCX/PPTX 可选 extra | export.py |
| ✅ 横切 | thesis 实时评分 + 风险预警 · Prometheus /metrics · Bearer token · Docker · GitHub Actions CI · debate skeleton | thesis.py · observability.py · api.py · debate.py |
| ❌ Web 后端 | 数据层 / 工具层 / 能力层 / 编排层 / 运行底座 / eval 数据集 | 尚未开始 |
建议执行顺序:P0 先做闭环 demo(用户最早能看到价值)→ P1 扩公司数据底座(命中率提升)→ P2 让 debate 真跑(决策深度) → P3 把 RSS 接出去(真实数据流)。每条独立可起, 但顺序按"价值密度从高到低"。
把 web/app.html 里的模拟数据切到真实 agent REST 端点, 让用户在浏览器里就能看到 agent 跑出来的双视角决策。最小闭环: CEO brief + 投资 brief + 事件列表 + 风险预警 4 个区域用真数据。
web/app.html 是完整可交互的纯前端 demo, 内置模拟数据, 五层接口示例在前端闭环/decision/weekly · /events · /thesis/state · /alerts · /valuationCORSMiddleware, 暴露 web originweb/app.html 顶部加 API_BASE 配置(URL ?api= 可覆盖)fetchDecision / fetchEvents / fetchThesisState / fetchAlerts 4 个 async 函数SATAGENT_API_TOKEN 时用?api=http://127.0.0.1:8000 能看到 4 个区块全部真数据samples/events.jsonlweb/DEPLOY.md 追加"如何配 API_BASE"小节把卫星互联网产业链上下游核心标的从 6 家扩到 20 家, 让公司命中率从"低个位数 %"提到"两位数 %"。配合 valuation 模块给出更全面的位势矩阵, 也给 decision 的反哺提供更稳定的主线归类。
seed.py 当前只塞 6 家公司(中国卫星 / 海格通信 / 信科移动 / 中国卫通 / 中兴通讯 / 华力创通)orders / peer_rank / last_quarter_revenue_cny_yi)seed.py 的 dict(name / thread / products / customers / aliases / score / moat / risk / orders / revenue)tests/test_seed_expansion.py 验证 20 家全部能 match/decision/weekly?view=investor 至少 5 家进入仓位信号| 主线 | 候选公司 |
|---|---|
| 核心网 | 中兴通讯ⓘ · 烽火通信 · 信科移动ⓘ · 中国卫通ⓘ |
| 终端 | 海格通信ⓘ · 华力创通ⓘ · 中国卫星ⓘ · 上海瀚讯 · 七一二 |
| 芯片 | 海格通信ⓘ · 振芯科技 · 国博电子 · 复旦微电 · 国光电气 |
| 运营支撑 | 中科星图 · 航天宏图 · 超图软件 · 北斗星通 · 合众思壮 |
| 卫星制造 | 中国卫星ⓘ · 上海航天电子 · 航天电子 · 航天发展 |
| 总集 (未上市) | 时空道宇 · 星网集团 · 国电高科 · 中国电信卫星 |
把 debate.py 的 3 个角色接到 LLM provider(复用 llm.py 的 OpenAI/Claude 兼容客户端), 让它们读窗口 events 后真实生成论点 / 反论点 / 裁决, 输出 confidence multiplier 反哺到 decision.py 的仓位信号。
debate.py 是 skeleton(143 行), 3 个角色都用 _default_arg_writer 拼模板GET /debate?thread=终端, 输出格式定下来了:bull / bear / verdict / confidence_multiplierArgWriter Protocol — (stance, topic, evidence) → strLLMArgWriter 复用 llm.LLMClassifier 的 client, 不同 prompt_judge 改造接 LLM 裁决 → multiplier ∈ [0.5, 1.5]decision.py 加 --debate-thread, 跑完把 multiplier 应用test_debate.py 加 stub LLM 验证 round-tripdebate.py 写 docstring + prompt 设计原则/debate 跑 3-4 次 LLM 调用 · 高频要不要加缓存层SATAGENT_LLM_API_KEY 后 /debate?thread=终端 输出真实自然语言论点decision.py --debate-thread 终端 multiplier 至少应用到 1 家公司test_debate.py 至少新增 4 个测试覆盖 LLM stub + fallback选 3-5 个真实 RSS / Atom feed 配进去, 让 satagent fetch --source rss 跑真数据进 events 表, 验证整条 ingest 链路在真实数据上闭环。不依赖前 3 条, 但需用户先拍板候选源 + 出网策略。
sources/rss.py 是通用 publisher-agnostic 框架, UA / 重试 / 关键词过滤齐, 离线 fixture XML 全测试已过agent/config/rss_feeds.jsonsatagent fetch --source rss --config rss_feeds.jsonagent/docs/regression-real.md 追加"真实环境 7 天数据"小节| 候选源 | URL 提示 | 优先级 |
|---|---|---|
| 工信部 RSS | miit.gov.cn 各栏目 | 高 · 政策权威 |
| 通信世界 RSS | cww.net.cn/feed/ | 高 · 产业新闻密集 |
| 中卫导航协会 | glac.org.cn | 中 · 行业垂直 |
| 上交所 / 深交所 | 走 API 而非 RSS · 框架可改造 | 中 · 信号强 |
| 公司 IR 页 | 中兴 / 海格 / 中科星图 各 IR 页 | 中 · 单源强 |
| 通信产业网 | ccidcom.com/rss.xml | 低 · 商业站 |
下面是建议执行节奏的简化甘特, 横轴是工作日(W = Workday)。P0 / P1 并行不冲突(前端 vs 数据), P2 等 P1 公司库基本到位后开始(debate 需要有内容可辩论), P3 全程平铺。
| 项 | W1 | W2 | W3 | W4 | W5 | W6 | W7 | W8 | W9 | W10 | W11 | W12 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| P0 · 前端打通 | ||||||||||||
| P1 · 公司卡片扩容 | ||||||||||||
| P2 · debate 接 LLM | ||||||||||||
| P3 · RSS 真源 | ||||||||||||
这张表把仓库里所有 PRD 和路线图文档列齐, 每份都同时给出 markdown 源和可视化版。"待生成"表示当前只有 markdown, 可视化版还未做。本"下一步"文档 (NEXT-STEPS) 也包含在内, 两种形式都已就位。
下面 5 条不在本轮 P0-P3 里, 是更远的方向。此处只占位, 等本轮 4 条至少 3 条闭环后再排具体优先级与工期。
last_quarter_revenue_cny_yi 从手工填补改成自动抓取(财报季度公告 / 同花顺 / 巨潮)