# InvesResearch Agent · 产品需求文档(PRD)

> 面向专业投资人 / 分析师的多市场(A股 / 港股 / 美股)智能体深度调研系统
>
> 文档版本 **v1.0** · 状态:草案待评审 · 关联文档:《系统设计文档 v1.0》《开源调研对比报告》

---

## 文档信息

| 项 | 内容 |
|---|---|
| 产品名称 | InvesResearch Agent(内部代号 IRA) |
| 文档类型 | Product Requirements Document |
| 适用版本 | MVP(Stage 1)→ 差异化(Stage 2)→ 生态化(Stage 3) |
| 目标读者 | 产品、研发、设计、数据工程、合规、市场 |
| 关键依赖 | AKShare、Tushare、yfinance、edgartools、LangGraph、Anthropic Agent Skills、MCP |

---

## 1. 背景与问题陈述

专业投资人和分析师在做一笔二级市场投资决策之前,真正耗费时间的并不是"下单"那一刻,而是它前面那一长串繁琐的调研工作:把一家公司的财务三表逐年扒下来、判断它的盈利质量、找出可比公司做估值、读一遍最新的年报和招股书、扫一遍近期的新闻舆情、再把整个行业的产业链和竞争格局想清楚。这些工作高度依赖人工,且在 A股、港股、美股三个市场之间来回切换时,数据口径、复权方式、会计准则、信息源都不一样,极易出错,也极其耗时。一份扎实的深度公司研究,资深分析师往往需要花费数天到数周。

与此同时,大语言模型驱动的金融 Agent 在过去一年里快速成熟,但我们调研了 GitHub / Gitee 上 16 个代表性开源项目后发现一个明确的空白:这些项目几乎全部围绕"交易决策"和"策略回测"展开(例如 TradingAgents、ai-hedge-fund、qlib、FinRL),**没有一个真正面向"专业投资人深度调研"这一场景**——也就是把竞品对标、估值建模、行业研究、招股书拆解这些"研究"动作系统性地组织起来。换句话说,市场上不缺"帮你做决定的 Agent",缺的是"帮你把功课做扎实的 Agent"。

这正是 InvesResearch Agent 要填补的空白。我们不试图替投资人做决策(那既不现实也不负责任),而是把调研流程中可被自动化的部分——取数、清洗、计算、初步分析、报告撰写——交给一组协作的智能体,让分析师把时间留给真正需要人类判断的环节:假设的合理性、管理层的可信度、行业拐点的判断。

## 2. 产品目标与非目标

产品的核心目标可以用一句话概括:把一家公司或一个行业的深度调研,从"数天"压缩到"分钟级",同时保证产出的专业度足以作为正式研究的起点。具体而言,我们希望在 MVP 阶段就能让分析师对任意一支 A股 / 港股 / 美股标的,在十分钟内拿到一份包含财务诊断、可比估值和投资要点的结构化报告;在差异化阶段加入行业研究、DCF 建模、招股书解析和多空辩论,使产出接近一份卖方初稿;在生态化阶段把这套能力开源为标准的 Skills 包,让分析师能在自己惯用的任意 LLM runtime(Claude Code、Codex、Cursor、Gemini CLI 等)里直接调用。

需要明确划清的是产品的**非目标**。第一,本产品不是投资顾问,不提供个性化投资建议,所有产出都附带显著免责声明,定位为研究效率工具。第二,本产品不做实盘交易和下单执行,与券商交易系统不做对接。第三,MVP 阶段不追求实时高频行情(分钟级足够),不做毫秒级 tick 数据。第四,我们不自建付费数据源的替代品,免费 / 开源数据的覆盖度和准确性边界就是产品能力的边界,这一点对用户透明披露。

## 3. 目标用户与画像

产品主要服务三类用户,他们的需求强度和使用方式各有侧重。

| 画像 | 典型角色 | 核心诉求 | 使用频率 | 对深度的要求 |
|---|---|---|---|---|
| 深度研究型 | 买方 / 卖方分析师、基金经理 | 一份能直接用的深度公司 / 行业研究初稿 | 每周数次,每次较长 | 极高,需财务建模与估值 |
| 广度筛选型 | 量化研究员、多策略基金 | 批量筛选 + 快速初筛大量标的 | 每日,高频 | 中,重因子与可比 |
| 即时问答型 | PM、投资总监、个人专业投资者 | 临时性的、对话式的快速求证 | 不定时,碎片化 | 中低,重速度与可读性 |

这三类用户共享同一套底层能力,但在界面上通过两种使用模式来分别满足:深度研究型和广度筛选型偏好**结构化模式**(填参数、看仪表盘、导报告),即时问答型偏好**对话式模式**(自然语言提问、自动编排 Skill)。产品需要让同一个用户能在两种模式间自由切换,而不是把他们割裂成两个产品。

## 4. 用户场景与故事

为了让需求落到实处,我们用几个典型场景来描述用户真正会怎么用这个产品。

第一个场景是**单公司深度调研**。一位分析师接到任务要覆盖贵州茅台,他在搜索框输入"贵州茅台"或代码 600519,选择"深度版",系统随即编排起一组智能体:行业分析师去研究白酒赛道,公司分析师拉取五年财务数据,财务建模师构建未来预测,多空双方就估值展开辩论,风控官评估尾部风险,最后投资经理综合成稿。整个过程在界面右侧实时可见,分析师可以随时暂停、追问某个细节,几分钟后得到一份可导出 PDF 的深度报告。

第二个场景是**行业调研**。同一位分析师想理解"商业航空"这个行业,他输入行业关键词,系统产出市场规模(TAM/SAM/SOM)、产业链图谱(上游发动机航材、中游整机、下游航司)、关键驱动因素、行业内主要公司矩阵,以及近期行业要闻聚合。他可以从公司矩阵里勾选几家加入对比。

第三个场景是**量化初筛**。一位量化研究员想在沪深 300 里找出"低估值 + 高质量 + 正动量"的标的,他在筛选页勾选相应因子、设置阈值,实时得到一个排序后的股票池,然后一键把这些标的批量送进调研流程。

第四个场景是**对话式求证**。一位 PM 在看盘时突然想知道"宁德时代最近的毛利率趋势怎么样、市场怎么看",他直接在对话框里问,系统自动判断需要调用财务和舆情两个 Skill,几秒钟给出带图表的回答,PM 可以继续追问下去。

第五个场景是**跨 runtime 调用**。一位习惯用 Claude Code 的分析师不想离开他的终端,他把 InvesResearch 的 Skills 包安装到本地,直接在 Claude Code 里说"调研一下英伟达",Skills 自动加载、通过 MCP 取数计算,在终端里完成同样的调研——这要求我们的能力封装是 runtime 无关的。

## 5. 产品范围与功能优先级

产品功能按照三个发布阶段和 P0 / P1 / P2 优先级来组织。P0 是 MVP 必须有的核心功能,P1 是构成差异化竞争力的功能,P2 是生态化和锦上添花的功能。下表是功能全景。

| 模块 | 功能 | 优先级 | 阶段 |
|---|---|---|---|
| 公司调研 | Ticker 搜索与市场识别(中文模糊匹配) | P0 | S1 |
| 公司调研 | Snapshot 概览(行情、K线、关键比率、事件流) | P0 | S1 |
| 公司调研 | 财务三表与共同百分比 / 杜邦分解 | P0 | S1 |
| 公司调研 | 基本面深度(业务分部、客户集中度、护城河) | P1 | S2 |
| 公司调研 | 调研深度选择(Quick / Standard / Deep) | P0 | S1 |
| 估值 | 可比公司相对估值(自动选 peer) | P0 | S1 |
| 估值 | DCF 建模(参数可调 + 敏感性矩阵) | P1 | S2 |
| 估值 | Monte Carlo 估值分布 | P2 | S3 |
| 行业调研 | 行业图谱 + 产业链 + 市场规模 + 竞争格局 | P1 | S2 |
| 舆情 | 新闻 / 社媒情绪聚合与时序 | P1 | S2 |
| 量化 | 多因子筛选器(估值 / 质量 / 成长 / 动量) | P1 | S2 |
| 量化 | 因子回测验证 | P2 | S3 |
| 披露文件 | 招股书 / 年报 / 8-K 结构化抽取 | P1 | S2 |
| Agent | 多空辩论编排与实时可视化 | P1 | S2 |
| 报告 | 报告生成(Quick Note / Deep Dive,PDF/DOCX) | P0 | S1 |
| 报告 | 报告库(检索、收藏、版本 diff、一键再生) | P1 | S2 |
| 集成 | Skills 包(跨 runtime 调用) | P1 | S2 |
| 集成 | MCP server(数据与计算工具) | P1 | S2 |
| 集成 | CLI / SDK | P2 | S3 |
| 协作 | 多用户 session 共享与评论 | P2 | S3 |
| 平台 | Watchlist 与定时调研 / 告警 | P2 | S3 |

## 6. 详细功能需求

下面按模块展开 P0 和 P1 的关键功能需求。每条需求都尽量写清楚"输入—行为—输出"以及边界条件,以便研发直接拆解。

### 6.1 公司调研工作台

公司调研工作台是产品的核心入口,也是用户停留时间最长的地方。用户从顶部搜索框输入公司名或代码,系统需要支持三地市场的代码识别和中文公司名的模糊匹配——这一点对中国用户尤其重要,因为他们更习惯输入"茅台"而非"600519"。系统在内部把所有标的统一标准化为 `MARKET:TICKER` 的形式(如 `SH:600519`、`HK:00700`、`US:AAPL`),并据此路由到正确的数据源。

进入工作台后,用户先选择调研深度。Quick 模式(目标 2 至 4 分钟)只跑基础财务和概览;Standard 模式(6 至 10 分钟)加入可比估值和舆情;Deep 模式(15 至 25 分钟)启动完整的多智能体辩论流程。深度选择直接决定了后端编排哪些 Skill、调用哪个档位的模型,因此也直接关联到成本,界面需要在用户选择时给出预估耗时和预估成本的提示。

工作台主区域以六个标签页组织内容。Snapshot 标签展示当前价格、52 周区间、K 线图、市盈率市净率等关键比率的历史分位,以及一条按时间倒序的重大事件流。财务标签展示三大报表,默认折叠次要科目,提供共同百分比报表(把利润表各项表示为营收的百分比)和杜邦分解(把 ROE 拆成净利率、资产周转、权益乘数),并把现金流以瀑布图呈现。基本面深度标签(P1)用 sunburst 图展示业务分部和地理收入分布,标注主要客户和供应商集中度,并给出护城河的定性分析。估值标签整合相对估值和 DCF 两块。舆情标签展示情绪时间序列和新闻流。Agent 辩论标签则实时呈现多空双方的观点交锋。

工作台右下角常驻一个"生成研报"的主操作按钮,点击后唤起报告生成 Skill,把当前调研 session 的所有产出聚合成一份可下载的报告。

### 6.2 估值模块

估值是专业投资人最看重、也最容易在自动化中出错的环节,因此我们把它拆成两个相对独立又能联动的子能力。

相对估值(P0)的逻辑是:系统自动为目标公司挑选 5 到 8 家可比公司(基于行业归类、市值区间、业务相似度),计算 PE、PB、EV/EBITDA、PS 等倍数,给出可比公司的中位数和分位数,并据此反推目标公司的隐含价值区间。用户可以手动增删可比公司,系统实时重算。这里的关键边界条件是:对于亏损公司 PE 失效、对于金融和地产等特殊行业倍数口径不同,系统需要识别这些情况并切换合适的倍数,而不是机械套用。

DCF 建模(P1)允许用户在左侧输入一组假设——营收增长路径、利润率轨迹、资本开支、营运资本、WACC 的各个组成部分(无风险利率、市场风险溢价、beta、债务成本、资本结构)、永续增长率——中间区域实时画出分年的自由现金流瀑布图和最终估值区间,右侧给出 WACC 与永续增长率交叉的敏感性热力图。所有假设都应有一个"系统建议值"作为起点(基于历史财务和行业均值),但允许用户覆盖。这个模块必须设置 human-in-the-loop 断点:在用户确认核心假设之前,系统不会把 DCF 结果写进最终报告,因为这些假设的合理性必须由人来背书。

### 6.3 行业调研模块

行业调研(P1)解决的是"自上而下"的研究需求。用户输入一个行业关键词(如"商业航空"、"半导体设备")或标准行业代码(GICS 或申万),系统调用行业研究 Skill,其底层借助通用深度研究 Agent(gpt-researcher)做网络调研,结合 AKShare 的行业指数和概念板块数据,产出几块内容:行业市场规模的历史与预测(TAM/SAM/SOM)、产业链的可视化图谱(用 Mermaid 渲染上中下游)、关键驱动因素的卡片化呈现(政策、技术、需求三个维度)、行业内主要公司的可排序矩阵,以及按月聚合的行业要闻。公司矩阵里的每一行都可以勾选,直接加入对比分析或批量调研。这个模块有一个必须坦白的能力边界:免费数据源对小众行业(尤其是需要付费行业数据库才能拿到的细分数据,如航班载客率、订单簿)的覆盖是有限的,系统需要在产出中明确标注哪些数据是估算或缺失的,而不是用看似精确的数字误导用户。

### 6.4 量化筛选模块

量化筛选(P1)服务广度筛选型用户。界面提供因子勾选面板,因子分为估值、质量、成长、动量、波动、规模几大类,底层接 Qlib 的 Alpha158/360 因子库和 WorldQuant 的 Alpha101。用户选定股票池(如沪深300、标普500)、勾选因子、设置阈值或权重,系统实时返回排序后的股票池和每只股票的因子得分明细。筛选结果可以一键批量送入调研流程,也可以保存为一个"策略"以便定时重跑并推送变化告警(后者属于 P2)。因子回测验证(P2)是这个模块的进阶能力,允许用户把筛选逻辑在历史数据上跑一遍,看看它的历史表现。

### 6.5 Agent 编排与辩论可视化

多智能体编排是产品的技术内核,但对用户而言,它需要被"可视化"成一个可理解、可干预的过程,而不是一个黑箱。当用户发起一次深度调研,界面右侧(或 Agent 辩论标签内)实时显示一棵执行树:哪个 Agent 正在运行、已完成的 Agent 花了多长时间、当前这一步在做什么。对于多空辩论这一最有信息量的环节,界面要把 Bull、Bear、Neutral 三方的观点和互相的反驳逐轮展开,让用户能看到"看多的理由"和"看空的理由"如何碰撞、Neutral 如何仲裁。用户可以在任意节点暂停,追问某个 Agent("你说渠道是护城河,具体数据是什么?"),系统据此触发补充调研。这种"可观测、可干预"的设计是建立专业用户信任的关键——分析师不会信任一个说不清楚自己怎么得出结论的工具。

### 6.6 报告生成与报告库

报告生成(P0)把调研产出固化为可交付的文档。系统提供四种模板:约两页的 Quick Note(标的、当前价、估值分位、近期事件、一句话观点),15 到 30 页的 Deep Dive(业务拆解、财务诊断、行业地位、竞品矩阵、DCF 与相对估值、风险因素、投资要点与目标价区间),20 到 40 页的 Sector Report(行业研报),以及约五页的 Earnings Recap(财报点评)。报告支持 PDF 和 DOCX 导出,支持中英文双语,图表内嵌。每一份报告都必须包含醒目的免责声明。

报告库(P1)是用户所有历史产出的归档与再利用中心。它支持按标签、收藏、全文检索来组织报告,支持对同一公司不同时间点的报告做版本 diff(直观地看到上次研究到这次研究之间,基本面、估值、观点发生了什么变化),以及"一键再生"——用最新数据重跑同一模板,这对需要定期更新覆盖标的的分析师极其有用。

### 6.7 跨 Runtime 集成

集成能力(P1)是产品在生态层面的差异化。我们把所有调研能力封装成符合 Anthropic Agent Skills 开放标准的 Skill 包(每个 Skill 是一个含 SKILL.md 的目录),配合一个用 FastMCP 编写的 MCP server 来暴露数据和计算工具。这样的设计让同一套能力既能驱动我们自己的 Web 工作台,又能被 Claude Code、Codex CLI、Gemini CLI、Cursor 等 32 款以上的 LLM runtime 直接调用。一个安装脚本负责把 Skills 复制到各 runtime 的发现路径(如 `.claude/skills/`、`.codex/skills/`)。这里的设计原则是 Skills 负责"知识与流程"、MCP 负责"数据与计算",两者互补——这也是 Anthropic 官方推荐的范式。

## 7. 关键用户流程

最核心的用户流程是深度调研流程,它把前述多个模块串联起来。流程从用户输入标的和选择深度开始;前端把请求连同当前上下文(watchlist、最近调研)发往后端;Supervisor Agent 解析意图,决定需要加载哪些 Skill(深度调研通常会同时加载公司基本面、行业、估值三个主 Skill);各分析师 Agent 并行取数与初步分析;估值师基于财务数据建模;多空双方就估值和前景展开至少两轮辩论;风控官评估尾部风险;投资经理综合所有输入撰写结论;报告生成器产出可下载文档。整个过程中,关键节点(如 DCF 核心假设、最终投资结论)设有 human-in-the-loop 断点,用户可介入确认。流程的任何一步失败都不应导致整体崩溃——系统采用 checkpoint 机制(SQLite 落盘),失败步骤可重试或跳过,已完成的工作不丢失。

对话式流程则轻量得多:用户自然语言提问,Supervisor 判断意图并选择性加载一两个 Skill,快速返回带图表的回答,用户可连续追问,系统维护对话上下文。

## 8. 信息架构

产品采用经典的左侧导航 + 顶部工具栏 + 主工作区 + 可折叠右栏的布局。左侧导航包含 Dashboard、公司调研、行业调研、估值建模、量化筛选、Agent 辩论、报告库、设置八个一级入口,导航底部常驻用户的 Watchlist 和最近调研。顶部工具栏提供全局搜索、市场切换(A/HK/US)、调研深度选择和用户菜单。主工作区根据当前导航切换内容,内部多用标签页组织。右栏可折叠,默认在调研进行时展开,显示 Agent 协作流的实时状态。页面底部有一条状态栏,显示当前 session 的 token 消耗、成本、缓存命中率和各数据源的健康状态——这种"成本透明"对专业用户和付费决策都很重要。

## 9. 非功能需求

性能方面,Quick 模式的调研应在 4 分钟内完成,Standard 在 10 分钟内,Deep 在 25 分钟内;缓存命中的数据请求响应应在 100 毫秒内;界面操作的交互响应应在 200 毫秒内。可靠性方面,核心数据源采用双源容灾(primary + fallback),目标请求成功率达到 99% 以上;Agent 编排采用 checkpoint 机制保证可中断恢复。成本方面,单次 Deep 调研的模型成本目标控制在 0.5 美元以内,通过模型路由实现(舆情新闻等任务用便宜模型,估值和辩论等关键任务用强模型)。安全与合规方面,所有产出附带显著免责声明,明确产品为研究效率工具而非投资建议;免费数据源的使用边界对用户透明披露;对第三方 Skills 实施权限白名单和代码审计以防恶意 Skill;用户的研究数据加密存储,支持私有化部署选项。可访问性方面,界面支持中英文切换,关键数据支持导出为结构化格式(Excel、JSON)。

## 10. 数据需求

产品的数据策略是组合式的免费 / 开源数据源,辅以自建爬虫,通过路由和容灾来覆盖三地市场。A股财务数据以 Tushare 为主(规范化程度高)、AKShare 为辅;A股行情以 Tushare 和 AKShare 双源,新浪腾讯爬虫兜底。港股数据以 AKShare 为主。美股行情以 yfinance 为主、Alpha Vantage 为辅,美股财务和披露文件以 edgartools(直接解析 SEC EDGAR 的 10-K、10-Q、8-K、13F、S-1)为主。招股书和年报全文,A股从巨潮资讯抓取、港股从港交所披露易抓取。新闻舆情整合 AKShare 新闻接口、自建雪球财联社爬虫,以及 FinNLP 管道(覆盖 Reuters、CNBC、Eastmoney、StockTwits、Reddit 等)。宏观数据用 AKShare 的宏观接口和 FRED API。所有数据经 ETL 清洗后,关键指标做跨源校验(差异超过 10% 触发告警),并显式处理复权方式(前复权 / 后复权 / 不复权)和币种(CNY/HKD/USD)的统一。数据采用三层缓存:Redis 缓存实时报价,DuckDB/Parquet 缓存热点历史数据,PostgreSQL/TimescaleDB 存全量历史。这里有一个必须向用户透明的重要限制:这些免费数据源本质上是爬虫聚合或非官方封装,源站的服务条款可能禁止商业再分发,因此产品在商业化前必须取得授权或迁移到 Polygon、EODHD、Refinitiv 等付费源——这不是技术问题而是合规问题,需要在产品规划中提前预留。

## 11. 成功指标

我们用一组北极星指标和过程指标来衡量产品成功。北极星指标是"周活跃专业用户产出的有效研究报告数"——它同时捕捉了用户规模、活跃度和产品的核心价值交付。过程指标包括:调研任务的完成成功率(Skill 调用成功率,MVP 目标 90%、差异化阶段 95%)、单次深度调研的端到端耗时(目标随阶段下降)、单次调研的平均成本(目标控制在 0.5 美元内)、报告的"采纳率"(用户在产出后是否导出 / 收藏 / 再生,反映产出质量)、以及对话式追问的轮次(反映用户参与深度)。生态化阶段额外关注开源 Skills 包的 GitHub star 数和外部 runtime 的调用量。

## 12. 发布计划与里程碑

产品分三个阶段交付。Stage 1(0 到 4 周)交付 MVP,fork TradingAgents-CN 作为编排底座,搭建数据层(AKShare 主 + Tushare 免费层 + yfinance)和双层缓存,实现公司基本面调研、可比估值、报告生成三个核心 Skill,提供一个能输入标的出报告的简版 Web,验收标准是对 30 支 A股加 10 支港股加 10 支美股能在 5 分钟内出 8 页 PDF 且 Skill 成功率不低于 90%。Stage 2(1 到 3 个月)交付差异化能力,加入行业研究、DCF 估值、招股书解析,实现多空辩论循环,上线 MCP server 让外部 runtime 可调用,引入向量库实现 RAG 问答,验收标准是 Skill 成功率达 95%、深度报告在 10 分钟内完成、单次成本不超过 0.5 美元。Stage 3(3 到 6 个月)交付生态化,把 Skills 包标准化开源(Apache-2.0),集成量化因子库和回测形成"筛选到验证"的闭环,加入实时舆情订阅和异常告警,支持多用户协作,目标是开源仓库获得 1000 星以上、5 家企业客户试用。

## 13. 风险与依赖

产品面临几类需要持续管理的风险。数据合规风险是最根本的:免费数据源的商用授权问题必须在商业化前解决,否则有法律风险——应对方式是 MVP 阶段限定为研究用途、商业化前迁移付费源。数据质量风险体现在多源数据的不一致——应对方式是跨源校验和告警。产品价值的根本性风险在于 LLM 投研本身的局限:大模型不天生具备稳定预测市场的能力,多空辩论可能"看起来严谨"却没有真正的 alpha——应对方式是诚实地把产品定位为研究效率工具而非投资建议,并在所有产出附免责声明。标准成熟度风险来自 Agent Skills 跨 runtime 的互操作目前更多停留在格式层,各 runtime 的发现路径和高级特性仍有差异——应对方式是生产环境先聚焦 Claude Code 加 MCP 这条最成熟的链路,其他 runtime 作为渐进增强。多市场口径风险来自三地市场在复权、财年、币种、会计准则上的差异——应对方式是在数据层强制统一处理。

## 14. 待解决问题

进入研发前,还有几个关键问题需要团队讨论拍板。第一,商业模式与定价:是按调研次数计费、按月订阅,还是开源 + 企业版的双轨?这直接影响成本控制的优先级和付费源的迁移时机。第二,私有化部署的优先级:面向机构客户,数据不出域可能是硬性要求,这会显著影响架构(模型是否支持本地部署、数据是否完全自托管)。第三,免费数据源合规的法务边界:在多大范围内、什么用途下使用这些数据是安全的,需要法务给出明确意见。第四,DCF 等估值模块的"系统建议值"由谁背书:如果系统给出的默认假设导致用户决策失误,责任如何界定,这关系到产品的免责设计和功能边界。

---

> **免责声明** — 本产品及其产出的所有内容仅用于研究效率提升与教育目的,不构成任何投资建议。投资有风险,决策需谨慎。本文档中引用的开源项目数据为 2025-10 至 2026-05 的快照,可能存在波动。
