InvesResearch DocsAgent本体词典 · ontology
Ontology · docs/ontology.md

事件 → 4 主线 × 6 场景 × 6 维度

事件被分类到四个独立维度, 合起来构成事件的「身份」。Threads / Scenarios / Dimensions 是多标签(一个事件可命中 0~N 个),ThesisImpact 是单标签(增强 / 削弱 / 中性)。词典的「真实来源」是 satellite_agent/ontology.py, 本页与代码一一对应。

Threads4 Scenarios6 Dimensions6 POSITIVE45 NEGATIVE35 反义对8
§2 · Thread keywords

4 主线 · 关键词矩阵

每个主线展开关键词全集 + 设计原则。任意一个 keyword 命中即归入该 thread, 多标签允许。

核心网 · CORE_NETWORK

Thread.CORE
核心网5G NTNNTN核心网卫星核心网信关站馈电站馈电链路星地融合星上处理波束gNB回传组网ATG再生式载荷透明转发星座低轨高轨LEOGEOMEOTT&C测控地面站星地链路
设计原则故意不含「卫星互联网」「互联网卫星」 — 这是产业泛词, 几乎所有事件都会带, 放进来会污染其他主线归类。「星座」「低轨」「高轨」等天体描述词归核心网, 因为在事件文本里通常描述组网拓扑。

终端 · TERMINAL

Thread.TERMINAL
终端手持终端卫星电话VSAT用户终端便携终端车载终端船载终端机载终端便携站手机直连卫星直连卫星Direct-to-CellD2C宽带终端窄带终端用户单元ODMOEM
设计原则D2C / Direct-to-Cell 同义词都覆盖。ODM / OEM 命中表示供应链上下游事件。

芯片 · CHIP

Thread.CHIP
芯片基带芯片射频芯片RFICASICSoC卫星通信芯片NTN芯片FPGAMCUBBICMMICPA流片晶圆功放低噪放TR模组TR组件射频前端RFFE毫米波
设计原则「毫米波」放芯片, 因为产业事件提到它通常是 RF 性能上下文。不放「工艺」「制程」 — 太通用。

运营支撑 · OPERATIONS

Thread.OPERATIONS
运营商运维网管BOSS系统计费支撑系统OSSBSS网络管理客户管理频谱协调运营支撑频轨频谱频率许可频段使用频段使用许可无线电管理运营平台业务支撑网管系统网络运营网运牌照
设计原则故意不含「频段」 — 太泛(毫米波频段、5G 频段都会触发, 污染芯片归类)。改用更具体的「频段使用」「频率许可」。「牌照」放运营支撑, 因为它通常是运营资质相关。
§3 · Scenario keywords

6 个增量需求场景

Scenario · 6 个

~6 keywords each
低空
低空无人机UAVeVTOL通用航空低空经济通航低空飞行低空空域
车载
车载汽车智能网联车联网前装新能源车新能源汽车乘用车商用车车规
海事航空
海事船舶船载航空民航机载ARINC海上海空一体化船联网
工业 IoT
IoT物联网工业M2M窄带传感工业互联网边缘计算低功耗
应急
应急救灾应急通信抢险灾备灾害救援公共安全
具身智能
具身具身智能embodied人形机器人智能体
§4 · Dimension keywords

6 个影响维度

Risk 维度有特殊作用:当 Risk 命中且极性词为 0 时(pos == 0 && neg == 0), classifier 把 thesis_impact 从中性 fallback 到「削弱」。

Dimension · 6 个

影响维度
技术
技术突破研发专利标准样机测试试验首星在轨验证通过验收验收标准制定
产品
产品发布上市首发量产迭代新品立项推出新一代升级GA
市场空间
市场规模渗透率出货交付订单订单量出货量TAMSAM增长
商业模式
商业化定价套餐合作授权许可战略合作牌照合资联合体
公司竞争力
签约中标份额客户招标采购供应商斩获获得签订中标失败未中标丢失
风险
延期事故失败失利受阻调查监管亏损下调下修终止暂停退市诉讼败诉侵权召回停产弃标违约裁员罚款处罚
§5 · Polarity keywords

极性词典 · 45 + 35

命中数为 thesis_impact 计算的输入。pos > neg → 增强; neg > pos → 削弱; 平局 → 中性(若 Risk 命中则 fallback 削弱)。

POSITIVE · 正向

45 个 · sorted(set(...)) 强制 dedupe
上市上调中标交付在轨增长增持完成升级发布发射成功商用部署回购投产投运推出提升斩获新一代新增订单扩产扩张战略合作成功通过通过验收采纳量产立项突破签订签约落地获批获得规模化认证首单首发首次商用组网牵头入围入选启动

NEGATIVE · 负向

35 个 · sorted(set(...)) 强制 dedupe
下修下调中止事故亏损份额下滑停产停服停牌处罚失利失败客户流失弃标延期推迟暂停未中标减持解约调查诉讼败诉受阻退出退市违约召回罚款终止裁员竞争加剧丢失发射失败侵权
§5.3 · Negation pairs

负向反义对 (_NEGATION_PAIRS)

当负向短语包含正向子串时(如「未中标」含「中标」), 扣减对应正向 hit, 避免 pos/neg 互相抵消变中性。

反义对 · 8 对

未中标中标
中标失败中标
发射失败发射成功
未通过通过
未完成完成
未获批获批
启动调查启动
被调查通过
§6 · Thread judgement

主线归属判定流程

  1. 对每个 Thread, 扫描其 keywords, 任意一个命中即归入该 thread
  2. 一段文本可同时归入多个 thread (多标签)
  3. Scenario / Dimension 同理
  4. 在 ingest pipeline 里, match_companies(conn, text) 通过 aliases 反向匹配文本中提到的公司
  5. enrich_with_company_threads 把每家公司的 thread 字段并入 event.threads (去重)
  6. 反哺来的 thread 记录在 evidence.company_threads, 便于排查
§7 · Maintenance principles

词典维护原则

经过 30 条回归集 round 1 复盘沉淀的设计原则。下面每条原则附 round 1 已修复的反例。

1. 产业泛词不进主线
反例 「卫星互联网」被放在核心网 → 所有事件都被打上核心网
2. 短词必须够具体
反例 「频段」 → 毫米波频段也会命中 → 换成「频段使用」
3. 正向词同步给反义对
反例 加了「启动」 → 同步加「启动调查 → 启动」反义
4. dedupe 不可省
反例 「投运」在 POS 出现两次 → 计数 ×2 → 现在 sorted(set(...)) 强制去重
5. 争议标注写 _note
反例 招标重启 = 正向还是中性?在样本里加 _note 说理由, 不蒙混
6. 与代码同步
校验 satagent regress samples/labeled_regression.jsonl