研究 / Research — Tangerine Intelligence

实验记录

这是一份实验记录，不是宣传册。进行中的论文、整理好的数据集、已撰写的专利、模型指标——每个数字都按实测如实报告，不往上凑整。是什么、怎么测出来的、该信几分。

工作背后是什么

篇论文进行中

个数据集

项专利已撰写

0.832AUC

“坏一周”预测

06.1

进行中的论文

九篇论文在准备中。每一行就是一篇：它的主张，和支撑它的那一个量化结果——按实测如实报告，尚未经同行评审。顺着右列往下读，数字本身就是论据。

进行中

P-LEDGER · 进行中

编号	论文	结果（按实测）
P-01	行为信号:AI 感知的第三模态	20+ 数据集 2000 万动作里跑出 5-8 个潜在行为维度,压缩损失中位数 3%,跨模态压力预测 AUC 0.73。
P-02	第二层:动作 pattern 能预测心理状态,强度不能	动作 pattern 预测抑郁 r=0.336 (强度只 0.046);失眠 r=0.589 (强度 0.007);强度单独看心理健康全程低于随机。
P-03	生产数据里的行为 pattern 能预测系统性下滑,平均值不能	PCB 线一周状态预测:用动作 pattern AUC 0.832,用强度只有 0.688 (+0.144)。3 个数据集 12,764 条记录。
P-04	人类行为变异的统一模型	把 6 个行为科学传统合并成 6 个正交维度,120+ 引文,6 条可测预测在后续论文里验证。
P-05	理论驱动的行为类型识别:基准研究	8 个心理测量数据集、115 万参与者、18 个实验。仅 3 条信号冷启动余弦相似度 >0.969,跨维扩展 R² 升 48.1%。
P-06	行为类型与自评类型互不相关	行为类型与自评类型完全独立:Eisenberg 522 人 + IAT 10 万人 + CPC18 926 人,ARI = 0.007。
P-07	人类行为变异的通用维度	16 个数据集、58 万人 PCA:5 个通用维度 (准、快、量、稳、探);K=3 最优;周与周类型稳定度 67%。
P-08	类型悖论	类型对预测准度加 +0.0% (94.4%→94.41%),但类型匹配的干预能把成功率拉高 +11.6% (p<0.0001)。79-99.8% 的人横跨多个簇。
P-09	动作维度,不是人的类型	33 个数据集、1500 万动作、12 个领域。3 个通用动作维度 (节奏 39%、探索 22%、会话弧 15%) 合计解释 76.5% 方差;跨域 PCA 相似度 0.654。

编号

P-01

论文

行为信号:AI 感知的第三模态

结果（按实测）

20+ 数据集 2000 万动作里跑出 5-8 个潜在行为维度,压缩损失中位数 3%,跨模态压力预测 AUC 0.73。

编号

P-02

论文

第二层:动作 pattern 能预测心理状态,强度不能

结果（按实测）

动作 pattern 预测抑郁 r=0.336 (强度只 0.046);失眠 r=0.589 (强度 0.007);强度单独看心理健康全程低于随机。

编号

P-03

论文

生产数据里的行为 pattern 能预测系统性下滑,平均值不能

结果（按实测）

PCB 线一周状态预测:用动作 pattern AUC 0.832,用强度只有 0.688 (+0.144)。3 个数据集 12,764 条记录。

编号

P-04

论文

人类行为变异的统一模型

结果（按实测）

把 6 个行为科学传统合并成 6 个正交维度,120+ 引文,6 条可测预测在后续论文里验证。

编号

P-05

论文

理论驱动的行为类型识别:基准研究

结果（按实测）

8 个心理测量数据集、115 万参与者、18 个实验。仅 3 条信号冷启动余弦相似度 >0.969,跨维扩展 R² 升 48.1%。

编号

P-06

论文

行为类型与自评类型互不相关

结果（按实测）

行为类型与自评类型完全独立:Eisenberg 522 人 + IAT 10 万人 + CPC18 926 人,ARI = 0.007。

编号

P-07

论文

人类行为变异的通用维度

结果（按实测）

16 个数据集、58 万人 PCA:5 个通用维度 (准、快、量、稳、探);K=3 最优;周与周类型稳定度 67%。

编号

P-08

论文

类型悖论

结果（按实测）

类型对预测准度加 +0.0% (94.4%→94.41%),但类型匹配的干预能把成功率拉高 +11.6% (p<0.0001)。79-99.8% 的人横跨多个簇。

编号

P-09

论文

动作维度,不是人的类型

结果（按实测）

33 个数据集、1500 万动作、12 个领域。3 个通用动作维度 (节奏 39%、探索 22%、会话弧 15%) 合计解释 76.5% 方差;跨域 PCA 相似度 0.654。

06.2

模型背后的数据集

先看输入。任何主张之前，先是数据：从公开与采集来源整理、校验，在这里点清——这样下游每一个数字都能追回到真实的东西。

数据集汇总

数量项	计数	覆盖什么
数据集	33	公开与采集来源，逐一整理、校验。
行为动作	15M	构成模型学习的原始行为信号。
参与者	1.15M	覆盖的不同个体，用于检验泛化。
领域	12	不同任务类型，验证维度的通用性。

数量项

数据集

计数

覆盖什么

公开与采集来源，逐一整理、校验。

数量项

行为动作

计数

15M

覆盖什么

构成模型学习的原始行为信号。

数量项

参与者

计数

1.15M

覆盖什么

覆盖的不同个体，用于检验泛化。

数量项

领域

计数

覆盖什么

不同任务类型，验证维度的通用性。

06.3

专利

十一项专利已撰写，仅美国。均未提交——这一点我们直说。我们只公布数量，不列方向：在提交之前，权利要求不公开。

项专利已撰写

US-ONLY · DRAFTED

06.4

模型指标，用人话讲

两个 AUC 数字，每个都用人话读一遍。AUC 是模型把更差的那个排在更好的那个之前的概率：0.5 等于抛硬币，1.0 为完全正确。越高越好；下面写清模型在做什么、得了多少分。

FIG. 1 — “坏一周”预测

0.832AUC

0.5 = 抛硬币 →

把谁正滑向“坏一周”排出来。

输入 · 一条 PCB 线上的动作时序 pattern。

处理 · 模型按“坏一周”风险给每个工人排序。

输出 · AUC 0.832——模型把即将进入“坏一周”的工人排在状态稳定者之前的概率就是这么高。同一件事，只用强度只有 0.688。

FIG. 2 — 端侧 SDK

0.737AUC

信号更少 →

同样的排序，测在轻量级端侧模型上。

输入 · 信号少得多——只有端侧 SDK 能看到的那部分。

处理 · 同样的排序任务，跑在轻量级模型上。

输出 · AUC 0.737——排序质量在端侧 SDK 上依然立得住，而它用到的信号远少于完整流水线。

DOC	TI-WEB-RESEARCH-2026
REV	v1.1
DATE	2026-06-12
ISSUED BY	TANGERINE INTELLIGENCE INC.