06
实验记录
这是一份实验记录,不是宣传册。进行中的论文、整理好的数据集、已撰写的专利、模型指标——每个数字都按实测如实报告,不往上凑整。是什么、怎么测出来的、该信几分。
工作背后是什么
9
篇论文进行中
33
个数据集
11
项专利已撰写
0.832AUC
“坏一周”预测
06.1
进行中的论文
九篇论文在准备中。每一行就是一篇:它的主张,和支撑它的那一个量化结果——按实测如实报告,尚未经同行评审。顺着右列往下读,数字本身就是论据。
进行中P-LEDGER · 进行中
| 编号 | 论文 | 结果(按实测) |
|---|---|---|
| P-01 | 行为信号:AI 感知的第三模态 | 20+ 数据集 2000 万动作里跑出 5-8 个潜在行为维度,压缩损失中位数 3%,跨模态压力预测 AUC 0.73。 |
| P-02 | 第二层:动作 pattern 能预测心理状态,强度不能 | 动作 pattern 预测抑郁 r=0.336 (强度只 0.046);失眠 r=0.589 (强度 0.007);强度单独看心理健康全程低于随机。 |
| P-03 | 生产数据里的行为 pattern 能预测系统性下滑,平均值不能 | PCB 线一周状态预测:用动作 pattern AUC 0.832,用强度只有 0.688 (+0.144)。3 个数据集 12,764 条记录。 |
| P-04 | 人类行为变异的统一模型 | 把 6 个行为科学传统合并成 6 个正交维度,120+ 引文,6 条可测预测在后续论文里验证。 |
| P-05 | 理论驱动的行为类型识别:基准研究 | 8 个心理测量数据集、115 万参与者、18 个实验。仅 3 条信号冷启动余弦相似度 >0.969,跨维扩展 R² 升 48.1%。 |
| P-06 | 行为类型与自评类型互不相关 | 行为类型与自评类型完全独立:Eisenberg 522 人 + IAT 10 万人 + CPC18 926 人,ARI = 0.007。 |
| P-07 | 人类行为变异的通用维度 | 16 个数据集、58 万人 PCA:5 个通用维度 (准、快、量、稳、探);K=3 最优;周与周类型稳定度 67%。 |
| P-08 | 类型悖论 | 类型对预测准度加 +0.0% (94.4%→94.41%),但类型匹配的干预能把成功率拉高 +11.6% (p<0.0001)。79-99.8% 的人横跨多个簇。 |
| P-09 | 动作维度,不是人的类型 | 33 个数据集、1500 万动作、12 个领域。3 个通用动作维度 (节奏 39%、探索 22%、会话弧 15%) 合计解释 76.5% 方差;跨域 PCA 相似度 0.654。 |
编号
P-01
论文
行为信号:AI 感知的第三模态
结果(按实测)
20+ 数据集 2000 万动作里跑出 5-8 个潜在行为维度,压缩损失中位数 3%,跨模态压力预测 AUC 0.73。
编号
P-02
论文
第二层:动作 pattern 能预测心理状态,强度不能
结果(按实测)
动作 pattern 预测抑郁 r=0.336 (强度只 0.046);失眠 r=0.589 (强度 0.007);强度单独看心理健康全程低于随机。
编号
P-03
论文
生产数据里的行为 pattern 能预测系统性下滑,平均值不能
结果(按实测)
PCB 线一周状态预测:用动作 pattern AUC 0.832,用强度只有 0.688 (+0.144)。3 个数据集 12,764 条记录。
编号
P-04
论文
人类行为变异的统一模型
结果(按实测)
把 6 个行为科学传统合并成 6 个正交维度,120+ 引文,6 条可测预测在后续论文里验证。
编号
P-05
论文
理论驱动的行为类型识别:基准研究
结果(按实测)
8 个心理测量数据集、115 万参与者、18 个实验。仅 3 条信号冷启动余弦相似度 >0.969,跨维扩展 R² 升 48.1%。
编号
P-06
论文
行为类型与自评类型互不相关
结果(按实测)
行为类型与自评类型完全独立:Eisenberg 522 人 + IAT 10 万人 + CPC18 926 人,ARI = 0.007。
编号
P-07
论文
人类行为变异的通用维度
结果(按实测)
16 个数据集、58 万人 PCA:5 个通用维度 (准、快、量、稳、探);K=3 最优;周与周类型稳定度 67%。
编号
P-08
论文
类型悖论
结果(按实测)
类型对预测准度加 +0.0% (94.4%→94.41%),但类型匹配的干预能把成功率拉高 +11.6% (p<0.0001)。79-99.8% 的人横跨多个簇。
编号
P-09
论文
动作维度,不是人的类型
结果(按实测)
33 个数据集、1500 万动作、12 个领域。3 个通用动作维度 (节奏 39%、探索 22%、会话弧 15%) 合计解释 76.5% 方差;跨域 PCA 相似度 0.654。
06.2
模型背后的数据集
先看输入。任何主张之前,先是数据:从公开与采集来源整理、校验,在这里点清——这样下游每一个数字都能追回到真实的东西。
数据集汇总
| 数量项 | 计数 | 覆盖什么 |
|---|---|---|
| 数据集 | 33 | 公开与采集来源,逐一整理、校验。 |
| 行为动作 | 15M | 构成模型学习的原始行为信号。 |
| 参与者 | 1.15M | 覆盖的不同个体,用于检验泛化。 |
| 领域 | 12 | 不同任务类型,验证维度的通用性。 |
数量项
数据集
计数
33
覆盖什么
公开与采集来源,逐一整理、校验。
数量项
行为动作
计数
15M
覆盖什么
构成模型学习的原始行为信号。
数量项
参与者
计数
1.15M
覆盖什么
覆盖的不同个体,用于检验泛化。
数量项
领域
计数
12
覆盖什么
不同任务类型,验证维度的通用性。
06.3
专利
十一项专利已撰写,仅美国。均未提交——这一点我们直说。我们只公布数量,不列方向:在提交之前,权利要求不公开。
11
项专利已撰写
US-ONLY · DRAFTED
06.4
模型指标,用人话讲
两个 AUC 数字,每个都用人话读一遍。AUC 是模型把更差的那个排在更好的那个之前的概率:0.5 等于抛硬币,1.0 为完全正确。越高越好;下面写清模型在做什么、得了多少分。
0.832AUC
0.5 = 抛硬币 →
把谁正滑向“坏一周”排出来。
输入 · 一条 PCB 线上的动作时序 pattern。
处理 · 模型按“坏一周”风险给每个工人排序。
输出 · AUC 0.832——模型把即将进入“坏一周”的工人排在状态稳定者之前的概率就是这么高。同一件事,只用强度只有 0.688。
0.737AUC
信号更少 →
同样的排序,测在轻量级端侧模型上。
输入 · 信号少得多——只有端侧 SDK 能看到的那部分。
处理 · 同样的排序任务,跑在轻量级模型上。
输出 · AUC 0.737——排序质量在端侧 SDK 上依然立得住,而它用到的信号远少于完整流水线。