06

实验记录

这是一份实验记录,不是宣传册。进行中的论文、整理好的数据集、已撰写的专利、模型指标——每个数字都按实测如实报告,不往上凑整。是什么、怎么测出来的、该信几分。

工作背后是什么

9
篇论文进行中
33
个数据集
11
项专利已撰写
0.832AUC
“坏一周”预测
06.1

进行中的论文

九篇论文在准备中。每一行就是一篇:它的主张,和支撑它的那一个量化结果——按实测如实报告,尚未经同行评审。顺着右列往下读,数字本身就是论据。

进行中
P-LEDGER · 进行中
编号
P-01
论文
行为信号:AI 感知的第三模态
结果(按实测)
20+ 数据集 2000 万动作里跑出 5-8 个潜在行为维度,压缩损失中位数 3%,跨模态压力预测 AUC 0.73。
编号
P-02
论文
第二层:动作 pattern 能预测心理状态,强度不能
结果(按实测)
动作 pattern 预测抑郁 r=0.336 (强度只 0.046);失眠 r=0.589 (强度 0.007);强度单独看心理健康全程低于随机。
编号
P-03
论文
生产数据里的行为 pattern 能预测系统性下滑,平均值不能
结果(按实测)
PCB 线一周状态预测:用动作 pattern AUC 0.832,用强度只有 0.688 (+0.144)。3 个数据集 12,764 条记录。
编号
P-04
论文
人类行为变异的统一模型
结果(按实测)
把 6 个行为科学传统合并成 6 个正交维度,120+ 引文,6 条可测预测在后续论文里验证。
编号
P-05
论文
理论驱动的行为类型识别:基准研究
结果(按实测)
8 个心理测量数据集、115 万参与者、18 个实验。仅 3 条信号冷启动余弦相似度 >0.969,跨维扩展 R² 升 48.1%。
编号
P-06
论文
行为类型与自评类型互不相关
结果(按实测)
行为类型与自评类型完全独立:Eisenberg 522 人 + IAT 10 万人 + CPC18 926 人,ARI = 0.007。
编号
P-07
论文
人类行为变异的通用维度
结果(按实测)
16 个数据集、58 万人 PCA:5 个通用维度 (准、快、量、稳、探);K=3 最优;周与周类型稳定度 67%。
编号
P-08
论文
类型悖论
结果(按实测)
类型对预测准度加 +0.0% (94.4%→94.41%),但类型匹配的干预能把成功率拉高 +11.6% (p<0.0001)。79-99.8% 的人横跨多个簇。
编号
P-09
论文
动作维度,不是人的类型
结果(按实测)
33 个数据集、1500 万动作、12 个领域。3 个通用动作维度 (节奏 39%、探索 22%、会话弧 15%) 合计解释 76.5% 方差;跨域 PCA 相似度 0.654。
06.2

模型背后的数据集

先看输入。任何主张之前,先是数据:从公开与采集来源整理、校验,在这里点清——这样下游每一个数字都能追回到真实的东西。

数据集汇总
数量项
数据集
计数
33
覆盖什么
公开与采集来源,逐一整理、校验。
数量项
行为动作
计数
15M
覆盖什么
构成模型学习的原始行为信号。
数量项
参与者
计数
1.15M
覆盖什么
覆盖的不同个体,用于检验泛化。
数量项
领域
计数
12
覆盖什么
不同任务类型,验证维度的通用性。
06.3

专利

十一项专利已撰写,仅美国。均未提交——这一点我们直说。我们只公布数量,不列方向:在提交之前,权利要求不公开。

11
项专利已撰写
US-ONLY · DRAFTED
06.4

模型指标,用人话讲

两个 AUC 数字,每个都用人话读一遍。AUC 是模型把更差的那个排在更好的那个之前的概率:0.5 等于抛硬币,1.0 为完全正确。越高越好;下面写清模型在做什么、得了多少分。

FIG. 1“坏一周”预测
0.832AUC
0.5 = 抛硬币 →

把谁正滑向“坏一周”排出来。

输入 · 一条 PCB 线上的动作时序 pattern。

处理 · 模型按“坏一周”风险给每个工人排序。

输出 · AUC 0.832——模型把即将进入“坏一周”的工人排在状态稳定者之前的概率就是这么高。同一件事,只用强度只有 0.688。

FIG. 2端侧 SDK
0.737AUC
信号更少 →

同样的排序,测在轻量级端侧模型上。

输入 · 信号少得多——只有端侧 SDK 能看到的那部分。

处理 · 同样的排序任务,跑在轻量级模型上。

输出 · AUC 0.737——排序质量在端侧 SDK 上依然立得住,而它用到的信号远少于完整流水线。