生成式人工智能与消费者使用意愿研究平台 | 管理后台

版本: 2.4.6 (研究项目专用)
系统状态: 正常

Token总量

1,287,654

+12.3% 相比上周

平均响应时间

278 ms

-15 ms 相比上周

活跃实验组

4/4

全部实验组已激活

误拦截率

2.8%

低于目标阈值 (3.2%)

意识形态适配度量

感知流畅性 (PF) 0.89
目标: 0.85 当前: 0.89
身份威胁 (IT) 0.12
目标: ≤0.15 当前: 0.12

模型能力验证

GSM8K (数学推理)
76.3% +1.2%
BBH (行为基准)
68.7% +0.8%
有害行为测试集
敏感响应率: 93.4%
问题回避率
4.2% (目标: ≤5%)

实验进度监控

实验组数据趋势图

任务完成情况

信息搜寻任务 86/120
创作任务 79/120
交流任务 62/120
整体完成度
63.5%