Stroop 测试

点击与油墨颜色匹配的按钮——不是单词的含义。经典 Stroop 效应测量认知抑制,神经心理学家自 1935 年沿用至今的同一指标。

测试说明

你将看到 20 个色词,如 RED、BLUE、GREEN、YELLOW。每个单词以彩色油墨显示——有时与单词一致,有时不一致。点击对应「油墨颜色」的按钮,不是单词的含义。

举例:如果你看到单词RED以蓝色显示,请点击 BLUE。
Stroop test illustration with overlapping colored letters showing the interference effect

什么是 Stroop 测试?

Stroop 测试是 J. Ridley Stroop 于 1935 年创建的经典心理学实验。它将色词(如 RED)用彩色油墨(如蓝色)显示,要求你说出或点击「油墨颜色」而非单词含义。大脑想要读单词——那是自动的。抑制这种自动反应并改报油墨颜色才是测试的难点。

这种自动阅读与受控注意力之间的冲突称为 Stroop 效应。一致试验(「RED」用红色油墨)与不一致试验(「RED」用蓝色油墨)的反应时间差揭示了前额叶皮层抑制无关信息的效率。差距越大,大脑工作越费力——健康年轻成人通常显示 100-200ms 的差异。

Brain illustration highlighting prefrontal cortex and anterior cingulate cortex involved in Stroop interference

Stroop 效应详解

阅读是过度学习的技能。到 10 岁时,你看到任何单词都会自动阅读,速度快过思考。这就是为什么「BLUE」写成红色油墨会让你感觉刺眼——你的阅读反射先触发,然后意识必须覆盖它并改报「red」。这种覆盖称为认知抑制,由前额叶皮层和前扣带回皮层(ACC)执行。

本测试中你将看到两种试验。一致试验(单词与油墨匹配——「RED」是红色)简单;不一致试验(单词冲突——「RED」是蓝色)缓慢且易出错。差距大小是你的个人 Stroop 效应得分。健康成人:100-200ms 差距。儿童和老年人:200-400ms。ADHD、痴呆或严重睡眠不足者:400ms+ 差距且错误更多。

Stroop 测试 vs 颜色反应测试

两个测试都用颜色,但测量不同的认知技能。颜色反应测试(如我们的 /color 页)测量纯颜色辨识速度——你识别颜色和行动的速度。Stroop 测试在冲突信息下测量认知抑制——大脑抑制自动反应(阅读)以做出受控反应(命名油墨颜色)的能力。

对临床研究而言,Stroop 测试是黄金标准,因为阅读是人人共有的不可避免的自动过程。它产生的冲突是普遍的,这使得 Stroop 得分可跨人、跨年龄、跨文化比较。这也是它在 700+ 已发表 ADHD、痴呆、脑损伤和执行功能研究中被使用的原因。

不同年龄段的 Stroop 效应大小

认知抑制遵循明确的发育曲线。幼儿(7 岁以下)由于前额叶皮层仍在发育,Stroop 效应巨大。20-35 岁成人差距最小。50 岁后,随着执行功能逐渐衰退,Stroop 效应再次增大。

各年龄段平均 Stroop 效应大小(毫秒)

数据基于 MacLeod(1991)对 50+ Stroop 研究的元分析及当代综合测试数据。个体结果浮动 ±50ms。

影响 Stroop 表现的因素

年龄与执行功能

前额叶皮层在 25 岁成熟,50 岁后逐渐衰退。Stroop 效应在 60 岁后每十年增加约 5-10ms。

阅读流畅度

更流畅的读者显示更大的 Stroop 效应,因为单词阅读更自动化。不流畅读者差距更小,因为阅读干扰较少。

ADHD 和注意力障碍

ADHD 成人 Stroop 效应大 100-200ms,不一致试验错误率高 2-3 倍。这是有据可查的临床指标。

睡眠与疲劳

睡眠不足选择性损害前额叶功能。醒着 24 小时可使 Stroop 效应增加 100-200ms——类似轻度创伤性脑损伤。

双语者

双语者平均显示小 20-50ms 的 Stroop 效应。持续的语言切换建立可迁移到非语言任务的抑制技能。

咖啡因和兴奋剂

200mg 咖啡因使非习惯用户的 Stroop 效应减少 20-40ms。ADHD 兴奋剂药物(哌甲酯)在研究中显示更强效果。

Person taking a cognitive Stroop test on a tablet in clinical assessment setting

如何改善 Stroop 表现

Stroop 效应一部分固定(大脑解剖),一部分可训练(练习和生活方式)。多数成人通过专注努力可减少 30-60ms 差距。

每日练习注意力游戏。任务切换、n-back 和抑制训练等都训练相同的前额叶回路。

每晚睡 7-9 小时。Stroop 效应是最敏感于睡眠的认知指标之一——即使一夜不好也会清楚显示。

每天多数日子有氧运动 30+ 分钟。有氧运动增加前额叶血流,在研究中持续改善 Stroop 分数。

每天冥想 10+ 分钟。8 周研究中,正念练习增强注意控制并减少 Stroop 干扰。

限制酒精。即使适度饮酒(每天 2+ 杯)几周内也会明显降低 Stroop 表现。

学习第二语言。长期双语是抗年龄相关 Stroop 衰退最强的有据可查保护因素之一。

减少慢性压力。慢性压力的皮质醇直接损害前额叶功能并增大 Stroop 效应。

Stroop 测试的临床应用

Historical portrait of psychologist J. Ridley Stroop who created the test in 1935

ADHD 评估

更大的 Stroop 效应和不一致试验更多错误是 ADHD 有据可查的标志。本测试是标准神经心理学套件的一部分。

痴呆筛查

早期阿尔茨海默和额颞痴呆在记忆症状明显前就显示 Stroop 效应增大。用于研究级认知筛查。

创伤性脑损伤

脑震荡和 TBI 选择性损害前额叶-注意网络。Stroop 表现是运动医学中复出决策的敏感标志。

执行功能研究

Stroop 测试是三大核心执行功能测量之一(连同 Wisconsin 卡片分类和 Trail Making B)。自 1935 年起在 700+ 已发表研究中使用。

Stroop 效应背后的科学

当你看到「BLUE」写成红色时,两条神经通路同时激活:快速自动阅读网络(左颞叶,~200ms)和较慢的颜色命名网络(V4 → 前额叶皮层,~350ms)。两者都产生反应候选。前扣带回皮层检测这种冲突并发信号让前额叶皮层抑制阅读反应、让颜色反应获胜。

这种冲突监测系统在 fMRI 研究中有记录(Botvinick 2001、MacLeod & MacDonald 2000),显示 ACC 在不一致试验上特异性激活。Stroop 效应的精确大小——健康成人通常 100-200ms——是前额叶皮层覆盖自动阅读反应所需的时间。效应越大表明自上而下抑制越弱。本测试在 90 年中已通过 700+ 研究验证。

Stroop 测试 FAQ

关于 Stroop 测试及分数含义的常见问题。

Stroop 测试是 1935 年的经典心理学实验,测量认知抑制。你看到色词(如 RED)以彩色油墨(如蓝色)写出,必须报告油墨颜色而忽略单词。难度来自抑制自动阅读反应。

健康年轻成人通常显示 100-200ms 的 Stroop 效应(匹配和冲突试验之间的时间差),准确率 90%+。差距越小表明执行功能越强。60 岁以上成人平均 200-300ms,ADHD 成人通常 300ms+。

Stroop 测试测量认知抑制——大脑抑制自动反应(阅读单词)以做出受控反应(命名油墨颜色)的能力。它还测试选择性注意力和执行功能,都由前额叶皮层和前扣带回皮层运行。

Stroop 效应是单词及其油墨颜色冲突时发生的减速。读「RED」用红色(一致)很快。读「RED」用蓝色(不一致)在健康成人中慢 100-200ms。这一差距是你的个人 Stroop 效应得分。

一致试验显示色词以匹配油墨(RED 用红色)——这些快速简单。不一致试验显示冲突(RED 用蓝色)——这些缓慢,因为大脑必须覆盖阅读反应。Stroop 测试得分比较两种类型的速度。

美国心理学家 John Ridley Stroop 在 1935 年作为其乔治皮博迪学院博士论文的一部分发表了本测试。他的论文《系列言语反应中的干扰研究》是心理学中被引用最多的著作之一,被引用 17,000+ 次。

ADHD 成人持续显示更大的 Stroop 效应(单词干扰更多)和不一致试验更多错误。这一模式反映前额叶抑制较弱,是 ADHD 的核心特征。Stroop 是标准神经心理学 ADHD 测试套件的一部分。

增大的 Stroop 效应可能是额颞痴呆和阿尔茨海默的早期标志,常在记忆症状出现前。然而,单次测试无法诊断——临床医生使用 Stroop 配合其他测量。如担心认知变化,请咨询神经心理学家。

不需要。本 Stroop 测试完全在浏览器中运行,无需注册或登录。你的测试结果不存储在任何服务器上——它们仅在你的会话期间存在。免费使用次数不限。

颜色反应测试(如我们的 /color 页)测量你检测颜色和反应的速度。Stroop 测试专门测量认知抑制——在冲突下抑制自动反应的能力。它们使用类似视觉但测试不同的心理技能,各有用途。