Stroop 测试
点击与油墨颜色匹配的按钮——不是单词的含义。经典 Stroop 效应测量认知抑制,神经心理学家自 1935 年沿用至今的同一指标。
测试说明
你将看到 20 个色词,如 RED、BLUE、GREEN、YELLOW。每个单词以彩色油墨显示——有时与单词一致,有时不一致。点击对应「油墨颜色」的按钮,不是单词的含义。

什么是 Stroop 测试?
Stroop 测试是 J. Ridley Stroop 于 1935 年创建的经典心理学实验。它将色词(如 RED)用彩色油墨(如蓝色)显示,要求你说出或点击「油墨颜色」而非单词含义。大脑想要读单词——那是自动的。抑制这种自动反应并改报油墨颜色才是测试的难点。
这种自动阅读与受控注意力之间的冲突称为 Stroop 效应。一致试验(「RED」用红色油墨)与不一致试验(「RED」用蓝色油墨)的反应时间差揭示了前额叶皮层抑制无关信息的效率。差距越大,大脑工作越费力——健康年轻成人通常显示 100-200ms 的差异。

Stroop 效应详解
阅读是过度学习的技能。到 10 岁时,你看到任何单词都会自动阅读,速度快过思考。这就是为什么「BLUE」写成红色油墨会让你感觉刺眼——你的阅读反射先触发,然后意识必须覆盖它并改报「red」。这种覆盖称为认知抑制,由前额叶皮层和前扣带回皮层(ACC)执行。
本测试中你将看到两种试验。一致试验(单词与油墨匹配——「RED」是红色)简单;不一致试验(单词冲突——「RED」是蓝色)缓慢且易出错。差距大小是你的个人 Stroop 效应得分。健康成人:100-200ms 差距。儿童和老年人:200-400ms。ADHD、痴呆或严重睡眠不足者:400ms+ 差距且错误更多。
Stroop 测试 vs 颜色反应测试
两个测试都用颜色,但测量不同的认知技能。颜色反应测试(如我们的 /color 页)测量纯颜色辨识速度——你识别颜色和行动的速度。Stroop 测试在冲突信息下测量认知抑制——大脑抑制自动反应(阅读)以做出受控反应(命名油墨颜色)的能力。
对临床研究而言,Stroop 测试是黄金标准,因为阅读是人人共有的不可避免的自动过程。它产生的冲突是普遍的,这使得 Stroop 得分可跨人、跨年龄、跨文化比较。这也是它在 700+ 已发表 ADHD、痴呆、脑损伤和执行功能研究中被使用的原因。
不同年龄段的 Stroop 效应大小
认知抑制遵循明确的发育曲线。幼儿(7 岁以下)由于前额叶皮层仍在发育,Stroop 效应巨大。20-35 岁成人差距最小。50 岁后,随着执行功能逐渐衰退,Stroop 效应再次增大。
各年龄段平均 Stroop 效应大小(毫秒)
数据基于 MacLeod(1991)对 50+ Stroop 研究的元分析及当代综合测试数据。个体结果浮动 ±50ms。
影响 Stroop 表现的因素
年龄与执行功能
前额叶皮层在 25 岁成熟,50 岁后逐渐衰退。Stroop 效应在 60 岁后每十年增加约 5-10ms。
阅读流畅度
更流畅的读者显示更大的 Stroop 效应,因为单词阅读更自动化。不流畅读者差距更小,因为阅读干扰较少。
ADHD 和注意力障碍
ADHD 成人 Stroop 效应大 100-200ms,不一致试验错误率高 2-3 倍。这是有据可查的临床指标。
睡眠与疲劳
睡眠不足选择性损害前额叶功能。醒着 24 小时可使 Stroop 效应增加 100-200ms——类似轻度创伤性脑损伤。
双语者
双语者平均显示小 20-50ms 的 Stroop 效应。持续的语言切换建立可迁移到非语言任务的抑制技能。
咖啡因和兴奋剂
200mg 咖啡因使非习惯用户的 Stroop 效应减少 20-40ms。ADHD 兴奋剂药物(哌甲酯)在研究中显示更强效果。

如何改善 Stroop 表现
Stroop 效应一部分固定(大脑解剖),一部分可训练(练习和生活方式)。多数成人通过专注努力可减少 30-60ms 差距。
每日练习注意力游戏。任务切换、n-back 和抑制训练等都训练相同的前额叶回路。
每晚睡 7-9 小时。Stroop 效应是最敏感于睡眠的认知指标之一——即使一夜不好也会清楚显示。
每天多数日子有氧运动 30+ 分钟。有氧运动增加前额叶血流,在研究中持续改善 Stroop 分数。
每天冥想 10+ 分钟。8 周研究中,正念练习增强注意控制并减少 Stroop 干扰。
限制酒精。即使适度饮酒(每天 2+ 杯)几周内也会明显降低 Stroop 表现。
学习第二语言。长期双语是抗年龄相关 Stroop 衰退最强的有据可查保护因素之一。
减少慢性压力。慢性压力的皮质醇直接损害前额叶功能并增大 Stroop 效应。
Stroop 测试的临床应用

ADHD 评估
更大的 Stroop 效应和不一致试验更多错误是 ADHD 有据可查的标志。本测试是标准神经心理学套件的一部分。
痴呆筛查
早期阿尔茨海默和额颞痴呆在记忆症状明显前就显示 Stroop 效应增大。用于研究级认知筛查。
创伤性脑损伤
脑震荡和 TBI 选择性损害前额叶-注意网络。Stroop 表现是运动医学中复出决策的敏感标志。
执行功能研究
Stroop 测试是三大核心执行功能测量之一(连同 Wisconsin 卡片分类和 Trail Making B)。自 1935 年起在 700+ 已发表研究中使用。
Stroop 效应背后的科学
当你看到「BLUE」写成红色时,两条神经通路同时激活:快速自动阅读网络(左颞叶,~200ms)和较慢的颜色命名网络(V4 → 前额叶皮层,~350ms)。两者都产生反应候选。前扣带回皮层检测这种冲突并发信号让前额叶皮层抑制阅读反应、让颜色反应获胜。
这种冲突监测系统在 fMRI 研究中有记录(Botvinick 2001、MacLeod & MacDonald 2000),显示 ACC 在不一致试验上特异性激活。Stroop 效应的精确大小——健康成人通常 100-200ms——是前额叶皮层覆盖自动阅读反应所需的时间。效应越大表明自上而下抑制越弱。本测试在 90 年中已通过 700+ 研究验证。
Stroop 测试 FAQ
关于 Stroop 测试及分数含义的常见问题。
Stroop 测试是 1935 年的经典心理学实验,测量认知抑制。你看到色词(如 RED)以彩色油墨(如蓝色)写出,必须报告油墨颜色而忽略单词。难度来自抑制自动阅读反应。
健康年轻成人通常显示 100-200ms 的 Stroop 效应(匹配和冲突试验之间的时间差),准确率 90%+。差距越小表明执行功能越强。60 岁以上成人平均 200-300ms,ADHD 成人通常 300ms+。
Stroop 测试测量认知抑制——大脑抑制自动反应(阅读单词)以做出受控反应(命名油墨颜色)的能力。它还测试选择性注意力和执行功能,都由前额叶皮层和前扣带回皮层运行。
Stroop 效应是单词及其油墨颜色冲突时发生的减速。读「RED」用红色(一致)很快。读「RED」用蓝色(不一致)在健康成人中慢 100-200ms。这一差距是你的个人 Stroop 效应得分。
一致试验显示色词以匹配油墨(RED 用红色)——这些快速简单。不一致试验显示冲突(RED 用蓝色)——这些缓慢,因为大脑必须覆盖阅读反应。Stroop 测试得分比较两种类型的速度。
美国心理学家 John Ridley Stroop 在 1935 年作为其乔治皮博迪学院博士论文的一部分发表了本测试。他的论文《系列言语反应中的干扰研究》是心理学中被引用最多的著作之一,被引用 17,000+ 次。
ADHD 成人持续显示更大的 Stroop 效应(单词干扰更多)和不一致试验更多错误。这一模式反映前额叶抑制较弱,是 ADHD 的核心特征。Stroop 是标准神经心理学 ADHD 测试套件的一部分。
增大的 Stroop 效应可能是额颞痴呆和阿尔茨海默的早期标志,常在记忆症状出现前。然而,单次测试无法诊断——临床医生使用 Stroop 配合其他测量。如担心认知变化,请咨询神经心理学家。
不需要。本 Stroop 测试完全在浏览器中运行,无需注册或登录。你的测试结果不存储在任何服务器上——它们仅在你的会话期间存在。免费使用次数不限。
颜色反应测试(如我们的 /color 页)测量你检测颜色和反应的速度。Stroop 测试专门测量认知抑制——在冲突下抑制自动反应的能力。它们使用类似视觉但测试不同的心理技能,各有用途。