Featured image of post 需要忘掉的一课

需要忘掉的一课

学校教会我们钻烂测试的空子

📚 返回 Paul Graham 文章目录

需要忘掉的一课

December 2019

你在学校学到的最有害的东西,并不是哪一门课里的具体知识,而是:学会拿高分。

我上大学时,有一次一个特别认真的哲学研究生对我说,他从不在乎一门课拿了什么分,只在乎自己在这门课里学到了什么。这句话一直留在我脑海里,因为我只听过这么一次,有人会这样说。

对我来说——也对大多数学生来说——在大学里,“被如何衡量”几乎完全压过了“真正学到什么”。我算是挺认真的:我确实对大部分课都有兴趣,也很用功。但我最拼命的时候,毫无疑问是在备考。

按道理,考试只是它的字面意思:检验你在这门课里学到多少。按道理,你不该像“备考”那样为考试专门做准备,就像你不会“备”一次验血。按道理,你通过上课、听讲、阅读和(或)作业来学习,期末考试只是事后测量你学得如何。

但在现实里——几乎每个读到这里的人都知道——情况完全不是这么回事。听到上面那套“课程与考试本该如何运作”的解释,就像听一个词的词源,而那个词的意思早已面目全非。在现实里,“为考试而学习”这句话几乎是废话,因为真正的学习恰恰发生在那时候。勤奋与懈怠学生的差别在于:前者在考试前猛学,后者不学。没有人会在学期开始两周就通宵。

即便我算得上勤奋,我在学校里做的几乎所有努力,也都是为了在某个东西上拿个好分数。

在很多人看来,我这句话里出现“即便”很奇怪:这不就是同义反复吗?勤奋的学生不就是全 A 学生吗?这正说明,在我们的文化里,把学习等同于成绩已经渗透得有多深。

把学习和成绩混为一谈,真的有那么糟吗?是的,很糟。直到大学毕业几十年后、我在经营 Y Combinator 时,我才真正意识到它到底有多糟。

当然,我当学生时就知道:备考远不等于真正学习。最起码,你不会长期记住那些考前一晚硬塞进脑子的东西。但问题比这更严重。真正的问题是:大多数考试离“测量它们声称要测量的东西”差得太远。

如果考试真的能检验学习,事情倒也没那么糟:拿高分与真正学会,最终会趋同,只是晚一点而已。问题在于,几乎所有给学生的考试都太容易“被钻空子”了。大多数高分选手都知道这一点,而且熟到连质疑都懒得质疑。等你意识到“不这么做”听起来有多天真,你就明白了。

假设你正在上一门关于中世纪历史的课,期末考试即将到来。期末考试应该是对你中世纪历史知识的测试,对吧?所以如果你现在和考试之间有几天时间,如果你想在考试中表现出色,最好的方式肯定是阅读你能找到的关于中世纪历史的最好的书。然后你会知道很多关于它的知识,并在考试中表现出色。

不不不,有经验的学生会在心里这么说:你要是只去读那些真正讲中世纪史的好书,你学到的大部分东西都不会考。你该读的不是“好书”,而是这门课的讲义和指定阅读材料。甚至连这些也大多可以略过,因为你只需要关注那些“可能被出成考题”的东西。你要找的是边界清晰的信息块。指定阅读里哪怕有一段对某个微妙问题的精彩旁枝,你也可以放心跳过——它不太可能被加工成一道考题。可要是教授告诉你“1378 年大分裂有三个根本原因”,或“黑死病有三个主要后果”,那你最好把这三条背熟。至于它们究竟是不是原因或后果,其实不重要;就这门课而言,它们就是。

在大学里,经常有旧考试的副本流传,这些进一步缩小了你必须学习的内容。除了学习这位教授问什么类型的问题,你经常还会得到实际的考试问题。许多教授会重复使用它们。在教一门课10年后,很难不这样做,至少是无意中。

在某些课程中,你的教授会有某种政治目的要达成,如果是这样,你也必须达成它。这种需要的程度不同。在数学或硬科学或工程课程中,这很少是必要的,但在光谱的另一端,有些课程没有它你就无法获得好成绩。

在一门关于 x 的课里拿高分,与真正学到很多关于 x 的东西,差别大到你往往只能二选一;学生选择分数,也怪不得他们。所有人都用成绩来评判他们——研究生项目、雇主、奖学金,甚至他们的父母。

我喜欢学习,也确实很享受大学里写过的一些论文和程序。但我有没有在交完某门课的论文之后,再坐下来写一篇“纯粹为了好玩”的?当然没有。我还有别的课要交东西。只要一涉及“学习还是分数”的选择,我就会选分数。我上大学可不是为了考得一塌糊涂。

任何在乎拿高分的人都必须玩这套游戏,否则就会被玩的人甩开。在精英大学里,这几乎等于所有人,因为一个完全不在乎分数的人,多半一开始就不会在那里。结果是:学生们在竞争的,反而是把“真正学习”和“拿高分”之间的差距尽可能拉大。

为什么考试会这么糟?更准确地说:为什么它们这么容易被钻空子?任何有经验的程序员都能回答:一个作者从来没想过防黑的软件,会有多容易被黑?通常就跟漏勺一样,到处是洞。

“可被钻空子”是任何由权威强加的测试的默认状态。你被安排参加的考试之所以总是这么糟——总是这么偏离它们声称要测量的东西——原因很简单:出题的人几乎没花多少心思去防止它们被钻空子。

但你也不能因为考试好钻空子就怪老师。他们的职责是教书,不是设计“钻不动”的考试。真正的问题在于成绩——更准确地说,是成绩承担了太多用途。如果成绩只是老师用来告诉学生哪里做对了、哪里做错了的一种反馈,就像教练给运动员提建议一样,学生就不会被诱惑去钻题的空子。可惜在某个年龄之后,成绩就不再只是建议;在某个年龄之后,你在被教的同时,往往也在被评判。

我用大学考试举例,但它们其实还是最不容易被钻空子的。大多数学生一辈子参加的考试至少同样糟,尤其是那场“决定你能不能进大学”的考试,更是登峰造极。如果进大学只是招生官像科学家测量物体质量那样,去测量一个人头脑的品质,那我们只要对青少年说“多学点”就行了。你可以从这句话听起来有多不像高中生活,来判断“大学招生”作为一种测试到底有多糟。在现实里,高中里那些有野心的孩子不得不去做的、荒唐地具体的事情,和大学招生“可被钻空子”的程度几乎成正比:你不在乎、主要靠背诵的课程;为了显得“全面发展”而不得不参加的随机“课外活动”;像下棋一样人造的标准化考试;还有那篇你必须写的“作文/文书”,它显然要打中某个极其特定的靶心,但你并不知道靶心在哪。

这套测试不仅在“把孩子变成什么样”这件事上很糟,它还糟在极其可被钻空子——可钻到催生出整条产业链。考试培训公司和升学顾问的明确目的就是教人钻空子;而私立学校的功能里,也有很大一部分是在帮你钻这套空子。

这场特定的测试为什么这么容易被钻?我想是因为它在测量什么。大众叙事总说,进好大学靠的是“足够聪明”;但精英大学的招生官既不是、也从不声称自己只在找聪明。他们在找什么?他们在找的,是不仅聪明,而且在更一般意义上“令人赞赏”的人。那么这种“更一般的令人赞赏”怎么测?招生官靠感觉。换句话说,他们录取他们喜欢的人。

所以大学招生真正测试的是:你是否符合某一群人的品味。那当然是能被钻空子的。而且由于它既很容易被钻、又(被认为)事关重大,于是人们钻它的力度无出其右。这就是为什么它能在那么长的时间里、以那么大的幅度,扭曲你的生活。

难怪高中生经常感到疏离。他们生活的形状完全是人工的。

但浪费时间还不是教育体系对你做的最坏的事。最坏的是,它训练你相信:获胜的方式是钻烂测试的空子。这个问题更隐蔽,直到我看见它发生在别人身上,才真正意识到。

我开始在 Y Combinator 给创业公司创始人做建议时——尤其是年轻的那批——我一直困惑:为什么他们总喜欢把事情搞得特别复杂。他们会问:怎么融资?让风投愿意投你的诀窍是什么?我会解释:让风投愿意投你的最好办法,是你真的值得投。就算你能骗风投去投一家烂公司,你也同时在骗你自己——你把时间投进同一家公司,却要求他们把钱投进来。如果这根本不是个好投资,你为什么还要干?

“哦,”他们会说,然后停下来消化这个启示,接着问:那什么样的创业公司才算好投资?

于是我会解释:让一家创业公司有前途的,不只是投资者眼里“看起来有前途”,而是事实上有前途,关键在于增长。最好是收入增长;否则就是使用增长。你们需要做的,是获得大量用户。

那怎么获得大量用户?他们有各种想法:要搞一场大发布来拿“曝光”;要让有影响力的人替他们说话;甚至还知道要在星期二发布,因为那天最容易拿到关注。

不,我会解释:那不是获得大量用户的方法。获得大量用户的方法是把产品做得特别棒。这样人们不仅会用,还会推荐给朋友;于是只要你把增长启动起来,它就会指数式扩张。

到这一步,我已经告诉他们一件你以为显而易见的事:要做一家好公司,就得做出好产品。可他们的反应却像许多物理学家第一次听说相对论那样:一方面惊叹它“看起来真天才”,另一方面又怀疑“这么怪的东西不可能对”。“好吧,”他们会说,一副很听话的样子,“那你能不能把我们介绍给某某有影响力的人?还有,记得我们想在星期二发布。”

有时候,创始人要花上好几年才真正懂这些简单的道理。并不是他们懒或笨,而是他们似乎对眼前的东西视而不见。

我问自己:他们为什么总把事情弄得这么复杂?后来有一天我意识到,这不是个修辞问题。

当答案明明摆在眼前,创始人为什么却把自己绕成死结、去做错误的事?因为他们就是被这么训练出来的。他们的教育教会他们:赢的方式是钻测试的空子;而且甚至都没明说自己在训练他们这么干。年轻的、刚毕业的那批,从没遇到过非人工的测试。他们以为世界就是这么运作的:面对任何挑战,第一件事就是找出“钻这个测试的诀窍”。所以对话总从“怎么融资”开始,因为那最像测试:它发生在 YC 的末尾;有数字;数字越大似乎越好——那一定就是考试。

当然,世界上确实有很大一块领域,赢的方式就是钻测试的空子。这不只发生在学校。有些人出于意识形态或无知,声称创业也是这样。但事实不是。恰恰相反,创业最显著的一点之一是:你在多大程度上能靠“把活干好”来赢。任何事情都有边缘情况,但总体上,你靠获得用户来赢;而用户在乎的是产品能不能做成他们想要的事。

我为什么花了这么久才明白创始人为何把创业搞得这么复杂?因为我没明确意识到:学校一直在训练我们靠钻烂测试的空子来获胜。受训的不只是他们,还有我!我也被训练去钻烂测试的空子,只是直到几十年后才看清。

我的生活方式其实像是已经悟到了这一点,但我当时并不知道自己为什么这么做。比如,我一直避免去大公司工作。你要问原因,我会说它们虚、官僚,或者就是恶心。但我从没意识到:我对大公司那么反感,很大一部分原因是因为在那里你得靠钻烂测试的空子来赢。

同样,“测试不容易被钻空子”也是我被创业吸引的重要原因之一。但我当时也并没有明确意识到这一点。

我实际上是用“逐步逼近”的方式,做成了一件也许本该有闭式解的事:我在不知不觉中,逐渐把自己“钻烂测试空子”的训练给拆掉了。一个刚从学校出来的人,能不能仅仅通过认识到这个恶魔的名字,然后说一句“走开”,就把它赶走?似乎值得试一试。

光是把这种现象说清楚,就可能会改善很多,因为它的力量很大一部分来自我们对它的习以为常。一旦你看见了它,它就像房间里的大象——只是这是一头伪装得很好的大象。它如此古老、如此普遍;它其实只是疏忽的产物。没有人有意把事情设计成这样;这只是当你把学习和成绩、竞争,以及“考试天然不容易被钻空子”的幼稚假设放在一起时,必然出现的结果。

当我意识到自己最困惑的两件事——高中为何如此虚假、以及为什么那么难让创始人看见显而易见的事——竟然同出一因时,我被震住了。这样一块巨大的拼图,能在那么晚的时候“咔哒”一声归位,是很少见的。

通常这种大拼图归位后,会牵动很多领域,这次似乎也不例外。比如,它既说明教育本可以做得更好,也指向了可能的修复方式;它还暗示了一个所有大公司都爱问的问题的潜在答案:我们怎么才能更像一家创业公司?不过我不打算把所有影响都追到底。这里我想聚焦的是:这对个人意味着什么。

首先,它意味着:大多数雄心勃勃的大学毕业生,身上有一些东西可能需要“忘掉”。它还会改变你看世界的方式:你不再只是把各种工作粗略地按“看起来更有吸引力/更没吸引力”来排序,而是可以问一个非常具体的问题,用一种有趣的方式把它们分开——在这种工作里,你有多大程度是靠钻烂测试的空子来赢?

如果能快速识别“烂测试”,当然会很有用。有没有什么规律?还真有。

测试大致可以分两类:权威强加的,和非权威强加的。非权威强加的测试天然不容易被钻空子——因为没人声称它测量的是比它实际测到的更多的东西。比如一场足球比赛,只是在测试谁赢了,而不是哪支球队“更强”。这一点从解说员有时会在赛后说“更强的那队赢了”就能看出来。相反,权威强加的测试通常是别的东西的代理变量:一门课的考试按理说不只是测你这张卷子考得怎样,还要测你在这门课里学了多少。非权威强加的测试天然不容易被钻空子;权威强加的测试则必须被设计成不容易被钻空子——但通常并没有。于是,粗略地说,“烂测试”大致等同于“权威强加的测试”。

你也许真的喜欢靠钻烂测试的空子来赢。大概确实有人喜欢。但我敢打赌:大多数身处这种工作的人并不喜欢,只是把它当成世界运作的方式,除非你愿意“退出”,去当某种嬉皮手艺人。

我怀疑很多人默认认为:想赚大钱,就得接受在“烂测试”密布的领域里工作——这是代价。但我可以告诉你:这不对。它曾经是真的。二十世纪中叶,当经济由寡头垄断组成时,想爬到顶端,唯一办法就是玩他们那套游戏。但现在不是了。现在你可以靠把活干好来致富,这也是为什么人们比过去更热衷于“变有钱”的一部分原因。小时候,你要么当工程师做酷东西;要么当“高管”赚大钱。现在,你也可以靠做酷东西赚大钱。

随着工作与权威之间的联系逐渐松动,钻烂测试的空子也变得没那么重要了。这种联系的消蚀,是当下最重要的趋势之一;几乎每一种工作里都能看到它的影响。创业是最显眼的例子之一;写作也有类似变化:作家不必再服从出版商和编辑才能触达读者,现在可以直接面对读者。

我越想这个问题,就越乐观。这像是一种情况:只有当某个东西被移除,我们才会意识到它原来拖累了我们多少。我甚至能预见整座虚假的大厦崩塌。想象一下:越来越多人开始问自己“我愿不愿意靠钻烂测试的空子来赢”,并且回答“不愿意”,会发生什么?那些靠钻烂测试空子才能赢的工作,会被抽干人才;而那些靠把活干好来赢的工作,会迎来最有野心的人涌入。随着“钻烂测试空子”变得越来越不重要,教育也会演化为不再训练我们去做这件事。想象一下世界会变成什么样。

这不只是个人该忘掉的一课,也是社会该忘掉的一课;当我们真的把它忘掉时,会惊讶于被释放出来的能量。

注释

[1] 如果“考试只用来测量学习”听起来像不可能的乌托邦,那 Lambda School 已经是这么运作的。Lambda School 没有成绩。你要么毕业,要么不毕业。考试的唯一目的,是在课程的每个阶段判断你是否能继续学下去。所以整个学校本质上就是通过/不通过。

[2] 如果期末考试是一场与教授的长谈,那你确实可以靠读中世纪史的好书来准备。学校考试之所以那么容易被钻空子,很大一部分原因是同一场考试必须给大量学生使用。

[3] “学习”是拿高分的天真算法。

[4] 破解有多种含义。有一个狭义的含义,意思是破坏某物。这是一个人破解糟糕测试的含义。但还有另一个,更一般的含义,意思是找到问题的令人惊讶的解决方案,通常通过以不同方式思考它。在这种意义上的破解是一件美妙的事情。确实,人们在糟糕测试上使用的一些破解令人印象深刻地巧妙;问题不是破解本身,而是因为测试是可破解的,它们不测试它们应该测试的东西。

[5] Y Combinator 挑创业公司的人有点像招生官,不同之处在于:他们的录取标准不是随意的,而是被一个非常紧的反馈回路训练出来的——你录取了一家烂创业公司,或拒掉了一家好公司,通常最晚一两年就会知道,很多时候一个月内就知道了。

[6] 我敢肯定,招生官早就厌倦了读那些孩子的申请:他们似乎除了“愿意把自己伪装成应当呈现的样子以求录取”之外,没有别的个性。他们没意识到的是:在某种意义上,他们是在照镜子。申请者的“不真实”,正是申请流程任意性的倒影。一个独裁者也完全可以抱怨他身边的人不够真实。

[7] 我说的“好工作”,不是道德意义上的“好”,而是“好工匠把活干好”那种意义上的好。

[8] 有边界情况,很难说测试属于哪个类别。例如,筹集风险资本是像大学招生,还是像向客户销售?

[9] 注意,“好测试”只是指“不容易被钻空子”的测试。这里的“好”不是道德意义上的“好”,而是“运行得好”的好。有烂测试的领域与有好测试的领域,区别不在于前者“坏”、后者“好”,而在于前者是虚假的、后者不是。不过这两者也并非毫不相干。正如 Tara Ploughman 所说:从好走向恶的路径,会经过虚假。

[10] 认为最近经济不平等的增加是由于税收政策变化的人,对任何有创业公司经验的人来说似乎非常天真。现在不同的人正在致富,他们变得比仅仅税收节省能使他们变得的更加富有。

[11] 给虎爸虎妈的提醒:你可能以为自己在训练孩子“赢”,但如果你是在训练他们靠钻烂测试的空子来赢,那你——就像父母常干的那样——是在训练他们去打上一场战争。

感谢Austen Allred、Trevor Blackwell、Patrick Collison、Jessica Livingston、Robert Morris和Harj Taggar阅读本文草稿。

英文版:paulgraham.com/lesson.html|中文版:hijiangchuan.com/paulgraham/182-the-lesson-to-unlearn

📚 返回 Paul Graham 文章目录

更新记录:

  • 2026-01-21 HiJiangChuan 初稿翻译,术语待验证;
  • 2026-01-21 重新梳理,修正专业词汇的使用;