最近,我在账号评论区注意到了这样一场争论:
- 我们做笔记都是在记什么?到底什么样的东西有记录的价值?
我们是该事无巨细地记录一切信息,建一个自己的百度百科;还是只是将笔记看作一个记录自己经历与感悟的日记本?到底哪一个更好?
这场争论引起了我的兴趣。虽然做笔记这件事我们一般总是依从直觉,大多不需要他人教导。但是「做什么笔记?如何做笔记?」确实是一个绕不开的话题,而且充满争议。
基于此,在这里我想从认知科学以及我的研究专业的角度来深挖一下这一话题,理清楚:
- 什么样的内容需要记?
- 如何记这些内容?
- 语言在这过程中起什么作用?
「信息即知识」真的对吗
先考虑这样一个问题:
- 网上能轻易查到的内容,有没有记录的必要?
如果只看这一个问题,大多数人的第一直觉应该是「不需要」——重复的内容有什么好记的呢?秉持这一直觉的人将知识看作信息,将笔记看作一个信息收集库,专门用于收集生活中一闪而过的灵感以及不容易找到的稀缺信息。这样做逻辑看似完备,实践也证明了这样的收集库很有价值。Flomo、Memos、Thino 这样的产品便主打「收集库」功能,也都获得了不小的成功。包括我也是 Flomo 的重度用户。
不过「收集库」的逻辑背后其实隐含了一个前提:知识是可以「拿来就用」的。但是这个前提显然有问题。如果什么东西都可以拿来就用,那人人都会是博学家,世界上就不会有学校,也不会有痛苦的学生,「学习」这个词就不会诞生。知识从拥有到掌握中间有一道鸿沟,需要付出巨大的成本去填补。由此看来,收集库只适用于存储一些能「拿来主义」的内容,我们日常称之为「信息」。比如某某手续的流程、某个重要日期等;至于那些需要掌握和灵活运用的「知识」则不能用收集库的逻辑对待。
关于这个问题,我其实有一个小小的案例可以充当实证:作为一个研究生,我有阅读过许多文献;之前我并没有单独做文献笔记的习惯,只有在遇到周期性组会的时候我才会写一次文献笔记并且将其直接转为 PPT 供组会演讲之用。于是我的知识被分为了两部分:Obsidian 中的文献笔记和 Zotero 中的原始文献。两者各自占比约 1:5。


为了理清思路,我会周期性地写小综述总结我看过的方法思路。我发现,这些小综述中引用的文献几乎都是写过文献笔记的文章。

这说明,只需要经「手」一次,知识从拥有到掌握之间的距离就会大大缩短。虽然这一现象很好理解,但是如果想要从中获得更深刻的洞见,则需要结合一些理论做更加深入的分析,试图做到「知其然,且知其所以然」。
认识的三重结构
在解释案例这一问题上,我比较青睐起源于康德的这一套认识论模型。
过去很长一段时间里,人们总是倾向于认为我们接收的信息就是知识;康德(Immanuel Kant)否认了这一说法,他将人的认知能力分为三层:
- 感性(Sinnlichkeit):通过眼睛等感官直接读取信息,包括现实世界的感受以及阅读得来的信息;
- 知性(Verstand):人与生俱来的认知结构,可以整理感官得来的材料,得出真正的知识;比如我们会用类比、因果这样的逻辑去解释我们遇到的现象;
- 理性(Vernunft):试图超越经验;这和我们的讨论关系不大,不用做过多了解。
我们讨论的关键点就在于上面提到的认知结构(康德称之为「先验」)。康德认为:一切由感官感知到的内容,不论是生活经验还是他人生产的内容,对你来说都只是感性层面的信息;只有经过认知结构主动整理、解释过之后才是你能够运用的知识。案例中 Zotero 文献库中的文献对我来说属于前者,而我做的文献笔记则是经过我的认知结构处理过的内容。由于文献笔记已经经过了处理,适应了我的表达方式、叙事逻辑并且强调了我的关注点。因此相比于原始文献,其处理起来的负担要小得多。最终,大脑的「省力」本性驱使我尽可能选择现成的文献笔记,于是有了案例中所言的差异。

这一理论解释了案例中出现的差异,告诉我们唯有经自己的认知结构处理过的材料才是自己可以使用的知识。在这个互联网十分发达的时代,我们每个人都是海量信息的拥有者。问题的关键不在于我们拥有多少,而在于其中有多少是我们能够使用的。我们的个人笔记就是经过认知结构解释、重构后的内容,利用的成本极低,这是我们真正能够使用的知识。
此外,每个人的认知结构都是不同的,因此对于同样一份资料,每个人理解起来的难度也完全不同。正是由于认知结构的千差万别,即使到了互联网信息如此丰富的今天,我们也还是选择自己做自己的笔记而不是选择由他人代劳。
这一套理论也可以扩展到解释教材编写的问题上。书写教材之所以困难,是因为读者认知结构的差异导致处理教材所需付出的认知成本不同。教材编写者只能试图寻求读者认知结构的最大公约数。这也就注定了同样的教材之下不同的学生之间必然有成绩差别。
到这里,我们已经解答了「为什么记笔记」这一问题。这一洞见帮助我们从「知其然」跨越到了「知其所以然」。而现在,我们的任务是进一步跨越到「实践」。为了获得一些有助于实践的建议,我们还需要进一步深入到认知结构的内部去,了解认知结构本身以及其究竟是如何处理感官获取的内容。
认知结构:旧知识产生新知识
在「认知结构是什么这一问题」上,康德认为认知结构(他称之为「先验」)主要是将感官获得的材料归纳为了几个特定类型的知识:
- 分析的(先天的)——比如:「单身汉是未婚男子」
- 综合的(后天的)——比如:「这房子是绿的」
- 综合的(先天的)——比如:「凡事皆有原因」
这些案例乍看难以理解,实际上也确实难以理解。康德本人所著的书不好读已经成了一个梗。你可以在各种平台上看到读者们的遍地哀嚎。

不过不用担心,在这个问题上我不打算采纳康德的解释——他将认知结构归纳为几个固定的类型本身太过死板。后来的研究表明,人的认知结构不是一成不变的,而是和先天条件、后天经历甚至语言都息息相关的一种先验模型。打个经典的比方:
一部《红楼梦》,单是命意,就因读者的眼光而有种种:经学家看见《易》,道学家看见淫,才子看见缠绵,革命家看见排满,流言家看见宫闱秘事。
——《绛洞花主 · 小引》
而由于每个人的先天条件和后天经历都千差万别,所以不同的人其认知结构不尽相同,而且会发生改变。这印证了之前的说法。不过目前人们的研究有限,并不能洞察人脑内部的全部运行方式。关于认知结构到底是什么样的,我们只有一些「盲人摸象」式的理论。在这些理论中,我认为弗雷德里克·巴特莱特(Frederic Bartlett)提出的图式理论(Schema Theory)比较合理。
图式理论继承了康德关于人通过认知结构主动处理感官获得的材料的观点,但是其否定了「感性材料经过加工转化为知识」的说法。他将我们已有的知识称为图式(schema),认定新知识的诞生本质上是已有图式对新的感性材料进行解释。这两个说法看起来差不多,其主要区别在于:前者认为知识来源于材料;后者则认为是来源于其他知识。为了验证这个观点,巴特莱特做了一个实验:他让一组普通的英国被试者阅读北美印第安民间故事,间隔一段时间后要求他们复述这一故事。巴特莱特发现:许多受试者复述的故事被简化为符合英国文化图式的内容(如独木舟变成了船);而且故事还被添加了原本没有的细节(如推测战斗是为了复仇)。这说明:受试者并非记住了故事,而是根据自己已有的知识重新书写了故事;知识是重构的结果。
同样的,当新知识一产生,其马上就加入到了解释其他感性材料的行列:于是图式扩大了,人解释新的感性材料时能借助的工具变多,人的认知能力因此发生提升。以优化理论为例,按照图式理论知识产生的顺序,我们可以将学习的过程看作一座塔:

由于这种「学得越多、学得越快」特性形成了正反馈循环,导致人们很容易因为早期的一点点优势劣势在后期拉开巨大的差距,形成马太效应。这就是著名的「知识复利」概念的本质。
与此同时,图式理论也可以很好地解释为什么我们可以轻易记住一篇长篇小说中的海量情节,却难以记住一串 16 位随机数字;为什么一年级小朋友无法学习高等数学内容,而高中生就可以。前者是因为随机数字无法使用任何已有知识解释;后者是因为小朋友没有足够的知识去解释高等数学中讲到的内容。
图式的概念给了我们很大的启发,告诉了我们在学习新知识的时候要尽可能地将其和旧的知识联系起来。我们学习一个概念或者理解一个现象的时候要做两件事:
- 我有哪些已有的知识可能是和它有关的?
- 我该如何用已有的概念解释它?
对应到实践:
- 建立一个知识库尽可能地保留已有的旧知识,并且辅之以搜索机器,让我们可以快速获得我们需要的旧知识;
- 不要将写笔记看作记录要点,而是要看作对新事物的解释;
- 明确知识之间的解释与被解释关系,制作一张知识地图。
当前主流的所有笔记软件几乎都能支持这些实践要求,所以关于这方面我并不做推荐。如果你想要看具体的实践案例,可以看我之前写的笔记系统实战:以奖学金之名,我如何用 Obsidian 备考数学 - 少数派。
语言的作用
写到这里,我已经可以预料到这篇文章已经构成了对读者耐心的极大挑战。不过即使是这样,我也还有最后一个问题要谈:
- 为什么这些操作不能在脑海中完成,而是一定要写出来?
其实不论是写出来,还是说出来、讲出来,其本质都是一个:将知识从脑海中的思维转化为语言。经过这一重转换,知识又再次变回了语言承载的感性材料。但是这种材料已经是经过认知结构处理之后、可以快速变回脑中知识的材料了。这实际上是在问:语言到底有什么作用?
自然语言的研究是当前最火热的科研领域之一,包括我本人也在谋求获得一张自然语言处理领域的硕士学位证。语言在思维中起的作用十分复杂而且充满争议,如果要在这里详述恐怕这篇文章永远不会有尽头。不过我可以提供一个切入角度供你理解:语言可以强制启动系统 2 的功能,帮助你澄清模糊的概念,补齐知识缺失的细节——而这是系统 1 所做不到的。
系统 1 和 2 是心理学家丹尼尔·卡尼曼(Daniel Kahneman)在《思考,快与慢》中提出的概念。他将人的大脑功能分为系统 1 和系统 2。系统 1 负责无意识、快速的直觉型「快思考」;系统 2 则负责费力、复杂的「慢思考」。数万年的进化策略决定了我们的身体偏好系统 1 而排斥能耗高的系统 2。所以我们能看到人们直觉地排斥一切需要动用系统 2 的事情:
- 注重体验经验增长的欣喜感觉,排斥记录和复盘;
- 喜欢通过直觉对热点事件下定论,排斥仔细分析;
- ……
我们在学习的过程中也存在这样的特点:满足于知识流过脑子的感觉,不求甚解,实际上混杂了大量的误解和空缺的细节。而语言的帮助在于,用组织语言的方式显化了知识构建的过程,强迫我们启动系统 2 来对知识进行深入的建构。而在建构过程中我们引入了自我批评的元素,从而实现了对知识的「扬弃」。关于这个观点有一个我认为很有意思的例证:思维链(Chain of Thought, CoT)。我们都知道引入思维链能够提升模型回答的准确性,但是思维链并没有为模型回答问题提供更多的信息,这种提升是怎么形成的呢?我认为答案很可能和思维链对思考过程的显化作用有关系。通过组织语言,模型理清了隐含的误解和逻辑错误,从而改善了生成的质量。

DeepSeek 的回答也回应了这种说法:

语言的作用说明:记录的价值不在记录的结果,而在于记录的过程。因此过于依赖剪藏以及 AI 总结来节省人力可能不会带来期望的效果。我们最终还是要依赖输出带动输入,而不是规避这个过程。
结语
这篇文章凝聚了我近几个月阅读的内容以及思考。一直以来,有关认知的讨论虽然多,但是几乎都不是很在意讨论的基础。作为一个知识工程领域的研究者,我一直希望找到这样一个基础,让我们不只是像之前一样只是谈感受,遇到冲突时只能以「每个人有适合自己的选择」来搪塞过去。最后,我结合我的专业领域以及最近的阅读兴趣,选择了认知科学来充当这一基座。
笔记不是简单的存储文本,而是认知能力的延伸。我希望这篇文章能够引起更多有价值的思考,我在这里期待你的回音。
> 下载 少数派 2.0 客户端、关注 少数派公众号,了解更妙的数字生活 🍃
> 实用、好用的 正版软件,少数派为你呈现 🚀