- 精准学习
- (法)斯坦尼斯拉斯·迪昂
- 1635字
- 2023-05-17 16:12:57
学习就是调整心理模型的参数
调整心理模型有时非常简单。例如,我们怎样才能把手伸向我们所看到的物体并抓住它呢?笛卡尔(René-Descartes)在17世纪时就已经推测出,我们的神经系统一定包含将视觉输入转化为肌肉命令的加工回路(见图1-1)。你可以尝试亲自体验一下:戴上别人的眼镜,最好是一副高度数的眼镜,抓东西;更好的方式是,戴一副能使你的视线向左偏移十几度的棱镜,然后试着抓住物体。1你会发现你的第一次尝试完全失败了,因为戴着眼镜,你的手会伸到你瞄准的物体的右边。多尝试几次,向左逐渐调整你的动作。通过不断地尝试和失败,你的动作会变得越来越精准,因为脑已经学会了纠正视线的偏差。现在,摘下眼镜试着抓住物体,你会惊讶地发现你的手伸错了方向,太靠左了!(见图1-1)
图1-1 学习就是调整心理模型的参数
学习是什么? 学习就是根据外部反馈调整脑心理模型的参数。例如,a图中,学习用手指去瞄准以校正视觉和动作之间的偏差。每一次瞄准的错误都提供给脑有用的信息,继而慢慢缩小偏差。在神经回路中,虽然要校正的数字更大,但原理是一样的,辨识一个符号需要精细地调整几百万个神经联结。b图中,类似“8”的错误输出会回过头去反向传播,进而调整神经联结的数据,在下一次的尝试中改进输出。
到底发生了什么事?在刚刚短暂的学习期间,脑调整了它的内在视觉模式。此模式中对应视觉和身体方向之间偏移的参数被重新设置了。在这个通过试错进行重新校准的过程中,脑所做的事情与猎人为了调整他的步枪瞄准镜所做的事情类似:通过试射来调整他的瞄准镜,最终精准瞄准猎物。这种学习非常快,几次尝试就足以校正视觉和动作之间的偏差。然而,这个新的参数与旧的并不兼容,因此当我们摘掉眼镜恢复正常视力时,又会犯错。
不可否认,这种类型的学习有点特殊,因为它只需要调整与视觉角度相关的一个参数,大部分的学习比这精细得多,需要调整数十个、数百个甚至数千个参数,而我们的脑回路中有几百万个参数(每一个突触就是一个参数)。不过原则是相同的,即学习是在无数可能的内部模型中寻找最符合外部世界状态的可能性。
一个在东京出生的婴儿,在往后的两三年里,他的语言内部模型将不得不调整为符合日语的模型。这个婴儿的脑就像一台机器,内含数以百万计的回路设置。听觉层面的设置决定了日语中使用的辅音和元音,及其允许的组合规则。一个出生在日本家庭的婴儿必须知道哪些音素构成了日本语言,以及这些音素之间的区别。例如,有一个参数是区分R和L之间的发音,这在英语中非常关键,在日语中却无关紧要。在日语中,“Bill Clinton’s election”(比尔·克林顿的选举)和“Bill Clinton’s erection”(比尔·克林顿的勃起)没有任何区别……每个婴儿必须掌握一组固定的参数,而这些参数共同指定哪些类别的语音与他的母语相关。
从语音到词汇、语法到语义,每个层面的学习都重复了类似的过程。脑的组织结构是多层级的,一个模型嵌套在另一个模型中,就像俄罗斯套娃一样。学习就是用输入的数据去设置每一个层级结构中的参数。让我们看一个高级范例——语法规则的习得。在英语和日语的学习中,婴儿必须学会的一个关键是词序。在一个有主语、谓语和直接宾语的标准句子中,英语句式为“主语+谓语+宾语”:“John+eats+an apple(约翰吃了一个苹果)。然而在日语中,最常见的句式为“主语+宾语+谓语”:“约翰+一个苹果+吃”。值得注意的是,这个日语句式中还会因介词而改变。比如,“My uncle wants to work in Boston”变成了“Uncle my,Boston in,work wants”。这句话就变得与《星球大战》中尤达大师所说的话一样难懂。(2)但对一个讲日语的人来说,这句话一点问题也没有。
有趣的是,这种倒装句并不是相互独立的。语言学家认为它们来自一个名为“中心词位置”的参数:一个短语的中心词,在英语中总是位于第一位(在巴黎,我的叔叔,想生活),但在日语中被放在了最后(生活想,叔叔我的,巴黎在)。这个二元参数可以区分许多语言,甚至包括一些历史上没有关联的语言,例如纳瓦荷语遵循的规则就与日语相同。孩子为了学习英语或日语,必须学会如何设置他内部语言模型中的中心词位置参数。