读[美]特伦斯·谢诺夫斯基(Terrence Sejnowski)的《深度学习》,仿佛推开了人工智能的大门。作为“世界AI之父”,作者将深度学习的核心原理、前沿应用与跨学科思考融入文字,既有严谨的学术视角,也有对技术、教育与生命的深度叩问。以下摘录书中片段,连同自身的细碎思考,一起感受科技与思维的碰撞。
关于记忆的本质,书中提出了一个值得探讨的观点:“记忆持久性,位于外部神经元之间的空隙中,未被证明是真实的。” 这一表述打破了我们对记忆存储的固有认知,也为神经科学与深度学习的研究留下了探索空间。
深度学习的应用早已渗透生活的细微之处,比如用神经网络解读唇语:“神经网络来阅读唇语。人的嘴巴在运动过程中包含了声音的信息。尤哈斯的网络将嘴部的图像转换为每个时间点上产生声音的频谱。”
(一个小小的手机包含的 像语音识别 图像处理等等功能的背后离不开 计算生物物理神经等等多学科的研究,以用来实际应用!)
在实际应用中,深度学习的精准度令人惊叹:“经过训练后可以识别手写数字的多层玻尔兹曼机,对手写邮编进行精准识别。” 这种技术突破,让我们看到了机器学习在解决实际问题中的强大能力,也印证了特伦斯·谢诺夫斯基提出的“基于大脑式的计算方法是可行的”这一观点。
作者不仅关注技术本身,更延伸到对教育模式的反思:“我们背负着一个专门为大众教育而设计的流水线系统,对学生按年龄进行划分,教师在大班里年复一年地传授相同的课程。这可能是一种生产汽车的好方法,在劳动力只接受基本教育就能满足社会需求的年代,这样的方法还算行得通。但是当工作岗位需要更高水平的培训和终身学习来更新工作技能时,这个系统就落伍了。” 这一反思,恰恰贴合了当下人工智能时代对人才培养的新需求。
书中对新型感知技术的描述,藏着对未来科技的无限遐想:“这是表现场景的有效方式,因为大部分像素在大多数时间都保持不变,而每个脉冲都携带着有用的信息。”
(DVS摄像机,不是按帧出图,而是按照脉冲。如何开发出三维芯片?0和1之间能否再有0.5?或者开发出立体空间和芯片。)
事实上,文中提到的DVS摄像机,是一种受生物启发的新型视觉传感器,不同于传统帧相机,它仅输出局部像素级亮度变化的相关信息,具有高时间分辨率、低延迟等优势,能清晰捕捉高速运动目标,这也为三维芯片等未来技术的探索提供了思路。
当技术与认知碰撞,会引发更深刻的思考:“当我们进行跨模态(cross-modal)比较时,同时性问题变得更加令人困惑。你看到一个人在砍树,假设你离得足够近,即使声速比光速慢得多,你也可以同时看到并听到每次斧头对树木的砍击。而且随着与树的距离不断增加,同时性的幻觉仍然维持着,直到视觉和听觉信号到达你的大脑的时间差大于80毫秒时,我们就不再认为声音与砍击的动作同时发生(此时的距离大约为100英尺)。” 这一现象背后,是大脑对多感官信息的复杂处理机制,也呼应了“大脑无法真正同时处理两项任务,而是通过快速切换实现‘伪多任务’”的研究结论。
最后,作者抛出的疑问,跨越了技术本身,直指生命与认知的本质:“所有的物种都和我们一样以自我为中心吗?”
《深度学习》不止是一本技术科普书,更是一场思维的盛宴。特伦斯·谢诺夫斯基以跨学科的视角,将神经科学、计算机科学与人文思考融为一体,让我们在了解技术原理的同时,也学会用更理性、更谦逊的眼光看待世界与生命,看见科技背后的无限可能。
END