Difference between revisions of "于舒昂 每周课堂记录"

From PKC
Jump to navigation Jump to search
 
(40 intermediate revisions by the same user not shown)
Line 1: Line 1:
=课程笔记=
<big>=课程笔记=
==第一周==
==第二周==


==第二周==
key-value pair将复杂系统的本质抽象出来。提供了一种快速检索和定位知识的结构。从这种角度来理解科学革命,科学革命种的“科学共同体”所构建的“框架”、或是范式。描述的就是一个namespace的概念。在各自的namespace中进行研究和交流是通畅的、无歧义的。而跨过namespace的交流是无效的混论的歧义的。科学革命的本质就是通过namespace的重建、整合和完善构建新的范式。
 
联想到数据结构中key-value pair的结构,通过一一映射的hash值和排解hash冲突构建起快速查找的结构,但是这种结构除了快速查找之外没有任何其它意义,例如大小关系,排序关系,集合关系等等,我还在进一步思考这样的结构和计算机数据结构是否是等价的,有什么更深层次的意义。


==第三周==
==第三周==
本周课程从生命的起源出发,从个体上来讲,庞大生命是由一个受精卵细胞发育完成的;从广阔的进化或是演化的长河中来讲,所有生命的起源都是单细胞生物。在感叹生命起源的伟大和神奇的同时,我们意识到复杂的事物往往都是由简单的事物构成的,这为我们提供了一种最基本却也是目前为止最行之有效的研究范式或是研究框架——通过将复杂问题拆分成为简单单元或是“单子”来研究。
再次结合到计算机结构中,复杂的CPU是由单独的门电路组合而成的,依据简单的指令集完成复杂的工作,而近年来由于深度学习的火热而进入人们视野之中的GPU同样如此。相比起CPU,GPU有更多核心(成千上万个),但是每个核心都只能重复简单的工作,但是这样的多核心并行处理问题的思路却可以很好的解决矩阵乘法这样的问题。
由此可以引申出量变和质变的关系问题的讨论,这和Kuhn的观点是不谋而合的。在小的反常发现之处往往不认为是什么了不起的事情,这被认为是和常规科学的解谜游戏没有本质区别。但是当这样的反常积累,就会在某一个瞬间产生质变,即科学革命。Kuhn的观点和这种单子的观点是吻合的,本质相同的小的单元在聚合起来之后会发生本质的改变。也就是说,虽然复杂事物是由简单事物组成的,但是复杂事物并非简单事物的累加,而是产生一些截然不同的性质。


==第四周==
==第四周==
本周课程中我们讨论了事物之间的关系,具体的,用三国之间的故事来描述。
#刘备 & 刘禅
#曹魏 & 孙吴
#创业 & 统一大业
我们先来考察问题1,如果将刘备和刘禅两个人都视作单子的话,1描述的是两个单独事物之间的关系:“刘禅是刘备的儿子,刘禅继承了刘备的皇位”,这样的关系被定义为函数,即描述两个单独事物之间的关系。
接着我们考察问题2,曹魏这个政治集团不能被视作是一个单子,而是一个复杂的系统。描述系统和系统之间关系的映射或是刻画称之为函子,函子的本质是函数的集合和交叉映射。如果运用上一周课程的相关内容,一个系统可以被表示为多个单子的组合,这样的话函子就可以表示为多个函数的关系。如果这样的关系是线性的,就可以被抽象成线性代数中矩阵的数学模型。
问题3是最复杂的,其刻画的是映射之间的关系,所谓“关系之关系”。创业是使用武装冲突的方式夺取政权并实现统一,而统一大业则是更广泛的手段的集合,例如“挟天子以令诸侯”的方法,这样的两种手段之间有相同和不同之处,相同之处是都有着相同目的:夺取政权和统一;不同是手段不同,有温和的手段,暴力冲突的手段,政治的手段,经济的手段等等。
将上述问题的研究抽象成为数学模型,即“范畴论”的模型。范畴论是抽象地处理数学结构以及结构之间联系的一门数学理论,以抽象的方法来处理数学概念,将这些概念形式化成一组组的“对象”及“态射”。有些人开玩笑地称之为“一般化的抽象废话”。范畴论出现在很多数学分支中,以及理论计算机科学和数学物理的一些领域。
不是只专注在有特定结构的个别对象(如单子)上,范畴论会着重在这些对象的关系(因施工和)上;经由研究这些映射,可以学到更多关于这些对象的结构。再抽象化一次,范畴自身亦为数学结构的一种,因此可以寻找在某一意义下会保持其结构的“过程”;此过程即称之为函子。函子将一个范畴的每个对象和另一个范畴的对象相关连起来,并将第一个范畴的每个态射和第二个范畴的态射相关联起来。实际上,即是定义了一个“范畴和函子”的范畴,其元件为范畴,(范畴间的)态射为函子。


==第五周==
==第五周==
从文字和会计法则出发,我们通过对文字的发展演化史,记账的发展演化历史,我们得到这样一个公式
A=L+SE
而在物理学的哈密顿力学中
H=T+V
这样的相似性绝非偶然,上述两种一个量可以表述为两个量(若干个量)相加的结构可以被认为是一种守恒量。物理学的规律告诉我们,守恒量是由对称性产生的。物理定律的对称性也意味着物理定律在各种变换条件下的不变性。由物理定律的不变性,我们可以得到一种不变的物理量,叫守恒量,或叫不变量。比如空间旋转对称,它的角动量必定是守恒的;空间平移对称对应于动量守恒,电荷共轭对称对应于电量守恒等等。爱因斯坦就是当年思考这个问题时,提出“在惯性参考系变换操作下,物理规律保持不变”,这就是狭义相对性原理。进一步推广为:在任意参考系变换操作下,物理规律保持不变,这就是广义相对性原理。综上,我们可以看出,这样的对称-守恒关系是相当重要的,在人类科学史上扮演着举足轻重的作用。


==第六周==
==第六周==
本节课上我们讨论了知识表达和问题的转化这两个简明而又深刻的话题。这两个话题是相辅相成的,知识的表达形式决定了研究知识的可能性,而问题的转换本质也就是表达方式的转变,从而更方便我们去研究。
问题的转换主要分解为两个步骤,确定问题可以在现有的范式(例如计算机)下的可解性(make knowledge computable)以及确保问题在有限个步骤内可解。
首先是确保知识的可计算性。正如之前课程所说的那样,所有数据都是偏序集,这提供给我们一个很好的知识表达途径。我们通过系统拆分,将系统性的知识全部拆分为小的知识模块,成为“格”这样的结构。在论证知识之间关系的时候,我们可以用到“同胚”的概念构建等价性,Ted Nelson通过水流流过手指缝这样的现象得到了类似的启示,手指缝隙不断变化,水流也跟着变化,但是从拓扑学意义上来讲都是等价的。这是很难想象和表达的,把它概括到整个宇宙,世界是一个由不断变化的关系和结构组成的系统。这样的结构将连续系统和离散系统联系起来,确保了问题是可以被计算机所计算解决的。
受限于算力,我们需要确保整个系统是在有限步骤内可以解决的,也就是说,这个问题的计算复杂度是可以接受的。通过函数、函子和自然变换,可以构建穿越多层次的数据结构映射机制。这样可以对数据进行计算。
==第八周==
核心观点:所有数据都是偏序集(偏序集由有向关系构成)
现有数据的影响范围可被抽象编码为局部时空区间的“格”
[[File:时空锥.png|thumb]]


=科学革命的结构读书笔记=
==第九周==
==书本内容梳理==
本节课上我们讨论了控制论和通信,控制和通信往往都是分不开的一组话题。
《结构》一书第一次对范式这一概念做出了清晰的阐述,引入了常规科学、危机、反常和革命的概念,建立起了科学研究发展的基本规律�[1]。本文将这本书的内容从逻辑上大致分为四个部分
===常规科学与科学共同体===
常规科学指坚实的建立在一种或多种过去成就基础上的研究,是一种解谜活动。其主要解决的问题是现象与理论的一致、用现存理论预测有用的信息、阐明理论的问题。常规科学的目的不在于产生新的概念或者方法,因此它看上去似乎无足轻重。但库恩明确地表明科学研究的大部分时间都处在常规科学的过程中,常规科学的重要意义在于扩展已有范式的适用范围和精确程度,作为“反常指示器”而存在。
在《结构》中,库恩对科学共同体的阐述是在同一个学科领域中的科学家,他们拥有共同的公认的研究基础,有共同的一组研究问题。概括的来讲,就是在相同范式指导下的科学家们组成的团体。科学共同体是生产科学知识的单位,是进行科学认知的最小单位。在19世纪之前,科学研究还是一种个人行为,而如今,科学研究是一项庞大的,依赖于整个社会的工作,因此科学认知的最小单位就不再是个人而是科学团体。


核心观点:所有知识都可以被Name Functions所表达,我们的核心焦点在于关注命名结构之间的关系


系统设计方法论的充分必要条件是:可靠性(Soundness)、精确性(Precision)、可终止(Termination)


==关于Kuhn理论的思考==
可靠性要求建模系统建模所描述的“假设”与“断言”与运行结果一致。精确性主要用于标示语义(命名空间)的精确程度可根据应用场景的需求,即时地调用可供决策的算法与相应的度量衡。可终止性指的是在有限的时间与计算资源内得到可供决策的系统模型评估结果。
</big>

Latest revision as of 03:56, 15 December 2021

=课程笔记=

第二周

key-value pair将复杂系统的本质抽象出来。提供了一种快速检索和定位知识的结构。从这种角度来理解科学革命,科学革命种的“科学共同体”所构建的“框架”、或是范式。描述的就是一个namespace的概念。在各自的namespace中进行研究和交流是通畅的、无歧义的。而跨过namespace的交流是无效的混论的歧义的。科学革命的本质就是通过namespace的重建、整合和完善构建新的范式。

联想到数据结构中key-value pair的结构,通过一一映射的hash值和排解hash冲突构建起快速查找的结构,但是这种结构除了快速查找之外没有任何其它意义,例如大小关系,排序关系,集合关系等等,我还在进一步思考这样的结构和计算机数据结构是否是等价的,有什么更深层次的意义。

第三周

本周课程从生命的起源出发,从个体上来讲,庞大生命是由一个受精卵细胞发育完成的;从广阔的进化或是演化的长河中来讲,所有生命的起源都是单细胞生物。在感叹生命起源的伟大和神奇的同时,我们意识到复杂的事物往往都是由简单的事物构成的,这为我们提供了一种最基本却也是目前为止最行之有效的研究范式或是研究框架——通过将复杂问题拆分成为简单单元或是“单子”来研究。

再次结合到计算机结构中,复杂的CPU是由单独的门电路组合而成的,依据简单的指令集完成复杂的工作,而近年来由于深度学习的火热而进入人们视野之中的GPU同样如此。相比起CPU,GPU有更多核心(成千上万个),但是每个核心都只能重复简单的工作,但是这样的多核心并行处理问题的思路却可以很好的解决矩阵乘法这样的问题。

由此可以引申出量变和质变的关系问题的讨论,这和Kuhn的观点是不谋而合的。在小的反常发现之处往往不认为是什么了不起的事情,这被认为是和常规科学的解谜游戏没有本质区别。但是当这样的反常积累,就会在某一个瞬间产生质变,即科学革命。Kuhn的观点和这种单子的观点是吻合的,本质相同的小的单元在聚合起来之后会发生本质的改变。也就是说,虽然复杂事物是由简单事物组成的,但是复杂事物并非简单事物的累加,而是产生一些截然不同的性质。

第四周

本周课程中我们讨论了事物之间的关系,具体的,用三国之间的故事来描述。

  1. 刘备 & 刘禅
  2. 曹魏 & 孙吴
  3. 创业 & 统一大业

我们先来考察问题1,如果将刘备和刘禅两个人都视作单子的话,1描述的是两个单独事物之间的关系:“刘禅是刘备的儿子,刘禅继承了刘备的皇位”,这样的关系被定义为函数,即描述两个单独事物之间的关系。

接着我们考察问题2,曹魏这个政治集团不能被视作是一个单子,而是一个复杂的系统。描述系统和系统之间关系的映射或是刻画称之为函子,函子的本质是函数的集合和交叉映射。如果运用上一周课程的相关内容,一个系统可以被表示为多个单子的组合,这样的话函子就可以表示为多个函数的关系。如果这样的关系是线性的,就可以被抽象成线性代数中矩阵的数学模型。

问题3是最复杂的,其刻画的是映射之间的关系,所谓“关系之关系”。创业是使用武装冲突的方式夺取政权并实现统一,而统一大业则是更广泛的手段的集合,例如“挟天子以令诸侯”的方法,这样的两种手段之间有相同和不同之处,相同之处是都有着相同目的:夺取政权和统一;不同是手段不同,有温和的手段,暴力冲突的手段,政治的手段,经济的手段等等。

将上述问题的研究抽象成为数学模型,即“范畴论”的模型。范畴论是抽象地处理数学结构以及结构之间联系的一门数学理论,以抽象的方法来处理数学概念,将这些概念形式化成一组组的“对象”及“态射”。有些人开玩笑地称之为“一般化的抽象废话”。范畴论出现在很多数学分支中,以及理论计算机科学和数学物理的一些领域。

不是只专注在有特定结构的个别对象(如单子)上,范畴论会着重在这些对象的关系(因施工和)上;经由研究这些映射,可以学到更多关于这些对象的结构。再抽象化一次,范畴自身亦为数学结构的一种,因此可以寻找在某一意义下会保持其结构的“过程”;此过程即称之为函子。函子将一个范畴的每个对象和另一个范畴的对象相关连起来,并将第一个范畴的每个态射和第二个范畴的态射相关联起来。实际上,即是定义了一个“范畴和函子”的范畴,其元件为范畴,(范畴间的)态射为函子。

第五周

从文字和会计法则出发,我们通过对文字的发展演化史,记账的发展演化历史,我们得到这样一个公式

A=L+SE

而在物理学的哈密顿力学中

H=T+V

这样的相似性绝非偶然,上述两种一个量可以表述为两个量(若干个量)相加的结构可以被认为是一种守恒量。物理学的规律告诉我们,守恒量是由对称性产生的。物理定律的对称性也意味着物理定律在各种变换条件下的不变性。由物理定律的不变性,我们可以得到一种不变的物理量,叫守恒量,或叫不变量。比如空间旋转对称,它的角动量必定是守恒的;空间平移对称对应于动量守恒,电荷共轭对称对应于电量守恒等等。爱因斯坦就是当年思考这个问题时,提出“在惯性参考系变换操作下,物理规律保持不变”,这就是狭义相对性原理。进一步推广为:在任意参考系变换操作下,物理规律保持不变,这就是广义相对性原理。综上,我们可以看出,这样的对称-守恒关系是相当重要的,在人类科学史上扮演着举足轻重的作用。

第六周

本节课上我们讨论了知识表达和问题的转化这两个简明而又深刻的话题。这两个话题是相辅相成的,知识的表达形式决定了研究知识的可能性,而问题的转换本质也就是表达方式的转变,从而更方便我们去研究。

问题的转换主要分解为两个步骤,确定问题可以在现有的范式(例如计算机)下的可解性(make knowledge computable)以及确保问题在有限个步骤内可解。

首先是确保知识的可计算性。正如之前课程所说的那样,所有数据都是偏序集,这提供给我们一个很好的知识表达途径。我们通过系统拆分,将系统性的知识全部拆分为小的知识模块,成为“格”这样的结构。在论证知识之间关系的时候,我们可以用到“同胚”的概念构建等价性,Ted Nelson通过水流流过手指缝这样的现象得到了类似的启示,手指缝隙不断变化,水流也跟着变化,但是从拓扑学意义上来讲都是等价的。这是很难想象和表达的,把它概括到整个宇宙,世界是一个由不断变化的关系和结构组成的系统。这样的结构将连续系统和离散系统联系起来,确保了问题是可以被计算机所计算解决的。

受限于算力,我们需要确保整个系统是在有限步骤内可以解决的,也就是说,这个问题的计算复杂度是可以接受的。通过函数、函子和自然变换,可以构建穿越多层次的数据结构映射机制。这样可以对数据进行计算。

第八周

核心观点:所有数据都是偏序集(偏序集由有向关系构成)

现有数据的影响范围可被抽象编码为局部时空区间的“格”

时空锥.png

第九周

本节课上我们讨论了控制论和通信,控制和通信往往都是分不开的一组话题。

核心观点:所有知识都可以被Name Functions所表达,我们的核心焦点在于关注命名结构之间的关系

系统设计方法论的充分必要条件是:可靠性(Soundness)、精确性(Precision)、可终止(Termination)

可靠性要求建模系统建模所描述的“假设”与“断言”与运行结果一致。精确性主要用于标示语义(命名空间)的精确程度可根据应用场景的需求,即时地调用可供决策的算法与相应的度量衡。可终止性指的是在有限的时间与计算资源内得到可供决策的系统模型评估结果。