最近一段时间,系统性的学习了实验设计(DoE)的知识,把自己学习的内容和心得总结一下。虽然不知道能不能写明白,但是这个写的过程或许就是最有价值的过程!
无论哪一个学科的研究者想要研究这个真实世界的各种复杂现象,几乎都需要进行实验,我们这些生物狗更不会除外。实验是研究一个过程或者一个系统的最有用的工具。
真实世界的各种复杂现象,比如细胞的培养过程,蛋白的纯化过程,都是由一个个特定的过程或者系统组成,而实验可以用来发现特定过程或者系统的某些事情,或者说来确定过程或者系统的性能。一般,我们可以将过程或系统视为操作,机器,方法,人以及其他资源的一种组合,把某些输入变量转变为一个或多个可观测的响应变量的输出。其中某些输入变量是可控的,某些输入变量可能是不可控的。输入变量也称为因子,一般用x表示,输出变量也称为响应,一般用y表示。(2)确定有影响的因子(x)的取值在何处时可以使得响应(y)接近目标值;(3)确定有影响的因子(x)的取值在何处时可使得响应(y)的变异性最小;(4)确定有影响的因子(x)的取值在何处时可使得不可控变量的效应最小;实验设计,就是研究正确的设计实验计划和分析实验数据的理论和方法,通过改变过程的输入因子,观察其相应的输出响应的变化,从而获取关于该过程的知识,确定各个因子的重要性以及各因子是如何影响响应,并获得最优化过程,从而达到解决上述四个问题的目的。在没有实验设计之前,科学家是如何解决上述问题的呢?很显然,在做实验之前,我们会先确定我们一些我们认为比较重要的,或者比较感兴趣的因子,那实验怎么做?一种最直接的方法就是选择这些因子的任意组合,测试它们,观察发生了什么(响应),然后基于观测的结果,推断某个因子可能更加的重要,在下一轮的实验中则改变这个因子,其他因子不变。这种方法可以无限的持续下去,这种实验方法称为最佳猜测法。对于有经验的研究者来说,这种方法可能会比较有效,但是对于一个新手来说,这种方法则是一种非常低效率的方法,而且有时候,结果取决于运气。如果最初的最佳猜测并没有产生预期的效果,那么研究者就不得不做另一种因子的组合来开启最佳猜测。还有,如果研究者最初的最佳猜测获得了一个可接受的结果,虽然不是最优办法,但仍可能试图阻止实验。一次一因子法(OFAT)
这种方法包括对每个因子选择初始点,然后在保持其他因子的初始选择点不变的条件下,让每一个因子在其所允许的范围内连续变动。当所有的实验都做完之后,就可以做出每个因子的效应图,对因子效应的解释就比较直观。OFAT法的主要缺点在于,没有考虑因子之间可能存在交互作用,除此之外, OFAT法能否获得最优的选择很大的依赖于初始选择点的位置,这也是OFAT法的效率不够高的原因。如果说OFAT法的缺点是没有考虑因子之间的交互作用,而如果需要研究这种因子之间交互作用的话,很自然能想到的一种方法是把所有因子的所有水平组合都研究至少一次不就可以了吗。的确如此,这就是最早的析因实验法的核心。析因实验是处理多个因子的一种正确的做法,在析因实验法中,所有的因子都是同时在改变的。析因实验法标志着DoE时代的开始。析因实验法是由英国的Ronald A.Fisher爵士提出,至今还不到100年的时间,尽管最初是为了解决农业实验的问题,但是现在已经广泛应用于各行各业。而Fisher也被公认为DoE的创始人。Fisher在开创了析因实验的同时,还提出了方差分析,P值的原理,某种意义来说,Fisher也是现代统计学的革新者。随着时代的发展,尤其是工业革命,互联网革命的到来,析因实验法也发展了很多,以析因设计为基础,提出了更多更先进,更有效率,更能解决实际问题的实验方法,比如部分析因实验,响应曲面实验,稳健参数设计,混料设计等等。他们在不同的领域,解决不同的问题上发挥着各自的作用,而所有的这些,我们统称为实验设计(DoE)。
如果你也在学习实验设计,想深入的交流和探讨,关注星辰视界公众号,或者留言申请加入星辰群,一起开始学习DoE!