基本概念
历史背景
试验设计的发展历程可以分为几个重要阶段:
- 农业试验时期:比较和选择品种(和/或处理)在不可控制的田间条件下,Fisher开创性的试验设计和方差分析(ANOVA)工作。
- 工业时代:过程建模和优化,大批量材料,大型设备,Box的工作受化学工业启发,适用于其他加工行业,回归建模和响应面方法。
- 质量革命:质量和生产力提升,变异减少,全面质量管理,田口的稳健参数设计工作,六西格玛运动。在制造业(汽车、电子、家用电器等)有许多成功应用。
- 当前趋势和潜在新领域:计算机建模和试验,大型复杂系统,生物技术、纳米技术、材料开发等应用。
试验设计的定义
试验设计(DOE)是指在存在变异的情况下,无论是否完全受试验者控制,设计任何信息收集活动的过程。
试验类型
试验可以根据其目的分为几种类型:
- 处理比较:目的是比较一个因子的几种处理(例如,有4种水稻品种,想看它们在产量和抗旱性方面是否有差异)。
- 变量筛选:有大量因子,但只有少数重要因子。试验应识别重要的少数。
- 响应面探索:在识别重要因子后,探索它们对系统的影响;回归模型构建。
- 系统优化:确定最优条件(例如,最大化半导体制造产量或最小化缺陷)。
- 系统稳健性:希望优化系统并减少不可控制(噪声)因子的影响。(例如,希望汽车在不同道路条件和不同驾驶习惯下都能良好运行;IC制造过程在不同湿度和灰尘水平条件下都能良好工作)。
基本术语
- 因子:在试验中研究其对响应变量影响的变量。
- 因子水平:因子的数值或设置。
- 处理或水平组合:一次试验中所有因子的值集合。
- 试验单元:应用处理的对象。
- 试验(或运行):将处理应用于试验单元。
- 随机化:使用机会机制将处理分配给试验单元或运行顺序。
试验的系统方法
- 陈述研究目标。
- 选择响应变量...应与研究目的相对应。
- 名义最佳、越大越好或越小越好。
- 选择因子和水平。
- 使用流程图或因果图。
- 选择试验设计(即计划)。
- 执行试验(使用规划矩阵确定处理集和运行顺序)。
- 分析数据(应选择设计以满足目标,使分析高效且简单)。
- 得出结论。
基本原则
试验设计的三个基本原则:重复、随机化和区组
- 重复
- 每个处理应用于代表总体的单元
- 重复与重复测量的区别
- 使得能够估计试验误差
- 减少估计的方差并增加检测显著差异的能力
- 随机化
- 使用机会机制(如随机数生成器)将处理分配给单元或运行顺序
- 优点:
- 防止潜在变量或"潜伏"变量
- 减少处理分配中的主观偏差
- 确保统计推断的有效性
- 区组
- 区组指同质单元的集合
- 有效的区组:区组间变异大于区组内变异
- 在同一区组内运行和比较处理
- "能区组的就区组,不能区组的就随机化"
单因素试验
单因素布局
单因素布局(也称为完全随机设计)是指处理完全随机地分配给试验单元,试验单元应在整个试验过程中以随机顺序运行。
优点:
- 灵活
- 统计分析直接
- 即使存在缺失观测值,分析仍然简单
缺点:
- 如果单元不相似,试验误差较大
最适用情况:
- 试验单元相似
- 存在缺失数据
- 相对较小的试验
方差分析
单因素试验的模型:
\[y_{ij} = \eta + \tau_i + \varepsilon_{ij}, i = 1,...,k; j = 1,...,n_i\]
其中:
- \(y_{ij}\) = 处理i的第j个观测值
- \(\tau_i\) = 第i个处理效应
- \(\varepsilon_{ij}\) = 误差,独立的\(N(0, \sigma^2)\)
模型拟合:
\[y_{ij} = \hat{\eta} + \hat{\tau}_i + r_{ij} = \overline{y}_{..} + (\overline{y}_{i.} - \overline{y}_{..}) + (y_{ij} - \overline{y}_{i.})\]
其中"."表示对特定下标的平均。
方差分析分解:
\[\sum_{i=1}^{k} \sum_{j=1}^{n_i} (y_{ij} - \overline{y}_{..})^2 = \sum_{i=1}^{k} n_i (\overline{y}_{i.} - \overline{y}_{..})^2 + \sum_{i=1}^{k} \sum_{j=1}^{n_i} (y_{ij} - \overline{y}_{i.})^2\]
F检验:
对于原假设\(H_0: \tau_1 = \cdots = \tau_k\),F统计量为:
\[F = \frac{\sum_{i=1}^{k} n_i (\overline{y}_{i.} - \overline{y}_{..})^2 / (k-1)}{\sum_{i=1}^{k} \sum_{j=1}^{n_i} (y_{ij} - \overline{y}_{i.})^2 / (N-k)} = \frac{MSTr}{MSE}\]
该统计量服从自由度为\(k-1\)和\(N-k\)的F分布。
多重比较
当F检验拒绝原假设时,我们需要确定哪些处理对之间存在显著差异。对于一对处理,通常使用t检验和t统计量:
\[t_{ij} = \frac{\overline{y}_{j.} - \overline{y}_{i.}}{\hat{\sigma} \sqrt{1/n_j + 1/n_i}}\]
其中\(\hat{\sigma}^2 = RSS/df\)是方差分析中的均方误差;如果\(|t_{ij}| > t_{N-k, \alpha/2}\),则在\(\alpha\)水平上声明"处理i和j不同"。
当进行\(k'\)次检验来检验\(H_0: \tau_1 = \cdots = \tau_k\)时,试验误差率(EER)是在\(H_0\)下声明至少一对处理显著不同的概率。需要使用多重比较来控制EER。
Bonferroni方法:
如果\(|t_{ij}| > t_{N-k, \frac{\alpha}{2k'}}\),则在\(\alpha\)水平上声明"\(\tau_i\)不同于\(\tau_j\)",其中\(k'\)是检验次数。
对于单因素布局,\(k'=\binom{k}{2}=\frac{1}{2}k(k-1)\),随着k增加,\(k'\)增加,临界值\(t_{N-k, \frac{\alpha}{k'}}\)变大(即方法检测差异的能力降低)。
优点:不需要独立性假设。
Tukey方法:
如果\(|t_{ij}| > \frac{1}{\sqrt{2}} q_{k, N-k, \alpha}\),则在\(\alpha\)水平上声明"\(\tau_i\)不同于\(\tau_j\)",其中\(q_{k, N-k, \alpha}\)是自由度为k和N-k的学生化极差分布的上\(\alpha\)点。
Tukey方法比Bonferroni方法更强大,因为其临界值通常更小。
单因素试验的回归模型
当因子是定量的时,可以使用回归模型来分析数据。例如,对于一个定量因子x,我们可以拟合线性模型:
\[y = \beta_0 + \beta_1 x + \varepsilon\]
或二次模型:
\[y = \beta_0 + \beta_1 x + \beta_2 x^2 + \varepsilon\]
对于有重复试验的数据,我们可以使用失拟检验法判断当前模型是否合适。
残差平方和分解:
\[SSE = \sum_{i=1}^{k} \sum_{j=1}^{n_i} (y_{ij} - \hat{y}_i)^2 = \underbrace{\sum_{i=1}^{k} \sum_{j=1}^{n_i} (y_{ij} - \overline{y}_i)^2}_{SSPE} + \underbrace{\sum_{i=1}^{k} n_i (\overline{y}_i - \hat{y}_i)^2}_{SSLof}\]
由此可得\(\sigma^2\)的两个无偏估计:\(SSPE/\sigma^2\)和\(SSLOF/\sigma^2\)分别服从自由度为\(n-k\)和\(k-p\)的卡方分布。
失拟检验:
\[F_{LOF} = \frac{SSLOF/(k-p)}{SSPE/(n-k)} = \frac{MSLOF}{MSPE} \sim F_{k-p, n-k}\]
单因素随机效应
在单因素随机效应模型中:
\[y_{ij} = \eta + \tau_i + \varepsilon_{ij}\]
其中\(\varepsilon_{ij}\)是独立的误差项,服从\(N(0, \sigma^2)\),\(\tau_i\)是独立的\(N(0, \sigma_\tau^2)\),且\(\tau_i\)和\(\varepsilon_{ij}\)是独立的。\(\sigma^2\)和\(\sigma_\tau^2\)是模型的两个方差分量。
对于固定效应模型的原假设:\(\tau_1 = \cdots = \tau_k\)应替换为:
\[H_0: \sigma_\tau^2 = 0\]
在\(H_0\)下,F检验和方差分析表仍然适用。
模型未知的单因素试验和建模
如果试验者对模型没有先验知识,需要通过试验来估计模型,可以采用非参数回归模型:
\[y = m(x) + \varepsilon\]
建模方法有:
- 基函数法
- 近邻多项式估计
- 样条法
- 局部加权散点光滑法
- 小波分析等
评判标准通常是均方误差(MSE)和整体均方误差(MISE)。
多因素试验
配对比较设计
配对比较设计是指两种处理随机分配给每个包含两个单元的区组。可以消除区组间变异,如果这种变异很大,则效果显著。
配对t检验:
设\(y_{i1}\)、\(y_{i2}\)分别是单元i的处理1和2的响应,\(i=1,...N\)。设\(d_i = y_{i2} - y_{i1}\),\(\overline{d}\)和\(s_d^2\)分别是\(d_i\)的样本均值和方差。
\[t_{paired} = \sqrt{N} \overline{d} / s_d\]
如果\(|t_{paired}| > t_{N-1, \alpha/2}\),则在\(\alpha\)水平上声明两种处理显著不同。
配对设计与非配对设计的比较:
- 配对设计:两种处理随机分配给每个包含两个单元的区组。可以消除区组间变异。
- 非配对设计:每种处理应用于一组单独的单元,也称为两样本问题。如果配对不必要,则有用;它还有更多的误差估计自由度。
随机区组设计
随机区组设计(RBD)是配对比较设计的扩展,k个处理随机分配给每个区组(包含k个单元);总共有b个区组。总样本量\(N = bk\)。
模型:
\[y_{ij} = \eta + \alpha_i + \tau_j + \varepsilon_{ij}, i=1,...,b; j=1,...,k\]
其中\(y_{ij}\)是第i个区组中第j个处理的观测值,\(\alpha_i\)是第i个区组效应,\(\tau_j\)是第j个处理效应,\(\varepsilon_{ij}\)是误差,独立的\(N(0, \sigma^2)\)。
估计:
\[y_{ij} = \hat{\eta} + \hat{\alpha}_i + \hat{\tau}_j + r_{ij} = \overline{y}_{..} + (\overline{y}_{i.} - \overline{y}_{..}) + (\overline{y}_{.j} - \overline{y}_{..}) + (y_{ij} - \overline{y}_{i.} - \overline{y}_{.j} + \overline{y}_{..})\]
方差分析:
\[\sum_{i=1}^{b} \sum_{j=1}^{k} (y_{ij} - \overline{y}_{..})^2 = \sum_{i=1}^{b} k(\overline{y}_{i.} - \overline{y}_{..})^2 + \sum_{j=1}^{k} b(\overline{y}_{.j} - \overline{y}_{..})^2 + \sum_{i=1}^{b} \sum_{j=1}^{k} (y_{ij} - \overline{y}_{i.} - \overline{y}_{.j} + \overline{y}_{..})^2 = SS_b + SS_t + SS_r\]
检验和多重比较:
原假设\(H_0: \tau_1 = \cdots = \tau_k\)可以使用F统计量进行检验:
\[F = \frac{SS_t/(k-1)}{SS_r/((b-1)(k-1))}\]
如果F检验拒绝\(H_0\),应进行\(\tau_j\)的多重比较。多重比较的t统计量为:
\[t_{ij} = \frac{\overline{y}_{.j} - \overline{y}_{.i}}{\hat{\sigma} \sqrt{1/b + 1/b}}\]
在\(\alpha\)水平上,Tukey多重比较方法将"处理i和j不同"识别为:
\[|t_{ij}| > \frac{1}{\sqrt{2}} q_{k, (b-1)(k-1), \alpha}\]
双因素和多因素布局
双因素布局类似于RBD,不同之处在于这里有两个处理因子而不是一个处理因子和一个区组因子。
模型:
\[y_{ijl} = \eta + \alpha_i + \beta_j + \omega_{ij} + \varepsilon_{ijl}, i=1,...,I; j=1,...,J; l=1,...,n\]
其中\(y_{ijl}\)是因子A的第i个水平和因子B的第j个水平的第l个重复的观测值,\(\alpha_i\)是A的第i个主效应,\(\beta_j\)是B的第j个主效应,\(\omega_{ij}\)是A和B之间的第(i,j)个交互效应,\(\varepsilon_{ijl}\)是误差,独立的\(N(0, \sigma^2)\)。
估计:
\[y_{ijl} = \hat{\eta} + \hat{\alpha}_i + \hat{\beta}_j + \hat{\omega}_{ij} + r_{ijl} = \overline{y}_{...} + (\overline{y}_{i..} - \overline{y}_{...}) + (\overline{y}_{.j.} - \overline{y}_{...}) + (\overline{y}_{ij.} - \overline{y}_{i..} - \overline{y}_{.j.} + \overline{y}_{...}) + (y_{ijl} - \overline{y}_{ij.})\]
方差分析:
方差分析表包括因子A、因子B、A×B交互作用和残差的平方和和自由度。
拉丁方和希腊-拉丁方设计
拉丁方设计是随机区组设计的扩展,可以容纳两个区组因子。
拉丁方设计:每个拉丁字母(即处理)在每行和每列中出现一次。
希腊-拉丁方设计:在拉丁方设计的基础上增加了希腊字母,形成一个更复杂的设计,可以容纳三个区组因子。
不完全区组设计
不完全区组设计是指每个区组只包含处理的一个子集,而不是所有处理。这在区组大小受限时很有用。
平衡不完全区组设计(BIBD):每对处理在相同数量的区组中出现。
协方差分析
协方差分析(ANCOVA)是方差分析和回归分析的结合,用于控制可能影响响应的协变量。
二水平全因析试验
2^k设计的基本概念
2^k设计是指k个因子,每个因子有2个水平(通常编码为+1和-1)的全因子设计。
设计矩阵、规划矩阵和模型矩阵:
- 设计矩阵:列出每次运行的因子水平
- 规划矩阵:以实际单位列出因子水平
- 模型矩阵:包括交互项的设计矩阵
平衡性:每个因子水平在设计中出现相同次数。
正交性:对于任何一对因子,每种可能的水平组合在设计中出现相同次数。
因子效应和图
主效应:
因子A的主效应定义为:
\[ME(A) = \overline{z}(A+) - \overline{z}(A-)\]
其中\(\overline{z}(A+)\)是因子A在高水平时的响应平均值,\(\overline{z}(A-)\)是因子A在低水平时的响应平均值。
交互效应:
A和B之间的交互效应定义为:
\[AB = \frac{1}{2}[ME(B|A+) - ME(B|A-)]\]
其中\(ME(B|A+)\)是在A的高水平下B的条件主效应,\(ME(B|A-)\)是在A的低水平下B的条件主效应。
主效应图和交互效应图:
- 主效应图:绘制因子水平与响应均值的关系
- 交互效应图:绘制一个因子的条件主效应在另一个因子的不同水平下的变化
使用回归计算因子效应
可以使用回归分析来计算因子效应。对于2^k设计,可以建立回归模型:
\[y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_{12} x_1 x_2 + \cdots + \varepsilon\]
其中\(x_i\)是因子i的编码水平(+1或-1),\(\beta_i\)是主效应系数,\(\beta_{ij}\)是交互效应系数。
因子设计的基本原则
效应层次原则:
- 低阶效应比高阶效应更可能重要。
- 同阶效应同样可能重要。
效应稀疏性原则:
在因子试验中,相对重要的效应数量很少。这类似于质量调查中的帕累托原则。
效应遗传原则:
为了使交互作用显著,至少其中一个父因子应该显著。
与一次一因子方法的比较
一次一因子(OFAT)方法的缺点:
- 对于相同精度的效应估计,需要更多的运行。
- 无法估计某些交互作用。
- 分析结论不够一般。
- 可能错过最优设置。
正态图和半正态图
正态图:
将因子效应估计按大小排序,然后绘制它们与正态分布分位数的关系。如果所有效应都是零,图应该是一条直线。显著偏离直线的点表示显著效应。
半正态图:
将因子效应估计的绝对值按大小排序,然后绘制它们与半正态分布分位数的关系。这避免了正态图中正负值之间的潜在视觉误判。
Lenth方法
Lenth方法是一种形式化的检验,可以为效应分配p值。
步骤:
- 计算伪标准误差:\(PSE = 1.5 \times median\{|\hat{\theta}_i|: |\hat{\theta}_i| < 2.5 s_0\}\),其中\(s_0 = 1.5 \times median\{|\hat{\theta}_i|\}\)。
- 计算\(t_{PSE} = \hat{\theta}_i / PSE\)。
- 如果\(|t_{PSE}|\)超过给定的临界值,则声明\(\hat{\theta}_i\)显著。
两种版本:
- 个体误差率(IER):不考虑多重检验问题
- 试验误差率(EER):考虑试验中进行的检验数量
名义最佳问题
名义最佳问题是指存在基于工程设计要求的标称值或目标值t。
二步法:
- 选择一些因子的水平以最小化\(Var(y)\)
- 选择不在(1)中的因子的水平,使\(E(y)\)更接近t
如果一个因子对\(E(y)\)有显著影响但对\(Var(y)\)没有显著影响,则该因子是调整因子。
使用对数样本方差进行离散分析
对数样本方差\(\ln s^2\)有几个优点:
- 将\(s^2\)从\((0, \infty)\)映射到\(\ln s^2\)在\((-\infty, \infty)\)上
- 更适合方差预测
- 大多数物理定律有乘法成分,对数将乘法转换为加法
- 方差稳定性
2^k设计中的区组
可以将2^k设计安排在2^p个区组中,其中\(p < k\)。这通常通过使用高阶交互作用来定义区组。
例如,对于2^3设计,可以使用123列来定义区组方案:如果123 = -1,则为区组I;如果123 = +1,则为区组II。这样,区组效应估计与123交互作用估计相同,它们被称为混淆。
三水平设计和正交表
三水平设计的应用场景
三水平试验在以下情况下很有用:
- 当响应和定量因子(如温度)之间存在曲线关系时。用两个水平无法检测这种曲率效应。
- 定性因子可能有三个水平(例如,三种类型的机器或三个供应商)。
- 通常在因子的当前设置\(x_0\)和\(x_0\)周围的两个设置下研究因子对响应的影响。
因子水平的表示形式
- 2水平:
- +/-:乘法运算
- 0/1:加法(模2)运算
- 3水平:
- 0/1/2:加法(模3)运算
- 基本元:0,作用类似于两水平时的"+"
3^k设计的方差分析
3^k设计是多因子布局的特例,可以应用方差分析方法。
正交分量系统
在三水平设计中,两因子交互作用的平方和可以分成两个正交成分:
- A×B有4个自由度
- A×B有两个成分,记为AB和AB^2,每个有2个自由度
正交表
正交表是一种特殊的试验设计表,可以高效地研究多个因子。它们具有平衡性和正交性,可以大大减少所需的试验次数。
二水平部分因析试验
部分因析设计准则
评价部分因析设计的准则包括:
- 分辨度:最短定义字的长度
- 纯净准则:效应不与其他低阶效应别名
- 最小低阶混杂准则(MA):比较字长型(Word Length Pattern)
广义最小低阶混杂准则
别名模式分析:
- AENP(Aliased Effect-Number Pattern):分析别名效应的数量模式
- GMC准则:最大化高阶效应的纯净度
如何解除效应间的别名
当需要解除效应间的别名关系时,可以使用跟随试验设计,如折叠-反转技术,通过添加补充试验来解除别名。
总结
试验设计是一门系统性的学科,它提供了一套方法来有效地规划、执行和分析试验,以获取关于因子如何影响响应的可靠信息。通过应用适当的设计原则和分析技术,可以最大化从有限资源中获取的信息量,并做出更明智的决策。
从基本的单因素设计到复杂的多因素和部分因析设计,试验设计提供了一系列工具来处理各种实际问题。理解这些设计的基本原理和适用条件,对于在实践中有效应用试验设计至关重要。