英论阁Enago官方博客分享 http://blog.sciencenet.cn/u/Enago

博文

试验研究设计的三种类型和十大误区 | 英论阁Enago 精选

已有 3578 次阅读 2023-1-3 11:51 |个人分类:学术科研|系统分类:科研笔记

在科研方法中,系统论及系统工程、试验设计及优化、可靠性工程是三大通用基础。系统论及系统工程是以系统集成为目的,研究影响因子之间的相互作用。试验设计及优化是研究控制因子(自变量)与响应(因变量)之间的因果关系和寻优方法。可靠性工程是使用设计和维修等手段使产品的均值和偏差在概率统计分布上合理并满足可靠度要求。试验研究设计(experimental research design,简称ERD)是指试验研究(experimental research,简称ER)的设计方法,在广义上属于试验设计(Design of Experiments,简称DoE)的一部分,在狭义上专指安排研究对象和揭示因果关系或对比关系的试验方法。

需要指出的是,研究(research)并不等同于试验(experiment)。研究包括两种手段,即试验(例如找出阳光对植物生长的影响)和推论(deduction,例如勾股定理的推导)。试验研究是相对于推论研究而言。收集试验数据的方法包括测量(measurement)、测试(testing)、模拟(simulation)、计算(computation)、调查问卷(survey)等。试验需要具有变量(variable)和环境(setting)这两个要素。变量包括因子(factor)和响应(response),而因子可以分为控制因子(control factor)和噪声因子(noise factor),或者分为具有显著影响的因子(significant factor)和无关的因子(extraneous factor)。环境指试验涉及的硬件设备、软件控制条件、试样(或受试者,统称研究对象)。

改变控制因子的取值,观察研究对象的响应变化,从而得出对比性(如果有对照组)或非对比性(如果没有对照组)的因果关系检验结论并验证假说(hypothesis),是试验研究区别于非试验研究(即推论研究)的首要本质特征。试验研究的第二个特征是由于依赖对因子的控制,从而容易发生人为错误,例如控制因子选择错误、无关因子控制错误、噪声因子分析错误。试验研究在因子和响应上的错误会导致因果关系的逻辑推理错误和试验结论无效。

试验研究聚焦于因子对响应的影响,广泛应用于社会科学、心理学、教育学、自然科学、工程技术、医学等几乎所有学科领域。一个比较简单的试验研究例子是取同一种植物的两个样本,将其中一个暴露在阳光下(称为样本A),而另一个远离阳光(称为样本B)。在相同的浇水等培育条件下,如果当研究结束时,我们发现样本A持续生长而样本B死亡,那么可以得出结论:阳光有助于该植物的生长。在人类行为学领域,社会学家主要使用试验方法测试人类行为。例如,随机选择两个人成为社会互动研究的对象,将其中一个人放入一个房间让其在一年内不与任何人交往,而将另一个人安排在有几个人居住或工作的房间内,享受人与人之间的互动。在实验结束时,社会学家会发现这两个人的行为有所不同。

在试验设计(DoE)中,有几个不同的领域聚焦于不同的内容。试验研究设计(ERD)聚焦于研究对象的安排方法。全析因设计(full factorial design)和部分析因设计(partial factorial design)聚焦于各因子水平值的组合方法。对于少于3个因子的全析因设计,因子-响应的数据处理和展示方法可以采用参变量扫值(parametric sweeping)。对于多于3个因子的全析因设计,因子-响应的数据处理和展示方法通常只能采用响应曲面方法(response surface method,简称RSM)。部分析因设计包括传统设计(traditional design)和非传统设计(non-traditional design)。传统设计包括正交设计(orthogonal design)、中心复合面设计(central composite face)、D-最优(D-Optimal)设计等大量试验设计方法。非传统设计包括拉丁超立方(Latin Hypercube,又称空间填充法)和均匀设计(uniform design)。极差分析(analysis of range或ANOR)聚焦于使用正交设计而不经过回归分析(regression analysis)即可手算粗糙寻优。方差分析(analysis of variance或ANOVA)聚焦于使用F检验(F-test)分析显著性效果,包括因子对响应的影响是否显著,以及回归项和整个回归方程是否显著等。回归分析或响应曲面方法聚焦于使用拟合器(emulator)建立因子与响应之间的数学关系,以便能够预测响应并精细寻优。蒙特卡罗模拟(Monte Carlo Simulation,简称MCS)聚焦于使用随机抽样的方法产生随机因子的随机组合。以上这些试验设计的主要领域均大量依靠统计学知识。

试验研究设计的典型工作方式是在初步研究后形成一个假说,然后设计一个对照试验(controlled experiment)。首先,确定哪些因子是相关的或独立的。然后,将研究对象随机分配到不同的试验组,每组接受不同水平的因子变化影响。控制因子不发生任何变化的组称为对照组(control group),能够展示研究对象在没有任何试验干预情况下的响应或表现。分配研究对象的方法包括完全随机设计和随机分组设计。在完全随机设计中,每个研究对象被随机分配到一个控制因子变化水平(或在医学研究中的一种治疗方案)。在随机分组设计中,首先根据共同特征对研究对象进行分组,然后在各组内随机分配控制因子的水平值。

试验研究设计还可以被划分为以下三种类型:预备试验研究设计(pre-experimental research design),准试验研究设计(quasi-experimental research design),真正试验研究设计(true experimental research design)。

预备试验研究设计包括以下三种类型

·       单因子个案研究设计(One-Shot Case Study Research Design)。例如,学生在学期内上课,在期末接受考核。学生是研究对象。期末考试分数是响应。上课的内容是因子。

·       单组研究对象前测和后测研究设计(One-Group Pretest-Posttest Research Design)。例如,对一组病人在治疗前和治疗后分别收集响应数据。另一个例子是员工的培训效果统计。在一名员工入职前,公司对其进行业务测试,称为前测。在6个月的工作期间,该员工持续接受业务培训。培训内容是因子,员工的业绩表现是响应。公司在每次培训后对员工进行业务测试,称为后测。

·       静态组比较(Static-Group Comparison)。将2组或2组以上的试验组置于观察中,其中只有其中一组受到某种治疗或控制因子水平值影响,其他组保持静止。对所有组进行后测,并假设观察到的组间差异即为治疗效果或因子的影响。

准试验研究设计与真正试验研究设计既有相似之处,也有不同点。在准试验研究设计中,研究对象不是随机分配的。这种方法在教育研究中很常见,因为教育管理者有时不允许随机选取学生作为研究对象。

真正试验研究设计依赖于统计分析来验证或否定某个假说。它是最准确的试验研究设计类型,包含对照组和试验组,以及至少一个可以由研究者控制的因子。研究对象的分布必须是随机的。这种设计具体包括以下两种类型:

·       仅后测对照组设计(Posttest-Only Control Group Design)。针对试验组和对照组均只进行后测,然后从组间差异得出结论。

·       前测-后测对照组设计(Pretest-Posttest Control Group Design)。

试验研究设计需要避免以下十个方面的问题或误区:

1.     工作缺乏意义(lack of significance):试验研究设计必须包含针对“那又怎样(so what)”这类问题的明确答案,必须清晰表达为什么这项研究很重要,以及它对该领域有什么贡献。

2.     没有将自己的研究与过去的文献联系起来(not linking the past with your study):需要有全面的文献综述,并确定需要填补的知识空白点在哪里。

3.     研究问题没有定义好(poorly defined research problem)或不够具体(lack of specificity):由于在选择试验设计之前必须先确定研究问题,因此必须明确具体地划分和定义打算研究的问题,包括目标(objective)、疑问(question)、假说(hypothesis)。这些都不能宽泛、笼统或模糊。

4.     省事主义(provincialism):如果研究的应用范围或地理区域过窄、抽样或分析过于局限,研究结果的适用性就会大打折扣,甚至会被认为不够典型或不具有普适价值。

5.     无效的理论框架(invalid theoretical framework):需要构建一个能够被检验的、具有明确逻辑推导思路的假说。

6.     缺乏对研究的局限性进行讨论(lack of discussion on research limitations);每项研究都有某种局限性。它们的原因和处理方法以及导致的数据缺失程度和对结果有效性的影响,应当被纳入论文的讨论或结论部分,并在试验设计方法策划时予以考虑。

7.     研究工具和技术的描述不清晰(lack of clear description of research instruments and techniques):需要解释为什么使用这些收集数据的工具(如问卷调查)和技术(如半结构化访谈)解决所研究的问题,尤其当这些工具和技术不是最先进的时候。需要论证所采用的工具和技术如何能够提供合理可靠的数据来回答所研究的问题。

8.     糟糕的抽样(poor sampling):试验研究设计中的一个常见缺陷是采用接近抽样(proximity sampling),即在抽样时只考虑是否容易接触到研究对象和是否容易获得样本,而非基于研究目的之真正需求,那么这种抽样方式产生的数据是不可信的。

9.     不充分或不恰当的统计分析(insufficient or improper statistical analysis):定量研究必须具有对统计数据的完整描述,包括均值、中位数等参数。

10.  未充分考虑伦理影响(insufficient consideration on ethical implications):试验研究设计必须考虑如何将参与者的风险降到最低,同时还能保证解决所要研究的问题。否则,研究的客观性和有效性会受到质疑。


*精心的实验研究设计更需要搭配完善的语言进行成果表述!学术道路中,论文发表的语言难题就交给英论阁博士硕士学科专家,2000+名母语编辑、平均19.4年经验,为您的SCI发表之路保驾护航!科学网读者专属润色9折

115425h2d2xd8vjtq3sv28.png

英论阁英文润色 术翻译  期刊投稿支持

请关注英论阁微信公众号
EnagoChina

image.png

更多科研出版干货就在
SCI论文学术交流平台
EnagoAcademy


EnagoSubscription.jpg




https://m.sciencenet.cn/blog-681387-1370315.html

上一篇:甄别出版中的数据检查和数据共享两个不同概念 | 英论阁Enago
下一篇:赶进度,算下来一天要写1000字,无痛论文写作法技巧呈上!| 英论阁Enago

2 胡大伟 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2023-5-31 17:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部