英论阁Enago官方博客分享 http://blog.sciencenet.cn/u/Enago

博文

系统工程的学术图表制作详谈 | 英论阁Enago 精选

已有 3393 次阅读 2022-8-12 09:30 |系统分类:论文交流

学术图表是指论文或著作中的插图和表格。插图和表格之间的主要区别在于表格可以展示具体数值,而插图利于展示数据趋势。引用自己过去发表过的或别人已经发表的图表,不仅需要获得出版社的版权许可,而且必须注明出处。关于图表的格式,可以详见由李德华主编、电子科技大学出版社于2010年出版的《学术规范与科技论文写作》中的“插图的规范化”和“表格的规范化”两章。插图分为数据图和示意图,各有其目的。数据图则是理工科论文结果部分的主要展示手段,无论对于揭示新的科学发现还是展示新的科研方法,都具有关键性作用。因此,策划数据图在本质上就是规划科研成果的在完整性(深广性)方面的具体内容。本文将带您了解科研成果的核心内容——数据图的策划方法,充分展示您科研成果的深广性,提升中稿率。

能够从数据图上有效准确读取数据的最大维度是二维,即一个由横轴(x)和纵轴(y)围成的平面。如果维度再多,就读不准了。如果维度再少,则没有充分利用人眼能够准确读取数据的全部空间潜力,即没有将数据摆放到极致数量。零维是一个点。一维是一条线。二维是一个平面。三维图(或称立体图)由于具有倾斜的透视效果,并不利于准确读取数据。因此,人们通常将三维图压扁转化为二维等值线图,将原本属于在立起来的第3根轴(z)上的数据投射到x-y二维平面上,用一圈圈的曲线表示z方向的等值数据。因此,数据图的策划目的就是如何使用x-y曲线图和x-y-z等值线图用满二维平面所能发挥的表达潜力

任何一个系统,都可以用“输入-关联-输出”来表征其科学内涵关系。学术论文的目的通常就是揭示输入如何影响输出,以及如何描述关联。例如,对于发动机系统,输入是燃料流量和环境温度。输出是功率和尾气排放。关联是发动机硬件或代表发动机硬件的性能计算模型。输入参数称为因子(factor)。输出参数称为响应(response)。因子通常用x1、x2、x3、…、xk表示,称为k维因子,构成k维空间。因子中包括可控因子和噪声因子(noise factor,即不可控因子)。响应通常用y1、y2、y3、…、ym表示,称为m个响应。响应参数中包括优化目标和约束条件。

如果一个系统是稳态的,不随时间变化,那么这个系统的因子和响应就都是与时间无关的状态参数。但是,很多系统都是具有动态变化的瞬态系统,即与时间有关的动力学系统。这时,时间(t)便成为一个独特的因子,经常占据数据图的横轴。这就导致在二维平面只能再放另外一个因子。这就是为什么瞬态系统在数据表达方面非常困难的原因。

如果一个系统可以用确定性假设来描述,那么它的因子就可以具有几个离散的水平值。例如,发动机的燃料流量可以是10、20、30等。但是,如果一个系统必须用非确定性即概率性来描述,那么它的因子就必须使用诸如正态分布等概率分布函数来表征,例如某个参数的制造误差或发动机的环境温度变化规律。概率分布用概率密度函数(probability density function,简称pdf)表征,横轴是参数取值,纵轴是pdf值,概率分布曲线上的每一个点表征该取值出现的机会大小。对于概率性数据,由于pdf值需要占据一根坐标轴,这也导致在二维平面只能再放另外一个因子。这就是为什么概率性系统在数据表达方面也非常困难的原因。

大多数的科研工作是稳态确定性的,这意味着这些工作可以策划将两个因子放在二维平面。这时,有两种作图方式。第一种方式可以用Microsoft Excel作图,将x1放在横轴,将响应放在纵轴,做出一条曲线,此时x2必须固定某个取值。然后,将x2取3~5个水平值,分别做出3~5条曲线。这就是著名的“五线图”。第二种方式需要用MATLAB作图,将x1放在横轴,将x2放在纵轴,将响应值标记在等值线上。这两种作图方式都称为参变量扫值法(parametric sweeping)。它们的特点是将两个变量像席卷扫描一样囊括所有因子水平值的组合,这称为全析因设计(full factorial design)。参变量扫值法对于应付一个或两个因子是非常简单、有效和准确的,而且可以从做出的数据图中直接观察和读取最优值,即某个响应作为优化目标时的最大值或最小值,以及对应的一个或两个因子的取值。

当因子数量超过两个时,如果仍然使用参变量扫值法做全析因设计,不仅作图表达会变得非常繁琐,而且响应参数的计算量也随着因子数量和因子水平值数量的增加而快速急剧增加,导致实际上无法执行全析因设计。这时,就需要使用部分析因设计(partial factorial design),舍弃大量因子水平值的组合点,依靠统计学理论,构造少量具有代表性的组合点,获得尽可能多的因子-响应之间的依变信息。这种方法称为试验设计(Design of Experiments,简称DoE)。如果比较试验设计的任意两个组合点,会发现它们的各因子的水平值都是同时变化的,而不再是像参变量扫值法的“一次变化一因子”那样固定所有其他因子的取值而只改变一个因子的水平值。因此,这种试验设计的数据就无法使用参变量扫值法来绘制,而必须先使用诸如二次或三次多项式等拟合器(emulator)来拟合构造各因子与每个响应之间的数学关系。然后,再使用MATLAB或Excel中的寻优工具求解优化值。这时,求出的优化解是一个设计点,它是零维的,代表所有因子的某种水平值的组合,给出某个目标响应的最大值或最小值。将两个因子放在横轴和纵轴上用试验设计的数据做响应图,是没有任何意义的,因为这个平面上的每一个点都具有其他因子的不同取值,因此不可比。对于试验设计数据来讲,有意义的作图方式是将两个响应分别放在横轴和纵轴,进行多目标优化,求取帕雷托前锋曲线(Pareto frontier)。

综上所述,数据图的策划是科研成果的核心内容规划,需要明确问题的类型、因子和响应的数量、水平值的选取、作图的类型(参变量扫值或试验设计优化)等因素。这样,才能有效地将科学发现用可视化手段充分表达出来。


*完善的学术图表离不开准确的语言阐述,论文发表中的语言难题就交给英论阁博士硕士学科专家,2000+名母语编辑、平均19.4年经验,为您的SCI发表之路保驾护航!科学网读者专属润色9折

115425h2d2xd8vjtq3sv28.png

英论阁英文润色 术翻译  期刊投稿支持

请关注英论阁微信公众号
EnagoChina

image.png

更多科研出版干货就在
SCI论文学术交流平台
EnagoAcademy


EnagoSubscription.jpg




https://m.sciencenet.cn/blog-681387-1350901.html

上一篇:科研方法面面观:掌握操作、能力、意识三方面 | 英论阁Enago
下一篇:别人的工作台长啥样?科研场景大揭秘,show出你的工作台,赢取多重办公室好礼!|英论阁Enago

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-9-28 10:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部