图片和表格不仅是讲述科研故事的有力工具,也是科学出版物的重要组成部分。科研论文数量种类庞杂,在这个快节奏的时代,为了更高效地获取论文的重要信息,读者通常会跳过稿件的正文,而主要查看文中图表所传达的内容。AJE在本文总结了数据分析和可视化中非常实用的几种图表,并以不同情景进行分组。
为什么图表在科学出版物中很重要?
复杂的数据有时可能难以用简洁的文字解释清楚,但却可以通过图表的形式予以直观、快捷的呈现。因此,如何确保文中的图表能够在独立于文本叙述的基础上,将最重要的科研发现清楚、准确地传达出来,是一个值得认真考虑的重要问题。
表格是一种有利于进行大量数据汇总的简便方法;而精心制作的图片,通过将数据可视化,能够直观地呈现出令人信服的论据。为了更好地帮助您在准备稿件时巧妙地借助图表来有效呈现您的科研数据,本文将为您详细介绍运用各种形式图表的注意事项。
呈现数据的不同形式及其注意事项
1. 表格
表格是一种可用于呈现大量数据的简洁有效的方法。当您想要汇总某些特定信息或需要呈现精确值时,则可使用表格;此外,当您的实验数据具有许多不同的度量单位时,用图片形式可能难以简洁明了地进行呈现,那么此时表格也是一种方便的显示工具。
一个精心设计的表格应具有如下要素:
- 分别按照各行和各列进行划分的具有明确定义的类别
- 行和列之间足够的间距
- 明确定义的单位
- 易于阅读的字体类型和字号大小
- 清晰简洁的标题及注释
尽管表格是一个呈现大量数据的好方法,但有时可能需要花费较多功夫才能充分解释清楚,且无法简单直观地呈现数据变化趋势。因此,如果想要显示数据之间的关系,说明数据变化趋势,或进行数据之间的比较时,则最好使用数据图。
2. 数据图
数据图可以从大量数据中快速传达出关键的结论性信息,例如,通常用于显示两组或多组数据之间的功能或统计学关系。
设计良好的数据图应具有如下要素:
- 明确标记的坐标轴
- 明确指定的数量单位
- 在图例中予以明确定义的绘图元素(例如误差线、差异显著性的标记法,等等)
- 易于阅读的字体类型和字号大小
数据图可用于显示离散的或连续的定量数据,例如重量、高度、温度、计数,等等。
2.1 离散数据(discrete data)
离散的定量数据多指某类数据的数量,且不能被有意义地划分为更小的增量;对于一次实验观察来说,只能获得并记录有限个数量的数值。例如,一个家庭可以养1只或2只宠物,但不能养1.5只。
常见的用于呈现离散数据的图片形式主要包括:
- 柱形图/条形图(bar graphs):柱形图是显示离散变量的标准方法,其中每个柱状图形代表各类别中所观察到的数量或其比例。
图1 柱形图示例:用于总结调查问卷的答复
- 折线图(line graphs):折线图是绘制离散变量变化情况(通常随时间变化)的有用方法。
图2 折线图示例:用于呈现康复患者数量随时间的变化情况
2.2 连续数据(continuous data)
连续数据可以采用任何数值,并且可以被分为更小的增量,包括小数和十进制数值,且任何两个数值之间都存在无限个可能的数值。例如,高度、重量和温度等等均属于连续数据。
常见的用于呈现连续数据的图片形式主要包括:
- 直方图(histograms):直方图可用于显示连续数据的分布,并说明分布是对称的(即正态分布)还是偏斜的。
图3 直方图示例:正态分布与偏斜分布
- 点图(dot plots):点图也可用于显示数据的分布,但是对于突出显示数据点的集群和离群值特别有用。
图4 点图示例:数据点的集群和数据点离群值
- 箱形图/盒式图(box plots):箱形图可用于呈现分成组的连续变量,因其可显示每组数据的集中趋势、分布和离群值。
图5 箱形图示例:每月平均温度
- 散点图(scatter plots):散点图可用于显示两个连续变量之间的关系,散点图所呈现的相关性可用来评估关系的强弱。
图6 散点图示例:用于展示正相关或负相关关系及其相应的Pearson相关性(Pearson’s correlation)
值得提醒的是,在绘制连续数据时,应尽量避免使用柱形图或折线图。柱形图和折线图遮盖了数据的分布情况,并且无法向读者提供准确、完整的数据信息——这是因为许多不同的分布有时甚至可能产生相似的条形图或折线图。或许这句话从字面意思上难以理解,那么请看如下的例子,下图演示了不同的数据集如何产生相同的柱形图。
图7 示例:不同数据分布可能产生相同的柱形图(B ~ E中所显示的数据都可以产生如A所示的柱形图)
在上图中,对于右侧的图7B ~ 7E来说,这四个散点图都可以产生类似于左侧图7A那样的柱形图,这个柱形图仅能显示两组之间的一部分差异信息。而在图7B中则可以看出,数据呈对称分布且在两组之间存在高度重叠的情况;在图7C中,两组之间的差异主要由离群值导致;图7D中,每组数据均呈现双峰分布的情况,提示可能存在需要进一步研究的潜在的亚组;在图7E中,A组中数据点的数量是B组中的两倍,B组中数据分布较窄可能仅仅是因为该组中数据点较少,提示需要更多的B组数据才能验证目前表面上所呈现出的两组之间的差异。这些信息,仅仅通过图7A所示的柱形图,无法准确、完整地予以呈现。
小结
读者对数据的理解仅限于作者在稿件中所呈现的内容。在制作图片时,请根据您的数据类型,确保选用恰当的图片类型,来有效、准确地呈现您辛辛苦苦获得的完整的科研数据。AJE希望本文这篇满满的干活分享,能极大地帮助您更高效地准备您的科研论文。