第1章 统计学概要
当今世界充斥着大量数据,甚至任何人都可能被淹没。如果你对媒体中所读到的统计数据感到怀疑,我一点也不会感到好奇 — 我有时也会这样。好消息是,虽然有很多误导性和不正确的信息等待着你,但也有许多优秀的内容正在产生,例如许多涉及数据的研究和技术正在帮助改善我们生活的质量。你的任务是能够筛选出好的信息,并对自己有信心能够做到这一点。通过对统计学和统计程序的深入了解,你在日常生活、工作和课堂上都能够在数字方面获得力量和信心。这就是本书的目的。
在本章中,我将为你概述统计学在今天充满数据的社会中扮演的角色,以及你可以采取什么措施不仅仅是生存,更是茁壮成长。你将对统计学有一个更广泛的视角,将其视为科学方法中的伙伴 — 设计有效的研究,收集良好的数据,组织和分析信息,解释结果,并得出适当的结论。
蓬勃发展统计世界
要理解那些以大大小小方式影响你日常生活的统计数据,确实有些难。从早上醒来的那一刻开始,你就开始接触统计数据,当你查看新闻并听气象学家根据她对过去数据和当前天气条件的统计分析而得出的天气预测时,这一过程就开始了。在吃早餐时,你查看谷物盒子一侧的营养信息。在工作中,你从图表和表格中提取数字,输入电子表格,运行诊断,进行测量,执行计算,估算费用,使用统计基准做决策,并根据过去的销售数据订购库存。
在午餐时,你去了一家基于对500人的调查而得出的排名第一的餐馆。你吃的食物是根据营销数据定价的。你去看医生,他们测量你的血压、体温、体重,并进行血液测试;在收集了所有信息后,你会得到一份报告,显示你的数字以及你与统计规范的比较情况。
你驾驶着一辆通过统计诊断运行的计算机进行维护的汽车回家。当你到家后,你打开新闻,听到最新的犯罪统计数据,看到股市表现如何,并了解上周有多少人参观了动物园。
晚上,你用已被统计证明能够抵抗蛀牙的牙膏刷牙,读一些《纽约时报》畅销书(基于统计销售估计),然后入睡 — 只为在第二天早上重新开始。但是,你怎么能确定你每天遇到并依赖的所有那些统计数据是正确的呢?在第2章中,我将更深入地讨论统计如何参与我们的生活和工作的一些例子,其影响是什么,以及如何提高对它的意识。
一些统计数据是模糊的、不适当的,或者纯粹是错误的。你需要更加注意每天遇到的统计数据,并培养你的思维,停下来说“等一下!”,筛选信息,提出问题,在某些情况下发现问题时提出警告。在第3章中,你将看到被错误统计数据误导的方式,并学会在自动相信结果之前进行批判性思考和识别问题的技能。
和其他领域一样,统计学有其自己的术语,我在第4章中概述和解释了一些最常用的统计术语。了解这种语言会提高你理解和传达统计信息的能力,而不会感到害怕。当你使用精确的术语描述统计结果的问题(以及原因)时,你的可信度会提高。而你涉及统计表、图表、图形和分析的演示将会充实而有效。
在接下来的部分,你将看到统计学如何参与科学方法的每个阶段。
设计适当的研究
无论是制药公司还是生物学家,市场分析师还是政府,每个人都在提出问题。最终,每个人都将使用统计学来帮助他们回答这些问题。特别是许多医学和心理学研究都是因为有人想知道问题的答案。例如,
✓ 这种疫苗能否有效预防流感?
✓ 国人对经济状况有何看法?
✓ 社交网络网站的使用增加是否导致青少年抑郁?
在形成研究问题之后的第一步是设计一个有效的研究,收集能够帮助回答问题的数据。这一步骤相当于确定你将使用什么过程来获取所需数据。在本节中,我概述了两种主要类型的研究 — 调查和实验,并探讨了在相信研究结果之前评估研究设计的重要性。
调查
观察性研究是一种在不影响个体的情况下收集数据的研究。最常见的观察性研究是调查。调查是向从感兴趣的人群中选择的个体提出的问卷调查。调查有许多不同的形式:通过邮寄的纸质调查表,网站上的问卷调查,电视网络进行的电话调查,电话调查等等。
如果正确进行,调查可以是获取信息的非常有用的工具。然而,如果不正确进行,调查可能导致虚假信息。一些问题包括问题措辞不当,可能会误导,被选择参与的人没有回应,或者未包含整个人群中的某个群体。这些潜在问题意味着在进行调查之前必须经过深思熟虑。
许多研究人员花费大量时间和金钱进行良好的调查,你将会知道(根据我在第16章中讨论的标准),你可以信任它们。然而,由于你在媒体、工作场所和许多课堂中会接触到许多不同类型的调查,你需要能够迅速审查和评价调查的设计和实施方式,并能够以明智的方式指出其中的具体问题。你在处理调查时需要的工具可以在第16章中找到。
实验
实验通过以一种能够进行明确比较的方式对参与者施加一个或多个处理。在应用处理后,记录下相应的反应。例如,为了研究药物剂量对血压的影响,一个组可能服用10毫克的药物,另一个组可能服用20毫克。通常还会涉及一个对照组,其中受试者每人都接受一种假治疗(例如糖丸)或标准的非实验性治疗(例如给艾滋病患者的现有药物)。
良好而可信的实验旨在最小化偏见,收集大量良好的数据,并进行适当的比较(治疗组与对照组)。实验可能出现的一些潜在问题包括研究人员和/或受试者知道他们接受了哪种治疗,研究中未控制的影响结果的因素(例如在研究药物剂量时,受试者的体重),或者缺乏对照组(没有基线来与结果进行比较)。
但是,当设计正确时,如果治疗组与对照组之间的反应差异在统计上显著(不太可能仅仅是偶然发生的),实验可以帮助研究人员建立因果关系。
实验被认为有助于创造和测试药物,确定制作和准备食物的最佳实践,并评估新治疗是否能够治愈疾病,或至少减轻其影响。通过巧妙设计的实验,我们的生活质量肯定得到了改善。然而,并非所有实验都设计良好,特别是当研究结果对你非常重要时,你判断哪些结果可信、哪些结果不可信的能力至关重要。有关实验及如何评估它们的所有信息均可在第17章找到。
收集优质数据
在设计完研究,无论是调查还是实验之后,将参与的个体选定,并建立一个收集数据的过程。这个过程的这一阶段对于最终产生可信数据至关重要,这一部分突出了其中的要点。
选择一个好的样本
统计学家有一句谚语:“垃圾进,垃圾出。”如果你以一种有偏见的方式选择你的受试者(参与你研究的个体),即偏袒某些个体或群体,那么你的结果也将是有偏见的。就是这么简单。
假设鲍勃想知道你们城市的人对一个拟议的赌场的看法。鲍勃拿着他的剪贴板去商场,询问路过的人给出他们的意见。有什么问题呢?嗯,鲍勃只会得到a)在那个商场购物的人的意见;b)在那一天;c)在那个特定的时间;d)并且愿意回答的人的意见。
这些条件太过狭隘 — 这些人并不代表城市的横截面。同样,鲍勃可以设立一个网站调查,让人们使用它来投票。然而,只有知道这个网站的人,能够上网并愿意回答的人才会给他提供数据,而通常只有那些持有强烈意见的人才会费心去做。最终,鲍勃得到的只是一堆有偏见的个体数据,根本不代表整个城市。
为了最小化调查的偏见,关键词是随机。你需要随机选择你的个体样本 — 也就是说,通过某种“从帽子里抽名字”的过程。科学家使用各种方法随机选择个体,你可以在第16章中看到他们是如何做的。
需要注意的是,在设计实验时,收集一组随机的人并请他们参与通常是不道德的,因为实验对受试者进行了处理。你所做的是向志愿者发出参与请求。然后确保你从这群志愿者中选择的个体代表了感兴趣的群体,并且对这些个体的数据进行了良好的收集,以便将结果推广到更大的群体。你可以在第17章中看到是如何做的。
通过阅读第16章和第17章,你将了解如何深入分析他人选择样本的方法,甚至能够设计一个你自己可以使用的样本选择计划。最终,你将知道何时说“垃圾进,垃圾出”。
避免数据偏见
偏见是对某些个体或某些回应的系统偏爱。偏见是统计学家的天敌,他们尽一切可能将其最小化。想要一个偏见的例子吗?比如你正在进行有关国人工作满意度的电话调查;如果你在白天的9点到5点之间给家里的人打电话,你就错过了白天工作的人。也许白天工作者比夜班工作者更满意。
在收集调查数据时,你必须注意偏见。例如:有些调查太长了 — 如果有人在中途停止回答问题怎么办?或者如果他们给你提供错误信息,告诉你他们年收入10万美元而不是4.5万美元怎么办?如果他们给出的答案不在你的可能答案列表上怎么办?在收集调查数据时可能会发生一系列问题,你需要能够找出这些问题。
在涉及偏见和数据收集方面,实验有时甚至更具挑战性。假设你想测试血压;如果你在实验中使用的仪器坏了怎么办?如果有人在实验中途退出怎么办?如果在实验中发生了什么事情分散了受试者或研究人员的注意力怎么办?或者在必须在给药后一小时准确进行血液测试时找不到静脉怎么办?这些问题只是实验数据收集可能出错的一些例子,你必须准备好寻找和发现这些问题。
在阅读完第16章(关于样本和调查)和第17章(关于实验)之后,你将能够以不带偏见的方式选择样本和收集数据,对可能真正影响结果的细微之处敏感。而且,你将有能力评估统计结果的可信度,并因为你知道自己在说什么而被人听取。
创建有效摘要
在收集到良好的数据之后,下一步是对其进行总结,以把握全局情况。统计学家以两种主要方式描述数据:用数字(称为描述统计)和用图表(即图表和图形)。
描述统计
描述统计是描述数据集的数字,涉及其重要特征:
✓ 如果数据是分类的(个体被分为组,如性别或政治倾向),它们通常使用每组中个体的数量(称为频率)或每组中个体的百分比(称为相对频率)进行总结。
✓ 数值数据表示测量或计数,其中实际数字具有含义(如身高和体重)。对于数值数据,除了每组中的数量或百分比之外,还可以总结更多的特征。其中一些特征包括
• 中心测度(换句话说,数据的“中间”在哪里?)
• 散布测度(数据围绕中心有多分散或集中?)
• 如适用,衡量两个变量之间关系的数字(如身高和体重)
在某些情况下,某些描述统计比其他统计更合适;例如,平均值并不总是数据集中心的最佳测量;中位数通常是更好的选择。标准差并非是唯一衡量变异性的指标;四分位距也有其卓越的品质。你需要能够辨别、解释和评估每天向你呈现的各种描述统计类型,并知道何时需要更合适的统计。
你经常看到的描述统计是在第5章中计算、解释、比较和评估的。这些常用的描述统计包括用于分类数据的频率和相对频率(计数和百分比);以及用于数值数据的平均值、中位数、标准差、百分位数及其组合。
图表和图形
使用图表和/或图形以视觉方式对数据进行总结。这些是组织起来以一瞥或放大找到的特定结果的数据的展示方式。在这个迅速获取信息和迷你音频片段的世界中,图表和图形是司空见惯的。大多数图表和图形清晰、有效且公正地阐述它们的观点;然而,它们可能容许太多的自由,结果可能使你暴露于众多误导和不正确的图表。
在第6章和第7章中,我涵盖了用于总结分类和数值数据的主要图表类型。你将了解如何制作它们,它们的目的是什么,以及如何解释结果。我还向你展示了图表和图形如何被制造成误导性的方式以及你如何快速发现问题。这涉及到能够说:“等一下!这不对!”并知道为什么不对。以下是一些要点:
✓ 用于分类数据的一些基本图表包括饼状图和条形图,它们分解变量,如性别或青少年手机上使用的应用程序。例如,条形图可能使用从“强烈不同意”到“强烈同意”的五个标签显示对某个问题的意见。第6章为您提供了有关制作、解释和最重要的公正评估这些图表的所有重要信息。您可能会惊讶地看到一个简单的条形图会出现多少问题。
✓ 对于数值数据,例如身高、体重、时间或数量,需要一种不同类型的图表。称为直方图和箱线图的图表用于总结数值数据,它们可以提供关于数据集的即时信息。当然,它们也可能是误导性的,要么是偶然的,要么是有意设计的。
你每天都会遇到图表和图形 — 你可以打开一份报纸,甚至不费力地就能找到几个图表。拥有一把统计学家的放大镜来帮助你解释信息是至关重要的,这样你就可以在得出错误的结论并可能采取行动之前发现误导性的图表。你在第6章(用于分类数据)和第7章(用于数值数据)中将找到所有需要的工具。
确定分布
变量是正在计数、测量或分类的特征。例如性别、年龄、身高、体重或你拥有的宠物数量。
分布是变量可能值(或值的区间)的列表,以及它们发生的频率(或密度)。例如,美国新生儿性别的分布估计为52.4%男性和47.6%女性。
不同类型的变量存在不同类型的分布。以下三种分布是入门统计课程中最常见的分布,它们在现实世界中有许多应用:
✓ 如果变量计算在一定数量的试验中取得成功的次数(例如通过服用某种药物康复的人数),它具有二项分布。
✓ 如果变量取值符合“钟形曲线”,例如测试分数,那么该变量具有正态分布。
✓ 如果变量基于样本平均值,且你只有有限的数据,比如仅有十个受试者参与的减重计划测试,那么可能需要 t-分布。
在涉及分布时,你需要知道如何确定特定变量具有哪种分布,如何为其找到概率,以及如何计算结果的长期平均值和标准差。为了帮助你理清这些问题,我为你准备了三章,每一章专门讨论一个分布:第8章全面介绍二项分布,第9章处理正态分布,第10章专注于 t-分布。
对于那些正在学习入门统计课程的人,你知道最难理解的主题之一是抽样分布和中心极限定理(这两个概念密切相关)。第11章将逐步为你解释这些主题,使你了解抽样分布是什么,它的用途是什么,以及它如何为假设检验和置信区间等数据分析提供基础。当你理解中心极限定理时,它实际上有助于你更轻松地解决困难问题,而所有这些信息的关键都在第11章中等着你。
进行适当的分析
在收集并使用数字和图形描述数据之后,接下来就是有趣的部分:穿越那个被称为统计分析的黑匣子。如果研究设计得当,就可以使用适当的分析来回答最初的问题,这里的关键词是适当。
存在许多类型的分析,选择正确的分析方法对于不同的情况至关重要,正确解释结果,了解局限性,并能够评估他人选择的分析和他们得出的结论同样重要。
在本书中,你将获得使用入门统计学中最常见的方法进行数据分析所需的所有信息和工具:置信区间、假设检验、相关性和回归以及双向表的分析。本节为你提供了这些方法的基本概述。
误差范围和置信区间
你经常看到试图估计整个人口相关数字的统计数据;事实上,几乎每天都能在调查结果的形式中看到它们。媒体告诉你美国的平均汽油价格是多少,美国人对总统的工作感觉如何,或者人们每周花费多少时间上网。
但除非有人对整个人口的每个成员收集了数据,否则不能给你一个单一数字的结果,并声称它是对整个人口的准确估计。例如,你可能听说60%的美国人支持总统对医疗保健的方法,但你知道他们没问过你,所以他们怎么能问过每个人呢?而且因为他们没有问过每个人,你知道一个单一的答案是不够的。
实际上,数据是在人口的一个样本上收集的(例如盖洛普组织随机打电话给2,500人),对该样本的结果进行了分析,并基于这些样本结果对整个人口(例如所有美国人)做出了结论。
底线是,样本结果因样本而异,这种变异性需要被报告(但通常并没有)。用于衡量和报告某人样本结果精度水平的统计量被称为误差范围。在这个上下文中,“误差”并不意味着犯了一个错误;它只是意味着因为你没有对整个人口进行抽样,所以你的结果与你试图估计的人口实际值之间将存在差距。
例如,有人发现在受访的1,200人中,有60%支持总统的医疗保健方法,并报告结果的误差范围为正负2%。这个最终结果,你将发现你的发现被呈现为在58%到62%之间的可能值范围,被称为置信区间。
每个人都会接触到包含误差范围和置信区间的结果,随着今天数据的爆炸,许多人在工作中也在使用它们。确保你知道哪些因素影响误差范围(比如样本大小),以及一个好的置信区间的要素是什么,以及如何识别它们。你还应该能够在需要时找到自己的置信区间。
在第12章中,你将了解有关误差范围的一切:它的所有组成部分,它衡量和不衡量的内容,以及在多种情况下如何计算它。第13章将逐步为你解释置信区间的公式、计算和解释,涵盖了总体均值、总体比例以及两个均值和比例之间的差异。
假设检验
研究的一个主要支柱是被称为假设检验的技术。假设检验是一种利用数据验证或否定有关总体的声明的技术。例如,一名政治家可能声称她所在州80%的人同意她的观点 - 这是真的吗?或者,一家公司可能声称他们在30分钟内送达比萨饼;这是真的吗?医学研究人员经常使用假设检验来测试某种药物是否有效,比较新药与现有药物在副作用方面的差异,或者查看哪种减肥计划在某一群体中最有效。
最经常被测试的有关总体的要素有:
✓ 总体均值(30分钟的平均交付时间真的吗?)
✓ 总体比例(真的吗,80%的选民支持这位候选人,还是少于这个数字?)
✓ 两个总体均值或比例的差异(真的吗,这个新计划的平均减重量比最受欢迎的计划多10磅?或者,这种药物降低血压的效果真的比目前的药物多10%吗?)
假设检验在影响你日常生活的许多领域中被使用,例如医学研究、广告、民意调查数据,几乎任何基于平均数或比例进行比较的地方都会用到。在职场中,假设检验在营销等领域中被广泛使用,你想要确定某种广告是否有效,或者某一群体的人现在与去年相比是否购买更多或更少的产品。
通常你只听到假设检验的结论(例如,这种药物显著比你现在使用的药物更有效且副作用更少);但你看不到用于得出这些结论的方法。第14章详细介绍了假设检验的所有细节和基础,以便你能够有信心地进行和批评它们。第15章直截了当地提供了为一系列具体情况设置和执行假设检验的逐步说明(一个总体均值、一个总体比例、两个总体均值的差异等)。
阅读完第14章和第15章后,当你需要知道像应该将产品推向哪个群体、哪种轮胎品牌的使用寿命最长、某个减肥计划是否有效以及更大的问题,比如应该选择哪种手术程序时,你将会更加自信。
相关性、回归和双向表
研究中最常见的目标之一是找到变量之间的关联。例如,
✓ 哪些生活方式行为会增加或减少患癌症的风险?
✓ 这种新药有哪些副作用?
✓ 通过服用这种新的草本补充剂,我能降低胆固醇吗?
✓ 在互联网上花费大量时间是否会导致人体重增加?
寻找变量之间的关联有助于医学界设计更好的药物和治疗方案,为营销人员提供有关谁更有可能购买他们的产品的信息,并为政客提供关于支持或反对某些政策的论据。
在寻找变量之间关系的大生意中,你会发现大量的统计结果 - 但你能分辨什么是正确的,什么是错误的吗?许多重要的决策是基于这些研究结果做出的,了解在报告因果关系时需要满足哪些标准以认定结果可信尤为重要。
第18章详细解释了绘制两个数值变量的数据(例如剂量水平和血压),查找和解释相关性(x和y之间线性关系的强度和方向),找到最适合数据的线性方程(以及在何时适用此操作),以及如何使用这些结果基于另一个变量进行预测(称为回归)。你还将学到何时一条直线能够很好地拟合数据,何时不适应以及在直线拟合数据的情况下可以做出什么结论(以及不应该做出什么结论)的工具。
我在第19章详细介绍了用于寻找和描述两个分类变量之间关系的方法(例如每天服用的剂量和恶心的有无)。我还提供了有关收集和组织数据成双向表的信息(其中一个变量的可能值构成行,另一个变量的可能值构成列),解释结果,分析双向表数据以寻找关系并检查独立性的工具。正如我在本书中一直所做的那样,我为你提供了批判性地审视这些分析结果可信度的策略。
得出可信结论
进行统计分析时,研究人员使用依赖于公式的统计软件。但是,公式不知道它们是否被正确使用,当结果不正确时也不会警告你。归根结底,计算机不能告诉你结果的含义;你必须自己弄清楚。在本书中,你将了解在分析完成后可以做出哪些结论以及哪些不可以。以下各节简要介绍了得出适当结论的方法。
避免夸大的结果
结论中常见的一些错误是夸大结果或将结果概括到实际研究所代表的群体之外。例如,一位教授想知道观众最喜欢哪些超级碗广告。她在超级碗星期天从她的班级中挑选了100名学生,并请他们在广告播出时对每个广告进行评分。形成了一个前五名的列表,她得出结论说所有的超级碗观众都最喜欢这五个广告。但她实际上只知道她的学生最喜欢哪些广告 - 她没有研究其他群体,因此不能对所有观众做出结论。
质疑因果关系的声明
结论越线的一种情况是研究人员发现两个变量之间存在关系,然后自动得出这两个变量存在因果关系的结论。
例如,假设一位研究人员进行了一项健康调查,发现每天服用维生素C的人报告感冒的次数较少。在发现这些结果后,她写了一篇论文并发布了一份新闻稿,声称维生素C可以预防感冒,并以这些数据作为证据。
尽管维生素C可能确实能够预防感冒,但这位研究人员的研究不能这样声明。她的研究是观察性的,这意味着她没有控制与维生素C和感冒都可能相关的任何其他因素。例如,每天服用维生素C的人可能在整体上更注重健康,更经常洗手,更多锻炼,吃更好的食物;所有这些行为都可能有助于减少感冒。
在进行控制实验之前,你不能根据找到的关系得出因果关系的结论。
成为一名侦探,而非怀疑论者
统计学远不止于数字。要真正“掌握”统计学,你需要理解如何从研究数据中得出适当的结论,并足够精明,不会轻信听到或读到的每一件事,直到了解信息是如何产生的,以及对它进行了什么处理,以及结论是如何得出的。这是整本书中都在讨论的内容,但在第20章中着重介绍了这一点,为你提供了十种成为统计学精明侦探的方法,让你认识到研究人员和媒体常犯的错误。
对统计学产生怀疑或愤世嫉俗是很容易的,特别是在了解了幕后发生了什么之后;不要让这种情况发生在你身上。你可以找到很多对你的生活产生积极影响的好信息。通过设定两个个人目标,找到你怀疑情绪的出口:
- 成为对每天看到的统计信息具备良好了解的消费者。
- 通过成为了解何时以及如何帮助他人,以及何时寻找统计学家的统计学“顾问”,确立工作安全感。
通过阅读和使用本书中的信息,你将自信地知道自己可以对统计结果做出明智的决策。你将以可信的方式进行自己的统计研究。你将准备好应对下一个办公室项目,批判性地评估那个让人讨厌的政治广告,或者迎接下一次考试!
- 2024-05-26[财经知识]你根本不懂(北大录取寒门学霸遭群嘲:没穷过,你根本不懂)
- 2024-05-26[财经知识]福客来(进化版的东北盒饭,喂饱这届务实的年轻人)
- 2024-05-26[财经知识]大集合(11款骁龙8Gen3手机大集合年末旗舰机汇总推荐,哪款更适合你?)
- 2024-05-26[财经知识]snark(浅谈零知识证明之二:简短无交互证明(SNARK))
- 2024-05-26[财经知识]卷积神经网络算法(最全面的卷积神经网络介绍,都在这里了(附代码))
- 2024-05-26[财经知识]世界公园(我国最新世界地质公园名录)
- 2024-05-26[财经知识]150个字的日记(小学生《暑假日记》优秀范文63篇,给孩子做个参考,可下载打印)
- 2024-05-26[财经知识]机具(建筑工地上11项施工机具的安全控制要点总结)