显著性检验在第6、7、8章中扮演着中心角色。尽管进行显著性检验的程序几乎是相同的,但细节,尤其是使用的公式可能会有很大的不同。这里是一个指南,以确定哪些公式和表格使用进行显著性检验。
实验或研究的数据分为两大类。如果数据是数值的,你将测量。如果数据是计数的形式,您将使用计数(X)或观察到的比例(
).
对于数值数据,要问的相关问题是你是否知道底层随机过程的标准差。如果你知道则使用正态分布。如果你不知道
在此之前,您将使用样本标准差年代估计
你必须使用t分布。
对于计数,如果样本量n小于等于20,知道吗p在此之前,你应该使用二项分布。如果你不知道p在此之前,你必须使用观察到的比例来估计它。同样,如果
是接近0还是1n是不是太大了,可以换吗
根据威尔逊的估计,(X+2)/(n + 4)。如果n大于15左右时,可以放心使用正态分布来近似二项分布。
如果你看两个样本的差异,零假设通常说两个样本没有差异。如果你看的是单个样本,问题陈述会告诉你用什么来做零假设。
标准误差大约有六种不同的公式,但您可以快速确定使用哪种公式。第一个问题是你看的是单个样本还是两个样本之差。第二个问题是你是否在衡量或
。第三个问题是你是否知道
或p或者提前估计它们年代或
.
这些公式用于计算单个样本的标准误差。
![]() |
数值 | 比例 |
---|---|---|
是 | ![]() |
![]() |
否 | ![]() |
![]() |
这是计算两个样本之差的公式。在这种情况下,比例公式使用了汇总估计,
![]() |
数值 | 比例 |
---|---|---|
是 | n。 | n。 |
否 | ![]() |
![]() |
接下来,计算一到两个样本的z分数或t分数。
注意,几乎赢博体育比较两个样本的情况下,零假设都是这样或
.
最后一步是从相关分布中计算P,并将其与您试图超越的显著性水平进行比较。
在计算P时,必须注意单面/双面可选性的区别。单边可选适用于可选假设说一个值在另一个值的一边的情况。如果你事先不知道选项会偏向哪一边,而你只是想表达两个事物不同的事实,你应该使用双面选项。实际的区别在于,在双边选择中,你在计算后将P翻倍。这使得拒绝零假设相对来说更加困难。
下面是一些我可能会测试你的其他概念。我可能会问的问题形式会有所不同。在某些情况下,我会要求定义或简短的讨论,而在其他情况下,你将不得不计算一些东西。
分布
的意思是
中值
方差
标准偏差
Stemplot
柱状图
离群值
箱线图
1.5 IQR范围试验
解释变量,反应变量
散点图
积极和消极联想
相关
隐藏变量
回归线
r2
实验、分组设计
配对实验
偏见
置信区间
联合分布
边缘分布
条件分布
测试
这些是期末考试时我会给你们的公式。如果一个公式没有出现在这里,要么你在考试中不需要它,要么我认为它足够简单,你可以记住它。
这里有四个示例问题,涵盖了第6、7、8和9章的内容。解决方案可以在这里找到。
1. 某州的八年级学生需要参加数学标准化成绩测试。在满分为1000分的考试中,全州的平均分为760分,标准差为70分。一赢博体育150名八年级学生的学校的平均成绩是800分。这是否明显高于全州平均水平?
2. 1958年底特律地区研究是对宗教对日常生活影响的重要社会学调查。样本基本上是大都市地区人口的简单随机样本。在656名受访者中,267名是白人新教徒,230名是白人天主教徒。其中一个问题是,政府在住房、失业和教育等领域是否做得足够;161名新教徒和136名天主教徒回答“不”。有证据表明白人新教徒和白人天主教徒在这个问题上存在分歧吗?
3. 1975年1月,美国儿科学会药物委员会建议不要给8岁以下的儿童服用四环素类药物。在田纳西州进行的一项为期两年的研究调查了1973年至1975年间医生开这些药的程度。该研究将家庭医生根据他们的执业县是城市、中级还是农村进行分类。研究人员调查了每个类别中有多少医生给至少一名8岁以下的患者开过四环素。这是观察到的计数表
城市 | 中间 | 农村 | |
---|---|---|---|
四环素 | 65 | 90 | 172 |
没有四环素 | 149 | 136 | 158 |
进行显著性检验,确定县型与四环素使用是否相关。
4. 一家银行比较了两项增加其信用卡客户刷卡金额的建议。方案A建议免除全年收费2400元或以上的客户的年费。建议B在年底提供总收费的一小部分作为现金回扣。该银行向150名现有信用卡客户的SRS提供每个提案。在年度结束时,记录每位客户的总收费。以下是统计摘要:
n | ![]() |
年代 | |
---|---|---|---|
一个 | 150 | 1987美元 | 392美元 |
B | 150 | 2056美元 | 413美元 |
两组收取的费用是否有显著差异?