样本方差_通俗易懂学Python,置信度与置信区间

-点击上面的“中国统计网”订阅我!这篇文章讨论了当今统计中的置信水平和置信区间。看来我没有写多少关于统计的东西。这篇文章试图写它。

01点估计

在讨论置信度和置信区间之前,先讨论点估计。什么是点估计?给你两个例子,你就会知道现在你想知道学校里学生的身高。你可以测量所有的学生并得到答案。这种方法可以,而且获得的数据必须是最真实的。但是有一个问题。有什么问题吗?也就是说,如果学生人数太多,工作量太大,无法进行所有测量,我们应该怎么办?然后随机选择一些学生,测量这些学生的身高,得到一个值(通常使用平均值)。用这部分的平均值来估计学生的整体身高。我们称这种估算方法为点估算。

现在你必须看看某条装配线上iphone的故障率。你怎么想呢?最笨的方法是打开所有的手机并试用,然后计算不合格手机的比例。可以吗?显然不是我们怎样才能知道这条装配线的质量,即抽样,从整条装配线上取一些手机进行检验,获得一个合格率,然后用这个合格率来估计整条装配线的合格率,这也是点估计

现在可以理解点估计的含义了吗,也就是说,通过使用随机抽样样本的计算指数值来估计总体指数情况常用的点估计方法如下:

使用样本均值来估计总体均值
使用样本方差来估计总体方差
使用样本分位数来估计总体分位数
使用样本中值来估计总体中值

02区间估计

以前在学校时用于考试。他总是喜欢在考试后评估分数。普通人不太可能直接估计出具体的数字。它必须是一个近似值。什么是近似值?例如,高考分数预计在600左右,这实际上是一个间隔,许多食品包装袋上通常写着0.5 KG。这是什么意思?要么多0.5 KG,要么少0.5 KG。我们把这种估计事物的方法叫做区间估计,得到的区间就是置信区间。

03置信度

您估计了一个区间,但是您的估计是否准确?它有多准确?我们称这个估计的区间置信的准确性(可信度)。例如,我有95%的信心我的NMET分数是600-650。这里的置信区间是[600,650],置信水平是95%

一般置信水平和置信区间在同一个方向,你是什么意思?置信度和置信区间通常是相同的趋势当置信水平高时,置信区间也大。当置信区间大时,置信水平也高。

例如,我100%确定我的NMET分数是0-750。这里的置信区间是[0,750],包括所有的分数。置信度绝对是100%

04如何计算置信区间

,然后我们如何通过部分样本计算总体的置信区间?主要有以下几个步骤:

步骤1:首先,要解决的问题有明确的定义你期望什么?不管是全校学生的身高还是他们的成绩

步骤2:计算样品的平均值和标准误差注意,标准误差不同于标准偏差(标准偏差反映了整个样本对样本平均值的离差程度,标准误差反映了样本平均值对总体平均值的变化程度)

标准偏差等于方差根符号

标准误差等于样本标准偏差的根除以n

步骤3:确定所需的置信水平例如,常用的95%置信水平意味着我对估计有95%的把握,这可以确保样本的平均值落在总平均值的2个标准差内

步骤4:查找z表并找到z值。什么是z形手表?您是否忘记了Z表是一个标准正态分布表,用于反映标准分数和概率值之间的关系,即概率值可以通过标准分数找到,标准分数也可以通过概率值检查回来

现在我们知道95%置信水平对应的概率值是2.5%,我们只需要通过标准正态分布表找出2.5%概率对应的标准分数,即z值

共同置信水平和标准分数z值

置信水平z值90% 1.6495% 1.9699% 2.58

步骤5:计算置信区间

a =样本均值-z*标准误差

b =样本均值+z*标准误差

最终置信区间为[a,b]

中国统计网。爱数据研究所

邮票“阅读原件”在北京见面!

大家都在看

相关专题