当前位置:首页 > 芯闻号 > 充电吧
[导读]由于统计学在现实生活和“高端”科学研究中有着很高的地位,时常思考统计相关的问题,加深对它的基础理论的理解应该对我们理解和研究现实世界有帮助。1、样本空间与总体的关系样本空间,在茆诗松等编著的《概率论与

由于统计学在现实生活和“高端”科学研究中有着很高的地位,时常思考统计相关的问题,加深对它的基础理论的理解应该对我们理解和研究现实世界有帮助。

1、样本空间与总体的关系

样本空间,在茆诗松等编著的《概率论与数理统计教程》一书中,是这样定义的:随机现象的一切可能的基本结果组成的集合称为样本空间,每个基本结果被称为样本点。首先理解一下,什么是随机现象?随机现象就是在一定条件下,并不总是出现相同结果的现象,称为随机现象。这里我们不去深究什么是现象,因为他的解释本身是抽象的,抽象的东西相对具体的东西理解稍微困难一点,我们可以在不断的学习过程中慢慢理解、意会这些概念。这里我们固定了某个关心的结果后,就可以产生样本空间了。比如,我们研究“某个环境中,固定条件下,投掷骰子出现的点数”,这里我们考虑的是出现的点数这种结果形式,为什么不是说结果,而是说结果形式,只是微妙的一点点差别而已,结果是确定的,而结果形式是概述这些可能的结果,我这样理解,但是由于这样会带来理解上的负担,干脆用“结果”这个词来代替了,在大多数情况下,大家都可以意会。这个例子中,我们考虑的是投掷骰子这种随机现象的出现点数这种结果,所以样本点有“出现1点”,“出现2点”,...,"出现6点",这些样本点组成样本空间。样本空间还强调了“一切可能”,表征全面性。样本空间的本质属性是集合,这个定义不想我们大家在代数中学到的空间一样,代数中,空间是定义了运算以及某些限定条件的集合,他跟分析中的空间也不一样,总之概率中的样本空间仅仅是一个集合而已,如果你愿意,你可以叫他样本集合。

总体,我们继续把茆诗松等人的定义作为理解的出发点,所谓总体就是指研究对象的全体。与样本空间不同,样本空间是随机现象的我们所关心的结果的集合,而总体是指对象的全体,它本质也是集合的概念,每个研究对象是可以区分开来的,每一个对象我们称之为个体,总体只说明是对象的集合,没有说明是结果的集合,但是很多情况下,或者研究统计的科学家实际上是想把总体定义成结果的集合的,实际中他们也是这样用的。他们隶属的学科也不同,样本空间属于概率论的范畴,总体属于统计的范畴。概率是给出某些假设本质,研究本质后的现象问题,就是说概率是已知概率分布,然后研究随机变量的关系啊,性质啊,给一些新的变量定义啊,比如数学期望,方差,标准差啊之类的,统计是为了发现总体某种原始本质性质,而做出的数学上的分析和理解。当然这只是我个人的理解,也许事实不是这样的,不管事实怎样,这样理解并不会对我们理解统计学的基本原理和方法造成障碍。

既然学科不同,即使他们有联系,我们在考虑不同学科的时候,根据上下文区分即可,不要过于纠结,纠结多了,会阻止我们前进的。


2、理解总体之后的概念和需要研究的问题

知道了什么是总体,什么是个体了么? 如果我们要研究某个区域中学生的身高,那么这个区域中所有学生的身高构成了我们研究问题的总体,每个学生的身高就是一个个体。这样一来,我们如果继续思考下,写书的作者也做过讨论,就是做数学理论研究,很容易想到去除实际背景,研究去除背景后的数学模型的性质理论。这里呢,我们就去除身高这个实际名词,我们研究的是代表身高的那一堆数,这堆数有的出现的次数多一点,有的出现的次数少一点,也就是说在这堆数中任意取一个数,每个数都有可能被抽到。那么我们可以把这个数看成随机变量去研究它,是可以的,这堆数有用一个分布函数来描述它,每个数用随机变量描述它。再插一点,什么是随机变量呢?随机变量是定义在样本空间上的一个实值函数。又提到样本空间了,另一种理解,样本空间就是这个区域中所有学生,样本点就是每个学生,那么不管你研究身高,还是体重,这两个都可以给出数量指标,这个指标完全可以用实数来表示,这就是随机变量了,如果考虑的是身高和体重,用一个二维随机变量来表示就行了。现在我们研究的是统计学问题,随机变量就是定义在总体之上的实值函数,但是前面我们说的总体是全体学生的身高啊,怎么不是全体学生呢?哈哈,可以根据上下文区分下,总体到底是什么,一般我们研究的是可以量化的指标,如果只考虑某一个指标的时候,我们研究的每个同学只有一个这样的指标,所以这个指标可以认为就是这个同学了,但是我们在研究多个指标的情况下,我们只能把总体看成是全体学生了,你不把它看成全体学生也可以,可以认为每个个体只是变成了一个多维描述的指标了而已。

在纠正道正路上来,我们研究总体的性质有很多限制,比如我们没有那么多人力去认真统计某个大区域中的所有学生身高。我们又想知道总体到底是一个什么样子的。其实我们说研究性质,不是十分准确,概率统计中,只要分布已知了,本质就知道了。所以准确的说,我们是为了研究总体的分布,想知道总体到底满足什么分布,然后某些分布具有什么性质,就是概率论研究的内容了。

不能每个个体都研究,我们就想一个办法来近似的研究整体,就是找一个我们认为能很好的代替总体的一个小集合来研究下,为了更好的在数学上研究呢,我们就引进了样本的概念。关于样本的定义大家有一点差别,但是不会影响我们后面的学习,我倾向于于寅写的高等工程数学里的理解,当然他也许不是这个定义的创造者,但是我读了他的书,学知识而已,就认为是他写的也不会影响我们最终的收获。样本就是按照一定规则从总体抽取的若干个体,抽取的个体数目称为样本容量,有的人也就他样本量。如果我们抽取的规则是随机的,也就是说每个个体被抽到的机会是均等的;每一次抽取的个体跟其它次抽取行为没有关系。这样的到的样本叫简单随机样本。我们大多数情况下研究这样的样本。因为这样的样本才能很好的反应总体的本质。至于为什么这样的样本能反应总体分布,我没有去证明,也许有前辈已经证明了,我们就可以站在前辈的肩膀上了。

想想,既然从总体中是随机拿到的一个值,那么代表这个值得变量就是随机变量了,它应该跟总体满足相同的分布,而且他们相互独立,所谓独立同分布啊。所以一个样本可以认为是一个多维随机变量,每一维都是独立的。试验做毕,你会得到一组值,这组值就是样本观测值。试验就是抽取个体的过程。样本中的每个个体呢,也有个新名字,叫样品。有的时候也不区分这个,所以有些书里面也就不介绍了。




本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

近日,2024中关村论坛年会发布了10项重大科技成果名单,其中“转角氮化硼光学晶体原创理论与材料”备受关注。

关键字: 激光

负责支持和保护网络生活的云服务提供商阿卡迈技术公司(Akamai),近日在其日益丰富的云产品阵容中又增添了一款基于NVIDIA GPU的媒体优化型产品。这款全新的云服务产品基于NVIDIA RTX 4000 Ada Ge...

关键字: 视频解码器

业内消息,近日高通公司宣布推出针对桌面平台的全新骁龙 X Plus 处理器。

关键字: 高通 骁龙 X Plus 处理器

近日,台积电在圣克拉拉年度技术研讨会上宣布首个“埃级”制程技术:A16。A16 是台积电首次引入背面电源输送网络技术,计划于 2026 年下半年开始量产。同时,台积电也在重新命名工艺节点,标志着「埃级」时代的开始。

关键字: 台积电 A16

4 月 25 日消息,4 月 25 日,国际数据公司(IDC)发布 2024 年第一季度中国手机市场跟踪报告,荣耀以 17.1% 的市场份额拿下第一,华为占 17.0% 位列第二,OPPO、苹果和 vivo 分别位列第三...

关键字: 荣耀 华为

业内消息, 近日华为全新Pura 70系列手机正式开售引发广大 数码爱好者追捧,但是有网友注意到这款手机的“AI修图”功能,竟然可以将照片中的人物衣服消除,并拍成视频发布网络。

关键字: 华为Pura70 华为

据韩媒报道,近日韩国多位军方人士透露,韩国军方正在考虑全面禁止在军事建筑内使用苹果手机,军方担心敏感信息通过录音泄露。

关键字: iPhone 苹果

为了满足日益增长的数据处理需求,铁威马NAS推出了全新的性能巅峰2024年旗舰之作F4-424 Pro,并搭载了最新的操作系统--TOS 6。这款高效办公神器的问世,无疑将为企业和专业人士带来前所未有的便捷与效率。

关键字: 存储 Linux 服务器

继“特斯拉开启万人大裁员”之后,如今又一家车企扛不住了!

关键字: 电动汽车

轻量级AI定制模型助力低成本快速部署 北京2024年4月18日 /美通社/ -- 数据和人工智能(AI)领域的领先者SAS—今日在SAS Innovate大会上首次展示了一款变革性的、旨在帮助企业直面业务挑战的解决方案...

关键字: SAS AI模型 人工智能 INNOVATE
关闭
关闭