什么是统计学
统计学是关于认识客观现象总体数量特征和数量关系的科学。
它是通过搜集、整理、分析统计资料,认识客观现象数量规律性的方法论科学。
由于统计学的定量研究具有客观、准确和可检验的特点,所以统计方法就成为实证研究的最重要的方法,广泛适用于自然、社会、经济、科学技术各个领域的分析研究。
扩展资料:
统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里士多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”、“政治算数”和“统计分析科学”三个发展阶段。
所谓“数理统计”并非独立于统计学的新学科,确切地说,它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而是属于数学的范畴。
统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。
描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。
推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。
变量(variable):每次观察会得到不同结果的某种特征。
分类变量(categorical variable):观测结果表现为某种类别的变量。
顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。
数值型变量(metric variable):又称定量变量,观测结果表现为数字的变量。
均值(mean):均值也就是平均数,有时特指算术平均数,这是相对其他方式计算的均值,求法是先将所有数字加起来,然后除以数字的个数,这是测量集中趋势,或者说平均数的一种方法。
中位数(median):也就是选取中间的数,要找中位数,首先需要从小到大排序,排序后,再看中间的数字是什么。
众数(mode):众数也就是数据集中出现频率最多的数字。
任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。
即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。
在具体进行取样时,必须根据研究目的的不同,选择不同的取样方法。
①单纯随机取样法先把每个个体编号,然后用抽签的方式从总体中抽取样本。这种方法适用于个体间差异较小、所需抽选的个体数较少或个体的分布比较集中的研究对象。
②分区随机取样法将总体随机地分成若干部分,然后再从每一部分随机抽选若干个体组成样本。这种抽样法可以更有组织地进行,而且中选的个体在总体的分布比单纯随机取样更均匀。
③系统取样法先有系统地将总体分成若干组,然后随机地从第一组决定一个起点,如每组15个元素,决定从第一组的第13个元素选起,那么以后选定的单位即28,43,58,73等等。
④分层取样法根据对总体特性的了解,把总体分成若干层次或类型组,然后从各个层次中按一定比例随机抽选。这种方法的代表性好,但若层次划分得不正确,也不能获得有高度代表性的样本。
参考资料:百度百科——统计学
统计学的名词解释
1)统计学:是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化 的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考
2)相关名词解释
1、统计:从数量方面认识事物的特征及规律的科学方法,有3层含义,及统计工作、统计资料、统计学.
2、统计总体:根据统计研究目的确定的所研究对象的全体.
3、总体单位:指构成总体的个别单位.统计总体的特征:同质大量差异
4、标志:指用来说明总体单位数量特征或属性特征的概念或名称
5、指标:说明总体单位数量特征的科学概念和具体数值.
6、统计设计:根据统计研究对象的性质和研究目的,对统计巩固在哦的各个方面和各个 环节的通盘考虑 和安排,制定各种设计方案的过程.
7、普查:专门组织的一次性的全面调查.
8、统计调查:根据统计设计的内容、指标和指标体系的要求,有计划、有目的、有组织的手机统计原始资 料的工作过程,是统计认识过程的第二个阶段,即定量认识的阶段.
9、 统计报表:按照国家统一规定的表格形式,统一规定的指标内容,统一规定的报送程序和报送时间,由填报单位自上而下逐级提供统计资料的一种统计调查方式.
10、统计整理:根据统计研究目的和统计分析的要求,使统计调查所获得的原始资料进行科学的分类和汇 总,或对简单加工过的资料进行再加工,使之系统化、条理化,从而得出能够反映事物总体特征资料的工作过程.
11、统计分组:根据研究任务的需要和事物内在的特点,将统计总体按照一定的标志划分为若干组成部分 的一种统计方法.
12、分类数列:将各组别与次数按一定的次序排列所形成的数列.
13、统计表:以表格来表现统计数据资料的一种形式.
14、总量指标:反映社会经济现象发展的总规模、总水平的综合指标.
15、相对指标:两个相互联系的现象数量的比率,用以反应现象的发展程度、结构、强度、普遍程度或比 例关系.
平均指标:平均指标又称平均或均值,反映的是现象在某一空间或时间上的平均数量状况.
变异指标:综合反映总体各单位标志值变异程度的指标.
16、时期指标:指反映某种社会经济现象在一段时间发展变化结果的总量指标.
17、时点指标:反映社会经济现象在某一时间状况上的总量指标.
18、时间序列:指社会经济现象在不同时间生的一系列同类指标值按时间先后顺序加以排列后形成的数列
19、发展水平:动态数列中的每一项具体指标数值.
20、增长量:用来说明社会经济现象在一定时期内所增长的绝对数量的指标.
21、发展速度:以相对数形式表现的动态分析指标,是两个不同时期发展水平指标对比的结果.
22、增长速度:反映现象数量增长方向和程度的动态相对指标.
23、统计指数:指用来反映不能同度量的多种事物综合动态变化的特殊相对数.
24、个体指数:指同一种现象的报告期与基期指标数值对比得到的发展数度指标.
25、总指数:综合说明不能同度量的许多个别事物构成的复杂现象总体综合变动的相对数.
26、因素分析法:利用指数体系以数量上分析复杂现象总动态中各个因素变动的影响程度和影响绝对效果
统计学的基本概念
总的来说它有总体、样本、标志、产量、统计指标、指标体系六大基本概念。
一、总体
统计学重要的概念之一,总体它是指统计研究的客观对象全体,它是由所有具有某种共同属性的事物所组成的集合体。它有三大特征,分别是大量性、同质性和差异性,也就是说必须有足够多的个体所组成,这些个体之间具有某种共同的属性,同时又存在许多的差异性。
(一)根据个体数量是否有限:分为有限总体与无限,有限总体是由有限个的个体所组成,例如全国企业总体,浙江省高校中心;无线总体就是有无限多的个体,例如宇宙中的星球中心,可无限重复的实验数据。
(二)按照它的存在形式不同:可以分为具体总体和抽象总体,具体总体是由具体的客观存在的个体组成,例如全国人口总体、某批产品总体等等;抽象总体是由假设的个体所组成的,如某类特定的消费者主体、某种条件下连续生产的产品总体等等。
(三)按照个体能否计数:就是可计数总体和不可计数总体,可计数总体指的是个体可以可计数并可以相加,如人口总体、同款同型号的产品总体;不可计数总体,指的是个体不可计数或者计数以后的结果不能相加,如超市的商品总体,它的计数结果是难以想象的。
(四)根据总体是否认为划定:分为自然总体和人为总体,自然总体它是由自然存在的个体所组成的,如人口总体、法人单位总体的;人为总体,它里面的个体通常由人来加以规定,实际上就是人为个体所组成的,如我们人口普查时候的小区。
二、样本
(一)它是从总体中随机抽取的一部分个体所组成的集合,我们有时候也称之为小总体。
它有两个术语平时可能会经常混淆,一个是样本容量、一个是样本个数。所谓样本容量是指样本当中包含的个体数;样本个数从一个总体当中抽取一个容量为n的样本,一共有多少种样本组合,也就是说最多可抽取的样本数。例如:采用不重复的抽样方法,从1234这5个数字构成的总体当中来抽取两个数字,组成一个样本,那么我们就说样本容量是2,而可以计算出来的样本个数是20。
(二)样本与总体的关系
1.总体是我们所要研究的对象,而样本则是所要观测的对象。
2.我们把样本理解为是总体的代表和缩影。
3.抽取样本的目的是来推断总体的。
4.随之考察角度的改变,总体和样本的角色是可以改变的。
三、标志
(一)、含义
它是用以描述或体现个体特征的名称。
(二)、分类
1.按照结果表现方式的不同分为:品质标志和数量标志。品质标志,它表明的是个体的属性特征,结果表现为定性数据,通常用文字来表现结果,如人的性别;数量标志,它表明个体的数量特征,表现为定量数据,例如人的身高,也就是说数量标志需要用数值来表现。2.按照表现结果是否相同分为:不变标志和可变标志。不变标志指所有个体的表现结果都一样,如一所高校学生的身份;可变标志,指的是这个标志它在不同个体上的结果是有差异的,是不完全一样的,如一所高校学生的身高。(不变标志就是同质性的要求,可变标志是差异性的要求)
3.按照表现个体特征的直接程度分为:直接标志和间接标志。直接标志,它是能够直接表明个体的属性特征或数量特征,如人口、性别、年龄,所以它既是品质标志又可以是数量标志;间接标志,它只能间接地来表明个体的数量特征,它只能是数量标志,它通过两个数量标志计算的结果,如企业的人均薪酬水平、人均产量等。
四、变量
(一)、含义
它是指可变的(数量)标志,现在我们越来越采用广义的变量即可变的标志与可变的指标都是变量(标志、指标、变量这三者都是通用的。)
(二)、分类
1.按照反映数据的计量尺度不同分为:定性变量和定量变量。定性变量是能够把结果表现为定性数据的变量;定量变量指的是能够把结果表现为定量数据的变量。
2.按其所受影响因素不同分为:确定性变量和随机变量。确定性变量指的是它的影响因素是可控的,如一个单位的工资总额取决于人数和人均工资水平这两个可控的因素;随机变量指的是这种现象的变化受各种不确定性的因素影响,如作物产量它就是一个随机变量。
3.按照数值变化是否连续分为:离散型变量和连续型变量。离散型变量通常指我们只能取整数,如人数、企业数;连续型变量指的是它的数值是连续不断的,任意两个数值之间还可以取很多个中间的数值,如身高、重量等。
五、统计指标
(一)
1.定义:反映总体综合数量特征的概念及其数值。
2.构成要素:指标名称、计算方法、时间界定、空间界定、数值、计量单位。
(二)分类
注:1.总量指标反映的是现象外在的规模数量特征,亦称为外延指标。
2.质量指标反映的是现象总体的内涵特征。
(三)统计指标和标志之间的关系
1.区别:标志是说明个体特征,而指标是说明统计总体数量特征。(大数据背景下,个体或总体和数值或文字可以理解为都是数据。)
标志的具体表现有的用数值,有的用文字表示;而指标都是用数值表示的。
2.联 系:标志是计算统计指标的依据;标志与指标之间存在变换关系。
六、指标体系
(一)统计指标体系它是反映统一总体多个方面数量特征的、一系列相互联系的统计指标所形成的体系。
(二)表现形式:
1.等式关系:指标体系内的相关指标可以用一个等式来表现,如一个国家的或地区的人口密度=人口总数/国土或领土面积。
2.补充关系(最为常见的表现形式):指统计指标体系内的不同指标可以从不同角度相互补充的来说明同一总体的不同的数量特征。
3.相关关系:指的是这个指标体系内部的指标之间具有某种内在关联性或者存在比较高的相关关系。这类指标体系可能是一个庞大的指标体系当中的一个分支体系。
4.原因、条件、结果关系:指的是指标体系内的指标有些作为原因或条件或结果。这四种表现形式有时候要共同配合使用。
什么是统计学?
统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化分析、总结,做出推断和预测,为相关决策提供依据和参考。
它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。随着数字化的进程不断加快,人们越来越多地希望能够从大量的数据中总结出一些经验规律从而为后面的决策提供一些依据。统计学专业不是仅仅像其表面的文字表示,只是统计数字,而是包含了调查、收集、分析、预测等。应用的范围十分广泛。
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域。
统计学专业介绍 统计学专业是什么
1、统计学专业主要包括一般统计和经济统计两类专业方向,培养具有良好的数学或数学与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的高级专门人才。
2、统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化分析、总结,做出推断和预测,为相关决策提供依据和参考。
3、它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。随着数字化的进程不断加快,人们越来越多地希望能够从大量的数据中总结出一些经验规律从而为后面的决策提供一些依据。统计学专业不是仅仅像其表面的文字表示,只是统计数字,而是包含了调查、收集、分析、预测等。应用的范围十分广泛。