- 瑞瑞爱吃桃
-
由于某种特殊原因的事故发生的次数,被表示为由于同样的原因而处于危险中的所有人的一个比率。例如,“每1000个人中的5个人”,这个意外事故率意味着由于这个特殊原因平均每1000个人有5个人发生事故。
准确度( accuracy):测量值接近真实值的程度。一个准确的测量值是十分接近真实值的
备择假设( alternative hypothesis)(H2):只有原假设被拒绝时才能被支持的声明。
方差分析( analysis of variance)( ANOVA):通过分析样本方差来检验三个或者更多总体均值是否相等的一种方法。
联合概率( and probability):事件A和事件B同时发生的概率。如何计算取决于两个事件是否独立。
先验方法( a priori method):见理论方法。
条形图( bar graph):一种由条形组成的图其中条形代表某种特殊分类的频数。条形的长度和频数成比例。
最佳拟合线( best-fit line):散点图中的一条线,它比其他可能的线更接近数据点(根据距离的标准统计测量),也叫作回归线。
偏好(bias):在统计研究中,研究设计和进行时的任何问题都倾向于支持某种结果。也叫特殊偏好或选择偏好。
双峰分布( bimodal distribution}:有两个峰值的分布。
分组( binning):将数据分组,每组包含一系列可能的数值。
盲法( blinding):使实验对象和/或实验者始终不知道谁是实验组,谁是对照组,包括双盲实验和单盲实验。
箱形图( boxplot):由五个数总结的图形。一个数线用作参照,从更小到更大的数值被装入箱中为中位数画一条贯穿整个箱子的线。两个“胡须分别伸出到低数值和高数值。也叫作箱线图。
个案对照研究( case-control study):类似实验的观察研究,因为样本很自然地被划分为两组(或更多组)。在研究时参与行动的参与者形成个案,类似于实验研究中的实验组。没有参与行动的参与者就是对照组,类似于实验研究中的对照组。
因果关系( causality):当一个变量是引起另个变量变化的原因时所呈现的关系。
人口普查( census):收集总体中每一个成员的数据。
中心极限定理( Central Limit Theorem):对于任何分布中的随机样本(样本容量都相同),随着样本容量的增加,样本均值的分布近似服从正态分布。
卡方统计量( chi-square statistic)(x2):用来决定在列联表(或双向表)中假设检验的统计显著性的数值。如果它小于临界值(取决于表格大小和期望的显著性水平),那么观测频数和期望频数之间的差别是不显著的。
整群抽样( cluster samp|ing):将总体分成很多组,在其中随机选择一些组,然后通过选择每组中的所有成员来获取样本。
判定系数( coefficient of determination)(R2):描述通过多元回归找出的最佳拟合方程的数值是如何拟合数据的。
比较值( compared value):在计算相对差异时与参考值进行比较的数值。
补集( complement):对于事件A,A不发生的所有结果表示为A。那么它的概率为:P(A)=1-P(A)
条件概率( conditional probability):给定个事件发生的概率,另一个事件发生的概率。记为P(B在A发生后)或者P(B|A)
置信区间( confidence interval):与置信水平相关的数值范围.即可能包含真实总体参
混杂( confounding):当不能确定单个被调查的因素而将不同因素影响混合在一起时,描述统计结果就会发生混杂。
混杂因素( confounding factors):在统计研究中能够混杂在一起的任何因素或变量.也被称为混杂变量
居民消费价格指数( Consumer Price Index)CPI):为了衡量通货膨胀率的指数。它根据超过600品、服务和居民消费的样本,每月计算并公开一次。
列联表( contingency table):见双向表。
连续数据(ontinuous data):可以呈现出给定区间中任何数值的定量数据。
等高线地图( contour map):地图中以相同的数值用曲线(等高线)连接地理区域。
对照组( control group):在实验研究中没有被处理的主体所组成的组。
任意抽样( convenience sampling):随意选择个样本。
相关性( correlation):两个变量的统计关系也可见负相关、不相关和正相关。
相关系数( correlation coefficient)(r):对两变量之间相关度的测量。它的值总是处于-1-1之间(即-1≤r≤1)
累计频数( cumulative frequency):对于某类别数据,这个类别和之前所有类别中数值的数量总和
死亡率( death rate):由于某种特殊原因的死亡人数,被表示为所有由于同种原因处于危险中的人们的分数。例如,“每1000个人中5个人”的死上率意味着100人中有5个人死于这个特殊原因的平均值。
自由度( degrees of freedom)(对于分布):样本容量减1,即n-1
相关事件(dedependent events:两个事件,其中一个事件的结果会影响另一个事件的概率
离差( deviation):特定数值离数据集均值的距离。可以用来计算标准差。
离散数据( discrete data):呈现出某个特殊值而不是它们之间其他数值的定量数据(如整数0,1,2)
分布( distribution):变量呈现出所有可能值的方式。可以用图表来表示。
样本均值的分布( distribution of sample means):找出给定容量的所有可能样本中的均值(x)后得出的分布。
样本成数的分布( distribution of sample proportins):找出给定容量的所有可能样本中的成数(p)后得出的分布
点图( dotplot):类似于条形图,除了每-个数值都是由点来表示。
双盲实验( double- blind experiment):参与者和实验者都不知道谁属于实验组,谁属于对照组的实验。
或然概率( either/or probability):事件A或事件B发生的概率。如何计算取决于事件是重叠的还是非重叠的。
经验法( empirical method):见相对频数法。
事件( event):在慨率中,拥有同一性质的个或很多结果的集合。也可见结果。
期望频数( expected frequency):在双向表中,行变量和列变量相互独立时,给定小格中期望的频数。
期望值( expected value):某个随机变量结果的平均值。
实验研究( experiment):研究人员使用一种处理方法,然后观察其对主体影响的研究。
实验者效应( experimenter effect):当研究人员或实验者通过类似于表情、音调或态度等因素在某种程度上影响主体时,就会发生这一效应。
五数概括法( five-number summary):用最小值、下四分位数、中位数、上四分位数和最大值描述数据分布的离散程度。
频数( frequency):对于一个数据类型,数据落人这一类型的次数。
频数表( frequency table):这种表格在一栏中列出所有数据类型,在另一栏中列出每个数据类型
赌徒谬误( gambler" s fallacy):坏运气使一个的频数。人“预期”有好运气的错误想法。
地理数据( geographical data):代表不同地理位置的数据。
直方图( histogram):显示定量数据(在定距测量和定比测量中)分布的条形图。条形有自然的顺序,条形的宽度有特殊的意义。
假设( hypothesis):在统计学中,指有关总体参数的声明,比如总体成数p或总体均值r。也可见备择假设和原假设。
假设检验( hypothesis test):检验有关总体参数声明的标准过程。
独立事件( independent events):两个事件,其中一个的结果不受另一个概率的影响。
指数( index number):用于比较不同时间或不同地点测量值的数值。必须选择某一特定时间(或地点)的数值作为参考值(或基数).其他时间(或地点)的指数是:
数值 = 指数/参考值 X100
通货膨胀( inflation):物价和工资随着时间推移而不断增长。它的总体比率用CPI来度量。
定距测量( interval level of measurement):对定量数据的测量,其中的差异或者区间都是有意义的,但比率是没有意义的。这个水平上的数据有任意起点。
联合概率( joint probability):见联合概率(and probability)
大数定律( law of large numbers):概率论中的一个重要结论。应用的前提条件是事件A的概率是P(4),且重复实验结果是独立的。定律:在实验不变的条件下,实验次数越多,则频率越接近P(A)。它也被称为平均法则。
左偏分布(| eft -skewed distribution):数值更多分散在左侧的分布。
左侧检验( left-tailed test):检验总体参数是否在声明数值左侧(更小的数值)的假设检验。测量尺度( level of measurement):见定类测量、定比测量、定距测量和定序测量。
预期寿命( life expectancy):当前给定年龄的人期望生存的平均年数。它基于目前的健康和医疗统计量,但并不考虑医疗科学和公共健康未来的变化
折线图( line cha):将一系列点连接成线形成的定量数据的分布图表。每个点的水平位置与它所代表数据集的中心相对应,而垂直位置与数据集的频数相对应。