㈠ 什么是医学统计学
什么是医学统计学
医学统计学是医学科学的一个组成部分,是医学院校各专业的必修课。你知道什么是医学统计学吗?下面是我为大家带来的关于医学统计学的介绍。欢迎阅读。
医学统计学简介:
医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。
主要特点
医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。
生物现象的一个重要特点就是普遍存在着变异。所谓变异(个体差异),系指相同条件下同类个体之间某一方面发展的不平衡性,系偶然因素起作用的结果。例如同地区、同性别、同年龄的健康人,他们的身长、体重、血压、脉搏、体温、红细胞、白细胞等数值都会有所不同。又如在同样条件下,用同一种药物来治疗某病,有的病人被治愈,有的疗效不显着,有的可能无效甚至死亡。引起客观现象差异的原因是多种多样的,归纳起来,一类原因是普遍的、共同起作用的主要因素,另一类原因则是偶然的、随机起作用的次要因素。这两类原因总是错综复杂地交织在一起,并以某种偶然性的形式表现出来。科学的任务就在于,要从看起来是错综复杂的偶然性中揭露出潜在的必然性,即事物的客观规律性。这种客观规律性是在大量现象中发现的,比如临床要观察某种疗法对某病的疗效时,如果观察的病人很少,便不易正确判断该疗法对某病是否有效;但当观察病人的数量足够多时,就可以得出该疗法在一定程度上有效或无效的结论。所以,医学统计学是医学科学研究的重要工具。
医学统计学在本世纪二十年代以后才逐渐形成为一门学科。解放前,我国学者即致力于把统计方法应用到医学中去,但人力有限、范围较窄。解放后,随着医学科研工作的发展,本学科得到迅速普及与提高。通过大量实践,在不少方面积累了自己的经验,丰富了医学统计学的内容。而电子计算机的作用,更促进了多变量分析等统计方法在医学研究中的应用。
内容包括
①统计研究设计。
我们制订调查计划或实验设计时,除专业问题外,还必须从医学统计学的角度考虑,使调查或实验结果能够科学地回答所研究的'问题。一个好的设计可以用较少的人力、物力和时间取得更多的较可靠的资料。
②总体指标的估计
医学研究中实际观测或调查的部分个体称为样本,研究对象的全体称为总体。人们除用均数、率等统计指标对调查或实验结果进行描述外,更重要的是通过样本的信息,来估计总体中相应的统计指标,即参数估计。
③假设检验。
就是依据资料性质和所需解决的问题,先建立适当的假设,然后采用适当的检验方法,根据样本是否支持所作的假设,来决定对假设的接受或拒绝。
④联系、分类、鉴别与鉴测等研究。
在疾病的防治工作中,经常要探讨各种现象数量间的联系,寻找与某病关系最密切的因素;要进行多种检查结果的综合评定、探讨疾病的分型分类:计量诊断,选择治疗方案;要对某些疾病进行预测预报、流行病学监督,对药品制造、临床化验工作等作质量控制,以及医学人口学研究等。医学统计学,特别是其中的多变量分析,为解决这些问题提供了必要的方法和手段。
作为医学工作者,学习和掌握一定的统计学知识是十分必要的。第一,在阅读医学书刊中,经常会遇到一些统计学方面的名词概念,有了这方面的知识,有助于正确理解文章的涵义;第二,在实际工作中,经常要做登记工作,要填写各种报表,只有懂得了原始登记与统计结果的密切关系,并掌握了收集、整理与分析资料的基本知识与技能,才能自觉地、认真地把登记工作做好,积累有科学价值的资料;第三,参加科研工作时,从开始设计到数据整理分析与统计结果的表达,每一步骤都需要统计学知识;第四,在制订计划、检查工作、总结经验时,都离不开统计数字,尤其在撰写科研论文时,有了统计学知识,才能使数据与观点密切结合,作出正确的结论。
学习统计学,首先必须明确:我们掌握的关键不是数学原理,而是怎样合理地、恰当地把数理统计的方法应用到医学科研工作中去,并结合专业知识,提高分析问题与解决问题的能力。其次在学习过程中,要理论联系实际,重视实习与练习。作业中要遵守数学上的规则与习惯,如小数点及各个位数应上下对齐,一个多位数的数值不能分写成两行,等号不能写在一行的末了而应写在第二行的开头等等。再次,各种统计符号必须写正确,汉字、阿拉伯字与外文字母必须写清楚,不能写成模棱两可,只有在学习时养成良好的习惯,将来工作中才能少出差错。
统计工作最根本的一条就是实事求是,如实反映情况。因此,无论日常工作或科学研究中,必须养成严肃认真的作风和反复核对的习惯,同一切弄虚作假的现象进行坚决的斗争,尽最大努力获得正确数据,使分析结论建立在可靠的基础上。
医学统计学是医学科学的一个组成部分,是医学院校各专业的必修课。医学统计学作为保证医药科研工作的重要手段已写入有关文件的要求中,作为高层次的医学专业人员,通过学习本门课程,可以较好地把统计原理和方法的思维逻辑应用于科研和管理中,尤其在本学科的研究设计和数据分析方面,更为明显。
通过本门课程的学习,要使学生学会人群健康研究的统计学方法,学会计量、计数资料的分析,非参数统计方法和多元统计分析方法及医学研究设计。其目的使大家具备新的推理思维,结合专业问题合理设计试验,科学获取资料,提高科研素质。
;㈡ 医学统计学重点知识归纳是什么
医学统计学重点知识归纳如下:
1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。
2、研究对象:具有不确定性结果的事物。
3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。
4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。
5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。
6、医学统计学中的基本概念
(1) 同质与变异
同质,指根据研究目的所确定的观察单位其性质应大致相同。
变异,指总体内的个体间存在的、绝对的差异。统计学通过对变异的研究来探索事物。
(2) 变量与数据类型
变量,是反映实验或观察对象生理、生化、解剖等特征的指标。
变量的观测值,称为数据,分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等)
定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)
有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。统计方法的选用与数据类型有密切的关系。
(3)总体与样本
总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。参数,指描述总体特征的指标。
统计量,指描述样本特征的指标。
(4)误差
误差,指观测值与真实值、统计量与参数之间的差别。可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。
抽样误差,是抽样引起的统计量与参数间的差异。抽样误差主要来源于个体的变异。统计学主要研究抽样误差。
(5)概率
概率,是描述某事件发生可能性大小的量度。
必然事件,事件肯定发生,概率P(U)=l。
随机事件,事件可能发生,可能不发生,概率介于0_P(A)≤ 1;不可能事件,事件肯定不发生,概率P($)=0。
小概率事件,事件发生的可能性很小,概率P(A)≤0.05、或P(A)≤0.01。
㈢ 医学统计学之概率分布的概念
医学统计学之概率分布的概念
众所周知,统计分析可以分为描述性统计分析 (descriptive statistics)和推断性统计分析 (inferential statistics)。下面是我为大家带来的关于医学统计学的知识,欢迎阅读。
对于推断性统计分析来说,要抓住其本质,就必须对其背后最根本的概率分布(probability distribution)有个清楚的理解。概率分布是很多统计推断方法的基础,最典型的例子就是正态分布,很多统计检验方法都会涉及到正态分布。而有些统计检验则是直接建立在统计量值服从某种概率分布的基础上的,比如t检验的t值服从t分布,方差分析的F值服从F分布,卡方检验的卡方值服从卡方分布等。因此在展开推断性统计分析或统计检验之前,先和大家一起熟悉一下概率分布。
首先简单介绍一下几个常见的概念:
1、Random variable (随机变量):
假设我们掷硬币,那么出现的结果有两种:正面或反面。我们换个角度,把正面和反面的结果与数字联系起来,将结果数量化,比如我们掷10次硬币,出现5正5反。这时我们就把掷硬币的结果 (正或反)与出现正或反结果的数字联系起来了。而随机变量就是一种function,它把每一种结果都与一个唯一的数值联系起来。对于随机变量的定义,版本有很多,我们来看一下其中的一个定义:一个随机试验的可能结果(称为基本事件)的全体组成一个基本空间Ω 。 随机变量X是定义在基本空间Ω上的取值为实数的函数,即基本空间Ω中每一个点,也就是每个基本事件都有实轴上的点与之对应。
随机变量一般可分为离散型随机变量(discrete)和连续性随机变量(continuous)。
所谓离散型随机变量是指随机变量X的取值是有限个或可列无限个。比如我们掷硬币,我们定义随机变量是正面的次数,那么我们掷10次,那么X的取值只能是0,1,2,3,4,5,6,7,8,9,10,这时我们就称X是个离散型随机变量。
所谓连续性随机变是指X可以取某一区间的所有值。比如,我们定义X为收缩压血压值,理论上来说X可以取任意非负值,此时X就是个连续性随机变量。
了解了什么是随机变量,接下来我们开始看一下什么是概率分布。。
2. 概率分布(probability distribution)
The probability distribution associated with the random variable X describes the likelihood of obtaining certain values or ranges of values of the random variable
概率分布是描述随机变量取某个特定的值或取某一区间范围内值的概率。
对应着概率分布的定义,取某个特定的值或取某一区间内的值,或者说对应着离散型变量或连续性变量,概率分布可以分为离散型概率分布和连续性概率分布。
常见的离散型概率分布有二项分布(Binomial Distribution)和泊松分布(Poission Distribution )。
常见的连续性概率分布,我们一般称为Probability Density Function,包括正态分布(Normal Distribution)、t分布 (t Distribution)、卡方分布 (Chi-Square Distribution)、F分布(F Distribution)等。
一提到概率分布,我们一般第一想到的便是正态分布,有人说没有正态分布就没有统计,由此正态分布的普遍性和重要性不言而喻。
那么为什么正态分布如此普遍和重要呢?
首先,很多情况下,自然界很多东西都是自然呈正态分布的,而更重要的原因在于中心极限定理(central limit theorem)的.应用。所谓中心极限定理是指当样本量足够大时,无论其总体分布如何,其样本均数趋于正态分布。中心极限定理为正态分布的普遍应用提供了最为坚实的理论基础。而对于上则几百例病人的临床试验来说,正态分布更是找到了其适合生长的最好土壤。另外,我们常用的一些统计方法都是依赖于正态分布的:
(1) 一些统计方法如t检验和方差分析,其应用的前提条件就是要求数据服从正态分布
(2) 而对于一些统计模型来说,比如线性模型,往往要求其残差服从正态分布。
关于正态分布在统计模型中的应用,下边有一段论述很有意思,小胖摘抄下来供大家参考:
正态分布对统计学家从某种角度来说是“垃圾的分布”。
当向一个统计学家问什么是正态分布时,他会回答:当一个变量有多个、解释不清的因素决定,而且每个因素的作用都不强,于是变量就呈现正态分布。
一个随机变量中有两种成分,一是非随机成分,一是随机成分分。建模把非随机部分用模型(函数形式)来表达,纯随机的成分就成了残差。
回归不论线性与否,残差是正态,说明模型不能表达的成分确实是“垃圾”,不能再处理的。
但是,我们把数据馈入模型,结果发现残差非正态(或并非白噪音),怎么办,最理想的办法是修改模型,使其符合正态假设。回归其实就是在杂乱的信息中,把有规律的信息用模型表达出来,而无规律的白噪声滤掉。
;㈣ 医学统计方法有哪些
医学统计方法概述 第一节 医学统计学 在临床医学中的作用和意义 一、医学统计学 1、统计学 统计学(statistics)是研究数据搜集、整理与分析的科学,是认识社会和自然现象数量特征的重要工具。 2、医学统计学 统计学在医学研究领域的应用称为医学统计学。 医学统计学与生物统计学、卫生统计学是统计学原理和方法在互有联系的不同学科领域的应用,三者间有少许区别,但无截然界限。 二、医学统计学在临床医学中的应用及意义 1、临床科研设计 2、对搜集资料的内在规律进行分析 3、为医务工作者阅读科技文献和撰写科研论文提供工具 第二节 统计工作的基本步骤 统计工作的基本步骤通常分为四步:(研究)设计、搜集资料、整理资料和分析资料。 一.研究设计(design) 设计一般包括专业设计和统计设计。专业设计即确定调查题目、内容等。统计设计包括资料收集、整理与分析。 统计设计包括资料收集、整理与分析全过程的统计设想和科学安排。 设计需考虑以下几方面: 1、研究的目的和假设是什么? 2、研究对象的选择范围是什么?如何确定? 3、研究方法是什么?技术路线如何? 4、具体的研究内容、观察项目与指标是什么? 5、研究对象的数量大小,如何抽样?怎样分组? 6、对观察指标如何进一步计算?具体采用哪些统计分析方法? 7、有哪些可能存在的误差?如何避免与减少其影响? 8、时间、人员、经费方面的安排。 实验三要素:处理因素、受试对象、实验效应 设计四原则:对照、随机化、重复、盲法 二、搜集资料(data collection) 按照设计要求,原则是及时、准确、完整地收集原始数据。 1、病历 2、日常医疗工作记录 3、临床检查与化验记录 4、疾病监测报表 5、专题研究 三、整理资料(data sorting) 1、资料的录入和清理 资料录入前后初步的清理是核实,其次是发现异
㈤ 医学统计学重点知识归纳有哪些
医学统计学重点知识归纳u分布是标准正态分布,均数为0,标准差为1的正态分布,t分布当自由度足够大的时候近似与u分布,n→∞时,t 分布与标准正态分布完全一致。
1)求极差(Range)R=Xmax-Xmin (29.64-7.42=22.22)。
2)确定组数和组距、划分组段组数确定需根据样本大小决定,一般取10组左右。(22.22/12=1.85)。
3)频数统计,列频数表。
图形特征:
集中性:正态曲线的高峰位于正中央,即均数所在的位置。
对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。
关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。
㈥ 医学统计学基础概念整理
医学统计学基础概念整理2017
统计学是研究数据的收集、整理和分析的一门科学。其工作流程为设计、搜集、整理、分析与结果报告。打个通俗的比喻,统计学就好比“打牌”,抓牌就是搜集数据,牌抓好后要整理一下,然后研究怎么打就是分析,打的输赢就是结果报告。下面是我为大家带来的关于医学统计学基础概念整理的知识,欢迎阅读。
一.总体与样本
总体:是指根据研究目的所确定的观察单位某项特征的集合。比如说我想研究山西医科大学所有在校生的平均体重,那根据此目的,我们研究的总体就是:山西医科大学所有在校生的体重数据的集合。但是需要注明一点:总体分为有限总体和无限总体,上面的例子就是有限总体,毕竟山西医科大学学生还是有限的,然而科研过程中面临的大多数是无限的总体,我们是无法取得其总体进行研究的。那我们面对无限总体怎么办呢?
我们为了研究无限总体,发明了抽样的方法。就像我们想知道一锅老母鸡汤的咸淡,不需要喝完所有的汤,只要摇匀,尝其一勺就可以了,这种思想就叫“抽样”。
样本:就是从总体中抽出的部分观察单位某项特征的集合。但是在抽样过程中必须遵守随机化的原则。
随机化原则:是指总体中的任何一个观察单位都要有同等的机会被抽到作为样本进行研究。那么如何保证随机化抽样呢,一般包括单纯随机抽样、系统抽样、分层抽样、整群抽样和多级抽样等方法。
二.参数与统计量
参数:用于描述总体特征的指标;
统计量:用于描述样本特征的指标;
总体、样本、参数与统计量的关系如下图。
统计学就是通过描述样本的统计量去推断描述总体的参数。这是通过偶然去发现必然的过程,通过一般去发现普遍的过程,是以小见大的过程。
三.误差
误差:观察值与真知之差。即我们通过一次试验得到的结果与事件真实结果之间的差值。误差根据其产生的原因,分为四种:
(1)系统误差:因为试剂未校正或仪器没有调零等因素造成的研究结果倾向性的增大或减小。如我们路过药房,门口放个一个体重计,请问我们在称自己的体重之前,首先要干的第一件事情是什么呢?从统计学角度,我们应该看看体重计上的指针是不是对准零,如果本身就有5Kg底重,那我们所有的同学去称,都将会重5Kg,即发生倾向性的偏大。其特点:倾向性的增大或减小,如果我们就行调零,就可以避免。
(2)随机误差(random error):是由各种偶然因素造成的观察值与真值之差。比如班级所有同学用同一把尺子测量我的身高,结果发现我的身高值是不一样的。其特点为:不可以避免,但可以减少。统计学有一定律叫做“测不准定律”,不管你怎么测,就是测不准,因此我们通常多次测量后取平均。
(3)抽样误差(sampling error):因为抽样造成的样本统计量与总体参数之间的差异。有人会说,刚才那一勺老母鸡汤的咸淡应该和锅里汤的咸淡是完全一样的啊,是的,但上面的例子是在讲抽样的原理,而我们科学研究和喝老母鸡汤是不一样的,因为汤里的氯化钠是均匀分布的,而我们科学研究的目标事件是不均匀分布的。比如某个班级120名同学的近视眼患病率为50%,我按照随机化原则随机抽取50名同学,则50名同学的近视眼患病率绝对不等于50%,因为近视眼同学在班级中的`分布是不均匀的。因此抽样误差的特点为:不可以避免,但可以减少。我们可以通过增大样本量进行减少。
(4)过失误差(gross error):
由于观察过程中的不仔细造成的错误判断或记录。过失误差可以通过仔细核对进行避免。
那我们统计学的存在主要是解决那种误差呢?我们通过统计设计减少系统误差、通过统计学检验去排除抽样误差的。
四.概率与频率
概率(P):用于反映某一事物发生可能性大小的一种量度。一般用大写的斜体P表示。
我们根据事物发生概率的大小,把事件分为3类:P=1为必然事件,发生率为100%;P=0为不可能事件,发生率为0;0
频率(f):是指我们进行了N次试验,其中一个事件出现的次数m与总的试验次数N的比值。
问题是:我们到底如何能够得到某一事件发生的概率呢,比如说谁能够告诉我一个半截粉笔从讲台上掉下摔断的概率P=?。我们至今的科学发展也没有办法通过公式去计算该值。那我们是怎么做的呢?有句话叫做“有些事情越想越烦,做起来却极其简单”。我们只需要那两盒同样的粉笔进行重复摔就可以了,如果总共100支粉笔,断了98只,那断的频率就等于f=98/100=0.98。而统计学上证实,当某事件发生次数较多时,频率就会接近于概率。意即f=P。因此,其实我们就是通过频率去估计概率的。
五.同质与变异
同质:是指观察单位所受的影响因素相同。而我们科研的观察单位所受的影响因素只可能相对的相同,不可能绝对的相同,因此,同质是相对的。
变异:是指观察单位在同质的基础上的个体差异。天底下没有两个完全一样的事物,唯一不变的就是变化。因此,变异是绝对的。
这一对概念对我们研究统计的意义:如果没有同质的话,就没有我们研究的总体或者样本。因为如果不同质,我们是不可能把他们放在一起进行研究的。如果没有变异,就根本没有统计学产生的必要,因为如果没有变异,我们拿一种药物治疗某病的一个病人,如果有效,该药对所有该病病人都应该有效,这是不可能的。
六.试验vs实验
试验——对已知事物结果的探索过程:为了查看某事的结果或某物的性能而从事某种活动。
实验——已有明确的结论/假说后的验证过程:为了检验某种科学理论或假设而进行某种操作或从事某种活动。
从上述来自《现代汉语词典》的两个解释,可以看出:实验中被检验的是某种科学理论或假设,通过实践操作来进行;而试验中用来检验的是已经存在的事物,是为了察看某事的结果或某物的性能,通过使用、试用来进行。
在我们实际应用中,很多词汇中到底是用“试验”还是“实验”是已经根据前人的经验明确了的。比如RCT(Randomized Controlled Trial),我们会叫“随机对照试验”,我想多半是因为翻译的过程中Trial翻译为“试验”更为合适。而RCT中,患者被分为两组时,则被称为“实验组”(Treatment Group)和对照组(Control Group)。
七.病人/患者vs受试者/研究对象
这两组词,也许没有必要把定义在贴上来了,因为他们的区别显而易见。病人/患者的称法,当然应该用于病人和患者的身上。如果研究是在健康人或者潜在患者人群中开展的,此时研究对象还不能确定为病人/患者,那么只能称其为受试者或研究对象。相似的,在产科的研究中,如果研究对象为一般的产妇,我们通常也不应该用“患者”或“病人”这样的称谓。
研究对象可以说是一个万金油,什么时候用都是可以的。而受试者我们又要说一下了,“受试者”常与某种干预联系在一起,通常仅在干预性研究(RCT、类实验)和诊断试验中才会使用。
八.终点vs结局
结局(Outcome)——研究中患者可能出现的一种结果:某种疾病或某种状态影响下的(人的)最终(健康)状态。
终点(Endpoint)——研究中患者某一结果的替代指标:用于在研究中判断干预或因素作用效果的某种“结局”。
在临床研究中,结局通常是指患者的某种转归,比如肿瘤患者中,痊愈、死亡、复发、转移这些都可以作为结局。当然,干预或某种因素暴露下短期的改变也可以成为结局,比如红细胞的升高、体温降低等等。而终点,则是临床研究中的效应评价点,比如主要终点、次要终点,此时用“结局”就不合适了。
上面这些看起来很头疼吧,那就记个最简单的。一般在试验性研究中(比如在RCT)我们一般使用“终点”,生存分析是有时也会用观察终点这一说法;而在其他类型的研究中,常使用“结局”。
九.排除vs剔除
所谓的排除标准就是考虑到研究的可行性和研究对象的安全,将一部分无法保证研究对象安全及不可行的符合入选条件的研究对象排除在研究之外。针对研究对象开始进行研究前,不将符合排除标准的对象作为研究对象纳入,这就是排除。
在临床研究中,根据入选排除标准确定研究对象之后,在研究中我们还会发现一些患者无法接受进一步干预或观察,或者在研究期间才能发现研究对象的某些特征不属于我们将要外推的范围。此时虽然这些对象在研究初期被确定为“研究对象”,认为他们属于研究结果将要外推到的人群,但实际上他们并不属于该类人群。这时我们就要将该类研究对象“剔除”出研究,相应的标准就是剔除标准。
简而言之,排除是在研究初期用于选择研究对象的;剔除是在研究中期用于去除随时发现的非外推人群的研究对象。
;㈦ 什么是医学统计学
医学统计学名词解释
(注:医学统计学名词解释一般会考英文,所以一定要同时记住他的英文,各个学校考察重点不同,自己进行删减添加即可,大致都是这些)
1. 统计学 (Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学
2. 医学统计学 :是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
3. 变量 :是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示
4. 同质 :是指事物的性质、影响条件或背景相同或相近。
5. 变异 :是指同质的个体之间的差异
6. 总体 :总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。
7. 样本 :从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。
8. 参数 :参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
9. 统计量 :统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
10. 随机抽样 :随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。
11. 变异 :在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
12. 计量资料 :对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。
13. 计数资料 :将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。
㈧ 医学统计学名词解释
医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
医学统计学在上世纪二十年代以后才逐渐形成为一门学科。解放前,我国学者即致力于把统计方法应用到医学中去,但人力有限、范围较窄。解放后,随着医学科研工作的发展,本学科得到迅速普及与提高。
通过大量实践,在不少方面积累了自己的经验,丰富了医学统计学的内容。而电子计算机的作用,更促进了多变量分析等统计方法在医学研究中的应用。
(8)医学统计知识大全扩展阅读
作为医学工作者,学习和掌握一定的统计学知识是十分必要的。
第一,在阅读医学书刊中,经常会遇到一些统计学方面的名词概念,有了这方面的知识,有助于正确理解文章的涵义;
第二,在实际工作中,经常要做登记工作,要填写各种报表,只有懂得了原始登记与统计结果的密切关系,并掌握了收集、整理与分析资料的基本知识与技能,才能自觉地、认真地把登记工作做好,积累有科学价值的资料;
第三,参加科研工作时,从开始设计到数据整理分析与统计结果的表达,每一步骤都需要统计学知识。
㈨ 医学科研中常用的统计学方法有哪些
秋风送爽,也给我们送来了刘岭教授的统计说说第五期。这一期的统计学方法之选择大家一定要认真学起来,说不定马上你就会用到了。
编者语
针对常用的基本统计学方法,一般而言说的就是t检验、单因素方差分析和卡方检验,这也是大家在写论文、阅读论文时经常遇到的统计学方法(几乎每篇文章都会涉及这一种或几种方法),那到底该采用何种统计学方法呢?今天我们就此来聊聊。
一、拿到数据开始分析之前,一定要进行数据类型的划分(图1),因为不同数据类型资料,描述的方式不一样,统计学方法也不一样。
图1 统计资料的类型
举个例子(表1):
表1 某地2002年735例65岁以上老年人健康检查记录
二、各种类型资料的统计分析(描述与统计推断)
1.计量资料
特点:每个观察单位的观察值之间有量的区别,有单位;
描述形式:最常见采用“X±S”(一般文献中经常见到),用算数均数描述其平均水平,用标准差描述其离散程度。如果遇到数据“特别变态”(特别是标准差大于算数均数),就采用Md(P25,P75)(Md为中位数,P25和P75为四分位数)(表2)。正态分布检验请大家复习:医学科研课堂丨统计说说(三):你所应该了解的正态、方差齐性检验
表2 计量资料常用统计指标的特点及其应用场合
统计推断方法:一般分为单因素和多因素两种。
单因素分析方法分析要点:一是划清数据类型(计量资料);二是明确试验设计类型(完全随机设计?几组样本?);三是注意所用方法的应用条件;四是满足正态方差齐性时采用t检验(注意t检验有三种形式哦!)或单因素方差分析,不满足时采用秩和检验(图2)。
图2 计量资料统计方法的正确选择
提醒两点:
① 如果样本数据不服从正态分布的话,那就只能用非参数检验(秩和检验),但其检验效能低于参数检验(t检验或方差分析)。所谓检验效能低就是本身有差异,却没有能力发现其差异。
② 如果是两组以上样本的数据时,不能采用t检验(会导致假阳性错误概率增加),应该采用方差分析。若方差分析的P<0.05,需再进一步两两比较,常用的方法为LSD法或SNK法(注意依旧不能采用t检验)。
在上两讲内容中我们已经学过t检验(医学科研课堂丨统计说说(二):你的t检验做对了吗?)和方差分析(医学科研课堂丨统计说说(四):统计学方法之灵魂—方差分析)了,至于秩和检验,我们以后会逐步介绍滴。
多因素分析一般采用回归分析,主要是线性回归分析,以后会给大家介绍此方法。
2.计数资料
特点:无序分类,同类别中各观察单位之间没有量的差别,但各类别间有质的不同,各类别互不相容。其中二分类一定是计数资料(例如性别只有男/女之分,是否继发某种疾病只有继发/未继发之分),而多分类满足分类在性质上没有程度等级上的差别,即为计数资料(例如婚姻状况包括未婚、已婚、离异、丧偶,就属于多分类,但各分类没有程度等级差别,因此为计数资料,尿糖定性检测结果包括-、+、++、+++、++++,属于具有程度等级差别的多分类资料,就不属于计数资料,属于等级资料了)。
描述形式:最常见采用“例数(%)”(一般文献中经常见到),主要要分清构成比(结构相对数)和率(强度相对数)的差别(表3)。而且在应用时,分母(就是样本量啦)一般不宜过小,分母太小不足以反映数据的客观事实,也不稳定。
表3 计数资料常用统计指标的特点及其应用场合
比如说:
1.某地肺癌患者中男性A例,女性B例,则当地肺癌患者的性别比为A/B就是“比”。
2.某次研究共检出了致病菌3种,总株数为A+B+C,其中一种致病菌检出株数为A,那么A/(A+B+C)就是构成比,即该种致病菌占总致病菌的比重或分布。
3.某研究对患者(总例数为B)进行治疗,结果治愈的患者例数为A,则A/B即为率(可以理解为治愈率)。
统计推断方法:一般分为单因素和多因素两种。
单因素分析方法分析要点:一是划清数据类型(计数资料);二是明确试验设计类型(完全随机设计?几组样本?);三是注意所用方法的应用条件;四是多样本率比较,若卡方检验的P<0.05,需再进一步两两比较,并进行Bonferroni校正,以控制假阳性(图3)。
图3 计数资料统计方法的正确选择
提醒两点:
① 构成比是以100作为基数,各构成部分所占的比重之和必须为100%,故某组成部分所占比重的增减必影响其它组成部分的比重;
② 构成比和率在实际应用时容易混淆,主要区别在分母上,所以应正确选择分母。
多因素分析一般采用回归分析,主要是Logistic回归分析,以后会给大家介绍此方法。
3.等级资料
特点:属于多分类资料,满足多分类在性质上有程度等级上的差别,各分类属性按一定顺序排列(有序),即为等级资料。
描述形式:最常见采用“例数(%)”(一般文献中经常见到),这和计数资料的描述大体相同,主要区别在于多个分类排列时一定要按照顺序进行(从小到大或从弱到强)。
统计推断方法:等级资料的统计分析方法在单因素分析中采用非参数检验(秩和检验),当然对于双向有序R×C资料,也就说分组变量和结局变量都是有序(等级)的情况,构成比的比较采用卡方检验,程度的比较采用秩和检验,趋势关联性的比较用秩相关(也称等级相关)。多因素分析中采用有序Logistic回归。
注意:分类变量(计数资料和等级资料)在软件分析操作时,要适当数量化处理(赋值),赋值情况会直接影响统计分析结果的解释。
最后用下面这张图来总结基本统计学方法的选择(图4)。
图4 常用基本统计学方法的正确选择
今天的内容就到这里,同学们多多复习,有什么问题和不懂的可以在下面留言,我们会请刘岭教授一一解答。好了,让我们期待下一期吧!
撰稿:刘岭 约稿编辑:刘芹
排版:毕丽 审核:王东
专家简介
刘岭:陆军军医大学卫生统计学教研室副教授,主要从事卫生统计学教学、科研工作。担任中华卫生信息学会第八届统计理论与方法专业委员会委员,重庆市预防医学卫生统计专业委员会副主任委员,并担任《第三军医大学学报》等多家杂志的编委、统计审稿专家。
历史推荐
医学科研课堂丨统计说说(四):统计学方法之灵魂—方差分析
医学科研课堂丨统计说说(三):你所应该了解的正态、方差齐性检验
医学科研课堂丨统计说说(二):你的t检验做对了吗?
医学科研课堂丨统计说说(一):样本量估算是个什么东东?
㈩ 医学统计学重点知识归纳有哪些
医学统计学重点知识如下:
1、医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。
2、医学多元统计方法:多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。
3、变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。
4、截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/终止(研究时限已到而终止观察)。
5、总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。