医学生常用统计

发布 2021-02-07 04:34:28 阅读 1564

计数资料与计量资料。

医学统计资料按其性质一般分为计数资料与计量资料两类。不同类型的统计资料应采用不同的统计分析方法。

计数资料是先将观察单位按某种属性或类别分成若干组,再清点各组观察单位个数所得到的资料。如临床某些检验结果用阳性或阴性反应表示,对一批某病患者检验完毕后,清点呈阳性或阴性反应的各有若干例。又如要调查某人群的血型分布,先按a、b、ab、o四型分组,再清点各血型组人数。

计数资料每个观察单位之间没有量的差别,但各组之间具有质的不同,不同性质的观察单位不能归入一组。对这类资料通常是先计算百分比或率等相对数,需要时做百分比或率之间的比较,也可做两事物之间相关的相关分析。

计量资料是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。如检查一批应征青年体重,需要磅秤测量,通常以公斤为单位,测得许多大小不一的体重值。其它如身长(cm)、血压(mmhg)、脉搏(次/分)、红细胞(万/mm3)转氨酶(单位)等,都属于计量资料。

每个观察单位的观测值之间有量的区别,但同一批观察单位必须是同质的。对这类资料通常先计算平均数与标准差等指标,需要时做各均数之间的比较或各变量之间的分析。

还有一些资料,也是将观察单位按某种属性或某个标志分组,然后清点各组观察单位个数得来的,但所分各组之间具有等级顺序。这些资料既具有计数资料的特点,又兼有半定量的性质,称为等级资料或半定量资料。例如对一批急性病毒性肝炎患者作麝香草酚絮状试验,将试验结果按分组,显然各组之间既有等级顺序,又有程序与量的差别。

又如某病住院病人的**结果,按**、好转、无效、死亡分组,同样各组之间具有顺序与程度之别。分析等级资料常用的统计指标有比和率,常用的统计方法有秩和检验、参照单位分析等。 在医学实践中,根据分析研究的目的,计数资料与计量资料可以互相转化。

例如血压值本是计量资料,但如果将一组20-40岁成年人的血压值分为血压正常与血压异常两组,再清点各组人数,于是这组血压资料就转化成为计数资料了。假若将这组血压值按低血压(130/90-110毫米汞柱)、重度高血压(>130/>110毫米汞柱)的等级顺序分组,清点各组人数,这时这组血压资料又转化为等级资料了。又如在计量诊断中,将某些阳性体征根据确诊病人的概率赋予分数,分数的多少代表量的大小,这样原来的计数资料就转化为计量资料。

由于计量资料可以得到较多的信息,所以凡能计量的,尽量采用计量资料。

临床科研统计方法与选择。

临床科研中数据的处理和统计方法是临床研究得出结论的步骤之一。而描述临床数据,应用正确的统计方法是获得正确的临床科研结果的前提。本文从描述数据到统计方法的选择介绍临床科研**中常用的统计方法、基本概念。

一、数据的种类。

1.数据种类:

临床上的数据通常可简单地分成计量资料、等级资料和分类资料(计数资料)三种类型。计量资料指连续的数据,通常有具体的数值,如身高、体重、血压、血红蛋白、胆红素和白蛋白等。等级资料指有一定级别的数据,如临床疗效分为**、显效、好转、无效,临床检验结果分为疼痛等症状的严重程度分为0(无疼痛(轻度(中度(重度)等,等级资料又称为半定量资料。

分类资料指各数据之间没有顺序或等级关系,而是归于一定属性,可以是两类,也可以是多类。如性别资料,按男性和女性分类,计算男性与女性各有多少例;职业资料,按工人、农民、职员等归类,计算各自的例数;随访结果资料,按生存或死亡归类,计算各自的例数;接受干预措施资料,按用试验药物、用安慰剂归类;是否存在吸烟、饮酒、幽门螺杆菌(hp)感染等暴露因素,按吸烟、不吸烟,饮酒、不饮酒,hp(+)hp(-)归类等。

2.数据的类别转换:

计量资料可以根据需要或一定的标准分成两个或数个等级而变成计数或等级资料。如年龄资料是计量资料,但可以按大于65岁、45~65岁、小于45岁分为老、中、青年3类而转变为等级资料或计数资料。但需要注意的是:

①计量资料转换为等级资料或计数资料比较简单,但从等级资料或计数资料就无法再转换成计量资料,因此,在临床上收集数据或计算机储存数据时,应考虑收集或储存计量资料,只有在数据处理时根据需要再转换为等级资料或计数资料。②对两组病人的某项指标进行统计学检验时,数据从计量转换为计数或等级资料,统计的效率也可能下降。

二、数据的统计描述。

对于临床研究数据,通常我们不可能在**中或在报道时告诉读者每一个病人的具体特征。我们需要知道这批数据的特征,一方面便于描述,另一方面便于两组数据或特征的差异比较,这就是统计描述。

1.计量资料(数据)的统计描述:计量资料的特征通常包括中心位置与离散程度。

中心位置通常用均数来描述,如一组病人的年龄、体重、血红蛋白、白蛋白、胆红素、肌酐和尿素氮等,要求是这类数据应该服从正态分布;如果数据经对数转换后呈正态分布,则可以用几何均数表示其中心位置,如hbsag滴度(1∶8,1∶16,1∶32,1∶64);对于偏态数据,通常用中位数表示其中心位置,加研究急性肝炎时alt、ast等范围从数十到上千变动较大,且每个病人的变化情况不一致。正态分布的数据离散程度可用标准差来描述;对于偏态数据,可以用4分位范围(inter quartie range, iqr)描述离散程度,即:iqr为第25百分位数(p25)~第75百分位数(p75)。

2.计数资料(数据)的统计描述:计数资料在分类时可以计算各类别在总数中的比重或百分比,称为构成比,如性别资料,100例病人中,60例男性,40例女性,可表示为男性占60%,女性占40%;如果数据分为发生或不发生,如死亡、患病等,则可计算其死亡率、发病率等指标,表示其发生的强度,称率。

构成比一般不能说明发生强度。临床上有很多率实际上只是个比例(构成比)。如患病率是一个比例,由于历史原因,仍称为患病率。

所以不能将构成比混为发病率来说明发生强度。当两个率进行比较时,如果某一指标足以对率的大小有影响(如年龄对死亡率),而该指标的组成(如年龄构成)在两组内不同,则需要对该指标进行标准化。

统计描述:根据数据可以用构成比或率来计算。如临床疗效可表示为**率、好转率等。

腹痛根据程度分为无、轻、中、重,可计算各程度的构成比。即用各种程度病人数除以总病例数,各构成比之和应为100%。4.

比数、优势比、相对危险度:在**学研究中,是暴露因素与疾病之间的联系强度的指标。比数是阳性率与阴性率之比。

相对危险度(rr)是两种暴露条件下发病率之比,如研究hp感染与胃癌的关系,采用前瞻性队列研究,按hp(与hp(-)分为2组观察若干年后胃癌的发生率,计算两组的发病率之比即估计相对危险度。优势比(or)是在病例对照研究中表示暴露与疾病发生之间的相关程度,是rr的近似值,如同样研究,采用病例对照设计,按胃癌与非胃癌分为两组,调查两组病人发病前hp感染情况,评价hp感染与胃癌之间的关系需用优势比。

三、定量数据的统计学检验。

临床研究中要进行两个样本或多个样本间差异的统计学检验,以判定差异是真实存在或者由于抽样误差引起。

1.t检验与方差分析:对于分组呈正态分布的定量资料,如为两组比较,可用t检验。

t检验有2种方法,取决于资料是成组比较还是配对比较。临床科研中对每一病人**前后的比较:如应用利胆药物后胆红素水平前后的比较;应用保肝药物后白蛋白水平的前后比较等多属于配对比较。

临床上许多研究无法配对,如新药与对照药物的比较,通常都是**组与对照组进行成组比较。在选用t检验时,这两种t检验的方法是不同的。

对两组以上(多组)资料比较,则选用方差分析;方差分析也有二种方法,取决于研究设计。如研究血液放置时间对血糖测定值的影响,对8名健康人抽血后将每一个体的血液分为4份,分别放置mi后测定血糖浓度,这种设计每4份血糖测定值均来自同一个体,称为随机区组随机,需要用随机区组分差分析。同样,如果我们的目的是比较三种不同降血糖药物的**效果,采用随机化方法将病人分为三组,每种药物应用于一组病人,三组病人最终的血糖比较则用完全随机设计方差分析。

需要注意的是,各组样本含量相等与不相等时,由于组间离均差平方和计算方法略有差别,所选用方差分析计算公式也不一样。

需要指出的是,配对或配伍组设计比成组或完全随机设计的优点是对某一因素进行控制,如上述4份血糖结果,除了放置的时间外,其余因素都一样(来自同一人),从而减少了偏倚误差,提高统计效率。

在进行方差分析时,如对a、b、c三种药物的疗效进行比较时,无效假设为三组疗效相同,即ho:a=差异有统计意义而推翻此无效假设时,其备选假设h1为三种药物的疗效全不相同或不全相同,这时并不能区分是哪两种药物疗效相同,哪两种不同。一种自然的想法是不做方差分析而直接做三个t检验,即检验由此直接得出结论。

从统计学角度看,这是不正确的,因为它增加了第一类错误,即假阳性错误的概率。这时统计上有意义的临界值概率α,已超过α=0.05的标准,因而是不可取的。

比较合理的方法是在方差分析后作多重比较(两两比较)。多重比较的方法很多,常用的有snksnkstudent new man keuls)法、duncan法、lsd法以及dunnett法等。应用t检验和方差分析的前提是:

①小样本时,无论t检验或方差分析,对数据的要求均应是正态分布,资料正态性问题可以用频数图考察或正态检验;②成组t检验和方差分析要求各组的样本方差间差异无显著性(方差齐性)。两组方差齐性检验可以用f检验;多组方差齐性检验可以用bettlett检验。

2.数据转换:如果数据属于某种特殊分布或数据具有一定特征,经过一定转换后可转换成正态或方差齐性,则分析效果更好。

如水中细菌数、单位时间放射性计数等符合普松分布,数据可通过平方根转换;非传染病患病率、白细胞百分数、淋巴细胞转换率、钡条胃排空检查的残留率等符合二项分布,数据可通过平方根反正弦函数转换;滴度资料等可通过对数转换。

3.非参数统计:非参数统计也针对两组或多组计量资料的比较,当t检验或方差分析的前提条件不能满足而对数据的总体分布不能确定或没有适当的转换方法时,可以用非参数统计方法。

相应于参数检验、配对比较的设计,非参数统计采用符号等级检验(wilcoxon法);两组比较采用两样本等级和检验(wilcoxon man and whitne ranksum法)或中位数检验;配伍组设计比较采用m检验(friedman法);多组比较采用h检验(kruskal and wallis)

表1 计量资料比较时参数与非参数统计方法选择。

设计方法参数统计* 非参数统计**

配对比较配对t检验符合检验,符号等级检验(wilcoxon)

两组比较成组比较t检验两样本等级和检验(wilcoxon mann and whitney),中位数检验

配伍组比较随机区组方差分析 m检验(friedman法)

多组比较完全随机设计方差分析 h检验(kruskal and wallis)

常用医学统计方法

统计学是以数学方法观察和比较事物的一门学科。一 研究对象 存在的事物或现象 变异 性质相同 对象之间存在的差异。变异导致的现象有,个体 个体 个体 部分 部分 部分 部分 全部。上述四种不同如果是变异所致,则不同是表像,相同才是本质。鉴于 变异 的存在,当欲判断事物与事物有无不同时,必需考虑排除因变...

医学生升职晋级

晋级与学位。1 本科生参加工作5年后可晋主治医师硕士研究生2年后可晋主治医师,唯一不同的是本科生晋主治考外语,研究生不用考。2 本科生在晋完主治医师5年后方可晋副主任医师,而硕士研究生在晋完主治医师3年后就可以晋副主任医师。在晋完副主任医师5年后方可晋主任医师。本科毕业到主任医师至少要15年。3 博...

医学生见习心得

见习心得。时间过得真快,短短两个学期的见习课程结束了,记得去年8月底去我坐在离开学校的大巴车上,既为离开学习生活了3年的校园感到有些伤感,又为即将迎来的见习课程感到兴奋,怀着这种心情,我来到了目的地 株洲市331医院。虽然医院的课程安排是半天理论课半天实践课,可对于我们这些以往只埋头读书的学生来说,...