欧洲五维健康量表EQ—5D—3L和EQ—5D—5L中文版比较的实证
研究
摘要 目的:从各个方面分析比较EQ-5D-3L和EQ-5D-5L,从而验证EQ-5D-5L比EQ-5D-3L能够更好地区分不同的健康水平。方法:对324名受访者进行问卷调查,每名受访者首先回答一些自身基本情况的问题和EQ-5D-3L问卷,半小时之后填写EQ-5D-5L问卷。根据EQ-5D-3L和EQ-5D-5L在各水平的重新分布来确定不同版本性能的差异,也可以使用Shannon指数和天花板效应来评价其各自的信息性或者使用EQ-5D指数得分对健康状况进行衡量等。结果:通过调查发现,EQ-5D-3L问卷的各水平大致被分给相应的EQ-5D-5L的各水平,EQ-5D的两个版本的平均不一致率为0.8%。EQ-5D-5L的辨别能力高于EQ-5D-3L,但是它们信息的有效性基本上是一致的。相比EQ-5D-3L的70.1%的完全健康状态,EQ-5D-5L下降到52.8%,而且EQ-5D-5L能够证明和EQ-VAS有更好的相关关系。结论:与EQ-5D-3L相比,EQ-5D-5L有更好的辨别力和较低的天花板效应。此外,EQ-5D-5L还表现出了良好的有效性。因此,EQ-5D-5L比EQ-5D-3L更具优越性,它能够更好地区分不同的健康水平,但是EQ-5D-5L的天花板效应依然存在。
关键词 EQ-5D-5L EQ-5D-3L 健康人群 健康相关生存质量
伴随着新医改的实施,中国的公共卫生事业和医疗技术水平在不断地发展和进步,中国居民的健康水平也得到了极大的提高。同样,测量人们健康水平的量表也在不断地完善。当然,测量健康水平的量表有许多,但是,欧洲五维健康量表(EQ-5D)作为一种简单、方便的量表在全世界范围内得到了广泛的应用。
1 欧洲五维健康量表(EQ-5D)
1.1 EQ-5D的介绍
欧洲五维健康量表(EQ-5D)是一种多维的健康相关生存质量的测量量表。而EQ-5D-3L是最初的EQ-5D版本,用来衡量和评价用户的健康状况。
EQ-5D量表[1]由问卷和效用值换算表两部分组成。EQ-5D问卷可分为 EQ-5D 健康描述系统和 EQ-VAS 两部分。EQ-5D健康描述系统包括5个维度:行动能力(Mobility)、自己照顾自己能力(Self-care)、日常活动能力(Usual Activities)、疼痛或不舒服(Pain/Discomfort)、焦虑或抑郁(Anxiety/Depression)。EQ-5D-3L每个维度包含3个水平:没有任何困难、有些困难、有极度困难。EQ-VAS是长20 cm的垂直视觉刻度尺。顶端为100分,代表“心目中最好的健康状况”,底端为0分,代表“心目中最差的健康状况”。效用值换算表是一个计算公式,可以根据受访者在问卷中5维度、3水平上做出的选择,计算出EQ-5D-3L指数得分,该得分代表了受访者的健康状况。EQ-5D-3L可测量243种可能的健康状况组合。
1.2 EQ-5D-5L问卷的提出
EQ-5D-3L相比其它的健康量表虽然存在一定的优势,但也有很严重的天花板效应(ceiling effect)[2]。所以,我们应尽量避免设计上的极端反应,增加每个维度水平上的量程分布,使得EQ-5D能够更可靠地区别对待不同层次的健康。根据此原理,EuroQol 的研究人员在EQ-5D-3L问卷的基础上设计了EQ-5D-5L问卷。
同EQ-5D-3L一样,EQ-5D-5L也是由问卷和效用值换算表两部分组成。不同的是EQ-5D-5L每个维度又包含5个水平:没有任何困难、有轻微困难、有中等困难、有严重困难、有极其严重困难。所以它可测量3 125种可能的健康状况组合。实质上,EQ-5D-5L是在EQ-5D-3L的基础上每个维度再增加2个水平,这样就能够很好地提高它的灵敏度并降低EQ-5D-3L所带来的天花板效应。
1.3 EQ-5D-3L与EQ-5D-5L的比较
EQ-5D-3L与EQ-5D-5L都有5个维度,都有同样的EQ-VAS视觉刻度尺,而且EQ-5D-5L每个维度的1、3、5水平与EQ-5D-3L的1、2、3水平基本类似,但并不完全相同。例如,在EQ-5D-5L中每个维度的3水平上都被改成了“有中等困难”。还有,EQ-5D-3L在行动能力这个维度的3水平上是“我卧病在床”,而EQ-5D-5L在这个维度上的5水平则是“我无法行走”。另外,EQ-5D-5L在每个维度增加的2水平上表述为“轻微困难”,在4水平上则表述为“严重困难”。在测量健康状况的组合中,EQ-5D-3L可以测量243种健康状态,而EQ-5D-5L可以囊括3 125种健康状况组合。
另外,使用数据库检索文献发现,使用EQ-5D来衡量的主要研究对象是患病人群,研究对象为健康人群的文献数量很少,而国内使用最新的EQ-5D-5L版本来衡量健康状况的研究更是没有涉及。但是,据文献研究显示,国外在使用EQ-5D-5L问卷测量健康人群或者患病人群的调研已普及开来。因此,为了推广EQ-5D新版本在国内的使用,本文根据调研数据率先分析论证了EQ-5D-3L和EQ-5D-5L的关系以及EQ-5D-5L所拥有的优越性,从而能够更好地促进EQ-5D-5L在国内的应用,提高量表区分不同健康水平的能力。
2 方法
2.1 数据
本次调研的目的是为了验证EQ-5D-5L较之EQ-5D-3L的优越性,以提高其在国内的使用,从而更好地区分不同的健康水平,改善中国居民的健康状况。研究者设计了针对本次调研的开放性实验问卷,并对324名受访者进行问卷调查,每名受访者首先回答一些自身基本情况的问题和EQ-5D-3L问卷,半小时之后填写EQ-5D-5L问卷。2.2 纳入与排除标准
纳入标准:①神志清醒、能清楚表达自己意见者。②对调查内容知情,同意配合者。排除标准:①丧失视力的患者。②神志不清、痴呆、各种精神病患者及不愿意合作者。
2.3 研究方法
根据调研数据的采集,采用Excel数据库进行数据录入,SPSS 18.0统计分析,描述EQ-VAS得分、EQ-5D健康维度分布、EQ-5D指数得分。利用EQ-5D指数得分可以对健康状况进行衡量,计算Shannon指数和天花板效应评价两个版本量表的信息性,根据EQ-5D-3L和EQ-5D-5L在各水平的重新分布来确定不同版本性能的差异,从而验证EQ-5D-5L比EQ-5D-3L能够更好地区分不同的健康水平。
2.3.1 EQ-5D指数的计算
1) EQ-5D-3L指数的计算。本次研究需要用到健康效用值。测量健康效用值有两种方法,包括直接测量法和间接测量法。直接测量法是通过直观的方法,直接从受试者得到其健康效用值;间接测量法是通过让受试者填写问卷,从受试者对各问题的选择来得到其所对应的健康效用值。本次研究的健康效用值是通过相应人群的效用值转换表由EQ-5D问卷中对5个问题的选择情况得到的。但是,目前还没有适合中国人群的效用值换算表,本次研究使用了世界公认的英国效用值换算表来获得EQ-5D-3L指数得分。但是,经过10多年的时间,总体人群对健康的偏好可能发生了改变,所以可能与当前人群对生存质量的评价有些偏差。
2) EQ-5D-5L指数的计算。国际药物经济学与结果研究协会第17届国际会议于2012年6月2日在美国举行,会议中探讨了EQ-5D-5L的使用情况。根据会议的研究结果,可以依据4种模型计算得出EQ-5D-5L价值集,从而计算指数值,分别为线性回归模型、非参数统计模型、logistic回归模型、项目反应理论。根据之前的调查研究,利用非参数统计模型、logistic回归模型这两种方法能够更好地降低EQ-5D-5L的天花板效应,另外考虑到简便性的原因,研究人员最终选择了非参数统计模型来计算EQ-5D-5L指数值。EQ-5D-5L指数的计算主要是获得EQ-5D-3L和EQ-5D-5L之间的转移概率矩阵,然后让EQ-5D-3L的指数乘以每个效用权重然后再加和,即可得到其指数值。通过EQ-5D官方网站,目前我们可以计算约10个国家EQ-5D-5L的指数值,本文EQ-5D-5L指数值同样使用评价较好的英国版本。
2.3.2 信息性
EQ-5D的信息性是指其辨别能力。天花板效应使得EQ-5D-3L问卷在两个极端水平上的选择数量增多,使其辨别力下降,而通过增加EQ-5D-3L的各维度水平的数量可以直接降低天花板效应。EQ-5D的信息性可以用Shannon指数(H’)和Shannon均匀度指数(J’)来评估。
根据其计算公式可知,H’max在EQ-5D-3L问卷中最大值为1.58,而在
EQ-5D-5L问卷中最大值为2.32。所以H’max值的增加代表着问卷各维度水平数量的增加,其辨别能力也相应地增加。
3 分析与结果
3.1 受访者特征
表1描述了纳入本次研究的受访者的社会人口学变量。研究对象中男、女比例相当。接受调查的居民的平均年龄为43.62岁,方差为268.762。本次调查汉族占大多数,婚姻状况为已婚并共同生活的占67.6%,受教育程度为受中等教育的人数较多。从业状况中,正式员工(128人,占39.5%)、离退休(69人,21.3%)、学生(55人,17.0%)。
3.2 EQ-5D-3L和EQ-5D-5L的分布情况
在表2中,EQ-5D-3L在自我照顾能力这个维度上表现得最好,没有一个居民在自我照顾上存在问题,在行动能力、日常活动能力两个维度上也仅有较小比例的居民存在着问题(分别为4.3%和2.8%),但是,在疼痛或不舒服、焦虑或抑郁两个维度上有较多的居民存在问题(分别为21.3%和13%)。在EQ-5D-5L问卷中,研究对象在健康五维度方面存在问题的比例高低依次为:疼痛或不舒服(36.7%)、焦虑或抑郁(25%)、行动能力(5.2%)、日常活动能力(3.4%)、自己照顾自己能力(0.6%)。
研究分析可知,EQ-5D-3L问卷中所有的问题EQ-5D-5L都有涉及(3L-5L 可以记作1=1,2=3,3=5)。如果受试者在没有问题和有中度问题或者有中度问题和有非常严重的问题上没有分歧,那么我们可以说EQ-5D-3L和EQ-5D-5L展现出来的结果是一样的。但是,也存在一些受试者觉得自己的健康状况处于EQ-5D-3L问卷中的1水平和2水平或者是2水平和3水平之间,但是又不知道该怎样选择。这时候EQ-5D-3L就存在了一定的缺陷,问卷本身的测量健康状况的灵敏度也就降低了。
3.3 不一致性
受试者在回答两个版本的EQ-5D时,具有重新分配的结果。重新分配是同一个受试者在回答EQ-5D-5L问卷和EQ-5D-3L问卷时会存在着细微的差异,这种差异也可能有着根本的不一致,所谓的不一致性是指在同一维度上不同水平之间存在着根本性的差异。例如:在回答EQ-5D-3L问卷的某一维度时,回答的是1水平,而在回答EQ-5D-5L问卷时回答的是3、4水平或者5水平,这种情况就称之为不一致性。等同于EQ-5D-3L的1水平与EQ-5D-5L的1、2水平相对应,2水平与2、3、4水平相对应,3水平与4、5水平相对应。表3展现了本研究在两个版本不同水平上受试者回答不一致的情况。
本研究数据显示,受试者关于两版本回答的平均不一致率为0.8%。相比其他国家,韩国研究人员关于癌症病人的EQ-5D-3L和EQ-5D-5L对比结果显示平
均不一致率为3.5%[3];美国癌症病人的平均不一致率为4.3%[2];波兰健康人群的平均不一致率为3.0%[4]。本研究平均不一致率较低的原因可能是前后两次量表测量间隔时间较短或受试人群都是健康人群的缘故。3.4 信息性
通过表4关于两个版本在“没有任何问题”水平上的比例我们可以发现,在行动能力、自己照顾自己能力、日常活动能力这3个维度上,EQ-5D-3L和EQ-5D-5L在第一水平上基本上没有差异,而在疼痛或不舒服和焦虑或抑郁这两个维度上(分别为78.7%对63.3%、87.0%对75.0%),EQ-5D-3L和EQ-5D-5L存在着明显的差异,这说明EQ-5D-3L的天花板效应在这两个维度上明显高于EQ-5D-5L。在全部健康(11111)状态下,EQ-5D-5L的全部健康情况较EQ-5D-3L有明显降低,这也说明EQ-5D-5L有着更好的区分能力。
在上文中,我们提到EQ-5D的信息性可以用Shannon指数(H’)和Shannon均匀度指数(J’)来评估。表5展现了EQ-5D-3L和EQ-5D-5L的信息测试结果。EQ-5D-5L在所有水平上的Shannon指数全部大于EQ-5D-3L,这说明EQ-5D-5L具有更好的信息性。EQ-5D-5L的信息效用值(J’)在“自己照顾自己能力”以及“焦虑或抑郁”这两个水平稍有提高,然而在其它水平上都有减小或者持平。
3.5 有效性
本次研究得到居民的EQ-VAS的平均得分为86.41。表6表明了EQ-5D指数与年龄和VAS得分的关系,随着年龄的增加,EQ-5D-3L和EQ-5D-5L指数有所下降,这表明伴随着年龄的增大,人群的健康相关生存质量也相应地下降。但是36~45岁的EQ-5D-3L和EQ-5D-5L指数大于26~35岁的,这说明36~45岁人群的健康状况要好于26~35岁;相应地,随着EQ-VAS得分的增加,EQ-5D-3L和EQ-5D-5L指数也在相应地增大,说明两者均具有很好的相关关系。
4 讨论
通过上述关于健康人群EQ-5D-3L和EQ-5D-5L问卷的比较,EQ-5D-3L问卷的各水平大致分给相应的EQ-5D-5L的各水平,EQ-5D的两个版本的平均不一致率为0.8%。与EQ-5D-3L相比,EQ-5D-5L受试者在回答“没有任何困难”这个水平上数量有所下降,也就是EQ-5D-5L的灵敏度有所提高。在“疼痛或不舒服”和“焦虑或抑郁”这两个维度上EQ-5D-3L存在很高的天花板效应,而在其它的维度上健康人群EQ-5D的两个版本则表现出了相似的天花板效应。相比EQ-5D-3L的70.1%的完全健康状态,EQ-5D-5L下降到52.8%,EQ-5D-5L的全部健康(11111)情况有明显降低,这说明EQ-5D-5L的辨别能力高于EQ-5D-3L,但是,他们的信息有效性基本上是一致的。而且通过计算EQ-5D指数与EQ-VAS的关系,能够证明EQ-5D-5L和EQ-VAS有很好的相关性。
毫无疑问,EQ-5D-5L的Shannon指数高于EQ-5D-3L。EQ-5D-5L的Shannon指数的增大说明其能够更好地描述不同的健康状况。EQ-5D-5L的天花板效应依然存在,但是与EQ-5D-3L相比有所降低。本次研究是国内第一次使用EQ-5D-5L量表来衡量用户的健康状况,相比以前的EQ-5D-3L,EQ-5D-5L具有更合理的
健康区分能力。但是本文也存在着一些不足之处,比如受试人群都是健康人群;受试例数比较少;受试者的受教育程度、从业状况存在一定的差异等。而且EQ-5D-5L依然存在一定的天花板效应,还需要我们继续进行改善。
5 结语
EQ-5D-5L的使用提高了不同健康水平的区分能力,能更好地跟踪调查用户的健康变化。与EQ-5D-3L相比,EQ-5D-5L有更好的辨别能力和较低的天花板效应。此外,EQ-5D-5L还表现出了良好的有效性。因此,综合本文以上信息不难发现,EQ-5D-5L比EQ-5D-3L更有优越性,值得我们国内工作者借鉴使用。
参考文献
[1] 李明晖, 罗南. 欧洲五维健康量表(EQ-5D)中文版应用介绍[J]. 中国药物经济学, 2009, 4(1): 49-57.
[2] Pickard AS, De Leon MC, Kohlmann T, et al. Psychometric comparison of the standard EQ-5D to a 5 level version in cancer patients[J]. Med Care, 2007, 45(3): 259-263.
[3] Kim SH, Kim HJ, Lee SI, et al. Comparing the psychometric properties of the EQ-5D-3L and EQ-5D-5L in cancer patients in Korea[J]. Qual Life Res, 2012, 21(6): 1065-1073.
[4] Herdman M, Gudex C, Lloyd A, et al. Development and preliminary testing of the new five-level version of EQ-5D-5L[J]. Qual Life Res, 2011, 20(10): 1727-1736.
(收稿日期:2012-12-06)
因篇幅问题不能全部显示,请点此查看更多更全内容