파킨슨병 환자에서 한국어판 Dizziness Handicap Inventory의 라쉬 분석에 의한 임상측정 특성 평가
Rasch Analysis of the Clinimetric Properties of the Korean Dizziness Handicap Inventory in Patients with Parkinson Disease
Article information
Trans Abstract
Objectives
The Korean Dizziness Handicap Inventory (KDHI), which includes 25 patient-reported items, has been used to assess self-reported dizziness in Korean patients with Parkinson disease (PD). Nevertheless, few studies have examined the KDHI based on item-response theory within this population. The aim of our study was to address the feasibility and clinimetric properties of the KDHI instrument using polytomous Rasch measurement analysis.
Methods
The unidimensionality, scale targeting, separation reliability, item difficulty (severity), and response category utility of the KDHI were statistically assessed based on the Andrich rating scale model. The utilities of the orderedresponse categories of the 3-point Likert scale were analyzed with reference to the probability curves of the response categories. The separation reliability of the KDHI was assessed based on person separation reliability (PSR), which is used to measure the capacity to discriminate among groups of patients with different levels of balance deficits.
Results
Principal component analyses of residuals revealed that the KDHI had unidimensionality. The KHDI had satisfactory PSR and there were no disordered thresholds in the 3-point rating scale. However, the KDHI showed several issues for inappropriate scale targeting and misfit items (items 1 and 2) for Rasch model.
Conclusions
The KDHI provide unidimensional measures of imbalance symptoms in patients with PD with adequate separation reliability. There was no statistical evidence of disorder in polytomous rating scales. The Rasch analysis results suggest that the KDHI is a reliable scale for measuring the imbalance symptoms in PD patients, and identified parts for possible amendments in order to further improve the linear metric scale.
서 론
파킨슨병(Parkinson disease)은 알츠하이머병에 이어서 두번째로 많이 발생하는 퇴행성뇌신경질환(degenerative neurological disease)이다[1-3]. 파킨슨병 환자에서의 어지럼(dizziness)은 서동 및 자세불안정의 운동 증상(motor symptom)뿐만 아니라 자율신경장애, 전정기능이상, 우울-불안장애 등의 비운동 증상(nonmotor symptom)에 의하여도 발생할 수 있으며 연구에 따라 파킨슨병 환자의 68%까지 보고되고 있다[4-7]. 퇴행성뇌신경질환 환자의 어지럼 증상은 환자의 기능 회복을 저해할 뿐만 아니라 건강 관련 삶의 질(health related quality of life)을 저하하게 되므로 개입 및 치료의 주요한 목표라고 할 수 있으며, 이에 파킨슨병 환자의 어지럼 증상 정도를 측정하는 임상평정척도(clinical rating scale)의 신뢰도(reliability)와 타당도(validity) 확보가 요구되고 있다[1,8-10].
라쉬 모형 분석(Rasch model analysis)은 현대적 검사이론(modern test theory)으로 칭해지는 문항반응이론(item response theory)에 기반한 모형 중의 하나로서[11,12], 기존의 고전적 검사이론(classical test theory)에서 임상평정척도의 난이도와 환자의 증상 정도 산출이 상호 의존적이며, 척도의 등간성이 전제되지 않고, 다분범주 기능(polytomous category function)에 대한 분석이 제한적이었던 한계점을 보완할 수 있어 최근 실제 임상 연구에 폭넓게 응용되고 있다[13-15]. 현재까지 어지럼, 균형 및 전정 장애와 관련한 임상척도 중에서는 Dizziness Handicap Inventory (DHI) [16]를 포함하여 Vision-Related Dizziness Questionnaire [17], Vestibular Activities and Participation Questionnaire [18], Vestibular Screening Tool [19], Berg Balance Scale [20] 등에 대해 라쉬 분석을 포함한 문항반응이론에 따른 임상평정 척도의 타당도 및 신뢰도 분석이 수행된 바 있다.
DHI는 1990년 Jacobson과 Newman [21]에 의해 어지럼에 의한 환자 본인이 인식하는 일상생활에의 영향과 제한 정도를 측정하기 위해 개발된 총 25문항의 자기평가식 평정척도이다. DHI는 각각 어지럼 증상으로 인한 기능적(functional) 특성, 정서적(emotional) 특성, 신체적(physical) 특성의 하위척도(subscale)로 이뤄져 있으며 각 문항별로 3점 리커트 척도를 사용하여 환자 본인이 기입하여 환자보고 성과(patient-reported outcome)를 측정한다. DHI는 2004년 Han 등[22]이 교차-문화적 번역 절차(cross-cultural translation procedure) 및 표준화를 거쳐 한국어판인 Korean Dizziness Handicap Inventory (KDHI)를 개발하였으며, 같은 연구에서 시행한 KDHI의 고전적 검사 이론에 따른 분석에서 신뢰도 및 타당도가 확인되었다. 그러나, 현재까지 파킨슨병 환자에서 KDHI의 임상측정학적 특성(clinimetric attribute)에 대해 문항반응이론에 기반한 분석은 아직 보고가 없다[10,16,21,22].
이 연구는 파킨슨병 환자를 대상으로 하여 다양한 파킨슨병의 임상 양상 중 특히 어지럼 증상을 평가하는 KDHI에 대해 고전적 검사 이론에 기반한 내적 신뢰도 및 수렴 타당성 분석을 시행하는 동시에 문항반응이론에 기초한 라쉬 분석을 시행하여 분리 신뢰도(separation reliability), 단일차원성(unidimensionality) 분석, 각 KDHI 문항별 라쉬 모형 적합도(Rasch model fit), 항목 극성(item polarity) 및 3점 리커트 척도에 대한 응답범주 기능(response category function)의 적절성을 평가하여 평정척도의 임상 측정 특성을 살펴보고자 하였다.
대상 및 방법
1. 대상
이 전향적 연구는 2016년 10월부터 2018년 6월까지 본원 신경과에 내원하여 영국 파킨슨병학회 뇌은행 진단 기준(UK Parkinson's Diseases Society Brain Bank Criteria)에 따라 특발성 파킨슨병(idiopathic Parkinson disease)으로 진단받고 치료받은 환자를 대상으로 하였다. 조사 대상이 되는 모든 환자들로부터 이 연구에 대한 고지된 동의(informed consent)를 진행하였으며 연구 내용을 이해하고 연구 참여에 자발적으로 동의한 환자를 대상으로 하였다. 모집 시점에서 급성으로 말초신경계의 이상에 의한 어지럼이 동반되었거나 중추성현훈이 있는 경우는 연구 대상에서 제외하였다.
2. 방법
연구 대상 환자의 파킨슨병 운동 증상의 진행정도 및 수준은 통합형 파킨슨병 평가척도(Unified Parkinson's Disease Rating Scale; UPDRS) 및 호엔야 척도(Hoehn-Yahr stage; H-Y stage)를 사용하여 평가하였고 환자의 전반적인 인지 기능은 한국형 간이정신상태검사(Korean Mini-Mental State Examination)를 통해 측정하였다. 파킨슨병 환자의 어지럼 증상에 대해서는 우선 환자에게 현재 경험하는 주관적 어지럼 증상의 유무(existence of subjective dizziness symptom)를 확인하였고, 이어서 총 25문항으로 구성된 한국판 어지럼척도(the Korean version of Dizziness Handicap Inventory)를 사용하여 체계적인 평가를 시행하였다[22]. 전술한 바와 같이, KDHI는 각각 기능적 특성(10문항), 정서적 특성(9문항), 신체적 특성(6문항) 하위 영역으로 구분된 총 25문항으로 구성되고 각 문항마다 ‘없다(no)’는 0점, ‘가끔(sometimes)’은 2점, ‘항상(yes)’은 4점으로 채점된다. 따라서 KDHI의 점수의 범위는 따라서 최저 0점에서 최고 100점까지 측정되며 점수가 높을수록 검사 대상자의 어지럼으로 인한 일상 생활의 제한 정도가 높은 것으로 간주하였다.
수집된 자료에 대하여 우선 IBM SPSS version 18.0 (IBM corporation, Armonk, NY, USA) 통계 프로그램을 사용하여 환자의 인구학적 특성의 기술적 통계 분석을 수행하였고, 고전적 검사 이론에 따른 신뢰도 및 타당도 분석을 진행하였다. 내적 신뢰도(internal reliability)의 측정을 위해서 전체 KDHI 척도에 대하여 크론바흐 α 계수(Cronbach α coefficient)를 구하고, 각각의 문항별로 문항-전체 상관계수(item-total correlation)를 산출하였다. 크론바흐 α 계수의 경우 0.70 이상, 문항-전체 상관의 경우 0.40 이상일 경우에 임상평정척도의 내적 신뢰도를 합당하다고 판단할 수 있다[22,23]. 수렴 타당도(convergent validity)의 측정을 위해서는 환자의 주관적 어지럼 증상의 유무에 따라 KDHI 수준의 차이가 있는지 Mann-Whitney 검정을 통하여 확인하였으며 통계학적 유의 수준은 p<0.05일 때 유의미한 것으로 판단하였다.
다음으로 문항반응이론에 따른 KDHI 척도의 임상 측정 특성 분석을 위해 Winsteps version 4.0.1 (Winsteps Inc., Chicago, IL, USA) 통계 프로그램을 사용하여 라쉬 분석을 실시하였다[10,24]. 우선 각 환자의 KDHI 자료에 대해 잔차 주성분 분석(principal component analysis of residual)에 따라 단일차원성 가정이 성립하는지 확인하였는데, 잔차 주성분 분석 결과 라쉬 측정으로 설명되는 분산(variance explained by Rasch measure)이 50% 이상이고, 라쉬 요인을 제외한 첫 번째 또는 두 번째 잔차 분산의 고유값(eigenvalue)이 3.0 미만일 경우에 평정척도의 단일차원성을 지지하는 것으로 판정할 수 있다[15,24]. 대상자 분리 신뢰도(person separation reliability) 및 대상자 분리 지수(person separation index)를 통해 내적 신뢰도(internal reliability)를 평가하였는데, 대상자 분리 신뢰도가 0.8 이상이면서 대상자 분리 지수가 2.0 이상일 경우 수용 가능(acceptable)한 것으로 판단하였다[10,13]. 각 문항들의 라쉬 모형 적합도(Rasch model fit)는 각각의 KDHI 문항 별로 내적합지수(infit) 및 외적합지수(outfit)의 평균자승잔차(mean square residual)를 산출하여, 평균자승잔차가 0.5 미만이거나 1.5를 초과할 경우 해당 문항이 라쉬 모형에 적합하지 않은 것으로 간주하였다[13,14]. 문항 극성(item polarity)의 경우 점-측정 상관계수(point-measure correlation)가 0.3 이상일 경우 적합한 것으로 보았다. 문항 난이도 평가를 위하여 환자-문항 분포도(patient-item distribution map; Wright map)를 도시하였으며, 환자-문항 로짓 평균(mean logit)의 차이로 평정척도 표적(scale targeting)을 평가하였다[11]. KDHI의 3점 리커트 척도에 대한 다분 응답범주의 기능은 앤드리치의 평정척도 모형(Andrich rating scale model)에 따른 응답범주 확률곡선(probability curves of the response categories)에서 평균 측정치가 단조적으로 증가하는지 확인하고, 범주별 응답 환자 수(patient count), 범주별 평균 측정치(average measure), 단계별 조정치(step calibration) 및 외적합 평균자승잔차를 산출하였다. 각 지표별로 범주별 응답 환자 수가 10명 이상이며, 범주별 평균 측정치 및 단계별 조정치가 위계적으로 증가하고 외적합 평균자승잔차가 2.0을 넘지 않을 때 각 응답범주 기능이 적합한 것으로 판단할 수 있다[24,25].
결 과
선정 기준 및 제외 기준에 적합한 총 62명의 파킨슨병 환자(남자 36명, 여성 26명)가 이 연구의 대상이 되었으며, 대상자 중에서 주관적 어지럼을 보고한 환자는 30명(48.4%)이었다. 환자들의 평균연령은 66.10±8.34세(평균±표준편차)였으며 파킨슨병의 운동 증상 수준을 보았을 때 호엔야 척도가 1.97±0.72, UPDRS 운동 증상 부문 점수는 18.94±8.41이었다. 전체 대상 환자군의 KDHI 총점의 평균은 11.94±13.83이었고, 세부 부문 점수의 평균은 각각 기능적 특성이 5.15±6.16, 정서적 특성이 4.27±5.05, 신체적 특성은 2.52±3.37이었다.
우선 고전적 검사 이론에 따른 내적 신뢰도 분석에 따르면, 크론바흐 α 계수는 0.973로 0.70의 기준치에 도달하였고, 문항-전체 상관은 각 25개 문항 별로 0.605–0.875의 범위로 모든 문항 들에서 경계치인 0.40을 초과하였다(Table 1). 현재 경험하는 주관적 어지럼 증상의 유무와 관련하여 척도의 수렴타당성을 보았을 때, 주관적인 어지럼 증상이 있을 경우에 Mann-Whitney 검정에 따르면 KDHI 점수가 통계적으로 유의하게 높았다(Mann-Whitney U=103.5, p<0.000).
다음으로 문항반응이론에 따라 KDHI를 평가하였다. KDHI의 25문항 전체를 포함하여 단일차원성 평가를 위한 잔차 주성분 분석을 수행하였을 때 라쉬 측정에 의해 설명되는 분산은 55.5%였으며, 라쉬 요소를 제외한 첫 번째 및 두 번째 잔차 분산의 고유값이 각각 2.95 및 2.80이어서 단일차원성을 지지하는 것으로 간주할 수 있었다. 이에 따라, 총 25문항의 KDHI 전체에 대한 라쉬 분석을 진행하였으며 우선 각 문항의 점-측정 상관계수 범위는 0.63–0.79로 모두 0.30 이상으로 만족하였다(Table 2). 각 문항별로 내적합 및 외적합 평균자승잔차가 0.5 미만이거나 1.5를 초과할 경우 해당 문항이 라쉬 모형에 통계적으로 적합하지 않은 것으로 판단할 때, 모든 문항의 내적합 평균자승잔차는 허용치 이내였으나 외적합의 경우 1번 문항 "위를 쳐다보면 증상이 심해집니까" 및 2번 문항 "증상 때문에 좌절감을 느낍니까"가 부적합에 해당하였다(Table 2). KDHI의 분리 신뢰도 검증에서는 대상자 분리 신뢰도는 0.82, 분리 지수는 2.17로 대체로 우수한 것으로 판단되었다. 환자-문항 분포도상 문항 난이도는 비교적 고르게 분포하였으나, 대상자 로짓 평균(mean logit for person)을 0으로 두었을 때 문항 로짓 평균(mean logit for item)이 –2.34±2.52로 대상 환자군의 어지럼 증상 정도보다 문항의 난이도가 대체로 높게 분포되어 있었다(Fig. 1). 문항별로 보면 13번 문항 "잠자리에서 돌아 누울 때 증상이 심해집니까"가 가장 어려운 문항으로 나타났으며, 반면에 23번 문항 "증상 때문에 우울합니까"는 가장 쉬운 문항이었다. 다분 응답범주의 기능 평가를 위해 앤드리치의 평정척도 모형에 따라 평가하였을 때, 평균 측정치가 단조적으로 증가하였고 범주별 평균 측정치 및 단계별 조정치가 위계적으로 증가하였다. 범주별 응답 환자 수가 10명 이상이며 외적합 평균자승잔차가 2.0가 넘지 않았고, 응답범주 확률곡선을 도시하였을 경우 범주 간의 교차점이 대체로 일정한 간격을 이루고 3점 척도의 각 응답범주가 다른 범주들과 잘 구분되고 있음을 확인할 수 있었다(Table 3, Fig. 2).
고 찰
이 연구에서는 파킨슨병의 다양한 임상 증상 중 특히 어지럼에 관한 KDHI 임상평정척도에 대해 고전적 검사 이론 및 문항반응이론에 의한 신뢰도 및 타당도를 평가하였으며, KDHI의 경우 이 연구에서 최초로 파킨슨병 환자군에 대하여 라쉬 분석에 기반하여 평정척도의 측정학적 특성을 보고하였다는 데 의미가 있다[16,21].
우선 고전적 검사 이론에 따른 신뢰성 및 타당성 평가에서 크론바흐 α 계수 및 문항-전체 상관계수에서 모두 기준치를 초과하는 결과를 보여 KDHI의 내적 신뢰도가 우수함을 검증할 수 있었다. 또한 환자의 주관적 어지럼에 대한 보고와 KHDI 간의 통계적 유의성을 확인하여 수렴타당성이 인정되었다. 이는 DHI가 타당도와 신뢰도를 가진 평정척도임을 보여준 기존의 고전적 검사이론에 기반한 연구와 일치하는 것으로[21,22,26], 특히 이 연구에서 크론바흐 α 계수가 0.973으로 측정되었는데 이는 기존 KDHI 표준화 연구에서 보고한 0.951과 유사한 높은 수준이었다[22].
문항반응이론에 따른 라쉬 분석에서는 연구 대상 환자군에 대해 단일 차원성이 유지되고 분리 신뢰도 및 문항 극성이 적절하여 파킨슨 환자의 어지럼 증상을 측정하는데 적합함을 검증하였다. 이는 상기 고전적 검사 이론에 따른 신뢰도 및 타당도 분석 결과와 대체로 일관된 결과라고 할 수 있으며, 특히 DHI의 하위척도들을 분리하여 이용하기 보다는 25개 문항 전체를 사용할 것을 권고한 기존 인자 분석 연구와 일치한 결과이다[26].
반면에 라쉬 분석 결과들 중 각 문항별 모형 적합도 및 환자-문항 분포도에서는 라쉬 모형에 부적합한 KDHI 문항들 및 부적절한 문항 표적의 문제가 확인되었다. 특히 1번 문항 "위를 쳐다보면 증상이 심해집니까" 및 2번 문항 "증상 때문에 좌절감을 느낍니까"의 경우에는, 기존 연구에서도 타 KDHI 문항 들과 비교하여 낮은 0.5 미만의 제곱다중상관분석 R2 결과를 보여준 바 있어 추후 해당 문항의 보완이 요청될 것으로 사료된다[22]. 또한 KDHI의 서열 척도를 로짓 기반 등간 척도로 변환시켜 도시한 환자-문항 분포도에 따르면 환자의 어지럼 수준에 비해 문항의 난이도가 대체로 높아서 파킨슨병 환자에서 낮은 정도의 불안을 측정하기 위한 문항이 결여되어 있으며, 중등도 이상의 어지럼을 보이는 환자들에서 좀 더 적합할 것으로 판단하였다[10,13]. 이는 예컨대 파킨슨병 환자의 어지럼 관련 임상시험을 시행할 경우 KDHI는 경한 정도의 호전 여부를 적절히 측정하지 못할 수도 있다는 점을 시사하는데, 원래의 DHI 척도가 대체로 어지럼이 심한 임상 환자군을 대상으로 하여 개발되었음에 따른 제한으로 추정된다[16,21]. 따라서 어지럼 증상의 호소가 비교적 높지 않은 파킨슨병 환자에서는 낮은 정도의 어지럼 증상에 반응할 수 있는 문항들의 추가 개발 및 채택을 고려하여야 할 것으로 보인다[12,15].
기존 연구들에 따르면 파킨슨병 환자 등을 포함하여 인지 기능 저하를 동반되는 고령 환자에서 다분 응답범주 사용이 적합한지에 대해 여러 논의가 있어왔다[10,27]. 리커트 척도에 사용된 반응범주의 수가 많을수록 세분화된 정보의 수집이 가능하며 내재적인 차이를 판별할 수 있는 반면, 과다한 수의 범주는 환자의 피로 및 혼란을 초래할 수 있는데 피험자의 연령 또는 지적 수준에 따라서 평가자의 의도대로 리커트 척도의 각 선택 범주를 명확히 구분하지 못하거나 피험자가 특정 범주만 계속 선택하는 경우 등이 그것이다[28]. 고전적 검사 이론의 경우 반응범주의 빈도를 비교하는 이외에는 다분 반응범주의 기능에 대한 추가적인 정보가 제한되었다. 이와는 달리, 라쉬 분석은 경험적으로 결정된 응답범주의 단계가 실제로 설계 및 의도한 바와 같이 작동하는지 판단하는 데 유용한 통계적 정보들을 분석 제공할 수 있다는 장점이 있다[11,12,29]. 이 연구의 경우에서는 앤드리치의 평정척도 모형에 따라 KDHI의 다분범주 기능을 분석하였을 때 3점 리커트 척도의 각 반응 범주가 대체로 적합한 기능을 하고 있음을 확인할 수 있었다.
이번 연구의 한계점은 다음과 같다. 우선 문항 응답범주가 2개를 초과하는 다분 임상평정척도의 라쉬 분석에서 주로 사용되는 모형들은이 연구에서 채택한 앤드리치의 평정척도 모형 외에도 매스터즈의 부분점수 모형(Masters’ partial credit model)이 있으며, 각 모형들은 각자의 특장점이 있다[10,25]. 만약 평정척도가 양분 문항 및 다분 리커트척도 문항의 혼합으로 구성된 경우에는 매스터즈의 부분점수 모형이 적합할 수 있으나, KDHI와 같이 동일한 응답 범주로 평정척도 전체가 이뤄진 경우 앤드리치의 평정척도 모형을 이용할 수 있다. 다음으로 연구 대상 환자가 평균 호엔야 척도 1.97±0.72로 대체로 경한 파킨슨 운동 증상을 가진 환자에 한정되어 있다는 점이다. 이러한 부분은 자기기입 설문지 연구의 대상자 모집 특성에 기인하는 것으로 이 연구에서 환자-문항 분포도를 도시하였을 때 KDHI의 문항 난이도가 환자의 증상 수준보다 대체로 높았던 점은 이 연구의 대상군이 파킨슨 증상이 대체로 경한 환자군에 제한되었음에서 기인할 수 있으며, 향후 진행된 병기의 파킨슨병 환자에 대한 후속 분석이 요구되는 부분이라고 할 수 있다[2,3,7]. 다음으로 최근 연구들에 따르면 원래의 DHI 척도에 대비하여 10개 또는 13개 문항으로 이뤄진 단축형 DHI 척도(short-form of DHI)들이 제시된 바 있다[16,26]. 이 연구에서는 25개 문항 전체로 구성된 KDHI에 대해서만 연구를 수행하였으나 추후 연구들에서는 단축형 DHI 척도의 임상측정학적 특성에 대해 평가를 고려할 수 있겠다.
결 론
이번 연구에서는 단일 기관에서 모집한 파킨슨병 환자를 대상으로 문항반응이론에 기반하여 KDHI에 대해 단일차원성, 라쉬 모형 적합도, 분리 신뢰도, 문항 난이도, 다분반응범주 분석 등을 포함하는 라쉬 분석을 수행하였다. 이 연구는 파킨슨병 환자 대상으로 KDHI에 대해 최초로 시행된 문항반응이론 기반 분석으로서, 파킨슨병 환자에 대해 임상평정척도의 단일차원성을 확인하였고, 다분문항범주 기능 및 분리 신뢰도가 대체로 적절하나 문항 난이도 및 일부 문항에서 라쉬 모형 부적합이 있음을 확인할 수 있었다. 향후 KDHI 임상평정척도의 난이도의 검토 및 일부 문항들의 개선이 이뤄질 경우, 파킨슨병 환자의 어지럼 증상의 평가와 효과적인 중재에 도움이 될 것으로 기대한다.
Notes
저자들은 이 논문과 관련하여 이해관계의 충돌이 없음을 명시합니다.
Acknowledgements
This research was supported by Daiichi-Sankyo Korea Co.