香香的工作日誌: 資料閱讀-評估的基本概念

評估的基本概念

評估
可以深入、客觀、全面地描述個案的臨床特質與問題
評估多方面之功能可協助治療計畫之擬定

對於目前臨床標準化評估工具使用之問題
思考→如何統整現有評估工具並且改善評估工具之精準度與效率!

心理計量
1.評估個人心理層面變項之科學
2.用數學的方式計量出欲評估變項之特質

健康相關評估工具之三大實用功能：
1.區辨功能─區辨不同群體間另一相關特質之差異(區辨效度，避免天花板或地板效應)

2.預測功能─預測個案未來的某些目標特質(預測效度)

3.療效評估功能─反應個案於功能上的重要改變

信度
評估工具重複評估一穩定特質時，可獲得相同結果的一致程度、穩定性，與隨機評估誤差之大小

(一)再測信度(test-retest reliability)：欲瞭解評估工具所得的評估結果是否穩定
在不同時間下重複使用同一評估工具於同一個案（欲評估之特質穩定），所獲得結果之一致程度
確保所偵測到的改變主要來自受測者本身的改變！

檢驗方式：以同一評估工具於不同時間點重複評估相同的受試者兩次，再以統計驗證前後兩次評估分數之一致性。

Kappa (κ)或weighted Kappa (κw)： 0.61至0.80為良好，0.81至1.00為理想。

驗證評估工具總分之再測信度則使用組內相關係數 (intraclass correlation coefficient, ICC)。ICC> 0.7可用於群體分數的比較（如實證研究中，比較實驗組與對照組之功能差異）；> 0.90可用於個別個案間分數的比較（如臨床中，比較甲個案與乙個案之功能差異）。

二次間隔時間的長短宜列入考量。

(二)評估者間信度或稱施測者間信度
不同評估者評估相同對象所得結果的一致性，用以檢驗工具的評估結果是否受到「評估者」或「施測者」的主觀判斷影響

檢驗評估工具個別項目之評估者間信度可依類別變相與順序變相分別使用Kappa或Weighted Kappa[22, 23]。對於κ之解釋[23]：0.61至0.80為良好，0.81至1.00為理想。
驗證評估工具總分之評估者間信度則主要是使用ICC。
0.7為群體個案之最低可接受標準；0.90為個別個案之最低可接受標準

(三)內部一致性(internal consistency) 或稱內在一致性
指評估工具中，各單項題目所得分數間的相關性及與評估工具所有項目總分之相關性，內部一致性代表一評估工具所有項目之同質性。愈高，評估結果愈穩定（信度愈佳）。

對於連續尺度的資料，可以Cronbach's alpha檢驗評估工具的內部一致性；
對於非連續尺度的資料，則以Kuder-Richardson 20 statistic檢驗。
數值解釋：> 0.7為良好，可用於群體分數的比較；> 0.9為優，可用於個別個案間分數的比較

(四)評估誤差
"隨機誤差"則是由隨機、偶然的原因造成的，例如評估時情境的微小改變、評估人員評估每位個案時的微小差別等，這些不可避免的原因造成評估結果在一定範圍內波動，引起隨機誤差，有時大，有時小，有時正，有時負。

1. 評估標準誤(standard error of measurement, SEM)SEM為信度指標其中一種，SEM代表個別評估結果之不穩定程度或隨機評估誤差大小。SEM數值即用來解釋個別分數的評估誤差的大小。
2. 最小可偵測之變化值(minimal detectable change, MDC)
臨床上，最小可偵測之變化值可用以判斷各別個案改變的分數是否超過評估誤差，因此MDC之臨床意義重大

效度
效度指評估結果的正確性，也就是代表評估工具是否能真實／正確測量到欲評估的建構或特質
(一)內容效度
指評估工具內容的適當性，包含評估工具項目的廣度含括欲評估之特質以及評估工具內容與欲評估特質/對象之相關性。
藉由專家對於評估工具整體與個別項目之同意百分比作為判斷良窳的統計指標

(二)表面效度
表面效度是指評估工具項目是否「明顯地」、「無疑義地」評量欲評估之特質
是主觀判斷（專家或病人）評估工具是否量測到欲評估之特質，但著重於評估工具建構完成之後的檢驗。
無須顧慮理論依據，可以直覺為主。

(三)效標關聯效度
指評估工具的評估結果與效標(criterion)之評估分數相關聯的程度。

(1) 同時效度
是指欲驗證之評估工具的評估結果與目前公認為黃金標準(gold standard)的效標(criterion)評估結果之關聯程度
驗證方法以相關係數為主。
Pearson’s γ或Spearman’s ρ：≧ 0.75為良好同時效度之標準；0.40至0.74為中等；≦ 0.40為差。

(2) 預測效度
是指評估工具的測量結果可預測個案未來的健康狀態（或相關特質，亦稱為外在效標）之程度
研究設計為追蹤研究，資料分析則以相關係數為主。預測效度愈高之評估工具，測量結果愈能有效預測外在效標。

(四)建構效度
是指評估工具能評估到理論上的概念、結構或特質的程度。
就是指評估結果的分數能夠依據理論而呈現擬測量之概念、結構或特質的程度。
目前醫學領域多以相關法、實驗法、因素分析(factor analysis)、羅序 (Rasch) 分析驗證理論上的「建構」是否成立。

(1) 收斂效度
評估工具欲評估特質與理論上相關特質之關連。
研究設計為同時評估，資料分析方式則以相關係數驗證。
相關係數高低之判定標準，原則以二變項理論上之關聯程度為依據。相關係數≧ 0.75為良好; 0.4至0.74為佳; ≦ 0.40為差[41]。然而，如果相關係數超過0.90，也須考量二評估工具是否評量同樣的建構。

(2) 發散效度
是驗證評估工具欲評估特質與不相關特質之不關聯程度
研究設計為同時評估，資料分析通常則以相關係數分析。發散效度相關係數之判定標準：相關係數< 0.3，表示二評估工具評估到的二種特質不相關，發散效度良好。亦即發散效度的驗證，可排除評估工具測量到不應測量到的特質。

(3) 區辨效度
是指評估工具之評估結果可根據其背景理論模式區辨不同屬性病人（或健康對照組）之程度(between group difference)。
研究設計為同時評估，資料分析方式則多以t檢定、變異數分析(analysis of variance, ANOVA)，與迴歸分析進行驗證。

反應性
是指評估工具可偵測個案本身或群體欲評估的目標特質些微變化之能力。
研究設計多為追蹤研究並且重複評估，資料分析則以效應值(effect size)為主。
1.配對t檢定：t值大於1.96，代表介入前測與後測具顯著差異，具反應性。
2.效應值(effect size, ES)：ES大於0.2，即具有反應性；ES愈大，反應性愈好。
ES = 0.2代表小的效應；ES = 0.5：中度效應；ES = 0.8：高度效應。
3.標準化反應平均值(standardized response mean; SRM)：標準同ES。

最小重要差異值
重要臨床差異值(clinical important difference, CID)是指反應個案功能改變或臨床病程的分數變化值，其中最小的CID即為最小重要臨床差異值(minimal clinical important difference, MCID)。

在某一範疇（評估工具）中，個案感受到有益的最小分數（評估分數）變化值。

個案在評估工具分數上的改變量必須超過MID才具備臨床重要意義。
MID 亦可透過「必須治療數」(number needed to treat, NNT)，協助解釋臨床試驗所得之治療效果，以利解讀療效。NNT的定義為臨床試驗中，採用特定治療模式，扣除對照組之療效後，需治療多少個案，可獲得1位個案具有重要意義（超過MID）療效的發生

P17,18,19表格！！！

香香的工作日誌

2010年7月22日星期四

資料閱讀-評估的基本概念

1 則留言:

2010年7月22日 星期四

資料閱讀-評估的基本概念

1 則留言:

2010年7月22日星期四