Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
ความไวและความจำเพาะ
ความไวและความจำเพาะ เป็นค่าวัดทางสถิติที่ใช้ประเมินประสิทธิภาพของการทดสอบที่ให้ผลเป็นสองส่วน (เช่นเป็นบวกและลบ) โดย
- ความไว (อังกฤษ: sensitivity) คือสัดส่วนของผลบวกที่เป็นจริงสำหรับภาวะนั้น ๆ (เช่น สัดส่วนของการตรวจพบโรคในผู้ที่ป่วยจริง) มีไวพจน์เป็นคำอื่น ๆ รวมทั้ง อัตราผลบวกจริง (true positive rate), recall, probability of detection ซึ่งใช้ในสาขาต่าง ๆ
- ความจำเพาะ (อังกฤษ: specificity) คือสัดส่วนของผลลบที่เป็นจริงสำหรับภาวะนั้น ๆ (เช่น สัดส่วนของการตรวจไม่พบโรคในผู้ที่ไม่ป่วย) มีไวพจน์เป็นคำอื่น ๆ รวมทั้ง อัตราผลลบจริง (true negative rate)
ความไวจึงมีประโยชน์ในการวินิจฉัยแยกกันผลลบปลอม (false negative) เพราะว่าการทดสอบยิ่งไวเท่าไร โอกาสการได้ผลลบ (เช่น การพบว่าไม่มีโรค) ที่ไม่เป็นจริง (เช่น บุคคลจริง ๆ มีโรค) ก็น้อยลงเท่านั้น และดังนั้น ถ้าความไวอยู่ที่ 100% โอกาสได้ผลลบปลอมก็อยู่ที่ 0% และความจำเพาะจึงมีประโยชน์ในการยืนยันภาวะที่มี โดยกันผลบวกปลอม (false positive) เพราะว่าการทดสอบยิ่งจำเพาะเท่าไร โอกาสการได้ผลบวก (เช่น การพบว่ามีโรค) ที่ไม่เป็นจริง (เช่น บุคคลจริง ๆ ไม่มีโรค) ก็น้อยลงเท่านั้น และดังนั้น ถ้าความจำเพาะอยู่ที่ 100% โอกาสได้ผลบวกปลอมก็อยู่ที่ 0%
ในการทดสอบหนึ่ง ๆ ปกติจะต้องแลกเปลี่ยนข้อดีข้อเสีย ยกตัวอย่างเช่น เพื่อความปลอดภัยของท่าอากาศยาน เครื่องตรวจโลหะอาจจะตั้งให้ส่งสัญญาณเตือนแม้สำหรับวัตถุที่เสี่ยงน้อย เช่น หัวเข็มขัดหรือลูกกุญแจ (คือการตรวจมีความจำเพาะต่ำ) เพื่อลดโอกาสเสี่ยงพลาดวัตถุอันตราย (คือการตรวจมีความไวสูง) การแลกเปลี่ยนข้อดีข้อเสียเช่นนี้สามารถแสดงในกราฟเส้นโค้ง receiver operating characteristic (ROC) การทดสอบที่สมบูรณ์จะไว 100% (เช่น คนป่วยทั้งหมดมีผลบวก) และจำเพาะ 100% (เช่น คนปกติทั้งหมดมีผลลบ) แต่ว่า โดยทฤษฎีแล้ว การทดสอบทุกอย่างจะมีขอบเขตความผิดพลาดต่ำสุดที่เรียกว่า Bayes error rate
นิยาม
Sources: Fawcett (2006) and Powers (2011). |
ลองสมมุติว่ากำลังประเมินการทดสอบชนิดใหม่ที่ตรวจคัดกรองโรคชนิดหนึ่ง แต่ละคนที่ทดสอบจริง ๆ มีหรือไม่มีโรค ผลสอบอาจเป็นบวก คือจัดบุคคลว่ามีโรค หรือเป็นลบ คือจัดบุคคลว่าไม่มีโรค แต่ผลของแต่ละคนอาจจะไม่เหมือนกับภาวะจริง ๆ ดังนั้น จะมีกรณีต่าง ๆ 4 อย่าง คือ
- ผลบวกจริง (true positive) ผู้ป่วยตรวจพบว่ามีโรคอย่างถูกต้อง
- ผลบวกปลอม (false positive) คนปกติตรวจพบว่ามีโรคอย่างไม่ถูกต้อง
- ผลลบจริง (true negative) คนปกติตรวจพบว่าไม่มีโรคอย่างถูกต้อง
- ผลลบปลอม (false negative) คนป่วยตรวจพบว่าไม่มีโรคอย่างไม่ถูกต้อง
โดยทั่วไป Positive = identified และ negative = rejected ดังนั้น
- True positive = correctly identified
- False positive = incorrectly identified
- True negative = correctly rejected
- False negative = incorrectly rejected
เราจะพิจารณากลุ่มทดสอบที่มีผลบวกมีจำนวน P และผลลบมีจำนวน N เนื่องจากโรคบางอย่าง ผล 4 อย่างสามารถทำเป็นตาราง contingency table หรือ confusion matrix ดังต่อไปนี้
ภาวะ/โรค (ตรวจด้วยการตรวจมาตรฐานสูงสุด) |
||||
เป็นโรค | ไม่เป็นโรค | |||
ผล การตรวจ |
ผล การตรวจ เป็นบวก |
ผลบวกจริง |
ผลบวกลวง (ความผิดพลาดชนิดที่ 1) |
ค่าทำนายผลบวก = Σ ผลบวกจริง Σ ผลตรวจทั้งหมดที่เป็นบวก
|
ผล การตรวจ เป็นลบ |
ผลลบลวง (ความผิดพลาดชนิดที่ 2) |
ผลลบจริง |
ค่าทำนายผลลบ = Σ ผลลบจริง Σ ผลตรวจทั้งหมดที่เป็นลบ
|
|
ความไว = Σ ผลบวกจริง Σ ผู้ป่วยทั้งหมดที่เป็นโรค
|
ความจำเพาะ = Σ ผลลบจริง Σ ผู้ป่วยทั้งหมดที่ไม่เป็นโรค
|
ความไว
ความไวหมายถึงสมรรถภาพของการทดสอบในการตรวจหาคนที่มีภาวะนั้น ๆ ในตัวอย่างของเรา ค่าความไวคือสัดส่วนของบุคคลที่ได้ผลบวกจากการทดสอบในบรรดาคนที่มีโรค ซึ่งเขียนเป็นสมการได้ดังต่อไปนี้
ผลลบจากการทดสอบที่ไวสูงจะมีประโยชน์ในการกันโรคออก (ruling out) คือเชื่อถือได้เมื่อผลเป็นลบ เพราะว่ามันไม่ค่อยวินิจฉัยผู้ที่มีโรคผิด การทดสอบที่ไว 100% จะตรวจเจอคนไข้ที่มีโรคทั้งหมดโดยให้ผลบวก ดังนั้น ผลลบจึงกันออกได้อย่างแน่นอนว่า คนไข้ไม่มีโรค แต่ผลบวกของการทดสอบที่ไวสูงไม่สามารถยืนยันว่ามีโรค (ruling in) คือ ลองสมมุติว่ามีการทดสอบ "ปลอม" ที่ออกแบบให้ออกแต่ผลบวกเท่านั้น ดังนั้น เมื่อทดสอบคนไข้ที่มีโรค คนไข้ทั้งหมดก็จะได้ผลบวก ซึ่งบ่งว่าการทดสอบมีความไว 100% แต่ว่า โดยนิยามแล้ว ค่าความไวไม่สามารถกันผลบวกปลอมได้ เพราะว่า การทดสอบปลอมก็จะออกผลบวกสำหรับคนปกติทั้งหมด ซึ่งบ่งว่าการทดสอบมีอัตราผลบวกปลอม 100% ทำให้ไม่มีประโยชน์อะไรในการตรวจจับ หรือยืนยันว่ามีโรค ความไวไม่ใช่อย่างเดียวกับความเที่ยง (precision) หรือค่าทำนายเมื่อผลเป็นบวก (positive predictive value) ซึ่งเป็นอัตราส่วนของผลบวกจริงต่อค่ารวมของผลบวกจริงกับผลบวกปลอม คือเป็นสัดส่วนของผลบวกจริงต่อประชากรที่แสดงผลบวก
การคำนวณค่าความไวไม่รวมผลการทดสอบที่คลุมเครือ ถ้าไม่สามารถทดสอบใหม่ได้ ตัวอย่างที่คลุมเครือไม่ควรจะรวมเข้าเพื่อวิเคราะห์ (โดยให้ระบุจำนวนตัวอย่างที่ยกเว้นเมื่อแสดงค่าความไว) หรือสามารถปฏิบัติเหมือนกับผลลบปลอม (ซึ่งจะเป็นการแสดงค่าต่ำสุดของความไว และดังนั้น อาจจะเป็นค่าประเมินที่น้อยเกินจริง)
ความจำเพาะ
ความจำเพาะเป็นสมรรถภาพของการทดสอบในการตรวจหาบุคคลที่ไม่มีภาวะนั้น ๆ ลองพิจารณาตัวอย่างการทดสอบคนไข้ของเรา ค่าความจำเพาะของการทดสอบก็คือสัดส่วนของบุคคลปกติที่ไม่มีโรค ผู้จะทดสอบได้ผลลบ ซึ่งสามารถเขียนเป็นสมการ
การได้ผลบวกจากการทดสอบจำเพาะสูงมีประโยชน์ในการวินิจฉัยว่าเป็นโรค (ruling in) เพราะว่า การทดสอบนี้ไม่ค่อยให้ผลบวกในคนปกติ เมื่อผลทดสอบเป็นบวก การทดสอบที่จำเพาะ 100% แสดงว่า ทั้งหมดเป็นผู้ป่วยโดยไม่มีคนปกติ
ผลลบในการทดสอบที่จำเพาะสูงจะไม่มีประโยชน์ในการกันโรคออก ลองสมมุติว่ามีการทดสอบ "ปลอม" ที่ออกแบบให้แสดงผลลบเท่านั้น ซึ่งเมื่อทดสอบคนปกติทุกคน ก็จะแสดงผลลบทุกคน และนี่ก็จะให้ค่าจำเพาะ 100% ต่อการทดสอบ แต่การทดสอบเดียวกันก็จะให้ผลลบต่อผู้ป่วยทั้งหมดเหมือนกัน ดังนั้น ก็จะมีอัตราอัตราผลลบปลอมที่ 100% ซึ่งไม่มีประโยชน์อะไรในการกันโรคออก (ruling out) ความจำเพาะโดยนิยามไม่สามารถกันผลลบปลอมได้ การทดสอบที่จำเพาะสูงจะมีอัตราความผิดพลาดชนิดที่ 1 ต่ำ
ตัวอย่างแสดงเป็นรูป
ตัวอย่างในการแพทย์
ในการวินิจฉัยทางการแพทย์ ความไวเป็นสมรรถภาพของการทดสอบในการระบุคนที่มีโรคอย่างถูกต้อง (อัตราผลบวกจริง) เทียบกับความจำเพาะที่เป็นสมรรถภาพในการระบุผู้ที่ไม่มีโรคอย่างถูกต้อง (อัตราผลลบจริง) ถ้ามีผู้ป่วย 100 คนที่ทดสอบ แต่มีเพียง 43 คนที่ได้ผลบวก การทดสอบนี้ก็จะมีความไว 43% ถ้ามีคนปกติ 100 คนที่ทดสอบ แต่มีคน 96 ที่ได้ผลลบ การทดสอบนี้ก็จะมีความจำเพาะ 96% ความไวและความจำเพาะเป็นคุณสมบัติของการทดสอบที่เป็นอิสระจากความชุกของโรค เพราะว่า ค่าของมันเฉพาะกับการทดสอบและไม่ได้ขึ้นอยู่กับความชุกของกลุ่มประชากรที่เป็นประเด็น เทียบกับค่าทำนายเมื่อผลเป็นบวก (positive predictive value) และค่าทำนายเมื่อผลเป็นลบ (negative predictive value) ซึ่งเป็นค่าที่ขึ้นกับความชุกของกลุ่มประชากรที่ทดสอบ แต่ความจำเพาะและความไวไม่ใช่ ค่าเหล่านี้แสดงให้ดูเป็นกราฟในแอปเพล็ตนี้ (Bayesian clinical diagnostic model) ซึ่งแสดงค่าทำนายเมื่อผลเป็นบวกและเมื่อผลเป็นลบโดยเป็นฟังก์ชันของความชุกของโรค ความไว และความจำเพาะ
สิ่งที่อาจทำให้เข้าใจผิด
มักกล่าวกันว่า การทดสอบที่จำเพาะสูงมีประโยชน์ในการยืนยันว่ามีโรคเมื่อได้ผลบวก และการทดสอบที่ไวสูงในการกันโรคออกเมื่อได้ผลลบ มีแม้แต่รหัสช่วยจำ คือ SPIN และ SNOUT ที่ใช้กันอย่างกว้างขวาง ซึ่งมาจากวลีว่า a highly 'SPecific' test, when Positive, rules IN disease (SP-P-IN) คือ การทดสอบที่จำเพาะสูง เมื่อได้ผลบวก จะยืนยันโรค และจากวลีว่า a highly 'SeNsitive' test, when Negative rules OUT disease (SN-N-OUT) คือ การทดสอบที่ไวสูง เมื่อได้ผลลบ จะกันโรคออก แต่กฎทั้งสองนี้อาจทำให้เข้าใจเหตุผลผิดได้ เพราะว่า กำลังการวินิจฉัยของการทดสอบอย่างใดอย่างหนึ่งจะขึ้นอยู่กับทั้งความไวและความจำเพาะ
ตารางแบบเติมตัวเลข
- ตัวอย่างใส่ตัวเลขสำหรับการทดสอบวินิจฉัยที่มีความไว 67% และความจำเพาะ 91% เมื่อทดสอบกับบุคคล 2,030 คนเพื่อตรวจหาโรคที่มีความชุกในกลุ่มประชากรที่ 1.48%
คนไข้ที่มีมะเร็งลำไส้ ดังที่ยืนยันโดย การส่องกล้อง (endoscopy) |
||||
มีโรคจริง | ไม่มีโรค | |||
ผลการ ตรวจเลือด ในอุจจาระ |
ผล บวก |
ผลบวกจริง (TP) = 20 |
ผลบวกปลอม (FP) = 180 |
ค่าทำนายเมื่อผล เป็นบวก (PPV) = TP / (TP + FP)
= 20 / (20 + 180) = 10% |
ผล ลบ |
ผลลบปลอม (FN) = 10 |
ผลลบจริง (TN) = 1820 |
ค่าทำนายเมื่อผล เป็นลบ (NPV) = TN / (FN + TN)
= 1820 / (10 + 1820) ≈ 99.5% |
|
ความไว = TP / (TP + FN)
= 20 / (20 + 10) ≈ 67% |
ความจำเพาะ = TN / (FP + TN)
= 1820 / (180 + 1820) = 91% |
การคำนวณที่เกี่ยวข้อง
- False positive rate (α) = type I error = 1 − specificity = FP / (FP + TN) = 180 / (180 + 1820) = 9%
- False negative rate (β) = type II error = 1 − sensitivity = FN / (TP + FN) = 10 / (20 + 10) = 33%
- Power = sensitivity = 1 − β
- Likelihood ratio positive = sensitivity / (1 − specificity) = 0.67 / (1 − 0.91) = 7.4
- Likelihood ratio negative = (1 − sensitivity) / specificity = (1 − 0.67) / 0.91 = 0.37
เพราะมีผลบวกปลอมจำนวนมาก และผลลบปลอมจำนวนน้อย ดังนั้น การตรวจคัดกรองที่แสดงผลบวกอย่างเดียวจะไม่สามารถยืนยันว่ามีโรคได้ดี (PPV = 10%) และจึงต้องตรวจสอบเพิ่มขึ้น แต่ว่า มันก็ยังสามารถระบุคนที่มีโรคจริง ๆ ได้ถึง 66.7% (ซึ่งเป็นค่าความไว) ถึงอย่างนั้น ถ้าผลเป็นลบ มันดีมากที่จะยืนยันว่าคนไข้ไม่มีโรค (NPV = 99.5%) และการตรวจคัดกรองในเบื้องต้นที่ได้ผลลบจะระบุคน 91% ที่ไม่มีโรคได้อย่างถูกต้อง (ซึ่งเป็นค่าความจำเพาะ)
การประเมินความผิดพลาดของค่าความไวและความจำเพาะ
ค่าความไวและความจำเพาะเพียงอย่างเดียวอาจทำให้เข้าใจผิด คือ จะต้องคำนวณค่าแย่ที่สุด (worst-case) ของค่าทั้งสองเพื่อเลี่ยงการพึ่งผลการทดลองที่มีจำนวนน้อย ยกตัวอย่างเช่น การทดสอบหนึ่งไว 100% เมื่อเทียบกับวิธีการมาตรฐาน (gold standard) 4 ครั้ง แต่ว่าการทดสอบอีกครั้งหนึ่งแสดงผลที่ไม่เท่าเทียม คือเท่ากับแสดงความไวแค่ 80% วิธีสามัญอย่างหนึ่งก็คือมีการบ่ง binomial proportion confidence interval (คือ ช่วงความเชื่อมั่นในสัดส่วนหนึ่งของประชากรทางสถิติ) ซึ่งบ่อยครั้งคำนวณโดยใช้ Wilson score interval ดังนั้น ช่วงความเชื่อมั่น (confidence intervals) ของค่าความไวและความจำเพาะสามารถคำนวณได้ โดยให้พิสัยของค่า (คือกำหนดค่าสูงและต่ำ) ที่อยู่ในระดับความเชื่อมั่นขั้นหนึ่ง (เช่น ความเชื่อมั่นที่ 95% ว่าค่าอยู่ระหว่างค่านี้กับค่านี้)
ศัพท์ในศาสตร์การค้นคืนสารสนเทศ
ในการค้นคืนสารสนเทศ (information retrieval) ค่าทำนายเมื่อผลเป็นบวกเรียกว่า precision (ความเที่ยง) และค่าความไวเรียกว่า recall แต่ไม่เหมือนกับการแลกเปลี่ยนข้อดีข้อเสียระหว่างความจำเพาะเทียบกับความไว ค่าทั้งสองนี้เป็นอิสระจากผลลบจริง (true negative) ซึ่งปกติจะเป็นข้อมูลที่ไม่รู้โดยมีจำนวนมากกว่าจำนวนเอกสารที่เกี่ยวข้องและต้องการค้นคืนมาก และข้อสมมุติในเรื่องนี้ว่า ผลลบจริงเป็นจำนวนที่ใหญ่กว่ามากจะไม่ค่อยมีในการประยุกต์ใช้ค่าสองอย่างนี้ในประเด็นอื่น ๆ จึงมีการใช้ F-score เป็นค่าเดียวที่แสดงประสิทธิภาพของการทดสอบที่ได้ผลบวก โดยเป็น harmonic mean ของ precision และ recall คือ
ศัพท์ในสถิติ
ในการศึกษาโดยการตรวจสอบสมมติฐานทางสถิติ (statistical hypothesis testing) ความไวของการทดสอบจะเรียกว่า กำลังทางสถิติ (statistical power) ของการทดสอบ แต่คำว่า กำลัง (power) ในเรื่องนี้มีความหมายกว้างกว่าความไวที่ใช้ในบทความนี้ การทดสอบที่ไวจะมีความผิดพลาดชนิดที่ 2 จำนวนน้อยกว่า
ดูเพิ่ม
แหล่งข้อมูลอื่น
-
Altman, DG; Bland, JM (1994). "Diagnostic tests. 1: Sensitivity and specificity". BMJ. 308 (6943): 1552. doi:10.1136/bmj.308.6943.1552. PMC 2540489. PMID 8019315.
{{cite journal}}
: CS1 maint: uses authors parameter (ลิงก์) - Loong, T (2003). "Understanding sensitivity and specificity with the right side of the brain". BMJ. 327 (7417): 716–719. doi:10.1136/bmj.327.7417.716. PMC 200804. PMID 14512479.
- UIC Calculator
- Vassar College's Sensitivity/Specificity Calculator
- MedCalc Free Online Calculator
- Bayesian clinical diagnostic model applet
Biomedical research: Clinical study design / Design of experiments
| |
---|---|
Overview | |
Controlled study (EBM I to II-1; A to B) |
|
งานศึกษาแบบสังเกต (EBM II-2 to II-3; B to C) |
|
วิทยาการระบาด/ methods |
|
Trial/test types | |
Analysis of clinical trials | |
Interpretation of results | |