Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.

การทดลองแบบสุ่มและมีกลุ่มควบคุม

Другие языки:

การทดลองแบบสุ่มและมีกลุ่มควบคุม

Подписчиков: 0, рейтинг: 0

ผังงานแสดงระยะการดำเนินงาน 4 ขั้นตอน คือ enrollment (การขึ้นทะเบียน/การรับสมัคร); intervention allocation (การจัดสรรการรักษา); follow-up (ติดตาม); data analysis (การวิเคราะห์ข้อมูล) ของการทดลองแบบสุ่มที่ติดตามกลุ่มทดลองและกลุ่มควบคุม/กลุ่มเปรียบเทียบ ผังงานดัดแปลงจากคำแถลงความ CONSORT ปี ค.ศ. 2010

การทดลองแบบสุ่มและมีกลุ่มควบคุม (อังกฤษ: randomized controlled trial; randomised control trial ตัวย่อ RCT) เป็นการทดลองทางวิทยาศาสตร์แบบหนึ่ง ที่ใช้เป็นมาตรฐานทอง (gold standard) ของการทดลองทางคลินิก มักจะใช้เพื่อตรวจสอบประสิทธิผลและประสิทธิภาพของบริการสุขภาพ (เช่นการแพทย์หรือการพยาบาล) หรือเทคโนโลยีสุขภาพ (เช่นยา อุปกรณ์ทางการแพทย์ หรือวิธีการผ่าตัด) โดยทำในกลุ่มคนไข้ที่เป็นตัวแทนประชากรทางสถิติ (statistical population) และใช้เพื่อรวบรวมข้อมูลอื่น ๆ ที่มีประโยชน์เกี่ยวกับผลลบของการรักษาพยาบาล เช่นปฏิกิริยาเชิงลบต่อยา (adverse drug reactions)

ลักษณะเฉพาะของ RCT ที่ทำทั่ว ๆ ไปก็คือ หลังจากที่มีการประเมินคุณสมบัติการรับเลือกของผู้ร่วมการทดลองแต่ก่อนที่จะเริ่มการรักษาพยาบาล (หรือเงื่อนไขอื่น ๆ ถ้าไม่ใช่การทดลองทางการแพทย์) จะมีการจัดผู้ร่วมการทดลองให้อยู่ในกลุ่มสองกลุ่มโดยสุ่ม กลุ่มหนึ่งจะได้รับการรักษาพยาบาล (หรือเงื่อนไข) ที่เป็นประเด็นการศึกษา อีกกลุ่มหนึ่งจะได้รับการรักษาพยาบาล (หรือเงื่อนไข) อีกอย่างหนึ่งที่เป็นตัวควบคุมหรือเป็นตัวเปรียบเทียบ การจัดกลุ่มโดยสุ่มในการทดลองจริง ๆ นั้นซับซ้อน แต่ว่าถ้าคิดอย่างง่าย ๆ จะเป็นกระบวนการเหมือนกับโยนเหรียญที่สมดุล หลังจากการจัดกลุ่มโดยสุ่ม จะมีการปฏิบัติต่อผู้ร่วมการทดลองทั้งสองกลุ่มเหมือน ๆ กันทุกอย่าง ยกเว้นการรักษาพยาบาลที่เป็นประเด็นศึกษา เช่นวิธีการรักษา การตรวจสอบ การรักษาโดยเป็นผู้ป่วยนอก และ/หรือการติดตามผล ข้อดีที่สำคัญที่สุดของการสุ่มที่ทำถูกต้องก็คือ ช่วยลดระดับ allocation bias คือสร้างความสมดุลขององค์พยากรณ์โรค (prognostic factor) ที่มีในคนไข้ ทั้งที่รู้และไม่รู้ ระหว่างกลุ่มต่าง ๆ ที่รับการรักษา กล่าวโดยสาระก็คือ คำว่า "สุ่ม" แสดงถึงกระบวนการจัดผู้ร่วมการทดลองให้อยู่ในกลุ่มการทดลองหรือกลุ่มควบคุมโดยเสี่ยงโชค เพื่อที่จะลดระดับความเอนเอียง

แม้ว่าคำว่า "RCT" และ การทดลองแบบสุ่ม (randomized trial) บางครั้งจะใช้เป็นไวพจน์ซึ่งกันและกัน แต่ระเบียบวิธีที่ดีกว่าก็จะใช้คำว่า "RCT" สำหรับการทดลองที่มีกลุ่มควบคุม (control) ที่ไม่ได้รับการรักษาที่เป็นประเด็นศึกษา (placebo-controlled study) หรือรับการรักษาที่มีการทดสอบมาก่อนแล้ว (positive-control study) เท่านั้น ดังนั้น คำว่า การทดลองแบบสุ่ม (randomized trial) ควรใช้เรียกงานศึกษาเปรียบเทียบกลุ่มการทดลองต่าง ๆ โดยที่ไม่มีกลุ่มควบคุม และเช่นกัน แม้ว่าตัวย่อว่า "RCT" จะสามารถขยายเป็น randomized clinical trial (การทดลองทางคลินิกแบบสุ่ม) หรือ randomized comparative trial (การทดลองเปรียบเทียบแบบสุ่ม) แต่ว่า เพื่อที่จะเลี่ยงความคลุมเครือในสิ่งตีพิมพ์ทางวิทยาศาสตร์ จะเป็นระเบียบวิธีที่ดีกว่าถ้าจะใช้ตัวย่อ "RCT" สำหรับการทดลองที่มีกลุ่มควบคุมเท่านั้น และเพราะว่า การทดลองทางคลินิกแบบสุ่มไม่จำเป็นจะต้องมีกลุ่มควบคุม (และงานบางงานไม่สามารถจะมีได้ เพราะว่าเป็นเรื่องที่ทำได้ยากหรือว่าไม่ถูกจริยธรรม) ดังนั้น คำว่า randomized controlled clinical trials (การทดลองทางคลินิกแบบสุ่มและมีกลุ่มควบคุม) ก็จะเป็นชื่อที่ดีสำหรับงาน RCT ที่เป็นการทดลองทางคลินิก

ให้สังเกตว่า มีการใช้ RCT ในงานวิจัยสาขาอื่น ๆ อีกด้วย รวมทั้งในสาขาต่าง ๆ ของสังคมศาสตร์ เช่นนิติศาสตร์ การศึกษา และการพัฒนาระหว่างประเทศ (ดูหัวข้อ "ในสังคมศาสตร์")

ประวัติ

การทดลองแบบสุ่ม (Randomized experiment) เกิดใช้เป็นครั้งแรกในปี ค.ศ. 1885 ในสาขาจิตวิทยาเชิงทดลองโดยบิดาของปรัชญาปฏิบัตินิยม (pragmatism) ชาวอเมริกัน ชาลส์ แซนเดอร์ส เพียร์ซ และในสาขาการศึกษา ต่อมาในปี ค.ศ. 1923 การทดลองแบบสุ่มก็เริ่มปรากฏในสาขาเกษตรกรรม ทำโดยนักสถิติชาวโปแลนด์-อเมริกัน Jerzy Neyman และนักสถิติชาวอังกฤษเซอร์โรนัลด์ ฟิชเช่อร์ และเป็นงานวิจัยเชิงทดลองและบทความอื่น ๆ ของฟิชเช่อร์นั่นเอง ที่ได้เริ่มสร้างความนิยมให้กับการทดลองแบบสุ่ม

ส่วน RCT ที่ตีพิมพ์เป็นบทความแรกในปี ค.ศ. 1948 เป็นงานชื่อว่า "Streptomycin treatment of pulmonary tuberculosis (การรักษาวัณโรคปอดด้วยสเตรปโตมัยซิน)" พิมพ์ในประเทศอังกฤษ ซึ่งผู้เขียนท่านหนึ่งก็คือออสติน แบร็ดฟอร์ด ฮิลล์ ผู้ได้รับเครดิตว่า เป็นคนแรกที่ได้ค้นคิด RCT แบบที่ใช้ในปัจจุบัน

โดยปลายคริสต์ศตวรรษที่ 20 ก็มีการยอมรับแล้วว่า RCT เป็นระเบียบวิธีมาตรฐานสำหรับ "การบำบัดโรคที่สมเหตุผล" (rational therapeutics) ในแพทยศาสตร์ โดยปี ค.ศ. 2004 มีผลงาน RCT กว่า 150,000 ชิ้นในระบบ Cochrane Library ขององค์กรความร่วมมือคอเครน เพื่อจะเพิ่มคุณภาพของการรายงาน RCT ในสิ่งตีพิมพ์ทางการแพทย์ นักวิทยาศาสตร์และบรรณาธิการนานาชาติกลุ่มหนึ่งได้พิมพ์บทความแถลงชื่อว่า "Consolidated Standards of Reporting Trials (มาตรฐานรวมในการรายงานการทดลอง)" (CONSORT) ในปี ค.ศ. 1996 2001 และ 2010 ซึ่งได้กลายมาเป็นระเบียบที่ยอมรับกันอย่างกว้างขวาง

จริยธรรม

มีหลักจริยธรรมที่เรียกว่า "clinical equipoise (ความเสมอภาคทางคลินิก)" ซึ่งก็คือจะเริ่มทำการทดลองได้ก็ต่อเมื่อ "มีความไม่ชัดเจนจริง ๆ ในกลุ่มผู้เชี่ยวชาญทางการแพทย์... เกี่ยวกับการรักษาที่ดีกว่า" เป็นหลักจริยธรรมที่ใช้โดยสามัญในการทดลองทางคลินิก (กล่าวอีกอย่างหนึ่งก็คือจะเริ่มการทดลองได้ก็ต่อเมื่อไม่ปรากฏมติของผู้เชี่ยวชาญว่า การรักษาที่เป็นประเด็นจะดีกว่าสิ่งที่เปรียบเทียบหรือไม่) และแม้ว่าจะเป็นหลักที่มีการนำมาใช้ด้วยใน RCT แต่ว่า จริยธรรมเกี่ยวกับ RCT มีเรื่องที่ต้องพิจารณาเป็นพิเศษ

อย่างแรกก็คือ มีการเสนอว่า ความเสมอภาค (คือไม่รู้ว่าจะมีผลดีกว่าหรือไม่) ไม่เป็นเหตุเพียงพอที่จะเริ่มทำการทดลองแบบ RCT อีกอย่างหนึ่งก็คือ "ความเสมอภาคที่เป็นมติของกลุ่ม" (collective equipoise) อาจจะไม่ตรงกับ "ความเสมอภาคที่เป็นมติของตน" คือ ผู้ทำงานวิจัยเองอาจจะเชื่อว่า การรักษาที่เป็นประเด็นมีผลดีกว่า และอย่างสุดท้ายก็คือ มีการใช้ "Zelen's design" ในการออกแบบ RCT ซึ่งสุ่มจัดผู้ร่วมการทดลองเข้ากลุ่ม ก่อนที่ผู้ร่วมการทดลองจะยินยอมรับเงื่อนไขที่เป็นประเด็นการศึกษา ดังนั้น ผู้ที่อยู่ในกลุ่มควบคุมอาจจะไม่รู้ว่าตนเป็นส่วนของการศึกษา และไม่จำเป็นที่จะต้องให้การยินยอมเพื่อจะรับการปฏิบัติรักษาที่เป็นมาตรฐาน (ที่ใช้เปรียบเทียบกับกลุ่มทดลอง) การสุ่มโดยที่ไม่มีการยินยอมเช่นนี้อาจจะถูกจริยธรรมสำหรับ RCT เกี่ยวกับการตรวจคัดโรค (screening) และการรักษาบางอย่าง แต่อาจจะไม่ถูกจริยธรรม "สำหรับการทดลองวิธีการรักษาพยาบาลโดยมาก"

การลงทะเบียนการทดลอง

ในปี ค.ศ. 2004 International Committee of Medical Journal Editors (คณะกรรมการบรรณาธิการวารสารแพทย์นานาชาติ; ตัวย่อ ICMJE ; เว็บไซต์) ได้ประกาศว่า การทดลองทั้งหมดที่เริ่มการขึ้นทะเบียน (enrollment) หลังวันที่ 1 กรกฎาคม ค.ศ. 2005 ต้องลงทะเบียนเพื่อที่จะมีสิทธิการตีพิมพ์ในวารสารชั้นนำที่เป็นสมาชิก 12 วารสารซึ่งรวมทั้ง BMJ, JAMA, NEJM และ The Lancet ถึงกระนั้น โดยปี ค.ศ. 2009 และ 2011 ก็ยังมีการทดลองที่ลงทะเบียนช้า หรือไม่ได้ลงทะเบียนเลย

ประเภท

โดยแบบ

การจัดประเภทอย่างหนึ่งก็คือโดยแบบงานศึกษา โดยเรียงลำดับจากแบบที่มีใช้มากที่สุดไปยังที่ใช้น้อยที่สุดในสิ่งตีพิมพ์เกี่ยวกับสุขภาพพยาบาล แบบหลัก ๆ ของ RCT มีดังต่อไปนี้

Parallel study - มีการจัดผู้ร่วมการทดลองแต่ละคนให้อยู่ในกลุ่มโดยสุ่ม ผู้ร่วมการทดลองทั้งหมดในกลุ่มจะได้รับ (หรือไม่ได้รับ) การรักษาพยาบาลที่เป็นประเด็นศึกษา
Crossover study (การศึกษาข้ามกลุ่ม) - ในช่วงการศึกษา ผู้ร่วมการทดลองแต่ละคนจะได้รับ (หรือไม่ได้รับ) การรักษาพยาบาลที่เป็นประเด็นการศึกษาตามลำดับสุ่ม
Cluster randomised controlled trial - มีการจัดชุมชนทั้งกลุ่ม (เช่นทั้งหมู่บ้าน หรือทั้งโรงเรียน) โดยสุ่มให้รับการรักษาพยาบาลที่เป็นประเด็นศึกษาหรือไม่ได้รับ
Factorial experiment - มีการจัดผู้ร่วมการทดลองโดยสุ่มให้อยู่ในกลุ่มที่จะได้รับการรักษาพยาบาลหรือไม่ได้รับ โดยเป็นแบบผสม (เช่น กลุ่ม 1 รับวิตามิน X และวิตามิน Y; กลุ่ม 2 รับวิตามิน X และยาหลอก Y; กลุ่ม 3 รับยาหลอก X และวิตามิน Y; และกลุ่ม 4 รับยาหลอก X และยาหลอก Y)

ในงานวิเคราะห์ RCT 616 งานที่มีการสร้างดัชนีใน PubMed ช่วงเดือนธันวาคม ปี ค.ศ. 2006 พบว่า 78% เป็นแบบ parallel; 16% เป็นแบบ crossover; 2% เป็นแบบ split-body; 2% เป็นแบบ cluster; และ 2% เป็นแบบ factorial

โดยประสิทธิศักย์และประสิทธิผล

RCT สามารถจัดให้เป็นประเภท "explanatory" (สำหรับอธิบาย) หรือ "pragmatic" (สำหรับปฏิบัติ) คือ RCT สำหรับอธิบายจะตรวจสอบประสิทธิศักย์ (efficacy) ภายใต้สิ่งแวดล้อมสถานการณ์ที่มีในงานวิจัยและที่มีระดับการควบคุมสูง โดยมีผู้ร่วมการทดลองที่มีการคัดเลือกในระดับสูง ส่วน RCT สำหรับปฏิบัติจะตรวจสอบประสิทธิผล (effectiveness) ในข้อปฏิบัติที่ใช้ในการรักษาพยาบาลตามปกติประจำวัน โดยมีผู้ร่วมการทดลองที่ไม่ได้ทำการคัดเลือก ภายใต้สถานการณ์สิ่งแวดล้อมจริง ๆ ที่ยืดหยุ่นได้ ดังนั้น RCT สำหรับปฏิบัติจะให้ความรู้เพื่อการตัดสินใจในการปฏิบัติจริง ๆ

โดยสมมุติฐานว่าเหนือกว่า ไม่แย่กว่า และเสมอกัน

วิธีการจัดประเภทของ RCT อีกประเภทหนึ่งจัดเป็น "superiority trials" (การทดสอบความเหนือกว่า) "noninferiority trials" (การทดสอบความไม่แย่กว่า) และ "equivalence trials" (การทดสอบความเสมอกัน) ซึ่งมีความแตกต่างกันโดยทั้งระเบียบวิธีและโดยการรายงาน RCT โดยมากเป็นการทดสอบความเหนือกว่า ซึ่งมีสมมุติฐานว่า การรักษาพยาบาลที่เป็นประเด็นจะเหนือกว่าการปฏิบัติวิธีอื่นอย่างมีนัยสำคัญทางสถิติ RCT บางส่วนเป็นการทดสอบความไม่แย่กว่า "เพื่อจะกำหนดว่า การรักษาพยาบาลใหม่นั้นไม่แย่กว่าการรักษาพยาบาลที่เป็นตัวเปรียบเทียบ" ส่วน RCT ที่เหลือเป็นการทดสอบความเสมอกัน ที่มีสมมุติฐานว่า ผลของการรักษาพยาบาลทั้งสองไม่สามารถแยกแยะความแตกต่างกันได้

การสุ่ม

ข้อดีของการสุ่มที่ถูกต้องใน RCT รวมทั้ง

"กำจัดความเอนเอียงในการจัด (คนไข้)ให้ได้รับการรักษาพยาบาล (treatment assignment)" โดยเฉพาะก็คือกำจัดความเอนเอียงประเภทความเอนเอียงโดยการคัดเลือก (selection bias) และปัจจัยกวน (confounding)
"ช่วยอำพรางวิธีการรักษาพยาบาลจากผู้ทำการตรวจสอบ จากผู้ร่วมการทดลอง และจากผู้ประเมินผล"
"เปิดโอกาสให้ใช้ทฤษฎีความน่าจะเป็นที่จะแสดงค่าความเป็นไปได้ว่า ความแตกต่างของผลที่ได้ในระหว่างกลุ่มการรักษาเป็นเพียงเรื่องบังเอิญ (chance)"

มีขั้นตอนสองขั้นในการจัดกลุ่มคนไข้โดยสุ่ม ขั้นแรกเป็นการเลือกวิธีการสุ่ม (randomization procedure) ที่สร้างลำดับการจัดกลุ่มที่พยากรณ์ไม่ได้ นี่อาจจะเป็นการสุ่มแบบง่าย ๆ โดยจัดให้คนไข้อยู่ในกลุ่มต่าง ๆ โดยมีความน่าจะเป็นเท่า ๆ กัน หรืออาจจะเป็นแบบ "restricted" (จำกัด) หรืออาจะเป็นแบบ "adaptive" (ปรับได้) ขั้นที่สองซึ่งเป็นเรื่องของการปฏิบัติโดยตรงก็คือ การปิดบังการจัดสรร (allocation concealment) ซึ่งหมายถึงการป้องกันอย่างเข้มงวดเพื่อจะให้แน่ใจได้ว่า การจัดกลุ่มคนไข้จะไม่มีการเปิดเผยก่อนขั้นตอนที่จะจัดคนไข้ให้เข้ากลุ่มจริง ๆ (เช่นหลังจากที่คนไข้ได้ยินยอมตกลงเข้าร่วมการทดลองแล้ว) ยกตัวอย่างเช่น วิธีการจัดกลุ่มอย่างเป็นระบบที่ไม่ใช่เป็นการสุ่ม เช่นการสลับให้คนไข้หนึ่งอยู่ในกลุ่มหนึ่ง และคนไข้ต่อไปอยู่ในอีกกลุ่มหนึ่ง อาจทำให้เกิด "โอกาสเกิดความมัวหมองโดยหาประมาณไม่ได้" และเป็นการทำลายการปิดบังการจัดสรร

การเลือกการสุ่ม

การสุ่มที่สมบูรณ์จะทำให้สำเร็จจุดมุ่งหมายดังต่อไปนี้คือ

เพิ่มกำลังทางสถิติ (statistical power) ให้สูงสุด โดยเฉพาะเมื่อมีการวิเคราะห์หารูปแบบในกลุ่มย่อย (Subgroup analysis) คือ โดยทั่ว ๆ ไปแล้ว การมีกลุ่มเท่า ๆ กันจะทำให้มีกำลังทางสถิติในระดับสูงสุด แต่ว่า ในการวิเคราะห์บางชนิด การมีกลุ่มไม่เท่ากันอาจจะมีอานุภาพยิ่งกว่า (เช่น การใช้ Dunnett’s procedure เพื่อเปรียบเทียบการใช้ยาหลอกเทียบกับการใช้ยาทดลองหลาย ๆ ขนาด) และอาจจะจำเป็นเพื่อเหตุผลที่ไม่เกี่ยวกับการวิเคราะห์ (เช่น คนไข้อาจจะสนใจที่จะเข้าร่วมการทดลองมากกว่า ถ้ามีโอกาสสูงกว่าที่จะได้รับการรักษาพยาบาลที่เป็นประเด็น หรือเช่น องค์กรที่มีหน้าที่ควบคุมทางกฎหมายอาจจะมีกฎบังคับให้มีคนไข้อย่างน้อยที่สุดในกลุ่มทดลองที่เป็นประเด็นการศึกษา)
ลดระดับความเอนเอียงโดยการคัดเลือก (selection bias) ให้ต่ำที่สุด คือ ความเอนเอียงอาจจะเกิดขึ้นถ้าผู้ทำการทดลองเลือกคนไข้เข้ากลุ่มโดยมีความเอนเอียง โดยจะตั้งใจก็ดีหรือโดยเกิดขึ้นใต้จิตสำนึกก็ดี กระบวนการสุ่มที่ดีจะพยากรณ์ไม่ได้ ดังนั้น ผู้ทำการทดลองจะไม่สามารถเดาว่าคนไข้จะจัดเข้ากลุ่มไหนโดยอาศัยการจัดกลุ่มที่เกิดขึ้นครั้งสุดท้าย ความเสี่ยงต่อ selection bias จะมีระดับสูงสุดถ้าผู้ทำการทดลองรู้การจัดการรักษาพยาบาลครั้งสุดท้ายของคนไข้ (เช่นการทดลองที่ไม่ได้อำพราง) หรือสามารถเดาได้ (อาจจะเป็นเพราะยามีผลข้างเคียงที่ไม่เหมือนใคร)
ลดระดับ allocation bias ให้ต่ำที่สุด (หรือ confounding) คือ ความเอนเอียงนี้อาจเกิดขึ้นได้เมื่อ covariate (ตัวแปรปรวนร่วมเกี่ยว) ที่มีอิทธิพลต่อผล ไม่มีการกระจายตัวอย่างสม่ำเสมอระหว่างกลุ่มต่าง ๆ ดังนั้นผลของการรักษาพยาบาล จึงเกิดความสับสนกับผลของตัวแปรปรวนร่วมเกี่ยว (คือเกิด accidental bias) ถ้าการสุ่มทำให้เกิดความไม่สมดุลของตัวแปรปรวนร่วมเกี่ยว ที่มีความสัมพันธ์กับผลที่ได้ในระหว่างกลุ่มการทดลอง ค่าประเมินของผลที่ได้อาจจะมีความเอนเอียงถ้าไม่ได้ปรับผลที่ได้จากตัวแปรปรวนร่วมเกี่ยว (ซึ่งอาจจะเป็นค่าที่ไม่ได้วัดและดังนั้นจึงปรับไม่ได้)

อย่างไรก็ดี ไม่มีวิธีการสุ่มอย่างใดอย่างหนึ่งที่สามารถให้ถึงจุดมุ่งหมายเหล่านี้ได้ในทุก ๆ สถานการณ์ ดังนั้น นักวิจัยจะต้องเลือกวิธีใดวิธีหนึ่งสำหรับงานศึกษา อาศัยการเปรียบเทียบข้อดีและข้อเสียของวิธีการสุ่ม

การสุ่มแบบง่าย ๆ

การสุ่มแบบง่าย ๆ (simple randomization) นี้เป็นวิธีที่ใช้โดยสามัญที่สุดและเข้าใจได้ง่ายที่สุด คล้ายกับ การโยนเหรียญที่สมดุลซ้ำ ๆ โดยมีชื่ออื่นว่า การสุ่มสมบูรณ์ (complete randomization) หรือ การสุ่มไม่จำกัด (unrestricted randomization) เป็นการสุ่มที่ทนทานต่อทั้งความเอนเอียงโดยการคัดเลือก (selection bias) และทั้ง accidental bias แต่ว่า จุดอ่อนของวิธีนี้ก็คืออาจจะทำให้กลุ่มต่าง ๆ มีขนาดไม่เท่ากันใน RCT ที่มีขนาดตัวอย่างน้อย ดังนั้น จึงมีการแนะนำให้ใช้สำหรับ RCT ที่มีผู้ร่วมการทดลองมากกว่า 200 คนเท่านั้น

การสุ่มแบบจำกัด

เพื่อให้ขนาดกลุ่มต่าง ๆ เท่ากันใน RCT ที่มีตัวอย่างน้อย จึงมีการแนะนำการใช้การสุ่มแบบจำกัด (restricted randomization) วิธีใดวิธีหนึ่ง การสุ่มแบบจำกัดประเภทหลัก ๆ ที่ใช้ใน RCT รวมทั้ง

Randomized block design หรือ blocked randomization (การสุ่มแบบบล็อก) ที่มีการกำหนด "block size" (ขนาดบล็อก) และ "allocation ratio" (อัตราส่วนการจัดกลุ่ม) โดยที่ผู้ร่วมการทดลองของแต่ละบล็อกจะมีการจัดกลุ่มโดยสุ่ม ยกตัวอย่างเช่น ถ้ามีขนาดบล็อกเท่ากับ 6 และอัตราส่วนการจัดกลุ่มเป็น 2:1 ก็จะมีการจัดกลุ่มโดยสุ่มเป็นคน 4 คนในกลุ่มหนึ่ง และ 2 คนในอีกกลุ่มหนึ่ง การสุ่มประเภทนี้สามารถผสมกับ "stratified randomization" (การสุ่มแบบแบ่งชั้น) เช่นในการทดลองแบบหลายศูนย์ (multicenter trial) แต่ละศูนย์จะมีการสุ่มในกลุ่มของตนเอง "เพื่อจะให้มีความสมดุลของลักษณะผู้ร่วมการทดลองต่าง ๆ ในแต่ละกลุ่ม" กรณีพิเศษของการสุ่มแบบบล็อกก็คือ (random allocation) ที่ตัวอย่างทั้งหมดจะรวมอยู่ในบล็อกเดียว ข้อเสียสำคัญอย่างหนึ่งของการสุ่มโดยวิธีนี้ก็คือ แม้ว่าขนาดของบล็อกจะใหญ่และคนในบล็อกจะมีความต่าง ๆ กันโดยสุ่ม การใช้วิธีนี้ก็ยังอาจจะนำไปสู่ความเอนเอียงโดยการคัดเลือก (selection bias) ข้อเสียอีกอย่างหนึ่งก็คือ การวิเคราะห์ที่สมบูรณ์จะต้องมีการแบ่งส่วนวิเคราะห์โดยบล็อก
Adaptive biased-coin randomization (การสุ่มแบบมีเหรียญเอนเอียงและปรับได้ โดยมี urn randomization เป็นที่รู้จักกันดีที่สุด) โดยวิธีการสุ่มที่ไม่ค่อยสามัญเช่นนี้ ความน่าจะเป็นที่จะจัดเข้าในกลุ่มหนึ่งจะลดลงถ้ากลุ่มนั้นมีคนมากเกินไป และจะเพิ่มขึ้นถ้ากลุ่มนั้นมีคนน้อยเกินไป วิธีการเช่นนี้เชื่อกันว่า เสี่ยงต่อ ความเอนเอียงโดยการคัดเลือก (selection bias) น้อยกว่าการสุ่มแบบบล็อก

การสุ่มแบบปรับได้

มีวิธีการสุ่มแบบปรับได้ (adaptive randomization) สองอย่างที่ใช้ใน RCT แต่ใช้ไม่บ่อยเท่าการสุ่มแบบง่าย ๆ หรือการสุ่มแบบจำกัด คือ

Covariate-adaptive randomization (การสุ่มแบบปรับตามตัวแปรปรวนร่วมเกี่ยว) ซึ่งวิธีหนึ่งที่ใช้ก็คือ minimization คือความน่าจะเป็นในการจัดเข้ากลุ่มจะมีค่าต่าง ๆ กันเพื่อลดความไม่สมดุลของตัวแปรปรวนร่วมเกี่ยว (covariate) ให้น้อยที่สุด เป็นวิธีที่มีทั้งผู้สนับสนุนและผู้ไม่เห็นด้วย เพราะว่า การจัดกลุ่มของบุคคลแรกในกลุ่มเท่านั้นที่เป็นการสุ่มจริง ๆ ดังนั้น วิธีนี้อาจจะไม่สามารถกำจัดความเอนเอียงขององค์ประกอบ (หรือตัวแปรปรวนร่วมเกี่ยว) ที่ซ่อนเร้นต่าง ๆ
Response-adaptive randomization (การสุ่มแบบปรับตามผลที่ได้) หรือรู้จักกันว่า outcome-adaptive randomization คือ ความน่าจะเป็นในการจัดเข้ากลุ่มหนึ่ง ๆ จะสูงขึ้น ถ้าคนไข้ก่อน ๆ ในกลุ่มมีการตอบสนองที่เป็นผลบวก แม้ว่าจะมีการอ้างว่า วิธีนี้ถูกจริยธรรมดีกว่าการสุ่มแบบอื่น ๆ ถ้าความน่าจะเป็นของประสิทธิผล ของการรักษาพยาบาลหนึ่ง ๆ มีค่าเพิ่มขึ้นในช่วงการทดลอง แต่ว่า ถึงโดยปี ค.ศ. 1993 นักวิชาการด้านจริยธรรมก็ยังไม่ได้ศึกษาวิเคราะห์วิธีนี้โดยละเอียด

การปิดบังการจัดสรร

"Allocation concealment" (การปิดบังการจัดสรร) มีนิยามว่า "วิธีการที่ป้องกันรักษากระบวนการสุ่มเพื่อไม่ให้รู้การรักษาพยาบาลที่จะจัดให้ ก่อนที่คนไข้จะเข้าสู่กระบวนการศึกษา" เป็นเรื่องที่สำคัญใน RCT คือโดยทางปฏิบัติแล้ว เพราะเหตุผลต่าง ๆ เป็นต้นว่าอาจจะมีความเห็นส่วนตัวที่เป็นไปทางใดทางหนึ่งเกี่ยวกับการรักษาพยาบาลที่เป็นประเด็นการศึกษา นักวิจัยทางคลินิกใน RCT อาจจะไม่สามารถรักษาความเป็นกลาง มีเรื่องที่เปิดเผยแบบนิรนามว่า มีนักวิจัยส่องไฟดูซองจดหมายที่ปิดผนึกไว้ หรือว่าเข้าค้นห้องสำนักงานเป็นต้น เพื่อที่จะหาข้อมูลการจัดกลุ่ม เพื่อจะได้มีโอกาสกำหนดการจัดกลุ่มของคนไข้คนต่อไปของตน การกระทำเช่นนี้ทำให้เกิดความเอนเอียงโดยการคัดเลือก (selection bias) และปัจจัยกวน (confounders) ซึ่งจะมีน้อยที่สุดถ้ามีวิธีการปิดบังการจัดสรรที่ได้ผล เป็นการกระทำที่ในที่สุดจะบิดเบือนผลของงานศึกษา วิธีการปิดบังการจัดสรรควรจะซ่อนการจัดกลุ่มจากทั้งคนไข้และทั้งนักวิจัย ไม่ให้สามารถรู้ได้จนกระทั่งถึงเวลาจัดคนไข้เข้ากลุ่มทดลองจริง ๆ เช่นหลังจากคนไข้ได้รับสมัคร และให้คำยินยอมเพื่อการรักษาที่ตนก็ยังไม่รู้คือยอมรับว่าตนอาจจะได้การรักษาของกลุ่มใดกลุ่มหนึ่งก็ได้

ระเบียบวิธีมาตรฐานเพื่อให้มั่นใจว่ามีการปิดบังการจัดสรรที่ได้ผล รวมทั้งการใช้ซองเอกสารที่มีเลขตามลำดับที่ปิดทึบ (SNOSE), การใช้กล่องบรรจุยาที่มีเลขตามลำดับมีขนาดมีน้ำหนักมีป้ายและลักษณะอื่นคล้าย ๆ กัน, มีการจัดสรรที่ควบคุมโดยเภสัช, และมีการจัดสรรที่ทำโดยส่วนกลาง มีการแนะนำว่า วิธีการปิดบังการจัดสรรควรจะรวมอยู่ในเกณฑ์วิธีการทดลองทางคลินิก (clinical trial protocol) และควรจะมีการรายงานอย่างละเอียดในสิ่งตีพิมพ์ที่แสดงผลของ RCT แต่ว่า งานศึกษาในปี ค.ศ. 2005 พบว่า RCT ส่วนมากมีเกณฑ์วิธีที่มีการปิดบังการจัดสรรที่ไม่ชัดเจน หรือไม่กล่าวถึงอย่างชัดเจนในงานที่ตีพิมพ์ หรือทั้งสองอย่าง อย่างไรก็ดี ก็ยังมีงานศึกษาในปี ค.ศ. 2008 ของงาน meta-analysis 146 งานซึ่งสรุปว่า RCT ที่มีการปิดบังการจัดสรร (allocation concealment) ไม่เพียงพอหรือไม่ชัดเจนมักจะมีความเอนเอียงไปทางผลบวกต่อเมื่อผลของ RCT เป็นการวัดผลที่เป็นอัตวิสัย (subjective) แต่จะไม่มีเมื่อเป็นการวัดผลที่เป็นปรวิสัย

ให้สังเกตว่า ในประเด็นการปกปิดการจัดสรร (allocation concealment) มักมีความสับสนในเรื่องหลัก ๆ คือ

การปกปิดการจัดสรรไม่เหมือนกับการอำพรางการรักษา เพราะการปกปิดการจัดสรรเป็นการปิดไม่ให้รู้กลุ่มหรือการรักษาที่จะสุ่มจัดให้คนไข้ก่อนจะจัดจริง ๆ เท่านั้น เพื่อกันความเอนเอียงโดยการคัดเลือก (selection bias) และปัจจัยกวน (confounders) อื่น ๆ ส่วนการทดลองแบบอำพรางจะปิดการรักษาแม้ในช่วงการทดลองเพื่อกันความเอนเอียงอื่น ๆ
การปกปิดการจัดสรรอาจจะหมายถึงการปกปิดการจัดกลุ่มรักษา หรือการปกปิดการรักษาที่ทำไปตามลำดับ
การสร้างลำดับสุ่มและการปกปิดการจัดสรรเป็นคนละขั้นตอนกัน การสุ่มจัดการรักษาให้คนไข้จะต้องมีทั้งการสร้างลำดับสุ่มที่พยากรณ์ไม่ได้ และทั้งระเบียบวิธีการปกปิดการจัดสรรที่สามารถกันไม่ให้รู้การจัดกลุ่มหรือการจัดการรักษา (treatment assignment)

ขนาดตัวอย่าง

จำนวนของผู้ที่รับการรักษาพยาบาล (จะนับโดยจำนวนคนหรือจำนวนกลุ่มก็ดี) ในกลุ่มควบคุมและกลุ่มทดลองจะมีผลต่อความแม่นยำของ RCT ถ้าผลการรักษาพยาบาลนั้นเล็กน้อย จำนวนผู้ที่รับการรักษาในกลุ่มทั้งสองอาจจะไม่เพียงพอที่จะปฏิเสธผลว่าง (null hypothesis) เมื่อทำการตรวจสอบโดยสถิติ และความล้มเหลวในการปฏิเสธผลว่างก็จะหมายความว่า การรักษาพยาบาลนั้นไม่มีผลที่มีนัยสำคัญทางสถิติ "ในการทดลองนั้น ๆ" แต่ว่าถ้ามีขนาดตัวอย่างที่เพิ่มขึ้น RCT เช่นเดียวกันอาจจะสามารถแสดงผลของการรักษาพยาบาลที่มีนัยสำคัญทางสถิติ แม้ว่าจะมีผลเพียงเล็กน้อย

การอำพราง

ข้อมูลเพิ่มเติม: การทดลองแบบอำพราง

RCT อาจจะเป็นการทดลองแบบอำพราง (blind experiment) คือมี "วิธีการที่ป้องกันผู้ร่วมการทดลอง ผู้ให้ความดูแล หรือผู้ประเมินผล ไม่ให้รู้ว่าผู้ป่วยได้รับการรักษาพยาบาลแบบไหน" โดยที่ไม่เหมือนกับการปิดบังการจัดสรร การอำพรางบางครั้งอาจไม่สมควรหรือว่าเป็นไปไม่ได้ที่จะทำใน RCT ยกตัวอย่างเช่น RCT เกี่ยวกับการรักษาพยาบาลที่ต้องอาศัยความร่วมมือเป็นการร่วมกระทำของคนไข้ (เช่น กายภาพบำบัด) ก็จะไม่สามารถอำพรางการรักษาพยาบาลจากคนไข้ได้

ที่สืบ ๆ กันมา RCT แบบอำพรางมักจะจัดประเภทเป็น "อำพรางฝ่ายเดียว" (single-blind) "อำพรางสองฝ่าย" (double-blind) หรือ "อำพรางสามฝ่าย" (triple-blind) แต่ว่า งานศึกษาในปี ค.ศ. 2001 และ 2006 พบว่า ชื่อเหล่านี้มีความหมายต่างกันสำหรับบุคคลต่าง ๆ ดังนั้น คำแถลงความ Consolidated Standards of Reporting Trials (CONSORT) ออกเมื่อปี ค.ศ. 2010 จึงกำหนดว่า นักวิจัยและบรรณาธิการไม่ควรใช้คำว่า อำพรางฝ่ายเดียว อำพรางสองฝ่าย หรืออำพรางสามฝ่าย แต่ให้อธิบาย "ถ้ามีการทำ (การอำพราง) ได้ทำต่อใครหลังจากการจัดให้ได้รับการรักษาพยาบาล (เช่น อำพรางผู้ร่วมการทดลอง อำพรางผู้ที่ดูแลรักษา และ/หรืออำพรางผู้ที่ประเมินผล) และทำอย่างไร"

RCT ที่ไม่มีการอำพรางควรเรียกว่า "ไม่อำพราง" (unblinded) หรือว่า "เปิด" (open) หรือถ้าเป็นการให้ยา "open-label" ในปี ค.ศ. 2008 งานวิจัยหนึ่งสรุปว่า ผลการทดลอง RCT ที่ไม่มีการอำพรางมักจะมีความเอนเอียงไปทางผลบวกถ้าผลนั้นวัดโดยวิธีที่เป็นอัตวิสัย (subjective) ไม่ใช่เป็นการวัดที่เป็นปรวิสัย (objective) ยกตัวอย่างเช่น ใน RCT ที่ตรวจสอบการรักษาโรคปลอกประสาทเสื่อมแข็ง (multiple sclerosis) ประสาทแพทย์ที่ไม่ได้รับการอำพรางมีความรู้สึกว่า การรักษาได้ผล แต่ว่า แพทย์ที่มีการอำพรางไม่คิดว่าได้ผล ใน RCT สำหรับปฏิบัติ (pragmatic) แม้ว่าบ่อยครั้งจะไม่ได้อำพรางผู้ร่วมการทดลองและผู้ให้การดูแลรักษา แต่ว่า "ทั้งน่าปรารถนาด้วยและบ่อยครั้งเป็นไปได้ด้วยที่จะอำพรางผู้ประเมิน (ผล) หรือเก็บหาข้อมูลที่เป็นปรวิสัยเพื่อการประเมินผล"

การวิเคราะห์ข้อมูล

วิธีการทางสถิติที่ใช้ใน RCT ขึ้นอยู่กับลักษณะข้อมูล รวมทั้ง

สำหรับข้อมูลที่ให้ผลเป็นทวิวิภาค คือแบ่งเป็นสองอย่าง สามารถใช้ logistic regression และวิธีอื่น ๆ (ยกตัวอย่างเช่น ใน RCT ที่กำหนดการตอบสนองแบบดำรงอยู่ได้ ของยา peginterferon alfa-2a ต่อไวรัสตับอักเสบชนิดซี)
สำหรับข้อมูลที่ให้ผลแบบต่อเนื่อง analysis of covariance สามารถใช้ตรวจสอบผลของตัวแปรทำนาย (predictor variable) (เช่น เพื่อตรวจความเปลี่ยนแปลงของไขมันในเลือดหลังจากได้ยาอะโทวาสแตติน ภายหลังจากการเกิดกลุ่มภาวะกล้ามเนื้อหัวใจขาดเลือดเฉียบพลัน)
สำหรับข้อมูลที่แสดง time-to-event outcome ที่การวัดข้อมูลอาจไม่สมบูรณ์ (เพราะเหตุ Censoring) การวิเคราะห์โดย survival analysis อาจจะสมควร (เช่นการใช้ Kaplan-Meier estimator และ Cox proportional hazards model ในการวิเคราะห์ช่วงเวลาที่จะเกิดโรคหลอดเลือดหัวใจหลังจากได้รับการบำบัดด้วยการทดแทนฮอร์โมน [hormone replacement therapy] หลังจากหมดระดูแล้ว)

ไม่ว่าจะใช้วิธีการทางสถิติใด ๆ เรื่องสำคัญที่ควรพิจารณาเกี่ยวกับการวิเคราะห์ข้อมูลของ RCT รวมทั้ง

ควรจะหยุดการทดลองก่อนจะเสร็จเพราะข้อมูลที่ได้แล้วหรือไม่ ยกตัวอย่างเช่น อาจควรที่จะหยุด RCT ก่อนเสร็จเพราะว่าการรักษา "ได้ผลดีหรือมีผลเสียเกินกว่าที่คาด" หรือว่า "ผู้ทำการทดลองพบหลักฐานว่าไม่มีผลแตกต่างที่สำคัญระหว่างวิธีการรักษาของกลุ่มทดลองกับของกลุ่มควบคุม"
ระดับที่กลุ่มการทดลองสามารถวิเคราะห์ได้ตามที่สุ่ม คือถ้าสามารถใช้ intention-to-treat analysis (การวิเคราะห์การรักษาตามที่ตั้งใจ) ได้หรือไม่ เพราะว่า การวิเคราะห์การรักษาตามที่ตั้งใจที่สมบูรณ์ "จะเป็นไปได้ก็ต่อเมื่อได้ข้อมูลผลที่สมบูรณ์" จากผู้ร่วมการทดลองทั้งหมดตามที่สุ่มเท่านั้น แต่ถ้าข้อมูลผลบางอย่างยังขาดเหลืออยู่ อาจจะทำการวิเคราะห์กรณีที่มีข้อมูลสมบูรณ์และข้อมูลที่เติมให้เต็มโดยเทคนิคทางสถิติแบบ Imputation ได้ อย่างไรก็ดี ยิ่งมีผู้ร่วมการทดลองในกลุ่มที่จัดโดยสุ่มดั้งเดิมมากเท่าไร โอกาสที่จะเกิดความเอนเอียงก็จะน้อยลงเท่านั้น
ควรจะใช้เทคนิควิเคราะห์แบบ subgroup analysis (การวิเคราะห์เป็นกลุ่มย่อย) หรือไม่ ซึ่งเป็นวิธีที่ "มักจะแนะนำไม่ให้ทำ" เพราะว่า สามารถเกิดปัญหาทางสถิติที่เรียกว่า multiple comparisons problem ที่แสดงผลบวกที่ไม่จริง (false positive) ทำให้ผลที่พบไม่สามารถจะทำซ้ำได้

การรายงานผลของ RCT

บทความแถลง "Consolidated Standards of Reporting Trials (มาตรฐานรวมในการรายงานการทดลอง)" (CONSORT) สำหรับปี ค.ศ. 2010 เป็น "รายการคำแนะนำอย่างต่ำที่สุดในการรายงาน RCT โดยเป็นข้อแนะนำอิงหลักฐาน" CONSORT 2010 มีรายการที่ใช้ตรวจสอบ 25 รายการ (และบางรายการจะมีรายการย่อย ๆ) ที่เน้นใช้ในงานที่มี "การจัดกลุ่มแบบสุ่มที่ทำเป็นรายบุคคล แบ่งเป็นสองกลุ่ม ทำแบบ parallel" ซึ่งเป็น RCT แบบที่ใช้สามัญที่สุด และสำหรับแบบการศึกษาของ RCT อื่น มีบทแถลงความที่เรียกว่า "CONSORT extensions" ซึ่งได้รับการเผยแพร่แล้ว

ข้อดี

มีการพิจารณาโดยมากว่า RCT เป็นหลักฐานทางวิทยาศาสตร์ที่น่าเชื่อถือที่สุดในลำดับชั้นหลักฐาน (hierarchy of evidence) ที่มีอิทธิพลต่อนโยบายและวิธีการรักษาพยาบาล เพราะว่า RCT สามารถลดการแสดงเหตุผลที่ไม่เป็นจริงและความเอนเอียงต่าง ๆ ผลของ RCT หลายงานอาจจะมีการรวบรวมในงานปริทัศน์เป็นระบบ (systematic review) ที่มีการใช้เพิ่มขึ้นเรื่อย ๆ เพื่อเป็นแนวทางในเวชปฏิบัติอิงหลักฐาน (evidence-based medicine)

ตัวอย่างองค์กรวิทยาศาสตร์ที่พิจารณา RCT หรืองานปริทัศน์เป็นระบบของ RCT ว่าเป็นหลักฐานที่มีคุณภาพสูงสุดรวมทั้ง

โดยปี ค.ศ. 1998 องค์กรอิสระ คณะกรรมการงานวิจัยสุขภาพและการแพทย์แห่งชาติ (National Health and Medical Research Council) ของประเทศออสเตรเลียกำหนดระดับ "Level I" สำหรับหลักฐานที่ "ได้มาจากงานปริทัศน์เป็นระบบของ RCT ที่เกี่ยวข้องกับประเด็นศึกษาทั้งหมด" และระดับ "Level II" สำหรับหลักฐานที่ "ได้มาจาก RCT ที่มีการออกแบบที่เหมาะสมอย่างน้อยหนึ่งงาน"
เริ่มตั้งแต่ปี ค.ศ. 2001 ในการทำคำแนะนำเกี่ยวกับแนวทางการปฏิบัติทางคลินิก คณะทำงานเฉพาะกิจเพื่อการบริการป้องกัน (ทางสุขภาพ) ประเทศสหรัฐอเมริกา (United States Preventive Services Task Force) พิจารณาทั้งการออกแบบและทั้งความสมเหตุสมผล (internal validity) ว่าเป็นตัวบ่งชี้คุณภาพของงานศึกษา และยอมรับว่า "หลักฐานที่ได้มาจากการทดลองแบบสุ่มและมีกลุ่มควบคุม" ที่มีความสมเหตุสมผล (เช่นอย่างน้อยในระดับ "I-good") ว่าเป็นหลักฐานที่มีคุณภาพดีที่สุดที่หาได้
กลุ่ม GRADE Working Group สรุปในปี ค.ศ. 2008 ว่า "การทดลองแบบสุ่มที่ไม่มีข้อจำกัดที่สำคัญ เป็นหลักฐานที่มีคุณภาพสูง"
ในประเด็นเกี่ยวกับ "การรักษาบำบัด/การป้องกัน และสมุฏฐานของโรค/ผลเสีย" ศูนย์เวชปฏิบัติอิงหลักฐานออกซฟอร์ด (Oxford Centre for Evidence-based Medicine) โดยปี ค.ศ. 2001 กำหนดหลักฐานระดับ "Level 1a" ว่าเป็นงานปริทัศน์เป็นระบบของ RCT ที่มีผลคล้องจองกัน และกำหนดหลักฐานระดับ "Level 1b" ว่าเป็น "RCT งานหนึ่ง ๆ ที่มีช่วงความเชื่อมั่น (Confidence Interval) ที่แคบ"

ตัวอย่างสำคัญของ RCT ที่มีผลไม่คาดฝัน แล้วช่วยเปลี่ยนวิธีปฏิบัติทางคลินิกรวมทั้ง

หลังจากที่ได้รับการอนุมัติจากองค์การอาหารและยาสหรัฐอเมริกา ยาป้องกันหัวใจเสียจังหวะ (antiarrhythmic agents) รวมทั้ง flecainide และ encainide ก็เกิดวางตลาดขายในปี ค.ศ. 1986 และ 1987 ตามลำดับ งานศึกษาที่ไม่มีการสุ่มเกี่ยวกับยาเหล่านั้นแสดงผลบวกอย่างน่าพึงใจ และยอดขายของยาก็เพิ่มขึ้นรวมกันนับเป็นใบสั่งยาถึง 165,000 ชุดต่อเดือนในต้นปี ค.ศ. 1989 แต่ว่า ในปีนั้นเอง มีรายงานเบื้องต้นของ RCT ที่สรุปว่า ยาทั้งสองเพิ่มอัตราการตายของคนไข้ และหลังจากนั้น ยอดขายของยาทั้งสองจึงได้ลดลง
ก่อนปี ค.ศ. 2002 โดยอาศัยงานศึกษาแบบสังเกต (observational studies) แพทย์โดยปกติจะเริ่มการบำบัดด้วยการทดแทนฮอร์โมน (hormone replacement therapy) สำหรับหญิงที่หมดระดูแล้ว เพื่อป้องกันกล้ามเนื้อหัวใจตายเหตุขาดเลือด (myocardial infarction) แต่ว่าในปี ค.ศ. 2002 และ 2004 มีการตีพิมพ์ผลงาน RCT จาก Women's Health Initiative (โครงการริเริ่มสุขภาพหญิง) ที่อ้างว่า หญิงที่รับการบำบัดด้วยการทดแทนฮอร์โมนเอสโทรเจนกับฮอร์โมน progestin มีอัตรากล้ามเนื้อหัวใจตายเหตุขาดเลือดสูงกว่าหญิงที่ได้ยาหลอก และหญิงที่รับการบำบัดด้วยการทดแทนฮอร์โมนเอสโทรเจนเพียงอย่างเดียวมีอุบัติการณ์ของโรคหัวใจที่ไม่ได้ลดลง คำอธิบายความแตกต่างระหว่างผลของงานศึกษาแบบสังเกตและ RCT รวมทั้งความแตกต่างระหว่างระเบียบวิธีที่ใช้ การใช้ฮอร์โมน และกลุ่มประชากรที่ศึกษา หลังจากการตีพิมพ์ RCT เหล่านี้ การบำบัดด้วยการทดแทนฮอร์โมนจึงได้ลดลง

ข้อเสีย

มีบทความมากมายที่แสดงข้อเสียของ RCT ข้อเสียที่กล่าวถึงบ่อยที่สุดจะกล่าวในหัวข้อย่อยดังต่อไปนี้

ความเป็นจริงมีความจำกัดนอกการทดลอง

ระดับที่ผลของ RCT สามารถใช้ได้จริง ๆ ในสถานการณ์นอกการทดลองมีความต่าง ๆ กัน ซึ่งก็หมายความว่า ระดับ external validity ของ RCT นั้นอาจจะจำกัด

องค์ประกอบที่มีอิทธิพลต่อการใช้ผลของ RCT ได้จริง ๆ รวมทั้ง

ภูมิภาคที่ทำการทดลอง (คือ การรักษาที่มีผลในประเทศหนึ่งอาจจะใช้ไม่ได้ในอีกประเทศหนึ่ง)
ลักษณะต่าง ๆ ของคนไข้ (เช่น RCT อาจจะทำในคนไข้ที่มีพยากรณ์โรค [prognosis] ดีกว่าโดยเฉลี่ย หรืออาจจะไม่รวม "ผู้หญิง เด็ก คนแก่ และบุคคลที่มีอาการโรคที่สามัญทั่วไป")
วิธีดำเนินการของงานศึกษา (เช่น คนไข้ใน RCT อาจจะได้รับวิธีแบบถี่ถ้วนในการตรวจวินิจฉัยและการรักษาพยาบาลต่อ ๆ มา ที่ยากที่จะทำได้ในสถานการณ์จริง ๆ)
การวัดผล (คือ RCT อาจจะใช้การวัดผลแบบประกอบ [composite measures]) ซึ่งปกติไม่ใช้ในการปฏิบัติทางคลินิก
การรายงานที่ไม่สมบูรณ์เกี่ยวกับผลร้ายที่เกิดขึ้นโดยการรักษาพยาบาล

ค่าใช้จ่ายสูง

ค่าใช้จ่ายของ RCT อาจจะสูงมาก งานวิจัยหนึ่งพบว่า งาน RCT ในขั้น Phase III 28 งานที่ได้รับทุนจาก National Institute of Neurological Disorders and Stroke (สถาบันโรคทางประสาทและโรคหลอดเลือดสมองแห่งชาติสหรัฐอเมริกา ซึ่งเป็นส่วนของสถาบันสุขภาพแห่งชาติ (สหรัฐอเมริกา)) ก่อนปี ค.ศ. 2000 มีค่าใช้จ่ายรวมกันถึง 335 ล้านเหรียญสหรัฐ โดยมีค่าใช้จ่ายเฉลี่ยที่ 12 ล้านเหรียญสหรัฐต่องาน อย่างไรก็ดี ผลตอบแทนการลงทุน (ROI) ของ RCT อาจจะสูง คืองานวิจัยเดียวกันนั้นแหละคาดว่า งาน 28 งานนั้นจะให้ผลกำไรสุทธิต่อสังคมถึง 46 เท่าของเงินทุนภายใน 10 ปี โดยประเมินปีอายุที่เพิ่มขึ้น (quality-adjusted life year) เนื่องจากการใช้ผลการทดลอง ว่ามีมูลค่าเท่ากับ GDP เฉลี่ยต่อคน

ใช้ระยะเวลายาว

งาน RCT ใช้เวลาเป็นหลายปีก่อนจะมีการเผยแพร่ และดังนั้นแพทย์จะไม่ได้ข้อมูลเป็นเวลาหลายปี และผลงานอาจจะมีความสำคัญน้อยลงเมื่อพร้อมที่จะเผยแพร่

อาจจะไม่ดีกว่างานศึกษาแบบสังเกต

มีงานวิจัย 2 งานในปี ค.ศ. 2000 พิมพ์ในวารสารการแพทย์นิวอิงแลนด์ที่พบว่า งานศึกษาแบบสังเกต (observational studies) และ RCT โดยรวม ๆ แล้วแสดงผลคล้ายคลึงกัน ผลงานเหล่านี้สั่นคลอนความเชื่อว่า "งานศึกษาแบบสังเกตไม่ควรใช้กำหนดการรักษาพยาบาลอิงหลักฐาน" และว่า ผลของงาน RCT เป็น "หลักฐานเกรดดีที่สุด" แต่ว่า งานวิจัยในปี ค.ศ. 2001 ที่พิมพ์ใน Journal of the American Medical Association (JAMA) สรุปว่า "ความไม่สอดคล้องกันแบบไม่บังเอิญก็สามารถเกิดขึ้นได้ (คือผลบวกลบที่ต่างกันจริง ๆ โดยไม่บังเอิญก็ยังมี) และความแตกต่างของระดับผลประเมินเพราะการรักษาพยาบาลนั้นเป็นเรื่องสามัญ (คือแสดงผลบวกเหมือนกันแต่มีขนาดผลไม่เท่ากัน)"

มีแนวคิดอีกสองอย่างที่ตั้งความสงสัยว่า RCT มีส่วนส่งเสริมความรู้ทางวิทยาศาสตร์อย่างไรที่เหนือจากการศึกษาแบบอื่น ๆ คือ

ถ้ามีการให้คะแนนโดยโอกาสที่จะมีการค้นพบใหม่ ๆ หลักฐานเชิงบอกเล่า (anecdotal evidence) จะได้คะแนนสูงสุด ตามมาด้วยงานศึกษาแบบสังเกต และตามมาด้วย RCT
RCT อาจจะไม่จำเป็นสำหรับการรักษาพยาบาลที่มีผลชัดเจนและรวดเร็ว เมื่อเทียบกับอาการของโรคที่ค่อนข้างจะเสถียรหรือค่อย ๆ แย่ลง ยกตัวอย่างเช่น การใช้เคมีบำบัดแบบผสม (combination chemotherapy) รวมทั้งการใช้ยา cisplatin ในการรักษามะเร็งอัณฑะที่แพร่กระจายออกไปแล้ว ซึ่งเพิ่มอัตราการรักษาจาก 5% ไปเป็น 60% ในงานศึกษาแบบไม่สุ่มในปี ค.ศ. 1977

เหตุการณ์ที่มีน้อยศึกษาได้ยาก

วิธีการรักษาพยาบาลที่ป้องกันเหตุการณ์ที่เกิดขึ้นน้อยมาก (เช่น กลุ่มอาการทารกตายกะทันหัน) และผลร้ายที่เกิดขึ้นน้อยมาก (เช่น ผลข้างเคียงที่น้อยมากของยา) อาจจะต้องใช้ RCT ที่มีผู้ร่วมการทดลองเป็นจำนวนมาก และดังนั้นการศึกษาแบบสังเกตอาจจะเป็นวิธีการศึกษาที่ทำได้ง่ายกว่า

ผลในอนาคตไกลศึกษาได้ยาก

ค่าใช้จ่ายจะสูงมากถ้าต้องทำ RCT เป็นปี ๆ หรือทศวรรษ ๆ เพื่อจะตรวจสอบผลจากการรักษาพยาบาลในอนาคตไกล ๆ

ผลที่ได้สนับสนุนอุตสาหกรรม ถ้าได้ทุนมาจากอุตสาหกรรม

งาน RCT บางงานได้ทุนทั้งหมดหรือบางส่วนมาจากอุตสาหกรรมรักษาสุขภาพ (เช่น จากบริษัทยา) เทียบกับจากรัฐบาล องค์กรไม่เก็งผลกำไร หรือแหล่งเงินทุนอื่น ๆ งานปริทัศน์เป็นระบบ (systematic review) ที่พิมพ์ในปี ค.ศ. 2003 พบบทความ 4 บทความพิมพ์ระหว่างปี ค.ศ. 1986-2002 ที่เปรียบเทียบ RCT ที่ได้ทุนมาจากอุตสาหกรรมและจากแหล่งอื่น ๆ และพบว่า ข้อมูลจากทั้งสี่บทความพบสหสัมพันธ์ระหว่างการได้ทุนจากอุตสาหกรรม กับผลบวกที่ได้จากการรักษาพยาบาลที่เป็นประเด็นการศึกษา งานศึกษาปี ค.ศ. 2004 ของ RCT ในช่วงระหว่างปี ค.ศ. 1999-2001 ที่พิมพ์ในวารสารแนวหน้าทางการแพทย์และทางศัลยกรรมพบว่า RCT ที่ได้ทุนจากอุตสาหกรรม "มีโอกาสสูงกว่าที่จะมีผลงานที่พบนัยสำคัญทางสถิติที่สนับสนุนอุตสาหกรรม" เหตุที่เป็นไปได้อย่างหนึ่งที่เกิดผลงานที่สนับสนุนอุตสาหกรรมสำหรับ RCT ที่ได้ทุนจากอุตสาหกรรมก็คือความเอนเอียงในการตีพิมพ์ (publication bias)

ผู้ร่วมการทดลองเข้าใจผิดเกี่ยวกับการรักษา

แม้ว่าผู้ร่วมการทดลองจะต้องให้ความยินยอมในการเข้าร่วม RCT แต่ว่า งานวิจัยต่าง ๆ ตั้งแต่ปี ค.ศ. 1982 พบว่า ผู้ร่วมการทดลองเป็นจำนวนมากเชื่อว่า ตนจะได้รับการรักษาพยาบาลที่ดีที่สุดสำหรับสภาพโรคของตนอย่างแน่นอน ซึ่งก็คือ ผู้ร่วมการทดลองไม่เข้าใจความแตกต่างกันระหว่างงานวิจัยกับการรักษาพยาบาล ดังนั้น ควรที่จะมีการศึกษาเพิ่มขึ้นเพื่อจะกำหนดความแพร่หลายและวิธีการป้องกันความเข้าใจผิดในเรื่องนี้

เป็นการศึกษาที่มีวงแคบ

งานทดลองทางคลินิกแบบสุ่มปกติจะตรวจสอบตัวแปรอย่างหนึ่งหรือเพียงไม่กี่อย่าง ที่ยากที่จะสะท้อนความเป็นจริงในสถานการณ์ทางการแพทย์ที่ซับซ้อนที่มีจริง ๆ เมื่อเทียบกับการรายงานเค้ส (case report) ซึ่งสามารถให้รายละเอียดในด้านต่าง ๆ ของคนไข้ เช่น ประวัติคนไข้ การตรวจร่างกาย การวินิจฉัยทางการแพทย์ สภาพจิตใจที่เกี่ยวเนื่องกับสังคม (psychosocial aspects) และการติดตาม

สามารถมีความผิดพลาดทางสถิติ

ข้อมูลเพิ่มเติม: ความผิดพลาดชนิดที่ 1 และ 2

RCT สามารถมีทั้งความผิดพลาดทางสถิติทั้งแบบที่ 1 (ผลบวกที่ไม่จริง) และแบบที่ 2 (ผลว่างหรือลบที่ไม่จริง) เกี่ยวกับความผิดพลาดแบบที่ 1 RCT ทั่ว ๆ ไปจะใช้ค่าความน่าจะเป็นที่ 0.05 (คือ 1 ใน 20) ที่จะแสดงวิธีการรักษาสองอย่างที่จริง ๆ มีสมรรถภาพเท่าเทียมกัน ว่าแตกต่างกันอย่างสำคัญ (คือมีโอกาส 5% ว่าผลบวกที่พบไม่มีจริง ๆ) เกี่ยวกับความผิดพลาดแบบที่ 2 แม้ว่าจะมีบทความที่ตีพิมพ์ตั้งแต่ปี ค.ศ. 1978 ที่ให้ข้อสังเกตว่า RCT จำนวนมากที่แสดงผลลบ มีขนาดตัวอย่าง (sample size) ที่เล็กเกินไปที่จะสรุปได้อย่างชัดเจนว่า วิธีการรักษาพยาบาลนั้นมีผลลบ (หรือผลว่าง) จริง ๆ และโดยปี ค.ศ. 2005-2006 ก็ยังมี RCT จำนวนหนึ่งที่รายงานการคำนวณขนาดตัวอย่างที่ไม่ตรงหรือไม่สมบูรณ์

มีผลทางวัฒนธรรมที่ยังไม่เข้าใจ

วิธีการของ RCT สร้างปรากฏการณ์ทางวัฒนธรรมบางอย่างที่ยังไม่มีความเข้าใจดี ยกตัวอย่างเช่น คนไข้บั้นปลายอาจพยายามเข้าร่วมการทดลองเพื่อใช้เป็นวิธีรักษาสุดท้าย แม้ว่าการรักษาพยาบาลนั้นจะมีโอกาสน้อยที่จะประสบความสำเร็จ

มีอันตรายจากการขัดกันแห่งผลประโยชน์

โดยมีจุดมุ่งหมายเพื่อเปิดโปงการขัดกันแห่งผลประโยชน์ของ RCT ที่ใช้เป็นข้อมูลของงานวิเคราะห์อภิมาน (meta-analysis) งานวิจัยในปี ค.ศ. 2011 ทำการปริทัศน์งาน meta-analysis 29 งานแล้วพบว่า การขัดกันแห่งผลประโยชน์ที่มีใน RCT ที่ใช้เป็นข้อมูล แทบไม่มีการเปิดเผย งาน meta-analysis ที่ตรวจสอบ 29 งานรวมทั้ง

งาน 11 งานจากวารสารการแพทย์ทั่วไป
งาน 15 งานจากวารสารการแพทย์เฉพาะทาง
งาน 3 งานจาก Cochrane Database of Systematic Reviews (ฐานข้อมูล งานปริทัศน์เป็นระบบขององค์กรความร่วมมือคอเครน)

งาน meta-analysis 29 งานรวมงาน RCT ทั้งหมด 509 งาน ในบรรดางาน RCT เหล่านั้น 318 งานรายงานแหล่งทุน (62% จากทั้งหมด) โดยมี 219 งานที่ได้ทุนมาจากอุตสาหกรรม (69% จากที่รายงาน) จาก RCT 509 งาน มีงาน 132 งานที่รายงานการขัดกันแห่งผลประโยชน์ทางการเงินของผู้ทำงานวิจัย (26% จากทั้งหมด) โดยมี 91 งานที่รายงานการมีผลประโยชน์ร่วมกับอุตสาหกรรม (69% จากที่รายงาน) แต่ว่า รายงานการขัดกันแห่งผลประโยชน์เหล่านี้แทบไม่มีการกล่าวถึงในงาน meta-analysis คือ มีเพียงแค่ 2 งาน (7% จาก 29 งานทั้งหมด) ที่รายงานแหล่งเงินทุนของ RCT และไม่มีงานไหนเลยที่รายงานการมีผลประโยชน์ร่วมกับอุตสาหกรรมของผู้ทำงานวิจัย ผู้ทำงานวิจัยนี้สรุปว่า

เพราะไม่มีการชี้แจงความขัดกันแห่งผลประโยชน์ เนื่องจากได้รับเงินทุนหรือมีผลประโยชน์ทางการเงินร่วมกับอุตสาหกรรมและธุรกิจ สำหรับงานวิจัยแบบสุ่มและมีกลุ่มควบคุมที่รวมอยู่ใน meta-analysis (ดังนั้น) ความเข้าใจและการประเมินหลักฐานที่ได้มาจาก meta-analysis อาจจะมีความบิดเบือน

ในสังคมศาสตร์

การใช้ RCT ในงานวิจัยทางสังคมศาสตร์ยังเป็นเรื่องที่มีการถกเถียงกันอย่างไม่รู้จักจบสิ้น คือพวกที่มีพื้นฐานประสบการณ์ทางการแพทย์หรือการรักษาพยาบาลกลุ่มหนึ่งก็กล่าวว่า งานวิจัยในประเด็นต่าง ๆ เกี่ยวกับสังคมศาสตร์ขาดความน่าเชื่อถือ และควรจะพัฒนาโดยเพิ่มการใช้ RCT ในบางประเทศ เรื่องนี้เป็นเรื่องที่มีการถกเถียงกันในระดับสูงในเรื่องการศึกษาทางการขนส่ง คือมีนักวิชาการบางท่านที่เสนอว่า งบประมาณของรัฐที่ใช้ในโครงการที่เนื่องกับการส่งเด็กไปโรงเรียนนั้นไม่สมควร ยกเว้นถ้ามีอิทธิผลที่มีการรับรองโดย RCT มีงานวิจัยในปี ค.ศ. 2011 ที่ทำการปริทัศน์งานประเมินวิธีการปฏิบัติทางการขนส่ง 77 งาน และแบ่งงานเหล่านั้นออกเป็น 5 ระดับขึ้นอยู่กับคุณภาพ นักวิจัยสรุปว่า งานโดยมากมีคุณภาพต่ำ แล้วสนับสนุนให้ใช้ RCT ในงานวิจัยทางการขนส่งต่อไปในอนาคต

แต่ก็มีนักวิชาการท่านหนึ่งที่ไม่เห็นด้วยกับข้อสรุปเหล่านี้ โดยกล่าวว่า ข้อดีที่อ้างกันของ RCT ในการกำหนดเหตุและผล และในการป้องกันความเอนเอียงเป็นเรื่องที่กล่าวเกินความจริง แล้วเสนอ "หลัก 8 อย่างที่จะใช้ RCT ในสถานการณ์ที่ข้อปฏิบัติที่เสนอต้องอาศัยการเปลี่ยนพฤติกรรมของประชาชนเพื่อที่จะมีอิทธิผล"

คือ ข้อปฏิบัติที่เสนอต้องมีลักษณะเหล่านี้คือ

ยังไม่ได้ใช้กับสมาชิกทุกคนในกลุ่มประชากร (เช่น ทุกคนในประเทศ หรือพนักงานทุกคนขององค์กร เป็นต้น)
จะใช้ในสถานการณ์สิ่งแวดล้อมที่คล้ายกับที่มีในกลุ่มควบคุม
สามารถแยกออกจากข้อประพฤติปฏิบัติอื่น ๆ และจุดมุ่งหมายงานศึกษาก็เพื่อตรวจสอบผลของข้อปฏิบัติ
ช่วงเวลาจากการเริ่มใช้ข้อปฏิบัติและการแสดงผลต้องเป็นระยะเวลาสั้น ๆ

และกลไกที่เป็นเหตุต้องมีลักษณะเหล่านี้ คือ

เป็นกลไกที่นักวิจัยเข้าใจดีแล้ว หรือว่า กลไกที่อาจเป็นเหตุอย่างอื่น ๆ ต้องสามารถตรวจสอบได้
ไม่มีกลไกการป้อนกลับอย่างมีนัยสำคัญระหว่างกลุ่มทดลอง (ที่จะใช้ข้อปฏิบัติที่เป็นประเด็นการศึกษา) และสิ่งแวดล้อมภายนอก
มีความสัมพันธ์กับองค์ประกอบภายนอกที่มีเสถียรภาพและสามารถพยากรณ์ได้
จะต้องทำงานเช่นเดียวกันถ้ากลุ่มควบคุมกับกลุ่มทดลองนั้นกลับกัน

การพัฒนาระหว่างประเทศ

ปัจจุบันนี้ มีการใช้ RCT ในการตรวจสอบการช่วยเหลือการพัฒนาระหว่างประเทศ (international development) ทั่วโลก นักเศรษฐศาสตร์การพัฒนาที่องค์กรวิจัยต่าง ๆ รวมทั้ง Abdul Latif Jameel Poverty Action Lab และ Innovations for Poverty Action ได้ใช้ RCT เพื่อตรวจสอบอิทธิผลของโปรแกรมแก้ปัญหาความยากจน สุขภาพ และการศึกษาในประเทศกำลังพัฒนา

แม้ว่า RCT อาจจะมีประโยชน์ในการประเมินผลของนโยบาย แต่ก็จำเป็นที่จะตีความผลที่ได้ในงานศึกษาทางสังคมศาสตร์อย่างระมัดระวัง ยกตัวอย่างเช่น ข้อปฏิบัติในการแก้ปัญหาอาจจะทำให้เกิดความเปลี่ยนแปลงทางสังคม-เศรษฐกิจ และทางพฤติกรรม ที่สร้างตัวแปรสับสนในความสัมพันธ์ต่าง ๆ ที่พบ

สำหรับนักเศรษฐศาสตร์การพัฒนาบางพวก ประโยชน์ที่ได้จาก RCT เทียบกับวิธีการศึกษาแบบอื่น ๆ ก็คือ การสุ่มจะป้องกันความเอนเอียงโดยการคัดเลือก (selection bias) ซึ่งเป็นปัญหาในงานวิจัยปัจจุบันเกี่ยวกับนโยบายการพัฒนา ในงานศึกษา RCT ตัวอย่างในปี ค.ศ. 2007 ที่น่าสนใจงานหนึ่งในสาขาเศรษฐศาสตร์การพัฒนา มีการสุ่มหมู่บ้าน 608 หมู่บ้านในประเทศอินโดนีเชียที่จะมีการสร้างถนนออกเป็นกลุ่มหลัก 2 กลุ่ม คือ ไม่มีการสอบบัญชีจากรัฐบาลกลาง และมีการสอบบัญชี และในสองกลุ่มนั้น แต่ละกลุ่มจะมีกลุ่มย่อยอีกสามกลุ่มคือ ไม่มีการเชิญให้ (กลุ่มรากหญ้า) เข้าร่วมประชุมที่แสดงบัญชีการใช้จ่าย, มีการเชิญให้เข้าร่วมประชุม, และมีการเชิญให้เข้าร่วมประชุมโดยใบเชิญมีฟอร์มให้กรอกความเห็นแบบนิรนาม หลังจากทำการประเมิน "งบประมาณที่ขาดหายใป" (คือคอร์รัปชั่น) นักวิจัยสรุปว่า การตรวจสอบโดยรัฐบาลมีประสิทธิผลยิ่งกว่า "การเพิ่มการร่วมมือจากกลุ่มรากหญ้าเพื่อการตรวจสอบ" โดยมีจุดมุ่งหมายที่จะลดคอร์รัปชั่น แต่จริง ๆ แล้ว ข้อสรุปเดียวกันนี้ ก็ยังสามารถได้จากการสร้างแบบจำลองที่สมควร แล้วใช้ข้อมูลที่ได้จากการศึกษาระยะยาว (longitudinal studies) อีกด้วย

เรื่องสำคัญที่สุดโดยรวม ๆ ในการศึกษาทางสังคมศาสตร์ก็คือ ต้องสามารถทำการตรวจสอบหาข้อมูลเกี่ยวกับผลที่คาดหวัง และผลที่ไม่คาดหวัง ที่เกิดขึ้นจากนโยบายปฏิบัติที่เป็นประเด็นการศึกษา

อาชญาวิทยา

มีการทำงานศึกษาแบบ RCT เพิ่มขึ้นเรื่อย ๆ ในสาขาอาชญาวิทยา คือ งานปริทัศน์ในปี ค.ศ. 2005 พบงาน RCT 83 งานในสาขาที่พิมพ์ในระหว่างปี ค.ศ. 1982-2004 เทียบกับ 35 งานที่พบในระหว่างปี ค.ศ. 1957-1981 ซึ่งจัดประเภทเป็น 5 ประเภท คือ policing (การรักษากฎหมายและความสงบเรียบร้อย) prevention (การป้องกัน) corrections (การลงโทษ) court (ศาล) และ community (ชุมชน) โดยเพ่งความสนใจไปที่โปรแกรมเปลี่ยนพฤติกรรมนักโทษ งานวิจัยในปี ค.ศ. 2008 อ้างว่า RCT อาจจะเป็นเรื่องยากที่จะกระทำ (เช่น ถ้าการดำเนินการ RCT จะต้องมี "การตัดสินลงโทษที่สุ่มนักโทษให้อยู่ในโปรแกรม [ทดลอง] ต่าง ๆ")

การศึกษา

มีการใช้ RCT เพื่อประเมินข้อปฏิบัติทางการศึกษาหลายอย่าง เช่น มีงานในปี ค.ศ. 2009 ที่สุ่มห้องเรียนประถมศึกษา 260 ห้องเป็นกลุ่มควบคุมและกลุ่มทดลองที่มีการตรวจคัดพฤติกรรม (behavioral screening) มีข้อปฏิบัติเพื่อป้องกันแทรกแซงในห้องเรียน และมีการฝึกผู้ปกครอง แล้ววัดคะแนนทางพฤติกรรมและการศึกษาของนักเรียน มีงานอีกงานหนึ่งที่พิมพ์ในปี ค.ศ. 2009 ที่สุ่มห้องเรียนของเด็ก ป.1 678 คนเป็นกลุ่มทดลองที่มีข้อปฏิบัติแทรกแซงมีห้องเป็นศูนย์ (classroom-centered) กลุ่มทดลองที่มีผู้ปกครองเป็นศูนย์ (parent-centered) และที่ไม่มีข้อปฏิบัติ (no intervention คือกลุ่มควบคุม)

แหล่งข้อมูลอื่น

Domanski MJ; McKinlay S. Successful randomized trials: a handbook for the 21st century. Philadelphia: Lippincott Williams & Wilkins; 2009. ISBN 978-0-7817-7945-6.
Jadad AR; Enkin M. Randomized controlled trials: questions; answers; and musings. 2nd ed. Malden; Mass.: Blackwell; 2007. ISBN 978-1-4051-3266-4.
Matthews JNS. Introduction to randomized controlled clinical trials. 2nd ed. Boca Raton; Fla.: CRC Press; 2006. ISBN 1-58488-624-2.
Nezu AM; Nezu CM. Evidence-based outcome research: a practical guide to conducting randomized controlled trials for psychosocial interventions. Oxford: Oxford University Press; 2008. ISBN 978-0-19-530463-3.
Solomon PL; Cavanaugh MM; Draine J. Randomized controlled trials: design and implementation for community-based psychosocial interventions. New York: Oxford University Press; 2009. ISBN 978-0-19-533319-0.
Torgerson DJ; Torgerson C. Designing randomised trials in health; education and the social sciences: an introduction. Basingstoke; England; and New York: Palgrave Macmillan; 2008. ISBN 978-0-230-53735-4.

เว็บไซต์

Bland M. Directory of randomisation software and services. University of York; 2008 March 19.
Evans I; Thornton H; Chalmers I. Testing treatments: better research for better health care. เก็บถาวร 2010-12-25 ที่ เวย์แบ็กแมชชีน London: Pinter & Martin; 2010. ISBN 978-1-905177-35-6.
Gelband H. The impact of randomized clinical trials on health policy and medical practice: background paper. เก็บถาวร 2016-03-03 ที่ เวย์แบ็กแมชชีน Washington; DC: U.S. Congress; Office of Technology Assessment; 1983. (Report OTA-BP-H-22.)
REFLECT (Reporting guidElines For randomized controLled trials for livEstoCk and food safeTy) Statement
Wathen JK; Cook JD. Power and bias in adaptively randomized clinical trials. M. D. Anderson Cancer Center; University of Texas; 2006 July 12.
RCTrials.org - An online community forum dedicated to Randomized Controlled Trials. เก็บถาวร 2014-12-18 ที่ เวย์แบ็กแมชชีน
ResearchTool.org - Specialised RCT consulting and platform.

ด ค ก Biomedical research: Clinical study design / Design of experiments
Overview	การทดลองทางคลินิก Clinical trial protocol Clinical trial management Academic clinical trials
Controlled study (EBM I to II-1; A to B)	การทดลองแบบสุ่มและมีกลุ่มควบคุม การทดลองแบบอำพราง Open-label trial)
งานศึกษาแบบสังเกต (EBM II-2 to II-3; B to C)	งานศึกษาตามขวาง vs. งานศึกษาตามยาว, Ecological study งานศึกษาตามรุ่น (งานศึกษาตามรุ่นย้อนหลัง งานศึกษาตามรุ่นตามแผน) งานศึกษามีกลุ่มควบคุม (Nested case-control study) Case series Case study รายงานผู้ป่วย
วิทยาการระบาด/ methods	occurrence: อุบัติการณ์ (อุบัติการณ์สะสม) ความชุก ความชุก ณ จุดใดจุดหนึ่ง ความชุกในช่วงเวลา) association: absolute (Absolute risk reduction, Attributable risk, Attributable risk percent) relative (ความเสี่ยงสัมพัทธ์ (Odds ratio, Hazard ratio) other: Virulence Infectivity Mortality rate Morbidity Case fatality Specificity and sensitivity Likelihood-ratios Pre/post-test probability
Trial/test types	In vitro In vivo Animal testing Animal testing on non-human primates First-in-man study Multicenter trial Seeding trial Vaccine trial
Analysis of clinical trials	Risk-benefit analysis
Interpretation of results	Selection bias Correlation does not imply causation Null result
Category · Glossary · List of topics