[통계 기초] 실험 디자인과 데이터 수집의 원칙

KiwiChipKiwiChip
4 min read

1. 과학적 실험의 필요성

1986년 1월 28일, 우주왕복선 챌린저호(Challenger)가 발사 후 73초 만에 폭발하여 승무원 7명이 사망했다.
사고 원인을 조사한 리처드 파인만(Richard Feynman)은 고무 패킹(O-ring)이 낮은 온도에서 탄력을 잃었기 때문이라는 가설을 세웠다.
그는 얼음물에 고무 패킹을 넣어 탄력을 잃는 실험을 했지만, 대조군이 없는 불완전한 실험이었다.
과학적 실험에서는 단 하나의 변수(온도)만 바꿔야 하며, 대조군과 실험군을 비교해야 한다.

과학 연구에서 가설 설정

실험을 통해 데이터를 모으고 분석하여 가설이 맞는지 검증한다.

  • 추운 날씨가 우주왕복선 고무 패킹에 영향을 미쳤는가?

  • 스텐트 시술이 뇌졸중 예방에 효과적인가?

  • 새로운 백신이 실제로 효용이 있는가?

→ 연구 가설은 실험을 통해 검증될 수 있다.


2. 실험 설계 (Study Design)

실험에서는 대상이 실험군(treatment group)대조군(control group)으로 나뉜다.

챌린저호 사고 실험 설계

그룹실험 조건설명 변수 (Explanatory Variable)반응 변수 (Response Variable)
실험군고무 패킹을 얼음물에 넣음물의 온도고무 패킹의 탄력성
대조군고무 패킹을 미지근한 물에 넣음물의 온도고무 패킹의 탄력성

설명 변수(Explanatory Variable) → 원인을 제공하는 변수 (온도)
반응 변수(Response Variable) → 실험 결과에 의해 변하는 변수 (탄력성)

⚠️ 주의: 설명 변수와 반응 변수의 관계가 항상 인과관계를 의미하는 것은 아니다.
(예: 비행기 진동안전벨트 착용 → 상관관계는 있지만, 안전벨트를 맸기 때문에 비행기가 흔들리는 것은 아님!)


3. 실험 사례 분석

소아마비 백신 임상시험 (1954, 미국 NFIP)

1954년, 조나스 소크(Jonas Salk) 박사가 개발한 소아마비 백신의 효과를 검증하기 위해 실험을 진행했다.

✅ 실험 설계
미국 내 1, 2, 3학년 학생들을 대상으로 실험을 진행.

  1. 부모 동의를 받은 2학년 학생 → 백신 투약 (Treatment group)

  2. 1학년과 3학년 학생 → 백신 미투약 (Control group)

✅ 실험 결과

그룹소아마비 발병률
백신 투약 (2학년)25%
백신 미투약 (1,3학년)54%
부모 동의 없는 2학년44%

⚠️ 실험의 문제점

  • 부모 동의를 받은 2학년 학생들의 발병률(25%)이 부모 동의를 받지 않은 2학년(44%)보다 낮음.

  • 부모 동의를 받은 학생들은 소아마비 발병 가능성이 높은 집단일 가능성이 있음.

  • 즉, 백신의 효과를 정확하게 검증하기 어렵다.


소아마비 백신 2차 임상시험 (NFIP)

1차 실험에서 발생한 오류를 수정하기 위해 2차 실험을 진행했다.

  1. 모든 참가자를 "부모 동의를 받은 학생들"로 한정.

  2. 학생들을 임의로 실험군과 대조군으로 배정.

  3. 대조군 학생들에게 위약(가짜 약) 제공.

  4. 의사도 어느 학생이 백신을 맞았는지 모르게 함 (이중 암맹).

✅ 실험 결과

그룹소아마비 발병률
백신 투약 (Treatment)28%
백신 미투약 (Control)71%
부모 동의 없는 2학년46%

➡ 2차 실험에서는 실험군과 대조군의 차이가 명확해져 백신의 효과를 검증할 수 있었다.


4. 실험 설계의 5가지 원칙

효율적인 실험을 위해 다음 원칙을 지켜야 한다.

원칙설명
1. Controlling (통제)실험군과 대조군을 비교, control group은 위약(placebo) 사용
2. Randomization (임의 할당)실험 대상자를 랜덤하게 배정
3. Replication (반복 실험)충분히 큰 표본을 사용해 신뢰성 확보
4. Double-blind (이중 암맹)참가자와 연구자가 그룹을 모르게 설정
5. Blocking (블록화)실험에 영향을 줄 수 있는 변수를 구분하여 분석

1차 소아마비 백신 실험의 문제점Blocking 원칙 위배
2차 실험에서는 1학년, 3학년을 제외한 이유? → 부모 동의 여부를 통제하기 위해.


5. 스텐트 시술은 뇌졸중을 예방하는가?

실험 개요

  • 스텐트(stent): 혈관에 삽입하여 혈류를 유지하는 의료 기기.

  • 뇌졸중(stroke) 예방 효과를 확인하기 위한 임상 실험 수행.

✅ 실험 설계

451명의 뇌졸중 고위험군 환자를 대상으로 두 그룹으로 나눔.

그룹실험 조건환자 수
실험군전통적 의료관리 + 스텐트 시술224명
대조군전통적 의료관리(스텐트 X)227명

실험 시작 후 30일 및 1년 후 뇌졸중 발생률 측정.

✅ 실험 결과

그룹1년 후 뇌졸중 발생 환자 수비율
실험군 (스텐트 시술)45명20% (45/224)
대조군 (일반 치료)28명12% (28/227)

✅ 결과 해석

  • 스텐트 시술을 받은 실험군의 뇌졸중 발생률(20%)이 대조군(12%)보다 높다.

  • 즉, 스텐트 시술이 오히려 뇌졸중 예방에 효과가 없을 가능성이 있다.

➡ 하지만, 이 차이가 통계적으로 유의미한지 추가적인 통계 검정이 필요하다(앞으로 올릴 예정).


6. 결론: 실험을 설계할 때 고려할 점

  1. 대조군이 필요하다 → 비교할 그룹이 없으면 결론을 내릴 수 없다.

  2. 임의 할당(Randomization)이 중요하다 → 실험 대상이 공정하게 나뉘어야 한다.

  3. 위약 효과(Placebo Effect)를 고려해야 한다 → 위약을 사용해 효과를 정확히 분석.

  4. 반복 실험을 통해 신뢰성을 높인다.

  5. 실험 설계의 5대 원칙(Controlling, Randomization, Replication, Double-blind, Blocking)을 지킨다.

💡 실험 설계에서부터 조심해야 엉뚱한 데이터를 수집하지 않을 수 있다!

0
Subscribe to my newsletter

Read articles from KiwiChip directly inside your inbox. Subscribe to the newsletter, and don't miss out.

Written by

KiwiChip
KiwiChip

I'm currently learning Python and studying RAG (Retrieval-Augmented Generation).