[통계 기초] PPDAC model: 데이터 기반 문제 해결 과정

PPDAC 절차는 Problem(문제 정의) → Plan(계획) → Data(데이터 수집) → Analysis(분석) → Conclusion(결론) 과정을 거쳐 체계적으로 데이터를 활용하여 문제를 해결하는 방법론이다.
1. PPDAC 개요
단계 | 설명 | 예시 |
Problem (문제 정의) | 문제를 구체적으로 정의 | "실업률이란 무엇인가?" |
Plan (계획 수립) | 데이터를 어떻게 수집할지 결정 | "실업률을 측정하는 기준과 방법을 정함" |
Data (데이터 수집) | 실제 데이터를 수집 | "실업자와 취업자 데이터를 조사" |
Analysis (분석) | 수집된 데이터를 활용해 분석 | "실업률 계산 및 시각화" |
Conclusion (결론 도출) | 분석 결과를 바탕으로 결론 도출 | "실업률이 증가하는 원인 분석 및 정책 제안" |
2. PPDAC 적용 사례
(1) 실업률 분석
✅ Problem (문제 정의)
현재 국내 실업률은 얼마인가?
실업률의 정의는 무엇인가?
한국: 경제활동인구(취업자 + 실업자) 중 실업자가 차지하는 비율.
경제활동인구: 만 15세 이상 중 실제로 수입이 있는 일을 한 사람(취업자) + 일을 하지 않았으나 구직활동을 한 사람(실업자).
비경제활동인구(예: 전업주부, 학생, 은퇴자)는 실업률 계산에서 제외됨.
✅ Plan (계획)
실업률을 어떻게 측정할 것인가?
통계청의 고용조사 데이터를 활용.
성별, 연령대별, 산업별 실업률도 분석.
✅ Data (데이터 수집)
한국의 실업률 관련 데이터 수집:
통계청, 노동부, 한국은행 등의 공공데이터 활용.
지역별, 성별, 연령별 실업률 데이터를 확보.
✅ Analysis (분석)
실업률 변화를 분석.
특정 산업(IT, 제조업 등)의 실업률 비교.
청년 실업률과 중장년 실업률 차이 분석.
계절적 변동 패턴 확인 (예: 졸업 시즌 이후 실업률 상승).
✅ Conclusion (결론 도출)
실업률 상승 원인 분석.
정부 정책(예: 청년 고용 지원책)의 효과 평가.
기업의 고용 트렌드 변화 파악.
(2) 지구상의 나무 개수 추정
✅ Problem (문제 정의)
지구상에는 나무가 몇 그루 있는가?
"나무"의 정의는?
사람 가슴 높이에서 잰 나무줄기 지름이 일정 이상이고 딱딱한 줄기를 가진 식물.
지름이 일정 이상: 대부분의 국가에서는 10cm 이상을 기준으로 함.
✅ Plan (계획)
나무 개수를 어떻게 측정할 것인가?
모든 나무를 직접 측정하는 것은 불가능.
위성사진 + 지리적 데이터(GIS) + 표본조사를 활용.
기후와 지형별로 샘플 지역을 설정해 단위면적당 나무 밀도를 측정.
✅ Data (데이터 수집)
약 43만 개의 tree density 측정 데이터 확보.
위성사진 및 GIS 데이터를 활용해 각 지역별 나무 밀도 예측.
✅ Analysis (분석)
통계 모델(음이항 회귀분석)을 사용해 지구 전체의 나무 개수 추정.
변수: 강수량, 기후, 지형, 토양, 인간 활동 등.
특정 지역의 나무 밀도를 바탕으로 유사 지역의 데이터를 예측.
✅ Conclusion (결론 도출)
지구상의 나무 개수: 약 3조 400억 그루 (오차범위: ±1,000억).
연간 150억 그루의 나무가 사라짐.
인류 문명이 시작한 이후 전체 나무의 46%가 감소.
6. 결론: PPDAC 활용의 중요성
PPDAC 절차를 따르면 데이터를 기반으로 문제를 명확히 정의하고 해결 방법을 체계적으로 분석할 수 있다.
✅ PPDAC 적용이 중요한 이유
명확한 문제 정의 → 애매한 개념(실업률, 나무, 성차별 등)의 정의 필요.
체계적인 계획 수립 → 어떤 데이터를 수집할지, 측정 방법을 정해야 함.
데이터 기반 분석 → 감이 아니라 객관적인 수치를 바탕으로 의사결정.
정확한 결론 도출 → 잘못된 해석(예: 심슨의 역설)을 방지하고 진짜 원인을 파악.
💡 데이터 분석은 감이 아닌, 체계적이고 논리적인 접근이 필수!
Subscribe to my newsletter
Read articles from KiwiChip directly inside your inbox. Subscribe to the newsletter, and don't miss out.
Written by

KiwiChip
KiwiChip
I'm currently learning Python and studying RAG (Retrieval-Augmented Generation).