CHAP 3. 확률분포
✖️ 확률변수와 확률분포
✅ 확률변수 (Random Variable)
• 의미:
통계적 시행(예: 동전 던지기, 주사위 던지기 등)의 결과를 수치화한 변수
→ 이산값, 연속값, 범주형 값 모두 가능
• 왜 “변수”인가?
시행 결과는 무작위(랜덤)로 변하므로 “확률변수”라고 부름
• 예시
동전을 3번 던지는 시행의 표본공간:
{HHH, HHT, HTH, THH, HTT, THT, TTH, TTT}
→ 이 중 H의 개수를 변수 X로 설정: X ∈ {0, 1, 2, 3}
• 분류
유형 | 설명 | 예시 |
이산 확률변수 | 셀 수 있는 값 | 주사위 눈, 불량품 수 |
연속 확률변수 | 실수 범위의 값 | 키, 몸무게, 시간 |
범주형 확률변수 | 명목적 구분 | 선호 색상, 혈액형 |
✅ 확률분포 (Probability Distribution)
• 의미:
확률변수가 특정 값을 가질 확률을 수학적으로 나타낸 것
표본공간(통계적 실험 시행에서 나올 수 있는 모든 가능한 결과들의 집합)의 각 원소 또는 구간에 대한 확률
• 예시
• 이론적 분포 vs 경험적 분포 (표본분포)
확률분포 | 수학적으로 정의된 이론적 분포 • 주어진 조건 하에서 모든 가능한 결과에 대한 확률이 정해져 있음 • 시행을 하지 않아도 확률을 계산할 수 있음 |
정육면체 주사위 → P(X = x) = 1/6 for x = 1,2,3,4,5,6 |
표본분포 | 실험/관찰을 통해 얻은 데이터(관찰된 결과의 비율(상대도수)) 기반의 분포 • 실험 결과로 얻어진 데이터 기반 • 시행 횟수(n)가 작으면 이론분포와 차이가 있음 • n이 커질수록 확률분포에 수렴 (→ 대수의 법칙) |
주사위를 100번 던졌더니 1이 12번, 2가 18번, … 6이 17번 나왔다면 P(X=1) = 0.12, P(X=2) = 0.18, …, P(X=6) = 0.17 |
n이 증가할수록 표본분포는 이론적 확률분포에 수렴한다
→ 대수의 법칙(Law of Large Numbers)에 의해 증명
구분 | 확률분포 | 표본분포 |
의미 | 이론적 확률 모델 | 실험 결과의 상대도수 |
기반 | 수학적 정의 | 실제 시행 데이터 |
대상 | 모집단(population) | 표본(sample) |
형태 | 이상적 / 정확함 | 현실적 / 오차 존재 |
수렴 여부 | 고정됨 | 시행 수 증가 시 확률분포에 수렴 |
✖️ 이산확률분포
✅ 이산확률변수 (Discrete Random Variable)
• 정의:
결과값이 정수이거나 셀 수 있는 개수로 떨어지는 확률변수
• 예시:
• 불량 제품 수 (0, 1, 2, …)
• 주사위 눈 (1~6)
• 고객 수, 이메일 도착 수
✅ 이산확률분포 (Discrete Probability Distribution)
• 의미:
이산 확률변수가 가질 수 있는 각 값에 대한 확률을 부여한 함수
• 이산확률분포는 확률질량함수 (pmf: probability mass function)로 표현함
✅ 3. 확률질량함수 (PMF)
• 정의:
확률변수의 각 가능한 값에 대해 확률을 부여하는 함수
• 성질 (조건):
1 → 모든 확률은 0 이상
2 → 가능한 모든 값의 확률의 합은 1
예시: 주사위 던지기
✖️ 연속확률분포
✅ 연속확률변수 (Continuous Random Variable)
• 정의:
무한히 많은 값을 가질 수 있는 확률변수 (실수 범위에서 연속적인 값)
• 예시:
• 매출액 (ex: 1,230,456.72원)
• 사람의 키, 몸무게
• 나이, 시간, 거리 등
✅ 확률밀도함수 (PDF: Probability Density Function)
• 연속확률변수는 확률 자체를 특정 값에 할당할 수 없음 (점 확률 = 0)
• 대신, 구간에 대한 확률을 확률밀도함수 를 이용해 면적으로 계산함
확률밀도함수의 조건
1. 0 이상
2. 전체 면적 = 1
3. 구간 확률 계산 가능
✅ 비교 요약 : 이산 vs 연속 확률분포
구분 | 이산확률변수 | 연속확률변수 |
값의 형태 | 정수/셀 수 있음 | 실수/연속 |
확률함수 | 확률질량함수 (pmf) | 확률밀도함수 (pdf) |
점 확률 | P(X=x) > 0 가능 | P(X=x) = 0 |
구간 확률 | 값 하나하나 더함 | 적분(면적)으로 계산 |
예시 | 주사위, 불량품 수 | 키, 나이, 시간 |
📌 핵심 요약
• 연속 확률변수는 무한한 실수값을 가질 수 있는 변수
• 확률은 구간으로 계산하며, 점 확률은 항상 0
• 확률밀도함수(pdf)는 3가지 조건을 만족해야 함
• 대표 분포: 균등분포, 정규분포, 지수분포 등
'🔢 수학 > 확률 및 통계학' 카테고리의 다른 글
✖️ 확률과 통계학 : CHAP 2. 확률 // 베이즈 정리 (0) | 2025.03.26 |
---|---|
✖️ 확률과 통계학 : CHAP2. 확률 // 표본공간과 사상, 계수기법 , 확률의 정의, 성질, 조건부 확률, 연관성 분석 (0) | 2025.03.20 |
✖️ 확률과 통계학 : CHAP1. 기술통계 // 변동 통계량, 그룹화된 자료, 줄기 잎 그림, 상자 그림 (0) | 2025.03.19 |
✖️ 확률과 통계학 : CHAP1. 기술통계 // 용어, 방법론, 측정 척도, 도수분포표/도수그래프, 위치 통계량 (0) | 2025.03.16 |