본문 바로가기
  • 컴공생의 공부 일기
  • 공부보단 일기에 가까운 것 같은
  • 블로그
🔢 수학/확률 및 통계학

✖️ 확률과 통계학 : CHAP 3. 확률분포 // 확률변수와 확률분포, 이산확률분포, 연속확률분포

by 정람지 2025. 3. 26.

CHAP 3. 확률분포

 

 

✖️ 확률변수와 확률분포

 

✅ 확률변수 (Random Variable)

 의미:

통계적 시행(예: 동전 던지기, 주사위 던지기 등)의 결과를 수치화한 변수

→ 이산값, 연속값, 범주형 값 모두 가능

 

 왜 “변수”인가?

시행 결과는 무작위(랜덤)로 변하므로 “확률변수”라고 부름

 

• 예시

동전을 3번 던지는 시행의 표본공간:

{HHH, HHT, HTH, THH, HTT, THT, TTH, TTT}

→ 이 중 H의 개수를 변수 X로 설정:  X ∈ {0, 1, 2, 3}

 

 분류

유형 설명 예시
이산 확률변수 셀 수 있는 값 주사위 눈, 불량품 수
연속 확률변수 실수 범위의 값 키, 몸무게, 시간
범주형 확률변수 명목적 구분 선호 색상, 혈액형

✅ 확률분포 (Probability Distribution)

 의미:

확률변수가 특정 값을 가질 확률을 수학적으로 나타낸 것

표본공간(통계적 실험 시행에서 나올 수 있는 모든 가능한 결과들의 집합)의 각 원소 또는 구간에 대한 확률

 

• 예시

 

 

 이론적 분포 vs 경험적 분포 (표본분포)

확률분포 수학적으로 정의된 이론적 분포

 주어진 조건 하에서 모든 가능한 결과에 대한 확률이 정해져 있음
 시행을 하지 않아도 확률을 계산할 수 있음
정육면체 주사위 →
 P(X = x) = 1/6  
for 
 x = 1,2,3,4,5,6 


표본분포 실험/관찰을 통해 얻은 데이터(관찰된 결과의 비율(상대도수)) 기반의 분포

 실험 결과로 얻어진 데이터 기반
 시행 횟수(n)가 작으면 이론분포와 차이가 있음
 n이 커질수록 확률분포에 수렴 (→ 대수의 법칙)
주사위를 100번 던졌더니 1이 12번, 2가 18번, … 6이 17번 나왔다면

 P(X=1) = 0.12, P(X=2) = 0.18, …, P(X=6) = 0.17 

 

 

n이 증가할수록 표본분포는 이론적 확률분포에 수렴한다

대수의 법칙(Law of Large Numbers)에 의해 증명

구분 확률분포 표본분포
의미 이론적 확률 모델 실험 결과의 상대도수
기반 수학적 정의 실제 시행 데이터
대상 모집단(population) 표본(sample)
형태 이상적 / 정확함 현실적 / 오차 존재
수렴 여부 고정됨 시행 수 증가 시 확률분포에 수렴

 


✖️ 이산확률분포

 

 

✅ 이산확률변수 (Discrete Random Variable)

 정의:

결과값이 정수이거나 셀 수 있는 개수로 떨어지는 확률변수

 

• 예시:

• 불량 제품 수 (0, 1, 2, …)

• 주사위 눈 (1~6)

• 고객 수, 이메일 도착 수


✅ 이산확률분포 (Discrete Probability Distribution)

 의미:

이산 확률변수가 가질 수 있는 각 값에 대한 확률을 부여한 함수

 이산확률분포는 확률질량함수 (pmf: probability mass function)로 표현함

 


✅ 3. 확률질량함수 (PMF)

 정의:

확률변수의 각 가능한 값에 대해 확률을 부여하는 함수

 

 성질 (조건):

1 → 모든 확률은 0 이상

2 → 가능한 모든 값의 확률의 합은 1

 


예시: 주사위 던지기

 


✖️ 연속확률분포

 

✅ 연속확률변수 (Continuous Random Variable)

 

 정의:

무한히 많은 값을 가질 수 있는 확률변수 (실수 범위에서 연속적인 값)

 

• 예시:

• 매출액 (ex: 1,230,456.72원)

• 사람의 키, 몸무게

• 나이, 시간, 거리 등


✅ 확률밀도함수 (PDF: Probability Density Function)

 연속확률변수는 확률 자체를 특정 값에 할당할 수 없음 (점 확률 = 0)

 대신, 구간에 대한 확률을 확률밀도함수 를 이용해 면적으로 계산함

 

 

확률밀도함수의 조건 

 

1. 0 이상

2. 전체 면적 = 1

3. 구간 확률 계산 가능


 

✅ 비교 요약 :  이산 vs 연속 확률분포

구분 이산확률변수 연속확률변수
값의 형태 정수/셀 수 있음 실수/연속
확률함수 확률질량함수 (pmf) 확률밀도함수 (pdf)
점 확률  P(X=x) > 0  가능  P(X=x) = 0 
구간 확률 값 하나하나 더함 적분(면적)으로 계산
예시 주사위, 불량품 수 키, 나이, 시간

 

📌 핵심 요약

 연속 확률변수는 무한한 실수값을 가질 수 있는 변수

 확률은 구간으로 계산하며, 점 확률은 항상 0

 확률밀도함수(pdf)는 3가지 조건을 만족해야 함

 대표 분포: 균등분포, 정규분포, 지수분포 등