1학년 1학기/통계

[유니와이즈]9강. 확률변수와 확률분포(3)

seungyeonworld 2025. 1. 27. 15:49

3.5 조건부 분포

 

* 조건부분포 : 다변수 확률분포에서 특정조건이 주어졌을때 다른 변수들의 확률분포

   (한 변수가 특정값에 고정되었을때, 다른 변수들의 분포)

 

* 이산형에서의 조건부분포

 

  - g(x) : X의 주변분포로 결합확률분포 P( X, Y)에서 Y를 합산하여 계산 (분자)

  - h(y) : Y의 주변분포로 결합확률분포 P( X, Y)에서 X를 합산하여 계산 (분자)

 

* 연속형에서의 조건부분포

 

 

★조건부분포와 조건부확률의 차이점

[조건부분포 활용예시]---> 전체 분포에 대해 이야기하며, 변수의 범위 전체를 다룸

  - 의료데이터  : 특정나이(Y)에서 혈압(X)의 분포분석

  - 마케팅데이터 : 특정지역(Y)에서 고객지출금액(X)의 분포분석

 

[조건부확률 활용예시] ---> 특정 값(사건)에 대해 이야기하며 단일 확률값 계산

  - 의료데이터 : 특정나에대환자가 특정질병을 앓을 확률

  - 스포츠 : 팀이 이미 3승을 거둔 상태에서 다음 경기를 이길 확률

 

 

3.6 통계적 독립

 

* 통계적독립 : f (xIy) 가 y에 종속되어 있지 않으면 f (xIy) = g(x)이고, f(x,y) = g(x)*f(h)

 

  - f (xIy) 가 y에 종속되어 있지 않으면 확률변수 X의 발생은 확률변수Y의 발생으로부터 아무런 영향을 받지않게 됨.

  - f(x,y) = g(x)*f(h) 가아닌 점(x,y)가 하나라도 존재하면, X와 Y는 통계적으로 독립이 아님(이산형)