1학년 1학기/통계

[유니와이즈]16강. 초기하분포

seungyeonworld 2025. 2. 17. 21:04

5.4 초기하 분포

 

** 이항분포 - 독립시행, 복원추출의 경우

** 초기하분포

  - 비복원추출의 경우 활용

  - 전체 모집단에서 특정한 속성을 가진 항목을 포함한 개수를 구하는 확률

  - ex. 빨강공 5개, 파란공 10개 있는 상자에서 무작위로 4개공을 비복원 추출할때, 빨강공이 2개나올 확률

      

 


** 초기하실험

 

  - N개의 유한모집단으로부터 크기 n인 확률표본을 비복원으로 추출

  - N개중  k 개는 성공, N - k는 실패

  - 초기하확률변수 X : 초기하실험엣 표본 중 성공의 수

  - 초기하분포 : 초기하확률변수의 확률분포, h(x;N, n, k)로 표시

    (N : 모집단크기, n : 표본의 수, k : N개중 성공의 개수)

 

** 초기하분포

 

  - k 개의 성공과 N - k 개의 실패로 구성된 크기 N인 유한 모집단에서 크기 n인 확률표본을 취할 때, 성공의 개수를 나타내는

   초기하확률변수 X의 확률분포는 아래와 같다.

  - x번 성공할 확률 * (n-x)번 실패할 확률 / 전체N개중 n개를 뽑을 확률

 


** 초기하분포의 평균과 분산

 

  [초기하분포의 평균]

  - 직관적으로 샘플링 된 개수 n에서 모집단 내 성공 비율 K/N 을 곱한 값으로 이해하기!

 

 

[초기하분포의 분산]

  - 첫번째 항 : 평균을 기반으로 한 기본적인 변동성

  - 두번째 항 : 모집단 내에서 성공과 실패의 비율에 따른 변동성

  - 세번째 항 :  비복원 추출에 의한 보정의 개수 (샘플을 뽑을수로 남은 모집단의 크기가 줄어들기 때문에 변동성이 줄어듦)

   => 이항분포와 비교시, 초기하분포는 비복원 추출을 고려하기 때문에 분산이 더 작아지는 경향이 있음

 

 

[이항분포와 초기화분포 비교]

    - N(모집단크기) 이 커지면 비복원추출과 복원추출의 차이가 적어짐을 의미

    - 초기하분포에서 N이 무한히 커질 경우 초기하분포 밀도함수가 이항분포 밀도함수로 수렴

    - N(모집단크기) 이 상당히 크고 N에 비해 n이 상대적으로 매우 작을 경우도 이항분포를 사용하여 근사적으로 계산

 

 

** 다변량초기하 분포

 

  -  초기하 분포는 두 개의 범주만 고려 (ex. 성공/실패 , 불량/정상)

  -  다변량 초기하 분포는 세 개 이상의 범주를 가질 수 있음

  -  ex. 공 색상이 빨강, 파랑, 초록으로 나뉜 경우에서 특정 개수를 뽑을 확률을 계산

  -  각 범주의 개수가 정해져 있는 상태에서 비복원 추출을 수행하므로, 한 범주의 값이 정해지면 다른범주의 값도 자동으로 결정

예제===============================================================

==================================================================