5.4 초기하 분포
** 이항분포 - 독립시행, 복원추출의 경우
** 초기하분포
- 비복원추출의 경우 활용
- 전체 모집단에서 특정한 속성을 가진 항목을 포함한 개수를 구하는 확률
- ex. 빨강공 5개, 파란공 10개 있는 상자에서 무작위로 4개공을 비복원 추출할때, 빨강공이 2개나올 확률
** 초기하실험
- N개의 유한모집단으로부터 크기 n인 확률표본을 비복원으로 추출
- N개중 k 개는 성공, N - k는 실패
- 초기하확률변수 X : 초기하실험엣 표본 중 성공의 수
- 초기하분포 : 초기하확률변수의 확률분포, h(x;N, n, k)로 표시
(N : 모집단크기, n : 표본의 수, k : N개중 성공의 개수)
** 초기하분포
- k 개의 성공과 N - k 개의 실패로 구성된 크기 N인 유한 모집단에서 크기 n인 확률표본을 취할 때, 성공의 개수를 나타내는
초기하확률변수 X의 확률분포는 아래와 같다.
- x번 성공할 확률 * (n-x)번 실패할 확률 / 전체N개중 n개를 뽑을 확률

** 초기하분포의 평균과 분산
[초기하분포의 평균]
- 직관적으로 샘플링 된 개수 n에서 모집단 내 성공 비율 K/N 을 곱한 값으로 이해하기!

[초기하분포의 분산]
- 첫번째 항 : 평균을 기반으로 한 기본적인 변동성
- 두번째 항 : 모집단 내에서 성공과 실패의 비율에 따른 변동성
- 세번째 항 : 비복원 추출에 의한 보정의 개수 (샘플을 뽑을수로 남은 모집단의 크기가 줄어들기 때문에 변동성이 줄어듦)
=> 이항분포와 비교시, 초기하분포는 비복원 추출을 고려하기 때문에 분산이 더 작아지는 경향이 있음

[이항분포와 초기화분포 비교]

- N(모집단크기) 이 커지면 비복원추출과 복원추출의 차이가 적어짐을 의미
- 초기하분포에서 N이 무한히 커질 경우 초기하분포 밀도함수가 이항분포 밀도함수로 수렴
- N(모집단크기) 이 상당히 크고 N에 비해 n이 상대적으로 매우 작을 경우도 이항분포를 사용하여 근사적으로 계산

** 다변량초기하 분포
- 초기하 분포는 두 개의 범주만 고려 (ex. 성공/실패 , 불량/정상)
- 다변량 초기하 분포는 세 개 이상의 범주를 가질 수 있음
- ex. 공 색상이 빨강, 파랑, 초록으로 나뉜 경우에서 특정 개수를 뽑을 확률을 계산
- 각 범주의 개수가 정해져 있는 상태에서 비복원 추출을 수행하므로, 한 범주의 값이 정해지면 다른범주의 값도 자동으로 결정

예제===============================================================

==================================================================
'1학년 1학기 > 통계' 카테고리의 다른 글
| [유니와이즈]17강. 음이항분포와 기하분포 (0) | 2025.02.18 |
|---|---|
| [유니와이즈]15강. 다항분포 (0) | 2025.02.09 |
| [유니와이즈]14강. 이산형 균일분포 (0) | 2025.02.09 |
| [유니와이즈]12강. 선형결합된 확률변수의 평균과 분산 (추후보충필요) (0) | 2025.02.05 |
| [유니와이즈]11강. 분산과 공분산 (0) | 2025.02.05 |