1학년 1학기/통계

[유니와이즈 1강]

seungyeonworld 2025. 1. 15. 19:42

1. 통계학과 자료분석

 

1.1 통계학의 개요

 

*통계학 :  관심을 가지고 있는 대상에 대한 정보와 자료를 수집하여 확실하지 않은 어떤 사실에 대해 과학적인 판다능ㄹ

                 할 수 있는 방법에 대해 연구하는 학문

* 모집단 :  조사 및 관심의 대상이 되는 집단

* 유한모집단 :  유한개의 자료로 구성된 모집단

* 무한모집단 : 원소의 수가 무한한 모집단 (ex. 공정, 약품의 약효 등)

* 전수조사 : 모집단의 모든 대상을 조사하는 것 (ex. 인구주택 총조사)
     -> 시간/공간/비용적 제한있음

* 표본조사 : 모집단을 대표할 수 있는 일부분(표본,샘플,모집단의 부분집합)을 택하여 조사

* 기술통계학 : 자료를 수집 및 정리하여 보다 더 쉽게 알 수 있도록 표 또는 그래프등에 의해 나타내거나 자료가 갖는

                       특성을 분석 및 설명하는 방법을 다루는 통계학

* 추측통계학 : 표본을 대상으로 얻은 정보들로부터 모집단에 대한 가설 검증하는 방법을 다루는 통계학

 

★기술통계학과 추측통계학 정리

 

 

1.2 표본추출

 

- 표본은 모집단을 잘 표현할 수 있어야한다.

- 작은 표본은 모집단을 잘 표현하지 못하고, 표본을 많이 구하는 것도 중요하지만 올바른 방법으로 구하는것도 중요하다.

 

* 단순램덤표본추출 :  특정크기의 표본들이 선택될 확률이 모두 동일한 추출법

  (크기가 N인 모집단에서 크기가 n인 표본을 뽑을 경우, 모든 n개의 원소의 부분집합이 추출될 확률이 동일함)

* 계통추출 : 첫 번째 표본은 임의추출, 두번째부터는 매 k번째 요소를 추출

* 층화램덤표본추출 :  충내부적ㅇ로는 동질적, 층간에는 이질적으로 추출 (ex.1학년/2학년/3학년)

* 군집표집 : 모집단을 여러 하위 집단(군집)으로 나누고, 그 중 일부 군집을 무작위로 선택하여 데이터를 수집하는  방법

   (각 군집이 모집단의 축소판 역할을 하도록 설계, ex.모집단- 한나라의 초등학생, 군집-각 초등학교)

* 다단계표집 : 여러 단계를 거쳐 점진적으로 표본을 선택하는 방법 이는 모집단을 계층적으로 나누어 각 단계에서

                       표본을 추출

 

 

★ 군집표집과 층화표본추출의 차이점

★ 다단계표집과 군집표집의 차이

 

1.3 실험

 

* 자료수집방법

  - 관측연구 : 요인에 대한 통제가 없는 연구, 변화를 인위적으로 가하지 않음 (ex.대기온도가 전력소모에 미치는 영향)

  - 실험 : 제어된 조사연구, 조사 대상을 무작위로 적정수로 나누어 그중 하나 또는 몇몇 집단에 대해 어떤 조치를 취한 후

             그 반응을 관찰

  - 후향연구 : 역사적 자료만 사용 (장점 : 비용x / 단점 : 역사적 자료의 타당성과 신뢰성에 의문)

 

* 실험단위 : 실험의 대상

* 실험집단 : 실험조치가 취해지는 집단

* 대조집단 : 조치를 취하지 않은 집단

 

* 실험과정 : 변화나 조치를 가하여 (요인을 통제하여) 그 결과 또는 반응을 측정

 

* 관측연구는 진정한 인과관계를 알아내기 어려울 수 있으나 (ex.우연) 제어된 실험은 원인,결과의 상관관계를 보여줄 수 있음