1학년 2학기/머신러닝원리와 응용

[1강_off] Python Packages

seungyeonworld 2025. 3. 14. 00:01

1. Pandas

📌 주요 역할:

  • 데이터 조작 및 분석
  • 구조화된 데이터를 쉽게 다룰 수 있도록 도와줌

📌 핵심 기능:

  • DataFrame, Series 구조 제공 (엑셀과 유사한 데이터 구조)
  • 데이터 정리, 필터링, 그룹화, 결합 등 가능
  • 결측치 처리 및 데이터 변환
 

2. NumPy (Numeric Python)

📌 주요 역할:

  • 수학적 연산 및 배열(array) 연산 수행
  • 머신러닝에서 수치 연산을 빠르게 처리하는데 필수

📌 핵심 기능:

  • 다차원 배열 (ndarray) 제공
  • 행렬 연산, 선형대수, 난수 생성 등 다양한 수학 연산 지원
 

3. Scikit-Learn

📌 주요 역할:

  • 머신러닝 모델 구현 및 분석을 위한 필수 라이브러리
  • 간단하면서도 강력한 데이터 분석 및 모델링 도구 제공

📌 핵심 기능:

  • 지도 학습(Supervised Learning): 회귀(Regression), 분류(Classification)
  • 비지도 학습(Unsupervised Learning): 클러스터링(Clustering), PCA(차원 축소)
  • 데이터 전처리(Preprocessing): 스케일링, 결측치 처리
  • 모델 평가(Evaluation): 교차 검증, 성능 평가 지표 제공
 

4. Matplotlib

📌 주요 역할:

  • 데이터 시각화 및 그래프 생성
  • 정적(static), 애니메이션(animated), 인터랙티브(interactive) 그래프 지원

📌 핵심 기능:

  • 선 그래프, 바 차트, 히스토그램, 산점도 등 다양한 그래프 제공
  • 데이터 시각화를 통한 인사이트 도출
 

5. PyTorch

📌 주요 역할:

  • 딥러닝 모델을 쉽게 만들고 훈련할 수 있도록 돕는 라이브러리
  • 연구 목적 및 실제 배포를 위한 동적 연산 그래프(dynamic computation graph) 제공

📌 핵심 기능:

  • 딥러닝 모델 구현 (CNN, RNN, Transformer 등)
  • GPU 가속을 통한 빠른 연산
  • 자동 미분(Autograd) 기능 제공
 

📌 정리

라이브러리주요 기능
Pandas 데이터 조작 및 분석 (DataFrame 제공)
NumPy 수치 연산 및 배열 연산 (ndarray 제공)
Scikit-Learn 머신러닝 모델 구축 및 평가
Matplotlib 데이터 시각화
PyTorch 딥러닝 모델 구축 및 GPU 가속