1. Pandas
📌 주요 역할:
- 데이터 조작 및 분석
- 구조화된 데이터를 쉽게 다룰 수 있도록 도와줌
📌 핵심 기능:
- DataFrame, Series 구조 제공 (엑셀과 유사한 데이터 구조)
- 데이터 정리, 필터링, 그룹화, 결합 등 가능
- 결측치 처리 및 데이터 변환
2. NumPy (Numeric Python)
📌 주요 역할:
- 수학적 연산 및 배열(array) 연산 수행
- 머신러닝에서 수치 연산을 빠르게 처리하는데 필수
📌 핵심 기능:
- 다차원 배열 (ndarray) 제공
- 행렬 연산, 선형대수, 난수 생성 등 다양한 수학 연산 지원
3. Scikit-Learn
📌 주요 역할:
- 머신러닝 모델 구현 및 분석을 위한 필수 라이브러리
- 간단하면서도 강력한 데이터 분석 및 모델링 도구 제공
📌 핵심 기능:
- 지도 학습(Supervised Learning): 회귀(Regression), 분류(Classification)
- 비지도 학습(Unsupervised Learning): 클러스터링(Clustering), PCA(차원 축소)
- 데이터 전처리(Preprocessing): 스케일링, 결측치 처리
- 모델 평가(Evaluation): 교차 검증, 성능 평가 지표 제공
4. Matplotlib
📌 주요 역할:
- 데이터 시각화 및 그래프 생성
- 정적(static), 애니메이션(animated), 인터랙티브(interactive) 그래프 지원
📌 핵심 기능:
- 선 그래프, 바 차트, 히스토그램, 산점도 등 다양한 그래프 제공
- 데이터 시각화를 통한 인사이트 도출
5. PyTorch
📌 주요 역할:
- 딥러닝 모델을 쉽게 만들고 훈련할 수 있도록 돕는 라이브러리
- 연구 목적 및 실제 배포를 위한 동적 연산 그래프(dynamic computation graph) 제공
📌 핵심 기능:
- 딥러닝 모델 구현 (CNN, RNN, Transformer 등)
- GPU 가속을 통한 빠른 연산
- 자동 미분(Autograd) 기능 제공
📌 정리
라이브러리주요 기능
| Pandas | 데이터 조작 및 분석 (DataFrame 제공) |
| NumPy | 수치 연산 및 배열 연산 (ndarray 제공) |
| Scikit-Learn | 머신러닝 모델 구축 및 평가 |
| Matplotlib | 데이터 시각화 |
| PyTorch | 딥러닝 모델 구축 및 GPU 가속 |
'1학년 2학기 > 머신러닝원리와 응용' 카테고리의 다른 글
| [2강_off] Pandas (0) | 2025.03.29 |
|---|---|
| [2강_on] Linear Regression(선형회귀) (0) | 2025.03.14 |
| [1강_on] 머신러닝 개요 (Machine Learning Overview) (0) | 2025.03.13 |