개요: MNIST 데이터셋을 활용해 이진 분류기를 훈련시키고, 작업에 맞는 적절한 지표를 선택하고, 교차 검증을 사용해 평가하고, 요구 사항에 맞는 정밀도/재현율 트레이드오프를 선택하고, 여러가지 지표와 곡선을 사용해 여러 모델을 비교하고 있음.
ML 과 DL에서 분류(Classificiation) 문제를 연습하는데 주로 사용됨
특징:
총 70,000개의 흑백 숫자 이미지
28*28 픽셀 크기의 손글씨 숫자 (0~9)
훈련 데이터 60,000개 / 테스트 데이터 10,000개
구조: MNIST 데이터셋의 각각의 숫자 이미지는 28x28 픽셀로 이루어져 있으며, 각 픽셀 값은 0(흰색) ~ 255(검은색) 까지의 범위를 가짐
🔹 X (입력 데이터) : 손글씨 숫자 이미지 (28×28 픽셀 → 784개의 숫자로 변환)
🔹 y (레이블, 정답 데이터) : 해당 이미지가 나타내는 숫자를 나타냄 (0~9 중 하나)
설명: ‘5-감지기’는 ‘5’와 ‘5 아님’ 두개의 클래스를 구분할 수 있는 이진 분류기(binary classfier)이다.