https://sdc-james.gitbook.io/onebook/4.-and/5.1./5.1.3.-mnist-dataset
TensorFlow 샘플에 보면 mnist 데이터셋이 많이 등장
MNIST는 인공지능 연구의 권위자 LeCun교수가 만든 데이터 셋이고 현재 딥러닝을 공부할 때 반드시 거쳐야할 Hello, World같은 존재
MNIST는 간단한 컴퓨터 비전 데이터 세트로, 아래와 같이 손으로 쓰여진 이미지들로 구성되어 있습니다. 숫자는 0에서 1까지의 값을 갖는 고정 크기 이미지 (28x28 픽셀)로 크기 표준화되고 중심에 배치되었습니다. 간단히 하기 위해 각 이미지는 평평하게되어 784 피쳐의 1-D numpy 배열로 변환되었습니다 (28 * 28).
MNIST 데이터는 Yann LeCun의 웹사이트에서 제공합니다. 편의를 위해 데이터를 자동으로 다운로드하고 설치하는 코드를 포함해 놓았습니다. 코드를 다운로드 하고아래와 같이 import하거나, 그냥 안에 붙여 넣으시면 됩니다.
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("./samples/MNIST_data/", one_hot=True)
Mnist 데이타셋에는 총 60,000개의 데이타가 있는데, 이 데이타는 크게 아래와 같이 세종류의 데이타 셋으로 나눠 집니다. 모델 학습을 위한 학습용 데이타인 mnist.train 그리고, 학습된 모델을 테스트하기 위한 테스트 데이타 셋은 minst.test, 그리고 모델을 확인하기 위한 mnist.validation 데이타셋으로 구별됩니다. 각 데이타는 아래와 같이 학습용 데이타 55000개, 테스트용 10,000개, 그리고, 확인용 데이타 5000개로 구성되어 있습니다.
'TensorFlow' 카테고리의 다른 글
테슬라 주가 예측 프로그램 ( 텐서플로우) (0) | 2022.03.22 |
---|---|
Apple M1, 텐서플로우 설치하기 (0) | 2022.03.21 |
Mac CommandLineTools 설치와 오류 해결 방법 – xcode-select: error: command line tools are already installed, use “Software Update” to install updates (0) | 2022.03.21 |
Tensorflow, 케라스 (Keras) 이건 또 뭐니? (0) | 2022.02.10 |
텐서플로우(TensorFlow) 가 뭐야? (0) | 2022.02.10 |