728x90 dataset2 [PyTorch] Dataset & Dataloaders 모델에 데이터를 넣을려면 어떻게 해야할까? 자료를 모은다(collecting) → 자료를 정리한다(cleaning) → 전처리 작업 (pre processing) → 데이터(Data) 완성! 그럼 이것을 바로 모델에 넣으면 될까? NO! Dataset 클래스(class)를 통해 목적에 맞는 데이터 값을 받고 이것을 DataLoader라는 것을 통해 Model에 맞는 batch 등 Model input에 맞게 다듬은 다음에 Model에 넣는 것이다. 뭔 말이지...? 그래서 우선 하나씩 알아보자 Dataset 클래스 - 데이터 입력 형태를 정의하는 클래스 - 데이터를 입력하는 방식을 표준화 한다는 것에 의의가 있다. - Image, Text, Audio 등에 따른 다른 입력 정의를 내린다. - 클래스 안에.. 2022. 12. 24. Data Augmentation Data Augmentation (데이터에 인위적 변화를 주는 것) Data Augmentation을 하는 이유 우리는 항상 깔끔한 데이터만을 얻을 수 없다. 어느 데이터는 중앙에 있지 않고 어떤 데이터는 작고 어떤 데이터는 흐릿하다. 따라서 조금 더 어려운(?) 데이터로 훈련을 시키면 어떨까? 실험을 했는데 결과는 더 좋게 나오면서 여러 DataAugmentation이 활성화 되었다. torchvision.transforms Image에 다양한 함수를 적용할 수 있다. 예시 CODE from torchvision import transforms data_aug = transforms.compose([transforms.RandomCrop((224,224)), transforms.ToTensor()]) .. 2021. 8. 27. 이전 1 다음 728x90