Data Augmentation (데이터에 인위적 변화를 주는 것)
Data Augmentation을 하는 이유
우리는 항상 깔끔한 데이터만을 얻을 수 없다. 어느 데이터는 중앙에 있지 않고 어떤 데이터는 작고 어떤 데이터는 흐릿하다. 따라서 조금 더 어려운(?) 데이터로 훈련을 시키면 어떨까? 실험을 했는데 결과는 더 좋게 나오면서 여러 DataAugmentation이 활성화 되었다.
torchvision.transforms
Image에 다양한 함수를 적용할 수 있다.
예시 CODE
from torchvision import transforms
data_aug = transforms.compose([transforms.RandomCrop((224,224)), transforms.ToTensor()])
아래 공식문서를 통해 transforms안에 있는 여러 함수 기능에 대해서 알 수 있다.
https://pytorch.org/vision/stable/_modules/torchvision/transforms/transforms.html
torchvision.transforms.transforms — Torchvision main documentation
Shortcuts
pytorch.org
torchvision.transforms vs Albumentations
사실 Albumentations가 더 빠르고 더 다양해서 Albumentations을 쓰는 것이 더 좋아보인다. 근데 왜 torchvision.transforms도 많이 쓰는지 잘 모르겠다.
Data Generation
데이터 셋을 잘 구성해도 잘 출력해야만 실속이 있다.
DataLoader
내가 만든 Dataset을 효율적으로 사용할 수 있도록 관련 기능 추가한 것이다.
Dataset vs DataLoader
## 피어세션
[피어세션](https://www.notion.so/2021-08-24-4c1d57efb60a4e4a920b7f345ffd9704)
'AI-Tech 부스트캠프' 카테고리의 다른 글
[PyTorch] Training, Inference 과정 (0) | 2021.08.27 |
---|---|
[PyTorch] 기본 모델링 과정 (0) | 2021.08.27 |
대회 참여하기 (0) | 2021.08.24 |
2021_08_19_(목) (0) | 2021.08.20 |
2021_08_16_(월) (0) | 2021.08.16 |
댓글