본문 바로가기
AI-Tech 부스트캠프

Data Augmentation

by Alan_Kim 2021. 8. 27.
728x90
반응형

 

 

Data Augmentation (데이터에 인위적 변화를 주는 것)

Data Augmentation을 하는 이유

우리는 항상 깔끔한 데이터만을 얻을 수 없다. 어느 데이터는 중앙에 있지 않고 어떤 데이터는 작고 어떤 데이터는 흐릿하다. 따라서 조금 더 어려운(?) 데이터로 훈련을 시키면 어떨까? 실험을 했는데 결과는 더 좋게 나오면서 여러 DataAugmentation이 활성화 되었다. 

torchvision.transforms

Image에 다양한 함수를 적용할 수 있다.

예시 CODE

from torchvision import transforms
data_aug = transforms.compose([transforms.RandomCrop((224,224)), transforms.ToTensor()])

아래 공식문서를 통해 transforms안에 있는 여러 함수 기능에 대해서 알 수 있다.

https://pytorch.org/vision/stable/_modules/torchvision/transforms/transforms.html

 

torchvision.transforms.transforms — Torchvision main documentation

Shortcuts

pytorch.org

torchvision.transforms vs Albumentations

사실 Albumentations가 더 빠르고 더 다양해서 Albumentations을 쓰는 것이 더 좋아보인다. 근데 왜 torchvision.transforms도 많이 쓰는지 잘 모르겠다.

 

 

Data Generation

 데이터 셋을 잘 구성해도 잘 출력해야만 실속이 있다.

같은 transforms라도 구조에 따라 속도가 다르다.

DataLoader

 내가 만든 Dataset을 효율적으로 사용할 수 있도록 관련 기능 추가한 것이다.

dataloader 식

 

Dataset vs DataLoader

Dataset(좌)는 DataLoader(우)와 하는일이 엄연히 다르다.

 

## 피어세션

[피어세션](https://www.notion.so/2021-08-24-4c1d57efb60a4e4a920b7f345ffd9704)

728x90
반응형

'AI-Tech 부스트캠프' 카테고리의 다른 글

[PyTorch] Training, Inference 과정  (0) 2021.08.27
[PyTorch] 기본 모델링 과정  (0) 2021.08.27
대회 참여하기  (0) 2021.08.24
2021_08_19_(목)  (0) 2021.08.20
2021_08_16_(월)  (0) 2021.08.16

댓글