강의 참고
https://kooc.kaist.ac.kr/machinelearning1_17/
인공지능 및 기계학습 개론Ⅰ 강좌소개 : edwith
본 강의는 기계 학습에 대한 이론적 지식을 확률, 통계, 최적화를 바탕으로 소개합니다. 이 과정에서 다양한 확률 이론 및 통계 방법론을 설명하며, 최적화 방법을 소개하고, Naiv... - KAIST 산업및
kooc.kaist.ac.kr
가정
Rule based learning (규칙 기반 학습)에서는 중요한 가정이 있다.
바로 '현실 세계 완벽히 설명 가능'(Perfect world) 하다는 전제이다.
1. 관측 에러가 존재하지 않는다. (즉 불규칙한 관측은 존재하지 않는다.) Training data is error-free,noise-free
2. 확률론적 요소가 우리가 관측하는 세계(system)에 존재하지 않는다.
3. 우리가 관측하는 세계에 대한 모든 정보가 있다.
※예시
완벽한 세계(Perfect world)에서 완전한 정보(Full information) <Sky, Temp, Humid, Wind, Water, Forecast>를 관측했더니 → EnjoySport(결과)가 나왔다고 가정
Sky | Temp | Humid | Wind | Water | Forecst | EnjoySpt |
Sunny | Warm | Normal | Strong | Warm | Same | Yes |
Sunny | Warm | High | Strong | Warm | Same | Yes |
Rainy | Cold | High | Strong | Warm | Change | No |
Sunny | Warm | High | Strong | Cool | Change | Yes |
● 인스턴스 X (Instance X)
- 위 표에서 인스턴스 X는 각각의 행(Row)를 의미하며 인스턴스 X는 크게 특징(Features)와 레이블(Label)로 나뉜다.
- 여기서 특징은 (Sky, Temp, Humid, Wind, Water, Forecst)의 값을 의미하고 레이블(label)은 EnjoySpt의 값을 나타낸다.
- 예로 Instance X_1의 Features: O: <Sunny, Warm, Normal, Strong, Warm, Same> 이고 Label: Y: <Yes>이다.
● 훈련 데이터셋 D (Training Dataset D)
- 인스턴스 X를 모아놓은 자료를 훈련 데이터셋 D라고 한다.
● 가설 H ( Hypotheses H)
- 특징 값(Feature values)를 통해 레이블 값(Label value)를 알수 있는 함수를 만들 수 있으면 우리는 가설을 세울 수 있다.
- 예로 $h_{i}$ : <Sunny, Warm, ?, ?, ?, ?> → Yes 라는 가설을 만들 수 있다.
'머신러닝' 카테고리의 다른 글
[ML_Basic] Naive Bayes Classifier (0) | 2023.01.04 |
---|---|
[ML_Basic] Decision Boundary (0) | 2023.01.01 |
[ML_Basic] Decision Tree (의사 결정 나무) (0) | 2023.01.01 |
[ML_Basic] 베이지안 확률론 (0) | 2022.12.30 |
[ML_Basic] 기본 확률론 (0) | 2022.12.30 |
댓글