머신러닝이란?
머신러닝은 다양한 input 데이터들을 종합하여 의미있고 유용한 결과와 예측을 이끌어내는 시스템입니다.
기본적인 머신러닝 용어
Label - 예측하고자 하는 정보로 simple linear regression 변수이다.
Feature - 다양한 input 데이터로 label을 결정지을 수 있는 특징들이다. Label과 같이 simple linear regression 변수이다.
Example - 말그대로 예시로 시스템이 학습할 수 있는 데이터의 특정한 인스턴스로
Labeled example과 Unlabeled example로 분류할 수 있다.
위와 같이 labeled examples는 추정하고자 하는 결과값인 label이 포함된 시스템이 학습할 수 있는 dataset이다.
위와 같이 unlabeled examples는 label이 제외된 dataset이다.
Model - model은 features와 label의 관계를 정의하는 것을 의미한다. 다시 말해 주어진 features를 이용하여 예상되는 label을 추정해낼 수 있다는 것이다. Model은 Traing과정과 Inference과정으로 나눠볼 수 있다. Training 과정은 model을 생성하고 학습하는 과정이다. 이 과정에서는 labeled example을 이용하여 features와 label의 관계를 파악한다. Inference는 학습된 model을 이용하여 unlabeled examples에 label을 추정하는 과정이라고 볼 수 있다.
Regression vs Classification
Regression - 연속적인 값에서 결과값을 추정하는것 ex) 집값, 유저의 광고 클릭 확률
Classification - 이산적인 값에서 결과값을 추정하는것 ex) 스팸메일인지?, 어떤 동물인지?
'Drawing (AI) > Google' 카테고리의 다른 글
Google ML crash course (6) (0) | 2023.02.27 |
---|---|
Google ML crash course (5) (0) | 2023.02.25 |
Google ML crash course (4) (0) | 2022.12.26 |
Google ML crash course (3) (0) | 2022.07.23 |
Google ML Crash Course (2) (0) | 2022.07.23 |