본문 바로가기
728x90

Drawing (AI)111

Udemy - 머신러닝의 모든 것 (Polynomial Linear Regression) 다항식 회귀 아래와 같이 polynomial linear regression은 multiple linear regression과 유사하다. 그러나 polynomial linear regression은 다양한 x1, x2, ... xn 변수들이 존재하는 multiple linear regression과는 달리 같은 x1변수에 대해 n제곱 꼴로 이루어져 있음을 알 수 있다. 아래와 같은 방식으로 데이터가 분포해 있을 경우 단순 선형 회귀 방식으로는 적절한 모델을 만들 수 없다. 데이터의 분포의 경향성이 곡선에 가깝기 때문이다. Why Linear? Polynomial Linear Regression은 polynomial함에도 linear이라는 이름이 붙어있다. 이는 굉장히 이상하게 느껴질 수 있다. 여기서 .. 2023. 3. 11.
Google ML crash course (7) 일반화 머신러닝에서 분류를 통해 답을 찾아내기 위해 일반화는 매우 중요하다. 그러나 아래와 같이 선형적으로 분류를 하는 경우 제대로 분류가 되지 않아서 틀린 결과가 나오는 경우가 존재한다. 따라서 아래와 같이 복잡한 구분선을 그어서 기존 데이터를 100% 정확하게 분류할 수 있다. 그러나 이러한 경우 아래와 같이 새로운 데이터가 들어왔을때 적절하게 분류해 낼 수가 없다. 이러한 경우를 "과적합(overfit)"이라고 표현한다. 모델이 너무 복잡하여 새로운 데이터를 분류하는데 어려움이 있는것이다. 과적합 현대에 와서, 우리는 "Okham의 면도날"이라는 통계 학습 이론과 계산 학습 이론의 분야로 공식화했다. 이 이론은 모델의 복잡성과 훈련 데이터에 대한 모델의 성능과 같은 요소를 기반으로 새로운 데이터로 .. 2023. 3. 7.
실전 시계열 분석 - Intro 시계열의 개요와 역사 시계열 분석(Time Series Analysis)은 시간 순서대로 정렬된 데이터에서 의미 있는 요약과 통계 정보를 추출하기 위한 것으로 과거 행동을 진단할 뿐만 아니라 미래행동을 예측하기 위해 이용된다. 과거부터 의학, 기상학, 경제학, 천문학등 다양한 학문에서 이용되어왔고 최근들어 기술의 발전으로 더욱 의미 있는 높은 수준의 결과를 만들어내고 있다. 머신러닝에서 시계열 분석 기계 학습은 시계열 데이터를 분석하는 데 점점 더 인기 있는 도구가 되었다. 시계열 분석에 적합한 머신러닝 알고리즘 예시들은 다음과 같다. 자기 회귀 통합 이동 평균(ARIMA): ARIMA는 관측치와 과거 관측치의 선형 조합 사이의 의존성을 모델링하는 시계열 예측 알고리즘이다. 지수 평활(ETS): ETS는.. 2023. 3. 5.
Udemy - 머신러닝의 모든 것 (Multiple Linear Regression-2) 스타트업 투자 프로그램 위와 같은 데이터 셋을 이용하여 투자해야할 스타트업을 선정하는 프로그램을 만들어본다. Data preprocessing 기본적으로 데이터 전처리 과정이 필요하다. state 항목이 수치형 데이터가 아니라 항목형 데이터이므로 encoding과정을 통해 수치형 데이터로 변환을 해준다. 이때 one-hot encoding 방식, 즉 3개의 범주이므로 3개의 항목을 만들어주어 해당하는 항목에만 1이들어가고 나머지는 전부 0으로 맞춰주는 방식을 이용하여 수치형 데이터로 만들고자 한다. Training from sklearn.linear_model import LinearRegression sklearn(사이킷런) 라이브러리에서 linear_model 모듈의 LinearRegression 클.. 2023. 2. 28.
Google ML crash course (6) Linear regression(2) 이번에는 실제 데이터셋을 이용해보고자 한다. 캘리포니아의 집값에 대한 데이터셋을 이용하여 선형회귀 과정을 밟아보자. #@title Import relevant modules import pandas as pd import tensorflow as tf from matplotlib import pyplot as plt # The following lines adjust the granularity of reporting. pd.options.display.max_rows = 10 pd.options.display.float_format = "{:.1f}".format 머신러닝에서 csv파일을 이용하는데 csv파일이란 Comma-seperated values 파일로 콤마.. 2023. 2. 27.
Google ML crash course (5) tf.keras tf.keras를 사용하여 선형 회귀를 구현해보고자 한다. import pandas as pd import tensorflow as tf from matplotlib import pyplot as plt build_model(my_learning_rate)라는 빈 model을 build하는 함수와 train_model(model, feature, label, epochs)라는 model을 학습시키는 함수를 정의한다. #@title Define the functions that build and train a model def build_model(my_learning_rate): """Create and compile a simple linear regression model.""" # .. 2023. 2. 25.
OpenAI 숨바꼭질 전문(?) AI Intro Two Minute Papers라는 평소에 즐겨보는 AI 논문 리뷰 유튜브에서 정말 재미있는 주제의 내용이 있어서 소개하고자한다. https://www.youtube.com/watch?v=Lu56xVlZ40M 간단하게 캐릭터들의 시야각이 존재하고 해당 시야에 들어오면 도망치는 팀이 잡히는 구조이다. 해당 룰만 주어지고 잡는팀, 도망치는 팀이 어떻게 숨바꼭질의 전문가가 되어가는지 알아보는 실험이다. 다만 필드에 중립 물체가 존재해서 해당 물체들을 움직여서 각팀에 유리하게 활용할 수 있다. 실험을 진행한 초반에는 아무 의미 없이 두팀이 뛰어다니다가 시야에 걸리면 게임이 끝나는 것이 반복이었으나 어느새 도망치는 팀은 필승전략을 생각해냈다. 주어진 두 물체로 문 두개를 막아서 절대 술래에게 걸리지 않.. 2023. 2. 19.
AI스터디자료-1주차 1주차 PPT 자료 딱 정해진 포함관계는 아니지만 흔히 위와 같이 분류하곤한다. 딥러닝의 가장 큰 특징은 인공신경망을 이용하여 방대한 데이터를 다룬다는 것이다. Machine은 가중치 즉,Parameter와 변수로 구성된 y=ax1+bx2+c와 같이 함수로 독립변수(Feature)와 종속변수(Label)의 관계를 표현하는 Model인 것이다. 이때 가중치(Parameter)를 결정하도록 하는 과정을 우리는 Model을 Training시킨다고 하고 해당 Model로 문제를 예측하는 과정을 추론이라고 한다. 강화학습은 ML, DL과는 조금 결이다른 내용으로 각 state에서 최선의 reward를 찾아가도록 하는 Model을 만드는 과정이라고 볼 수 있다. 가장 좋은 예시로 알파고가 있다. 한수(state)마.. 2023. 2. 11.
체중 감소 예측 프로그램 (딥러닝) Weight-Loss-Prediction (with ANN) 가상 데이터 생성하는 소스코드 data.py import random import numpy as np import csv import matplotlib.pyplot as plt # Create a list to store the data data = [] m_weight_graph = [] m_redu_graph = [] f_weight_graph = [] f_redu_graph = [] total_reduced_weight = 0 total_weight = 0 total_fat_per = 0 # Generate data for 10,000 people for i in range(30000): # Create a dictionary to s.. 2023. 2. 7.
728x90