회귀2 Scikit-learn의 기초 - 회귀(선형, 라쏘, 릿지, 랜덤포레스트, XGBoost) 1. 회귀 분석이란 무엇인가? 통계학에서 회귀 분석(回歸分析, 영어: regression analysis)은 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법 ★ 데이터 불러오기 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.datasets import load_diabetes # 당뇨병 환자 데이터 def make_dataset(): dataset = load_diabetes() df = pd.DataFrame(dataset.data, columns=dataset.feature_names) df['target'] = dataset.target X_trai.. 2023. 11. 25. 지도 학습의 종류 - 분류와 회귀 1. 지도학습 vs 비지도학습 지도학습과 비지도학습의 가장 큰 차이는 Y값 즉, 답이 주어지는가의 차이이다. 주어진 데이터에 의해 도출되는 Y값이 주어져 있기 때문 이를 통해 학습한다. 반면 비지도학습은 도출되는 Y값이 없기 때문에 주어진 데이터들의 공통된 특성들을 찾아 군집화 시킨다. 2. 지도학습 - 분류 vs 회귀 분류와 회귀의 가장 큰 차이는 Y값의 타입 즉, 분류는 레이블이고 회귀는 숫자인 것이다. 즉, 분류는 말그대로 Category가 Y값으로 주어지지만, 회귀는 어떠한 숫자 Y값으로 주어진다. 예를 들면 모레 우동집의 매출이 오를 것인가를 예측하고자 한다면, 분류모델은 "그렇다" 또는 "아니다"라 답하겠지만, 회귀모델은 예상되는 매출 수치로 답해준다. 이렇게 봤을 때 회귀모델이 더 뛰어난 모.. 2023. 11. 23. 이전 1 다음