본문 바로가기

분류 전체보기112

[시계열분석] 평활화모형 (이동평균, 지수평활, 이중지수평활, 윈터모형) 보호되어 있는 글 입니다. 2021. 2. 7.
[트리기반] 가지치기 보호되어 있는 글 입니다. 2021. 2. 7.
분류의 성능지표 보호되어 있는 글 입니다. 2021. 2. 4.
[분류] 트리를 만드는 기준 보호되어 있는 글 입니다. 2021. 2. 3.
[분류] 트리기반 모형, 넌 학생이고 난 선생이야 보호되어 있는 글 입니다. 2021. 2. 3.
[분류] 선형판별분석 (LDA, Linear Discriminant Analysis) 보호되어 있는 글 입니다. 2021. 2. 3.
스케일링을 하는 8가지 방법 보호되어 있는 글 입니다. 2021. 2. 3.
인코딩을 하는 5가지 방법 보호되어 있는 글 입니다. 2021. 2. 3.
[분류] 명목 서열 로지스틱 보호되어 있는 글 입니다. 2021. 2. 3.
1. Linear Regression CODE [3] How to select Variables How to select Variables Linear Regression CODE 0. EDA 항상 EDA와 도메인지식을 통해서 이상치와 결측을 제거하고 Feature Engineering을 통해 특성을 잘 조정해야한다. 모델의 성능을 높이는 데 가장 중요한 것은 다른데 있지 않다. 1. KBest ## K Best from sklearn.feature_selection import SelectKBest, f_regression selector = SelectKBest(score_func=f_regression, k=20) # Instance 생성 X_train_K = selector.fit_transform(X_train, y_train) # train 적용 X_test_K = selector.tra.. 2021. 2. 3.
1. Linear Regression CODE [2] Modeling Modeling with Multivariate , Polynomial, Ridge, Lasso Linear Regression CODE 0. Reference (Baseline) ## Simple Regression Reference Model (Mean or Median) # Visualization to flind Baseline plt.figure(figsize = (15,5)) plt.hist(df.target, bins=100,color='blue',alpha=0.5) plt.axvline(df.target.mean(),color ='red') plt.axvline(df.target.median(),color ='navy') plt.xlabel('target') plt.title('Histog.. 2021. 2. 3.
1. Linear Regression CODE [1] Simple Regression Simple Regression Linear Regression CODE 0. Reference (Baseline) ## Simple Regression Reference Model (Mean or Median) # Visualization to flind Baseline plt.figure(figsize = (15,5)) plt.hist(df.target, bins=100,color='blue',alpha=0.5) plt.axvline(df.target.mean(),color ='red') plt.axvline(df.target.median(),color ='navy') plt.xlabel('target') plt.title('Histogram of Price') plt.grid() plt.show().. 2021. 2. 2.