-
교차 검증을 위한 Cross_val_score() 함수 사용법머신러닝(MACHINE LEARNING) 2021. 4. 13. 22:23반응형
사이킷 런(Scikit-Learn) 에서 보다 쉬운 교차검증 API - cross_val_score()¶
-사이킷 런에서는 교차검증(K-Fold or StratifiedKFold) 를 더 쉽게 할 수 있는 API를 제공하는 데 그것은 cross_val_score 이다. cross_val_score 에는 여러가지 변수 값들이 있지만 중요한 몇가지만 알아보자.
estimator = > 분류 알고리즘(Classifier) 또는 회귀 (Regressor) 인지 구분 인자
X => feature 데이터 세트
Y => 레이블 데이터 세트
scoring => 예측 성능 평가 지표( 'accuracy', 'neg_brier_score' , 'top_k_accuracy'등등 겁나많다...)
cv => 교차 검증 폴드 수
cross_val_score() 수행 후, 반 환 값은 scoring 파라미터로 지정된 측정값을 배열 형태로 반환한다. 그럼 사용법을 알아보자 . (cv =5)으로 실시
dt_clf 값을 estimator 로 주었고, 내부적으로 StratifiedKFold 기법을 사용하기에 , 앞서 본 stratifiedKFold 와 평가지표가 동일하게 나오는 것을 볼 수 있다.
In [14]:from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import cross_val_score, cross_validate from sklearn.datasets import load_iris import numpy as np iris_data = load_iris() dt_clf = DecisionTreeClassifier(random_state = 11) data = iris_data.data label = iris_data.target
In [15]:scores = cross_val_score(dt_clf, data, label, scoring = 'accuracy', cv =5) print('교차 검증별 정확도 : {}'.format(np.round(scores,4)))
교차 검증별 정확도 : [0.9667 0.9667 0.9 0.9667 1. ]
반응형'머신러닝(MACHINE LEARNING)' 카테고리의 다른 글
XGboost (Ensemble 학습법) (0) 2021.04.14 GridSearchCV () - 파라매터 와 교차검증을 동시에 하는 API (0) 2021.04.13 K-Fold 와 Stratified-KFold 기법 (2) 2021.04.13 Train_Test_Split 함수 사용Train_Test_Split 함수 사용 (0) 2021.04.13 pandas_sklearn_DecisionTreeclassifier (0) 2021.04.13