-
pandas_sklearn_DecisionTreeclassifier머신러닝(MACHINE LEARNING) 2021. 4. 13. 17:11반응형
주피터 노트북을 활용한 Decision_Tree_Classifier 이다. 참고하길 바랍니다.
In [1]:from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split
In [2]:import pandas as pd iris = load_iris() # iris.data 는 Iris 데이터 세트에서 피쳐 만으로 된 numpy를 가지고 있습니다. iris_data = iris.data print(iris_data[:3]) print(iris_data.shape)
[[5.1 3.5 1.4 0.2] [4.9 3. 1.4 0.2] [4.7 3.2 1.3 0.2]] (150, 4)
In [3]:# iris_target 은 붓꽃 데이터 세트에서 레이블 데이터를 numpy로 가지고 있다. iris_label = iris.target iris_df = pd.DataFrame(data = iris.data, columns = iris.feature_names)
In [4]:iris_df.head()
Out[4]:sepal length (cm) sepal width (cm) petal length (cm) petal width (cm) 0 5.1 3.5 1.4 0.2 1 4.9 3.0 1.4 0.2 2 4.7 3.2 1.3 0.2 3 4.6 3.1 1.5 0.2 4 5.0 3.6 1.4 0.2 In [5]:X_train,X_test,Y_train,Y_test = train_test_split(iris_data, iris_label, test_size = 0.2 , random_state =11) print(X_train.shape) print(X_test.shape) print(Y_train.shape) print(Y_test.shape)
(120, 4) (30, 4) (120,) (30,)
In [6]:dt_clf = DecisionTreeClassifier(random_state = 11) dt_clf.fit(X_train, Y_train)
Out[6]:DecisionTreeClassifier(random_state=11)
In [7]:from sklearn.metrics import accuracy_score print('accuracy _ score : {0:.2f}'.format(accuracy_score(Y_test, dt_clf.predict(X_test))))
accuracy _ score : 0.93
In [ ]:반응형'머신러닝(MACHINE LEARNING)' 카테고리의 다른 글
GridSearchCV () - 파라매터 와 교차검증을 동시에 하는 API (0) 2021.04.13 교차 검증을 위한 Cross_val_score() 함수 사용법 (0) 2021.04.13 K-Fold 와 Stratified-KFold 기법 (2) 2021.04.13 Train_Test_Split 함수 사용Train_Test_Split 함수 사용 (0) 2021.04.13 Kaggle_Titanic (0) 2021.04.09