-
[인프런 - 파이썬 머신러닝 완벽 가이드] iris 품종 예측하기Data Science 2020. 6. 7. 23:55반응형
앞으로 인프런에 올라와있는 권철민님의 파이썬 머신러닝 완벽 가이드를 수강하며
공부한 내용 및 코드를 정리해 나아갈 것이다.
iris 품종 예측하기
# 필요한 라이브러리 import from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split import pandas as pd # 데이터 세트 로드 iris = load_iris() #feature 데이터 iris_data = iris.data # 레이블(결정값)데이터 iris_label = iris.target print("iris target 값 : " , iris.target) print("iris target 명 : " , iris.target_names) # DataFrame으로 변환 iris_df = pd.DataFrame(data=iris_data , columns=iris.feature_names) iris_df["label"] = iris.target iris_df.head(3)
sklearn의 iris데이터를 불러와
feature(속성) 데이터와 label(타켓,클래스)데이터로 나누어
iris_df라는 DataFrame을 생성한다.
# 학습데이터와 데스트 데이터 세트로 분리 # x feature y target X_train , X_test , y_train , y_test = train_test_split(iris_data, iris_label , test_size=0.2 , random_state=11) # DecisionTreeClassifier 객체 생성 dt_clf = DecisionTreeClassifier(random_state=11) # 학습 수행 dt_clf.fit(X_train, y_train) # 학습이 완료된 DecisionTreeClassifier 객체에서 test dataset으로 예측 수행 pred = dt_clf.predict(X_test) # 예측 정확도 평가 from sklearn.metrics import accuracy_score print("예측 정확도 : {0:.4f}".format(accuracy_score(y_test,pred)))
train_test_split을 사용해 학습features , 테스트features , 학습 class, 테스트 class를 생성
test_size : 전체 dataset에서 test dataset의 크기를 설정한다.
shuffle : default = True 전체 dataset에서 train dataset과 test dataset으로 분리 하기전에 데이터를 섞어준다.
dt_clf 라는 DecisionTreeClassifier객체를 생성해주고
fit()을통해 학습을 수행 predict()로 예측을 수행한다.
반응형'Data Science' 카테고리의 다른 글
[인프런 - 파이썬 머신러닝 완벽 가이드]머신러닝 classification(분류) 성능 지표 - 정밀도(Precision)과 재현율(Recall) (0) 2020.06.09 [인프런 - 파이썬 머신러닝 완벽 가이드] 머신러닝 classification(분류) 성능 지표 - 정확도 Accuracy , 오차 행렬 (Confusion Matrix) (0) 2020.06.09 [인프런 - 파이썬 머신러닝 완벽 가이드] 데이터 전처리 (데이터 인코딩과 스케일링) (0) 2020.06.08 [인프런 - 파이썬 머신러닝 완벽 가이드] 교차 검증 (0) 2020.06.08 [Data Science] 공공데이터 활용해 프랜차이즈 분석하기 (0) 2020.06.06