반응형
Decisionclassifier
-
[인프런 - 파이썬 머신러닝 완벽 가이드] 분류(Classification) 결정트리 Decision TreeData Science 2020. 6. 10. 06:29
결정트리 Decision Tree 결정트리 알고리즘은 데이터에 있는 규칙을 학습을 통해 자동으로 찾아내는 tree 기반의 분류 규칙을 만든다 ( If Else 기반 규칙 ) 즉 어떠한 기준으로 규칙을 만들어야 가장 효율적인 분류가 될것인가가 결정트리의 성능을 크게 좌우한다. 정보이득 ( Information Gain) 정보이득은 엔트로피라는 개념을 기반으로 한다. 엔트로피는 주어진 데이터 집합의 혼잡도를 의미. 서로 다른 값이 섞여있으면 엔트로피가 높고 같은 값이 섞여있으면 엔트로피가 낮다. 정보 이즉 지수는 1에서 엔트로피 지수를 뺸 값이다. 정보 이득이 높은 속성을 기준으로 분할한다. 지니 계수 지니계수는 원래 경제학에서 불평등 지수를 나타낼때 사용하는 계수 0이 가장 평등 1로 갈수록 불평등 ML에..