의사결정 트리 방법의 단계는 무엇인가요?
1. 기능 선택
기능 선택은 판단을 내리는 데 사용되는 기능을 결정합니다. 훈련 데이터 세트에서 각 샘플은 많은 속성을 가질 수 있으며, 다양한 속성의 효과는 크거나 작을 수 있습니다. 따라서 특징 선택의 기능은 분류 결과와 관련성이 높은 특징, 즉 강력한 분류 능력을 가진 특징을 필터링하는 것입니다. 특징 선택에 일반적으로 사용되는 기준은 정보 획득입니다.
2. 의사결정 트리 생성
특성을 선택한 후 루트 노드에서 트리거되고 해당 노드에 대해 모든 특성의 정보 이득이 계산되며 가장 큰 특성이 생성됩니다. 정보 이득은 노드 특성으로 선택됩니다. 특성의 다른 값에 따라 정보 이득이 매우 작거나 선택할 특성이 없을 때까지 동일한 방법을 사용하여 각 자식 노드에 대해 새로운 자식 노드를 생성합니다. .
3. 결정 트리 가지치기
가지치기의 주요 목적은 "과적합"을 방지하고 일부 가지를 적극적으로 제거하여 과적합 위험을 줄이는 것입니다.
소개
결정 트리는 분류 문제를 해결하기 위한 알고리즘입니다. 결정 트리 알고리즘은 트리 구조를 채택하고 레이어별 추론을 사용하여 최종 분류를 달성합니다.