Decision tree learning? 알고리즘 개요 전체 데이터셋을 현재(루트) 노드에 할당 (현재 노드 깊이 < 최대 깊이) 일때 다음과 같이 2분할을 반복 각 특성에 대해 2분할시 가장 변별력이 높은 특성값(분할점)을 찾음 모든 특성의 분할점에 대해 가장 변별력이 높은 특성(분할특성)을 선택 분할특성과 그 특성의 분할점을 기준으로 현재 노드를 2분할 2-3에서 분할 생성된 2개의 노드를 미분할 노드 집합에 추가 미분할 노드 집합 중 하나의 노드를 현재 노드로 할당
알고리즘의 동작 예시 KRX 005930의 1년 후 로그수익률 데이터셋 (2017.05.16 ~ 2023.08.27) 매주 하나의 평균값을 뽑은 개의 데이터셋 입력(8): 시총,유가,금값,자본/시총,잉여/시총,매출/시총,이익/시총,현금/시총 출력(1): 1년 후 로그수익률
결과 Decision Tree 시각화 테이블에서 데이터포인트 선택 → decision tree의 예측값을">