새로운 데이터셋을 보면 당황스럽죠. 수천개의 feature를 설명 없이 해석하는 건 어렵습니다. 이럴 때, featrue utility metric으로 순위를 구성하면 좋습니다. 이 함수는 feature와 target 사이의 연관성을 측정해줍니다. 그 다음에 유용한 featrues를 모아 작은 set을 만듭니다. 이 metric은 "mutual information"이라고 부릅니다. 두 개 사이의 관계를 측정하는 상관관계입니다. 장점은, correlation은 오직 선형 관계만 감지하지만, 이 방법은 모든 종류의 관계를 감지합니다. 정리하여, mutual information은 모델이 사용하고 해석하기 쉽거나 계산 과정에서 효율성이 보이거나 이론적으로 잘 만들어졌거나 과적합을 예방하거나 모든 종류의 관계..