Category Archives: Terms

Data Mining Algorithm List Tree

related material: 『Data Mining』-written by Ian H. Witten Basic Data Mining Algorithm ├───기본 규칙 추출: 1R ├───통계 모델링: 단순 베이지안 , 가우시안/정규분포(수치형) ├───분할정복기법: 의사결정트리 ├───연관 규칙 마이닝 ├───선형모델 │               ├수리예측: 선형 회귀 │               ├선형분류: 로지스틱 회귀 │            … Read More »

1,675 total views, no views today

Terms-C4.5(Pseudo Decision Tree Guidance System)

related material: 『Data Mining』-written by Ian H. Witten Category: Divide and conquer technique: Decision Tree Divide and conquer algorithms for Decision Tree 하향식 또는 Top-down Pseudo Decision Tree  유도 방법이라고도 불림 시드니 대학의 J.Ross Quinlan(wiki)에 의해 개발 및 개선 정보 이득을 기준으로 설명한 스킴은 기본적으로 ID3 스킴과 동일 이득비를  사용하는 스킴은 수년에 걸쳐 여러 차례… Read More »

1,731 total views, 1 views today

Terms-Information gain ratio

related material: 『Data Mining』-written by Ian H. Witten Category: Divide and conquer technique: Decision Tree Information Gain Ratio : 결정 트리 구조에서, 한 속성에 대한 가지 생성은 정보 이득 값(information gain) 이 가장 큰 값을 통해 이루어진다. 하지만, 정보 이득 값이 도출 가능한 속성 값이 많은 속성을 선호하는 경향이 있어, 이를 상쇄하기 위해 이득비(gain ratio)… Read More »

1,898 total views, no views today

Terms – information, bit

related material: 『Data Mining』-written by Ian H. Witten Category: Divide and conquer technique: Decision Tree Information Caculating (Decision Tree) Rules yes or no 둘 중 하나라도 0일 경우 information value 는 0 yes & no 가 동일한 값이면 max information value 가 된다. 정보는 단계적(multistage) 속성을 따른다. 예를 들면 info([2,3,4]) 의 경우,데이터가 2 또는 7(=3+4)… Read More »

1,461 total views, no views today