'dat a mining'에 해당되는 글 1건

  1. 2019.02.24 :: 정형 데이터 마이닝
Data 분석 2019. 2. 24. 12:42

데이터 마이닝(data mining)

- 거대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 과정


1. 분류(Classification)

- 새롭게 나타난 현상을 검토하여 기존의 분류, 정의된 집합에 배정하는 것을 의미

- 의사결정나무(decision trees), memory-based reasoning, link analysis


2. 추정(Estimation)

- 주어진 입력 데이터를 사용하여 알려지지 않은 결과의 값을 추정

- 신경망 모델(neural networks)


3. 예측(Prediction)

- 미래의 양상을 예측하거나 미래의 값을 추정한다는 거을 제외하면 분류나 추정과 동일한 의미를 갖는다

- 장바구니 분석, memory-based reasoning, 의사결정나무, 신경망 등이 모두 예측에 사용


4. 연관분석(Association Analysis)

- '같이 팔리는 물건'과 같이 아이템의 연관성을 파악하는 분석

- 연관규칙(association rules)


5. 군집(Clustering)

- 이질적인 모집단을 동질성을 지닌 그룹 별로 세분화하는 것

- 군집과 분류의 차이점 : 군집은 선분류 되어있는 기준에 의존하지 않는다 

- 주로 데이터 마이닝이나 모델링의 준비단계로 사용


6. 기술(Description)

- 훌륭한 기술은 데이터가 암시하는 바에 대해 설명이 가능해야 하며, 또한 설명에 대한 답을 찾아낼 수 있어야 한다


데이터 마이닝은 일반적으로 

목적 정의 -> 데이터 준비 -> 데이터 가공 -> 데이터 마이닝 기법의 적용 -> 검증의 

5단계를 수행한다


posted by 초코렛과자
: