'dat a mining'에 해당되는 글 1건
- 2019.02.24 :: 정형 데이터 마이닝
데이터 마이닝(data mining)
- 거대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 과정
1. 분류(Classification)
- 새롭게 나타난 현상을 검토하여 기존의 분류, 정의된 집합에 배정하는 것을 의미
- 의사결정나무(decision trees), memory-based reasoning, link analysis
2. 추정(Estimation)
- 주어진 입력 데이터를 사용하여 알려지지 않은 결과의 값을 추정
- 신경망 모델(neural networks)
3. 예측(Prediction)
- 미래의 양상을 예측하거나 미래의 값을 추정한다는 거을 제외하면 분류나 추정과 동일한 의미를 갖는다
- 장바구니 분석, memory-based reasoning, 의사결정나무, 신경망 등이 모두 예측에 사용
4. 연관분석(Association Analysis)
- '같이 팔리는 물건'과 같이 아이템의 연관성을 파악하는 분석
- 연관규칙(association rules)
5. 군집(Clustering)
- 이질적인 모집단을 동질성을 지닌 그룹 별로 세분화하는 것
- 군집과 분류의 차이점 : 군집은 선분류 되어있는 기준에 의존하지 않는다
- 주로 데이터 마이닝이나 모델링의 준비단계로 사용
6. 기술(Description)
- 훌륭한 기술은 데이터가 암시하는 바에 대해 설명이 가능해야 하며, 또한 설명에 대한 답을 찾아낼 수 있어야 한다
데이터 마이닝은 일반적으로
목적 정의 -> 데이터 준비 -> 데이터 가공 -> 데이터 마이닝 기법의 적용 -> 검증의
5단계를 수행한다
'Data 분석' 카테고리의 다른 글
분류분석 - 신경망 모형 (0) | 2019.02.24 |
---|---|
분류분석 - 로지스틱 회귀모형 (0) | 2019.02.24 |
시계열분석 (0) | 2019.02.24 |
최적회귀방정식의 선택 - 설명변수의 선택 : 단계적 변수선택 방법 (0) | 2019.02.17 |
이산형 확률분포와 연속형 확률분포의 종류 (0) | 2019.02.12 |