ADSP - 3장 정형데이터마이닝
■데이터마이닝 : 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법 ■분석방법 - 지도학습(교사학습): 정답을 알려주고 풀이는 하는 방식 => 의사결정나무, 인공신경망(ANN), 일반화선형모형, 회귀분석, 사례기반 추론, 최근접 이웃법(KNN) - 비지도학습(비교사학습): 비슷한 데이터를 군집화하는 방식 => OLAP, 연관성규칙발견, 군집분석, SOM ■추진단계 - 목적 설정 -> 데이터 준비 -> 가공 -> 기법 적용 -> 검증 ■데이터마이닝을 위한 데이터 분할(사전준비) : 모델 평가용 테스트 데이터와 구축용 데이터로 분할하여, 구축용 데이터로 모형을 생성하고 테스트 데이터로 모형이 얼마나 적합한지를 판단 - 구축용(50%), 검정용(30%), 시험용(20..
Developer
2020. 3. 14. 16:54