Developer

ADSP - 3장 데이터 분석

gabriel.LIM 2020. 3. 14. 16:42

데이터웨어하우스(Data WareHouse)

데이터마트(Data Mart)

요약변수

파생변수

reshape: 변수를 조합해 변수명을 만들고 변수들을 결합해 다양한 요약변수와 파생변수를 생성

철을 녹여(melt) 다시 모양을 다시 만듦(cast)

-melt()

-cast()

sqldf: R에서 sql의 명령어를 사용가능하게 해주는 패키지

plyr: apply 함수에 기반해 데이터와 출력변수를 동시에 배열로 치환하여 처리하는 패키지

data.table: R에서 가장 많이 사용하는 데이터 핸들링 패키지

- data.frame 방식보다 월등히 빠른속도

- 특정 column을 key 값으로 색인을 지정한 후 데이터를 처리

- 빠른 grouping, ordering으로 속도차가 큼