Developer
ADSP - 3장 데이터 분석
gabriel.LIM
2020. 3. 14. 16:42
데이터웨어하우스(Data WareHouse)
데이터마트(Data Mart)
요약변수
파생변수
reshape: 변수를 조합해 변수명을 만들고 변수들을 결합해 다양한 요약변수와 파생변수를 생성
철을 녹여(melt) 다시 모양을 다시 만듦(cast)
-melt()
-cast()
sqldf: R에서 sql의 명령어를 사용가능하게 해주는 패키지
plyr: apply 함수에 기반해 데이터와 출력변수를 동시에 배열로 치환하여 처리하는 패키지
data.table: R에서 가장 많이 사용하는 데이터 핸들링 패키지
- data.frame 방식보다 월등히 빠른속도
- 특정 column을 key 값으로 색인을 지정한 후 데이터를 처리
- 빠른 grouping, ordering으로 속도차가 큼