ADSP - 3장 데이터 분석
데이터웨어하우스(Data WareHouse) 데이터마트(Data Mart) 요약변수 파생변수 reshape: 변수를 조합해 변수명을 만들고 변수들을 결합해 다양한 요약변수와 파생변수를 생성 철을 녹여(melt) 다시 모양을 다시 만듦(cast) -melt() -cast() sqldf: R에서 sql의 명령어를 사용가능하게 해주는 패키지 plyr: apply 함수에 기반해 데이터와 출력변수를 동시에 배열로 치환하여 처리하는 패키지 data.table: R에서 가장 많이 사용하는 데이터 핸들링 패키지 - data.frame 방식보다 월등히 빠른속도 - 특정 column을 key 값으로 색인을 지정한 후 데이터를 처리 - 빠른 grouping, ordering으로 속도차가 큼
Developer
2020. 3. 14. 16:42