상세 컨텐츠

본문 제목

ADSP - 3장 데이터 분석

Developer

by gabriel.LIM 2020. 3. 14. 16:42

본문

데이터웨어하우스(Data WareHouse)

데이터마트(Data Mart)

요약변수

파생변수

reshape: 변수를 조합해 변수명을 만들고 변수들을 결합해 다양한 요약변수와 파생변수를 생성

철을 녹여(melt) 다시 모양을 다시 만듦(cast)

-melt()

-cast()

sqldf: R에서 sql의 명령어를 사용가능하게 해주는 패키지

plyr: apply 함수에 기반해 데이터와 출력변수를 동시에 배열로 치환하여 처리하는 패키지

data.table: R에서 가장 많이 사용하는 데이터 핸들링 패키지

- data.frame 방식보다 월등히 빠른속도

- 특정 column을 key 값으로 색인을 지정한 후 데이터를 처리

- 빠른 grouping, ordering으로 속도차가 큼

'Developer' 카테고리의 다른 글

vue Webpack 뜯어보기  (0) 2021.08.20
ADSP - 3장 정형데이터마이닝  (0) 2020.03.14
ADSP - 3장 통계분석의 이해  (0) 2020.03.14
GMT, UTC, KST 등.. 세계 표준시계  (0) 2015.12.01

관련글 더보기