일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 삼성자격증
- 데이터분석대외활동
- 삼성SDSBrightics
- 데이터전처리
- BrighticsStudio
- 삼성sds
- IT멘토링
- kaggle
- 브라이틱스데이터분석
- Brightics서포터즈
- SDSBrightics
- ProDS
- 모델링
- associateDS
- Kaggle출전
- 분석모델링
- 코딩없이데이터분석
- AdSP
- 서울시상권분석
- samsungsds
- Brightics
- 브라이틱스서포터즈
- houseprice
- EDA
- 상권배후지
- 브라이틱스
- Datascientist
- 회귀모형평가
- 데이터분석
- 골목상권데이터분석
- Today
- Total
목록전처리 (2)
Database for Everything

데이터 전처리에 필요한 dplyr 패키지 내장 함수 dplyr 함수 기능 filter() 행 추출 select() 열(변수) 추출 arrange() 정렬 mutate() 변수 추가 summarise() 통계치 산출 group by() 집단별로 나누기 left_join() 데이터 합치기(열) bind_rows() 데이터 합치기(행) 순서대로 정렬하기 (오름차순, 내림차순) 먼저 dplyr 패키지를 불러온 후, exam 데이터를 csv형태로 읽어주었다. 데이터 정렬은 arrange() 를 이용하여 해결할 수 있다. [오름차순] exam %>% arrange(math)를 입력해주면, 기존의 id변수 순으로 정렬되어있던 데이터가 수학점수가 낮은 사람에서 높은 사람 순으로 오름차순 정렬되어 출력된다. [내림차순]..

안녕하세요! Brightics 서포터즈 yeenn입니다. 이번 포스팅에서는 지난 포스팅 ↓ 에 이어 https://yeenn-db.tistory.com/31 [삼성 SDS Brightics] Brightics 개인 분석 프로젝트_서울시 골목상권 데이터분석_데이터 전처리① 안녕하세요! Brightics 서포터즈 yeenn입니다. ProDS시험도 끝났겠다 (합격도 했겠다!) 개강 첫 주라 비교적 여유로운 한 주를 보내고 있는데요, 정말 오랜만에 여유있게 포스팅을 작성하는 것 같아 기 yeenn-db.tistory.com 데이터 전처리 및 EDA과정을 다루어 보도록 하겠습니다! Select Column으로 컬럼명 변경 Load한 15개의 dataset에는 모두 기준연도 코드와 기준 분기코드가 존재하는데요, 이..