일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- EDA
- Kaggle출전
- 데이터분석
- 삼성자격증
- 브라이틱스
- IT멘토링
- Datascientist
- Brightics서포터즈
- Brightics
- associateDS
- 분석모델링
- kaggle
- 삼성SDSBrightics
- 브라이틱스데이터분석
- BrighticsStudio
- 서울시상권분석
- 브라이틱스서포터즈
- 상권배후지
- ProDS
- samsungsds
- 데이터분석대외활동
- houseprice
- 회귀모형평가
- AdSP
- 코딩없이데이터분석
- 데이터전처리
- 골목상권데이터분석
- 모델링
- 삼성sds
- SDSBrightics
- Today
- Total
목록R (24)
Database for Everything

값 내용 geom_point() 산점도 geom_col() 막대 그래프 - 요약표 geom_bar() 막대 그래프 - 원자료 geom_line() 선 그래프 geom_boxplot() 상자 그림 plotly 패키지+ggplot2 패키지 먼저, plotly 패키지를 설치하고 불러온 후, ggplot2로 만든 그래프를 plotly 패키지의 ggplotly()애 적용하면, 인터랙티브 그래프가 만들어진다. 우선, ggplot()을 이용해 그래프를 만들어보았다. 인터랙티브 그래프(산점도) 앞서 ggplot()으로 만든 그래프를 ggplotly()에 적용해 인터랙티브 그래프를 만들어보았다. 위와 같은 코드를 실행하면, 아래와 같은 인터랙티브 그래프(산점도)가 그려지는 것을 확인할 수 있다. 인터랙티브 그래프(막대 ..

ggiraphExtra 패키지 준비 단계구분도는 ggiraphExtra 패키지를 이용해 만들 수 있는데, 이 패키지를 이용하는 데에 앞서 mapproj 패키지를 먼저 설치해주어야 한다. 위와 같이 mapproj 패키지와 ggiraphExtra 패키지를 설치한 후, ggiraphExtra 패키지를 불러온다. 데이터 준비 R에 내장된 "USArrests" 데이터를 사용해보겠다. USArrests 데이터는 1973년 미국 주(state)별 강력 범죄율 정보를 담고 있다. str() 을 통해 데이터 변수의 정보를 살펴보았다. row: 50, column: 4 head()를 통해 데이터의 일부를 살펴보았다. 지역병 변수 생성 USArrests 데이터는 지역명 변수가 따로 없고. 대신 행 이름(rownames)이 ..

데이터 전처리에 필요한 dplyr 패키지 내장 함수 dplyr 함수 기능 filter() 행 추출 select() 열(변수) 추출 arrange() 정렬 mutate() 변수 추가 summarise() 통계치 산출 group by() 집단별로 나누기 left_join() 데이터 합치기(열) bind_rows() 데이터 합치기(행) 순서대로 정렬하기 (오름차순, 내림차순) 먼저 dplyr 패키지를 불러온 후, exam 데이터를 csv형태로 읽어주었다. 데이터 정렬은 arrange() 를 이용하여 해결할 수 있다. [오름차순] exam %>% arrange(math)를 입력해주면, 기존의 id변수 순으로 정렬되어있던 데이터가 수학점수가 낮은 사람에서 높은 사람 순으로 오름차순 정렬되어 출력된다. [내림차순]..

데이터 전처리에 필요한 dplyr 패키지 내장 함수 dplyr 함수 기능 filter() 행 추출 select() 열(변수) 추출 arrange() 정렬 mutate() 변수 추가 summarise() 통계치 산출 group_by() 집단별로 나누기 left_join() 데이터 합치기(열) bind_rows() 데이터 합치기(행) 데이터 프레임으로 내장 데이터 출력하기 먼저, dplyr 패키지를 load한 후, csv_exam.csv 파일을 데이터 프레임으로 만들어 출력한다. dplyr 패키지가 설치되지 않았다면, install.packages("dplyr")을 입력하여 해당 패키지를 설치한다. 출력 결과의 class 변수열을 보면, 데이터가 5개 반의 학생들로 구성되어 있다는 것을 알 수 있다. Fil..

데이터 프레임 생성하기 데이터 내의 변수만 이용해 분석할 수도 있지만, 데이터 내의 여러 변수들을 조합한 파생변수를 만들어 분석하는 것이 훨씬 유용한 경우도 많다. 우선 실습을 위한 데이터 프레임을 생성했다. 아래의 데이터 프레임에는 두 개의 변수를 할당해주었다. 파생변수 생성하기 파생변수는 데이터 프레임명에 $를 붙여 새로 만들 변수명을 입력하고, = 20, "pass", "fail" ) 1. 조건 2. 조건에 맞을 때 부여 3. 조건에 맞지 않을 때 부여 ifelse()구문은 위와 같은 순서로 코드를 작성하면 된다. 위 코드를 R에 그대로 입력해보면, 아래와 같은 값이 출력된다. 이러한 합격/불합격 판정 변수를 mpg$test 변수를 생성하여 할당한 후, head()함수를 통해 20번째 행까지 출력하..

R 프로그램을 설치한지도 공부할 책도 구매한지 몇 달이 지나가는데 이런저런 활동들과 개강준비 때문에 미루고 미루게 된 R 프로그램 스터디... 드디어 시작...! 데이터 파악 함수 함수 기능 head() 데이터 앞부분 출력 tail() 데이터 뒷부분 출력 View() 뷰어 창에서 데이터 확인 dim() 데이터 차원 출력 str() 데이터 속성 출력 summary() 요약 통계량 출력 head() → 데이터 앞부분 확인하기 데이터의 내용을 확인하려면 data frame명을 입력하여 실행하면 되지만, 화면에 너무 많은 데이터가 출력되기 때문에 알아보기 어렵다. 데이터의 일부만 출력하여 데이터의 형태를 확인할 때 head() 을 이용한다. head(데이터프레임 이름) 을 입력하면, 데이터의 앞에서부터 6번째 ..