일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- houseprice
- associateDS
- Brightics서포터즈
- 삼성sds
- 삼성SDSBrightics
- ProDS
- 브라이틱스데이터분석
- 모델링
- Brightics
- 삼성자격증
- BrighticsStudio
- 데이터분석대외활동
- 데이터분석
- 브라이틱스서포터즈
- kaggle
- EDA
- IT멘토링
- 회귀모형평가
- 골목상권데이터분석
- Datascientist
- 데이터전처리
- 분석모델링
- AdSP
- Kaggle출전
- SDSBrightics
- 서울시상권분석
- 코딩없이데이터분석
- 브라이틱스
- 상권배후지
- samsungsds
- Today
- Total
Database for Everything
[R 프로그램] 인터랙티브 그래프(2)_plotly 패키지로 인터랙티브 그래프 만들기 본문
값 | 내용 |
geom_point() | 산점도 |
geom_col() | 막대 그래프 - 요약표 |
geom_bar() | 막대 그래프 - 원자료 |
geom_line() | 선 그래프 |
geom_boxplot() | 상자 그림 |
plotly 패키지+ggplot2 패키지
먼저, plotly 패키지를 설치하고 불러온 후, ggplot2로 만든 그래프를 plotly 패키지의 ggplotly()애 적용하면, 인터랙티브 그래프가 만들어진다.
우선, ggplot()을 이용해 그래프를 만들어보았다.
인터랙티브 그래프(산점도)
앞서 ggplot()으로 만든 그래프를 ggplotly()에 적용해 인터랙티브 그래프를 만들어보았다.
위와 같은 코드를 실행하면, 아래와 같은 인터랙티브 그래프(산점도)가 그려지는 것을 확인할 수 있다.
인터랙티브 그래프(막대 그래프)
산점도 외에도 ggplot2 패키지로 만든 그래프는 ggplotly()를 이용해 인터랙티브 그래프로 만들 수 있다. ggplot2패키지에 내장된 diamonds 데이터를 통해 막대 그래프를 만든 후, ggplotly()에 적용해 인터랙티브 그래프를 만들어보았다.
(*diamonds 는 다이아몬드 5만여 개의 캐럿, 컷팅 방식, 가격 등의 속성을 담은 데이터)
인터랙티브 그래프(시계열 그래프)
먼저 dygraphs 패키지를 설치하고 불러온다. 이후, ggplot2 패키지에 내장된 economics 데이터를 이용해 그래프를 만들어보겠다.
(*economics 데이터: 실업자 수, 저축률 등 1967~2015년 미국의 월별 경제 지표를 담은 데이터)
dygraphs 패키지를 이용해 인터랙티브 시계열 그래프를 만들려면, 데이터가 시간 순서속성을 지니는 xts 데이터 타입으로 되어 있어야 한다. xts()를 이용해 economics 데이터의 unemploy(실업자 수) 를 xts 타입으로 변경하겠다.
(*xts 패키지는 R 내장 패키지로, 별도 설치 불필요)
앞에서 생성한 eco 를 dygraph()에 적용하면 뷰어창에 아래와 같은 인터랙티브 그래프가 그려진다.
dygraph() 에 %>% 를 이용해 dyRangeSelector()를 추가하면, 그래프 아래에 날짜 범위 선택 기능이 추가된다. 버튼을 움직여 특정 기간만 선택할 수 있고, 범위를 정한 뒤 좌우로 움직이면 시간에 따라 데이터가 어떻게 변하는지 알 수 있다.
여러 값이 포함된 인터랙티브 그래프(시계열 그래프)
인터랙티브 시계열 그래프에는 여러값을 동시에 표현할 수 있다.
economics 데이터 employ(실업자 수)와 psavert(저축률)를 그래프에 함께 표현해보겠다.
먼저, unemploy 변수와 psavert 변수를 xts 타입으로 바꾸겠다. unemploy 변수는 값이 1,000명 단위로 되어있는데, psavert 와 비교해보기 쉽도록 1000으로 나눠 100만명 단위로 수정하였다.
이후, eco_a와 eco_b 두 데이터를 cbind()를 이용해 가로로 결합하고, 변수명을 알아보기 쉽도록 수정하였다. eco2는 데이터 프레임이 아니라 xts 타입이기 때문에, rename()을 적용할 수 없으므로, colnames()를 이용해 변수명을 수정하였다.
이제 dygraph(eco2) %>% dyRangeSelector() 코드를 실행하고 그래프를 만들면, 뷰어 창에 저축률과 실업자 수가 모두 표현된 인터랙티브 시계열 그래프가 생성된다.
※ 위 포스팅은 「Do it! 쉽게 배우는 R 데이터 분석(이지스리퍼블리싱)」 도서를 바탕으로 작성되었습니다.
'R' 카테고리의 다른 글
[R 프로그램] 웹 크롤링 - 교보문고 주간 베스트 셀러 도서목록 불러오기 (0) | 2021.12.02 |
---|---|
[R 프로그램] 인터랙티브 그래프(3) - 대한민국 시도별 인구, 결핵 환자 수 단계 구분도 만들기 _ devtools, kormaps, ggi (0) | 2021.11.27 |
[R 프로그램] 인터랙티브 그래프(1)_미국 주별 강력 범죄율 인터랙티브 지도 시각화 - ggiraphExtra 패키지 (0) | 2021.11.25 |
[R 프로그램] 기초부터 다지기-데이터 전처리(2)_데이터 정렬, 요약, 통합하기 (0) | 2021.11.07 |
[R 프로그램] 기초부터 다지기(1) - 데이터 전처리_조건에 맞는 데이터 추출하기 ( filter(), %>%, %in% ) (0) | 2021.09.23 |