Database for Everything

[삼성 SDS Brightics] Brightics 개인분석 프로젝트 시작! _ 공공데이터 확보, 그리고 주제 선정 본문

삼성 SDS Brightics

[삼성 SDS Brightics] Brightics 개인분석 프로젝트 시작! _ 공공데이터 확보, 그리고 주제 선정

Yeenn 2021. 8. 31. 00:11
728x90

 

 

 

 

안녕하세요! 

Brightics 서포터즈 yeenn입니다.

 

ProDS 시험도 끝났고, 바람이 부는 선선한 가을이 오면서 

드디어 찾아온

 

개.강.

.....

 

 

 

다행히도

팀분석프로젝트 + 튜토리얼 영상제작 미션까지 무사히 마치고,

이제, Brightics 서포터즈의 마지막 미션을 시작하게되었습니다!

 

 

서포터즈 발대식을 했을 때가 엊그제 같은데 벌써 마지막 미션이라니 너무너무 아쉽습니다...ㅠㅠ흑흑

하지만 이번 미션은

총 10주에 걸쳐 진행되는 장기 프로젝트인만큼 

 

 

Brightics를 이리저리 뜯어보고 맛보고 즐길 수 있는 두달 가량의 긴 시간이 있다는 점!!

 

 

개인적으로 Brightics 서포터즈를 시작하면서 가장 기대되었던 활동이라 

정말 총력을 다해 프로젝트를 수행해 볼 생각입니다:>

 

 

 

Brightics 서포터즈 운영국에서 보내주신 일정은 아래와 같습니다!

 

 

 

 

아래에서 언급하겠지만,

활용하기 쉬운 공개dataset을 사용할 예정이긴 해도, 이전에 다루었던 정제된 data가 아닌

비교적 날것의 raw 데이터를 직접 가공하고 처리해야하기 때문에

 

위의 일정에 나온 기간보다 전처리에 쏟아야할 시간이 조금 더 길 수 있을 것 같다는 생각이 듭니다..!!

 

 

 


 

[개인 데이터 분석 프로젝트 주제 선정]

 

출처: SBS

 

 

이번 데이터분석 프로젝트의 주제는...

 

"서울시 골목상권 데이터 분석"

 

입니다!

 

(SBS 골목식당과 아무런 관련..없습니다)

 

 

 

데이터분석을 위한 공개dataset을 확보하기 위해 

데이터분석가들이 자주 참고하는 사이트에는 아래와 같은 3곳이 있는데요,

 

 

1. 공공데이터포털

: 국가 관리 통계 총괄관리 및 제공

 

 

https://www.data.go.kr/

 

 

 

2. 서울 열린데이터광장

:서울시 생산 공공데이터 제공

 

https://data.seoul.go.kr/index.do

 

서울 열린데이터광장

모든 서울시민을 위한 공공데이터 열린데이터광장에서 서울시와 연계 기관이 공개한 공공데이터를 확인하실 수 있습니다. 서울시와 관련된 다양한 공공데이터를 확인해 보세요.

data.seoul.go.kr

 

 

 

3. KOSIS 국가통계포털 

:정부기관에서 정보공개를 통해 공개되는 정보제공

 

https://kosis.kr/index/index.do

 

KOSIS 국가통계포털

내가 본 통계표 최근 본 통계표 25개가 저장됩니다. 닫기

kosis.kr

 

 

 

저는 이 중, 서울 열린데이터 광장의 '우리마을 가게 상권분석서비스'가 제공하는

골목상권 공개dataset을 활용하여 데이터분석을 진행하기로 하였습니다!

 

https://golmok.seoul.go.kr/main.do

 

우리마을가게 상권분석 서비스

제공정보 안내 업종과밀도 정의 : 사업체가 시장균형을 이룰 수 있는 적정한 정도를 넘어서 한 상권에 밀집하여 분포한 정도 구축내용 • 알고리즘 : 2013 - 2017년 상권정보 데이터를 활용한 GMM 모

golmok.seoul.go.kr

 

 

 

 

위 사이트가 제공하는 골목상권 공개 dataset은

서울시 골목상권 데이터와 / 골목상권배후지 데이터로 나뉘어있는데요, 

 

 

저는 이 중 각 데이터셋의

직장인구, 상주인구, 추정매출, 소득소비, 점포, 아파트, 접객시설 data를 활용하여 

서울시 골목상권에 영향을 미치는 다양한 요인을 분석하여 서울시 골목상권을 새롭게 활성화할 수 있는 방안

을 도출해보려고 합니다!

(원대한 포부...)

 

 

 

.

.

.

Q. 주제를 선정하게 된 계기?

 

처음 주제를 선정할 때에는 정말 막막했어요..ㅋㅋㅎ

정말 다양한 데이터들이 있었고, 또 같은 데이터로도 분석할 수 있는 주제도 다양했고, 

조금 더 욕심(?)을 부려서 직접 크롤링을 통해서 데이터 수집을 해볼까...생각도 해봤지만

 

이렇게 해서는 도저히 narrow down이 불가능하겠다! 싶어서 생각한 주제의 방향성은,

 

"최대한 시의성있고, 접근성이 좋은 주제를 찾자"

 

였습니다!

 

 

 

시의성,,접근성,,,을 생각하다보니 최근 뉴스 기사들을 훑어보게 되었고, 

그러다가 눈에 들어온 몇 뉴스기사들이 있었습니다.

 

 

 

 

 

코로나 19로 인해 소상공인들의 영업장 운영과 골목상권 매출 유지가 더욱 힘들어졌다는 기사였습니다.

 

 

기사를 보다보니, 타 공공기관의 기자단으로 활동을 하면서 얼마 전 작성했던 기사가 생각나더라구요!

지자체의 소상공인지원 및 골목상권 활성화 사업에 관한 홍보기사였는데요, 

 

 

여기에서 아이디어를 얻어 

"골목상권 활성화 방안 도출"

 

이라는 주제를 선정하게되었습니다!

 

 

자료를 찾아볼 수록 코로나로 인해 자영업자들이 더욱 힘들어진 것도 자명한 사실이고,

 

이 뿐 아니라 상권 주변 환경, 지역구, 유동인구, 시설, 거주정보, 소득 등의 다양하고 복합적인 요인이 

골목상권의 생존에 영향을 주고 있다고 판단이 되었고,

 

 

이를 보다 면밀히 분석할 수 있는 서울시의 골목상권 공공데이터를 이용하여 

Brightics로 유의미한 분석을 진행해보기로 결정했습니다!

 

 

 

초안 계획서도 마무리 되었고, 

큰 이변이 없다면 이를최종 주제로 선택하여

이번주부터 데이터 전처리 작업을 진행할 예정입니다!

 

 

 

 

마지막 개인분석 프로젝트도 기대해주세요!!

 

 

참! 

 

금주내에 업로드 될 Brightic3의 2번째 영상도 많은 기대바랍니다 ㅇ.<

 

 

 

 


본 게시물은 Brightics 서포터즈 활동의 일환으로 작성된 포스팅 입니다.

 

 

 

728x90
Comments