일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 상권배후지
- 브라이틱스
- 브라이틱스데이터분석
- 모델링
- houseprice
- 서울시상권분석
- 데이터분석대외활동
- SDSBrightics
- 데이터전처리
- BrighticsStudio
- 골목상권데이터분석
- associateDS
- 코딩없이데이터분석
- IT멘토링
- samsungsds
- ProDS
- 삼성자격증
- 회귀모형평가
- EDA
- Kaggle출전
- 삼성sds
- AdSP
- 데이터분석
- Brightics
- 분석모델링
- Datascientist
- Brightics서포터즈
- 브라이틱스서포터즈
- kaggle
- 삼성SDSBrightics
- Today
- Total
목록삼성 SDS Brightics (35)
Database for Everything

안녕하세요! 벌써 브라이틱스 개인분석실습 3주차에 접어들었네요. (시간이 너무 빨리가네요..) 종강도 했겠다.. 브라이틱스 활동에 더 많이 집중할 수 있는 시간이 생겨서 기쁩니다ㅎㅎ 이번 Brightics 실습에서 다룰 주제는 "T검정" 입니다! T 검정이란? T검정, T-test는 두 집단간의 평균을 비교하는 모수적 통계방법으로서, 표본이 정규성, 등분산성, 독립성 등을 만족할 경우 적용이 가능한 검정 방법입니다. 항목 설명 독립성 관측치는 각각 독립이다. 관측치는 서로 영향을 주지 않는다. 정규성 두 그룹의 모집단은 각각 정규분포이다. 등분산성 두 그룹의 분산은 동일하다. 이번 포스팅에서 다룰 T검정은 Paired T-test와 Independent T-test인데요, 본격적인 실습과 설명에 들어가기..

안녕하세요! Yeenn입니다. 첫 포스팅이었던 ↓ https://yeenn-db.tistory.com/2 [삼성 SDS Brightics] 브라이틱스 스튜디오로 코딩 없이 데이터 분석하자! 안녕하세요 삼성 SDS Brightics 서포터즈 합격 후 게시하는 첫 포스팅이네요! 서포터즈에 합격하면서 티스토리는 처음 개설하게 되었는데, 각종 미션 뿐 아니라 개인적인 데이터 관련 학습들도 앞 yeenn-db.tistory.com 위 글에서 Brightics Studio와 Brightics AI(Enterprise)에 대한 차이점을 간단히 언급했었는데요, 이번 포스팅에서는 두 Brightics 분석툴의 장점과 차이점에 대해 더 자세하게 알아본 후, Brightics AI(Enterprise) 버전 설치방법까지 알..

지난 포스팅 ↓ https://yeenn-db.tistory.com/6 [Brightics] Kaggle 1975-2018년 전세계 영화 박스 오피스 매출액 분석하기 ① - Data Load 오류 해결 안녕하세요! 벌써 여름이 된 것 같으면서도 아직은 낮에도 선선한 바람이 불어서.. 한여름이 되어 더워지기 전 마지막이 될(?) 시원한 여름을 나름 즐겨보려고 노력중인 요즘입니다. 이번에는 Kag yeenn-db.tistory.com 에 이어서, 영화 박스오피스 데이터를 분석해보도록 하겠습니다! dataset 정보는 위 포스팅을 참고해주세요. 데이터 Load까지 마친 Brightics 화면입니다. 이번 포스팅에서는, Brightics의 다양한 시각화 기능을 이용하여 영화 매출액에 영향을 미쳤던 변수들을 확인..

안녕하세요! 벌써 여름이 된 것 같으면서도 아직은 낮에도 선선한 바람이 불어서.. 한여름이 되어 더워지기 전 마지막이 될(?) 시원한 여름을 나름 즐겨보려고 노력중인 요즘입니다. 이번에는 Kaggle의 공개 dataset 중 하나인 "Top 10 High Grossing Films"를 분석해보겠습니다. 해당 dataset은 아래 링크에서 다운받을 수 있습니다! ↓ https://www.kaggle.com/bidyutchanda/top-10-highest-grossing-films-19752018 Top 10 Highest Grossing Films (1975-2018) The highest grossing Hollywood films of each year from 1975 to 2018 www.kagg..

안녕하세요! Brightics 서포터즈 2기 yeenn입니다. 지난 포스팅에서는 데이터 전처리 과정 중 데이터 정제에 관한 학습과정을 다루었는데요, 이번 포스팅에서는 효율적인 데이터 분석을 위해 꼭 필요한 과정인 데이터 결합 및 형태 변환 과정을 살펴보겠습니다! 데이터 결합과 변환과정은 왜 중요할까? 빅데이터 시대가 도래하면서 데이터의 활용 범위가 점점 확대되고 있는 추세인데요, 이에 따라 한 분야의 정형 데이터만을 분석하는 것보다는, 다양한 데이터를 결합, 변환 분석하여 예상치 못한 새로운 가치를 발견하는 과정이 더욱 중요해졌습니다. ※ 예) 심야시간 통화 데이터 x 택시 승하차 데이터 → 심야버스 노선 수립 농가 데이터 x 차량이동 데이터 → 조류독감 확산 예측 (출처: 데이터 산업 활성화 전략 의결..

지난 포스팅에서는 https://yeenn-db.tistory.com/3 [Brightics] 데이터 전처리 학습① - 데이터 정제(data cleansing) 이론 및 실습 안녕하세요! 드디어 브라이틱스 서포터즈의 2번째 미션이 시작되었습니다. 이번 개인 미션은 공개 dataset을 이용하여 Brightics Studio를 활용한 실습을 본격적으로 진행해보는 것인데요, 앞으로 약 3 yeenn-db.tistory.com 데이터 전처리 학습과 관련한 기본 이론과 기초 실습과정을 다루어봤는데요! 이번 포스팅에서는 Kaggle의 유명 dataset인 Titanic.csv를 이용하여 데이터 전처리 심화학습을 진행해보도록 하겠습니다. Kaggle이란? 빅데이터 분석에 관심이 있는 분들이라면 한 번쯤 들어봤을 K..

안녕하세요! 드디어 브라이틱스 서포터즈의 2번째 미션이 시작되었습니다. 이번 개인 미션은 공개 dataset을 이용하여 Brightics Studio를 활용한 실습을 본격적으로 진행해보는 것인데요, 앞으로 약 3주의 시간동안 Brightics studio를 통해 데이터 전처리과정과 통계분석과정을 살펴보도록 하겠습니다! 오늘 진행할 데이터 전처리 학습은 데이터 정제(data cleansing)입니다. 데이터 정제(Data Cleansing)란? "데이터 정제는 원천 데이터 혹은 통합된 원천 데이터의 포맷을 통일하거나, 누락값을 제거하거나, 구분자 (delimiter) 를 입력하거나, 데이터의 불필요한 값을 제거하는 등의 작업을 통해 고품질 데이터의 요건을 갖추는 작업을 의미합니다." 출처: http://w..

안녕하세요 삼성 SDS Brightics 서포터즈 합격 후 게시하는 첫 포스팅이네요! 서포터즈에 합격하면서 티스토리는 처음 개설하게 되었는데, 각종 미션 뿐 아니라 개인적인 데이터 관련 학습들도 앞으로는 이곳에 많이 기록할 것 같아요. (고심하고 지은 블로그 제목이 부끄럽지 않게끔,,) 각설하고! 드디어 첫 번째 개인미션이 주어졌습니다. 바로바로.. "Brightics Stuio" 를 다운받고 체험해보는 것! 빅데이터 시대를 맞아 데이터의 활용가치가 점점 중요해지고 있는데요, 종종 이런 말이 들려옵니다. "에이, 그 데이터분석 어쩌구, 데이터 다룰줄 아는 전공자들이나 하는 거 아니야?" . . . 땡! 아닙니다. 브라이틱스 스튜디오만 있으면, 전공자뿐 아니라 저같은 비전공자도 빠..