혼자 공부하는 데이터 분석 with 파이썬


What is 혼공학습단?

혼자 공부하는 사람들의 모임이라고 생각하면 좋을듯 싶다.


데이터분석을 공부하게 된 계기?

나는 웹 개발자로 일하고 있다. 주력은 Java, spring이지만
다양한 바운더리에서 기술스택을 쌓으면서 맡은바 업무를 충실히 해나고 있는평범한 IT 노동자이다.
그럼에도 웹 개발과는 큰 관련 없는 데이터 분석을 공부하게된 이유는
데이터 분석의 가치와 장래성 때문에 공부하게 되었다.


수 많은 책 중에 왜? 혼자 공부하는 데이터 분석을 선택했는가!!!

책 구성과 방향성 제시가 좋았고, 혼공단 좋았다.

데이터 분석에 대한 관심으로 ADsP 자격증은 취득하였지만, 실제 데이터 분석을 어떻게 하는지 잘 모른다.
뭔가 실무의 영역까지는 아니지만 간접 경험으로 경험해 보고 싶었다.
학습을 마친 후에는 인공지능 또는 딥러닝, 머신러닝과 같은 로드맵을 희망하기도 했다.
이러한 요건을 충족하는 책이 혼자 공부하는 데이터 분석 책 이었기에 선택하게 되었다.

혼공단이라는 런닝 메이트 같다 라는 느낌이 든다. 출판사에서 하는 프로그램이긴 하지만
뭔가 계획한 목표에 맞추어 과제를 올리고 그에 따라 선물도 주는 것이 포상을 받는 느낌이었다.
직장 생활을 하며 공부하기 위한 동기부여가 되었기에 좋았다.


책 구성이 무엇이 좋았나? 실무에 바로 적용 가능한가?

  스토리 텔링 형식의 책 구성이 좋았다.
글을 자연스럽게 읽어나가며 손코딩을 하고 결과를 확인하는 과정속에서
데이터 분석의 흐름을 알게된 것이 마치 꽉찬 알밤 처럼 알차고 좋았다.

책의 구성

첨부한 사진 처럼 첫장에 무엇을 배우는지 그리고 스토리 형식으로 풀어가나며 
해당 내용을 학습해 나가는 형식이다. 데이터 분석을 위한 파이썬 코드는 무엇인지 해당 기능에 대해서 자세히 설명하고
실제로 손코딩을 해봄으로써 결과를 확인 하는 과정까지 자연스럽게 이어지게 되어 있다.
장의 마지막에는 배운것에 대한 정리가 되어 있기에 공부한 내용에 대해서 리마인드 할 수 있는 구조이다.

여담이지만,  파이썬을 완벽하게 잘 할 필요는 없는듯 하다.
Java, javascript 등 다른 언어를 경험해 보았다면 쉽게 이해가 될거라고 생각한다.
따라서, with 파이썬에 겁먹지 않아도 될 것 같다.

이 책 한권으로 데이터 분석 실무를 할 수는 없다.
실무는 분명 책의 내용보다 더 복잡하고 다양한 문제가 있기 때문이다.
하지만, 데이터 분석의 흐름과 향후 공부 방향에 대해서는 잡을수 있다고 생각한다.


마치며

일을 하며 공부하는 것에 대한 부담도 있었지만 혼공단과 함께
끝까지 달려갈 수 있었던 것에 감사하게 된다. 
한권을 다 읽었다고 끝난게 아니라 이제 본격적인 시작이라고 생각한다.

데이터 분석이 무엇인지 알고 싶다면
"혼자 공부하는 데이터 분석 with 파이썬"


 

데이터 분석


6주자 : 2025.08.11 ~ 2025.08.17

과제 
(1) p.344의 손코딩(맷플롯립에서 bar()함수로 막대 그래프 그리기)을 코랩에서 그래프 출력하고 화면 캡쳐하기
(2) p.356 ~ 359의 스택 영역 그래프를 그리는 과정 정리하기


(1) p.344의 손코딩(맷플롯립에서 bar()함수로 막대 그래프 그리기)을 코랩에서 그래프 출력하고 화면 캡쳐하기

과제인증

import gdown
import pandas as pd
from matplotlib.font_manager import findSystemFonts

# 실습자료 다운로드
# gdown.download('https://bit.ly/3pK7iuu', 'ns_book7.csv', quiet=False)

# CSV 파일로 저장
ns_book7 = pd.read_csv('ns_book7.csv', low_memory=False)
ns_book7.head()

top30_pubs = ns_book7['출판사'].value_counts()[:30]
top30_pubs

top30_pubs_idx = ns_book7['출판사'].isin(top30_pubs.index)
top30_pubs_idx

top30_pubs_idx.sum()

ns_book8 = ns_book7[top30_pubs_idx].sample(1000, random_state=42)
ns_book8.head()

# 그래프 출력
"""
# 1
fig, ax = plt.subplots(figsize=(10, 8))
ax.scatter(ns_book8['발행년도'], ns_book8['출판사'])
ax.set_title('출판사별 발행도서')
#fig.show()
plt.rcParams['lines.markersize']

# 2
fig, ax = plt.subplots(figsize=(10, 8))
ax.scatter(ns_book8['발행년도'], ns_book8['출판사'], s=ns_book8['대출건수'])
ax.set_title('출판사별 발행도서')
#fig.show()

# 3
fig, ax = plt.subplots(figsize=(10, 8))
ax.scatter(ns_book8['발행년도'], ns_book8['출판사'],
           linewidths=0.5, edgecolors='k', alpha=0.3,
           s=ns_book8['대출건수']*2, c=ns_book8['대출건수'])
ax.set_title('출판사별 발행도서')
#fig.show()
"""

# 4
fig, ax = plt.subplots(figsize=(10, 8))
sc = ax.scatter(ns_book8['발행년도'], ns_book8['출판사'],
                linewidths=0.5, edgecolors='k', alpha=0.3,
                s=ns_book8['대출건수']**1.3, c=ns_book8['대출건수'], cmap='jet')
ax.set_title('출판사별 발행도서')
fig.colorbar(sc)
fig.show()

Chapter06복잡한 데이터를 표기하는 방법에 대해서 학습하였다. 실무에서도 당연하게 겪을수 있는 한글 인코딩 문제와 손코딩을 통한 실제 코딩 실습을 통한 데이터 분석에 대한 아이디어 학습을 할 수 있었다. 


데이터 분석


5주자 : 2025.08.04 ~ 2025.08.10

과제 
(1) p.314의 손코딩(맷플롯립에서 bar()함수로 막대 그래프 그리기)을 코랩에서 그래프 출력하고 화면 캡쳐하기
(2) p.316의 손코딩(텍스트 정렬, 막대 조절 및 색상 바꾸기)을 코랩에서 출력하고 화면 캡쳐하기


(1) p.314의 손코딩(맷플롯립에서 bar()함수로 막대 그래프 그리기)을 코랩에서 그래프 출력하고 화면 캡쳐하기

과제 인증


(2) p.316의 손코딩(텍스트 정렬, 막대 조절 및 색상 바꾸기)을 코랩에서 출력하고 화면 캡쳐하기

과제 인증


Chapter05에서는 데이터를 시각화하는 방법에 대해서 집중적으로 배울수 있는 장이었다.
데이터를 수집하고 전처리, 시각화하는 일련의 과정을 종합적으로 학습 할 수 있었던 장으로 생각한다.


 

데이터 분석


4주차 : 2025.07.21 ~ 2025.07.27

과제 
(1) [필수] p.279의 확인 문제 5번 풀고 인증하기 
(2) [선택] ch.04(04-1)에서 배운 8가지 기술통계량(평균, 중앙값, 최솟값, 분위수, 분산, 표준편차, 최빈값)의 개념을 정리하기


(1) [필수] p.279의 확인 문제 5번 풀고 인증하기

p279 5번 문제


Chatper04에서는 실질적인 데이터 분석이 무엇인지 본격적으로 시작하는 장이었다.
기본적인 통계부터 시작해서, 그래프로 표현하는 것까지 본격적으로 데이터 분석의 꽃을 향해 달려가는 느낌이다.


 

데이터 분석


3주차 : 2025.07.14 ~ 2025.07.20

과제
(1) [필수] p.182의 확인 문제 2번 풀고 인증하기
(2) [선택] p.219의 확인 문제 5번 풀고 인증하기


(1) [필수] p.182의 확인 문제 2번 풀고 인증하기

333
p182 ~ 183 2번 문제


(2) [선택] p.219의 확인 문제 5번 풀고 인증하기

p.218 ~ 219 5번 문제


Chatper03

keypoint : 데이터에 숨어 있는 잘못된 데이터를 찾아 조치하는 방법에 대해 학습.


Chatper03에서는 데이터 분석하면서 발생할 수 있는 분석에 불필요한 데이터를 변환하는 과정 데이터 랭글링(데이터 먼징)에 대해서 학습할 수 있었다. 데이터 프레임속에서 잘못된 행이나 없는 데이터를 찾아 조치하는 과정을 통해 데이터 분석에 가장 적합하게 처리하는 방법에 대해서 학습 할 수 있었다.


 

데이터 분석


2주차 : 2025.07.07 ~ 2025.07.13

과제 : p.150의 확인 문제 1번 풀고 인증하기 (기본/필수)


혼자 공부하는 데이터 분석 with 파이썬


Chatper02

Keypoint : 외부에서 데이터 가져오는 다양한 방법

API / HTTP / JSON / XML

(1) API : application Programming Interface  
무언가를 주고 받기 위해 필요한 규약  

(2) HTTP : Hyper Text Transfer Protocol  
문자 전송을 위한 약속  

(3) JSON : JavaScript Object Notation  
자바스크립트 객체 표기법  

(4) XML : eXtensible Markup Language  
확장된 마크업 언어 표기법


Study Code

https://github.com/forcetyty/selfStudyDataAnalysis/blob/67013943bc2fbcc37194cf80c447f029d0e735b4/%5B%ED%98%BC%EA%B3%B5%EB%B6%84%EC%84%9D%5D_chatper02.ipynb

 

selfStudyDataAnalysis/[혼공분석]_chatper02.ipynb at 67013943bc2fbcc37194cf80c447f029d0e735b4 · forcetyty/selfStudyDataAnaly

혼자 공부하는 데이터 분석 with 파이썬 . Contribute to forcetyty/selfStudyDataAnalysis development by creating an account on GitHub.

github.com


2장에서는 다양한 방법을 이용해서 데이터를 끌어 오는 방법을 배웁니다.
API 방식과 원리 그리고 절차에 대해서 학습 할 수있고, API 방식으로 데이터를 가져올때 겪을수 있는 다양한 상황들에 대하여 알수 있습니다. HTTP 방식에서 Get방식과 Post 그리고 데이터 포맷인 JSON과 XML에 대해서 학습 할 수 있습니다.


 

데이터 분석


1주차 : 2025.06.30 ~ 2025.07.06

과제 : p.81의 확인 문제 4번 풀고 인증하기 (기본/필수)


혼자 공부하는 데이터 분석 with 파이썬


Chatper 01

Keypoint 

1.  데이터 분석과 데이터 과학

데이터 분석 : 올바른 의사 결정을 위한 통찰 제공

데이터 과학 : 문제 해결을 위한 솔루션 제공

영역로 보자면 "데이터 과학 > 데이터 분석" 이렇게 분석하게는 좋을 듯 하다. 필요한 역량역시 프로그래밍, 통계, 수학, 도메인 지식을 필요로 하지만 결정으로 통찰과 솔루션 두 영역으로 구분하면 좋을 듯하다.

2. 구글 코랩과 주피터 노트북

구글 코랩 : Online 에서 파이썬 코드를 실행.

주피터 노트북 : Offline 에서 파이썬 코드를 실행. 아나콘다 설치를 통한 구성 필요.

3. 데이터 분석을 위한 데이터 넣기

(1) CSV, Excel, API 등
(2) CSV 파일의 특징 (' , '로 구분된 데이터)
(3) 인코딩을 기억하자 - UTF-8, EUC-KR
(4) 판다스로 데이터프레임 다루기
(5) 판다스의 시리즈와 배열


Study Code 

https://github.com/forcetyty/selfStudyDataAnalysis/blob/67013943bc2fbcc37194cf80c447f029d0e735b4/%5B%ED%98%BC%EA%B3%B5%EB%B6%84%EC%84%9D%5Dchatper01.ipynb

 

selfStudyDataAnalysis/[혼공분석]chatper01.ipynb at 67013943bc2fbcc37194cf80c447f029d0e735b4 · forcetyty/selfStudyDataAnalys

혼자 공부하는 데이터 분석 with 파이썬 . Contribute to forcetyty/selfStudyDataAnalysis development by creating an account on GitHub.

github.com


추가 숙제(남산도서관 데이터를 코랩에서 데이터프레임으로 출력하고 화면 캡처하기)

코랩 실행


 

 

데이터 분석 이미지


 인공지능(AI), 머신러닝, 딥러닝, LLM, 빅데이터가 세상을 뒤집어 놓고 있다. 세상의 변화에 따라가기 위한 학습이 필요하다. 그런데, 무엇을 어디서 부터 배워야 할지 막막하다. 막막함 가운데 나침판이 되어줄 길잡이로 "혼자 공부하는 데이터 분석 with  파이썬"과 함께 해보고자 한다. 


왜? "혼자 공부하는 데이터 분석 with 파이썬"

첫번째, 저자 Pick

 박해선님은 인공지능과 머신러닝, 딥러닝 관련 다수의 책을 집필했다. 현재 구글 ML GDE(Machine Learning Google Developer Expert) 포지션으로 활약 중이다.


두번째, 책 구성 Pick

출처 : 교보문고_ 상세페이지

혼자 학습하는 사람을 위한 구성이 마음에 들었다. 인터넷 강의와 수 많은 데이터 분석 관련 책들이 있지만 이 책만이 가지고 있는 구성이 맘에 들었다. 


세번째, 학습이 이후 방향성 제시 Pick

출처 : https://tensorflow.blog/author/haesunpark/

 사실 이 책을 선택한 가장 큰 이유가 로드맵 때문이다. 데이터 분석, 머신러닝, 딥러닝, 수학, 통계, 프로그래밍 모두가 중요하다고 하는데 어디서 부터 시작해야 할지 막막하다. 이러한 상황이기 때문에 나침판과 지도가 필요했다. "혼자 공부하는 데이터 분석 with 파이썬" 이책은 나에게 나침판과 지도와 같았다.


첫 걸음

광화문 교보문고
찾았다 요놈

시작

 

혼자 공부하는 데이터 분석 with 파이썬을 시작하면서
우연한 기회에 혼공이라는 그룹 스터디에 참여하게 되었다.

주관은 한빛미디어에서 하고, 혼자공부하는 시리즈 별로 주차별 커리큘럼을 소화하고 과제를 인증하는 형식을 진행된다.

커리큘럼

커리큘럼은 위의 표와 같다.

해당 커리큘럼에 맞게 진도를 진행하고 필수 과제를 블로그나 인스타와 같은 매체에 올린 후 링크를 공유하면 된다.

참여하게 된 계기는 한번 끝까지 완주해보자는 의지로써 참여하게 되었다.

완벽함 보다는 완주를 위해!!

관심 있는 분들은 아래 사이트를 참고하여 어떠한 곳인지 살펴보는 것도 좋을듯하다.

스터디는 단순 공부하는 것을 공유하는 것에서 끝나지 않고, 간식도 챙겨주니 공부하도 하고 간식도 먹는 도랑치고 가재잡는 좋은 기회인듯 하다.

https://hongong-study.discourse.group/

 

혼공학습단

 

hongong-study.discourse.group


 


침묵이라는 무기

출판사 : 가나출판사

저자 : 코르넬리아 토프 지음 / 장혜경 옮김


"넘쳐나는 정보속에서 할 말이 많은 세상, 침묵이라는 가치가 주는 힘을 깨닫게 해주는 책"


 말! 말! 말! 말을 정말 많이 한다. 사람과에 대화, 회의 등등 의사소통에 기본이 말이다. 그렇다보니 어쩔수 없이 말을 많이 한다. 그리고 말을 통해 자신에 생각과 의사를 전달한다. 그런데 과유불급이라고 했던가, 너무 많이 말을 해서 문제다.

 누군가는 자신에 의견을 그리고 뜻을 전달하기 위해 같은 의미에 말을 반복한다. 그래야만 듣는이가 이해하고 자신과 같은 생각을 한다고 믿는 것이다. 그런데 듣는 사람 입장에서는 같은 말이 반복되니 짜증나기 그지 없다. 결국, 화자든 청자든 실패한 의사소통이 되어 버린것이다.

 말이 너무 많다보니, 결국 자기 자신을 잃어 버린다. 말을 해야만, 음성적인 표출로만 자신을 나타낼수 있다고 생각하기에 많이 너무 많아 질수 밖에 없다. 그렇다보니 실수도 많아지고, 종국에는 자아를 잃어 버린다.

위에 언급한 내용이 이 책에 전부를 담고 있지는 않지만, 저자는 위 내용에 대한 저자에 침묵이라는 행동에 대한 생각을 전달해주고 있다.


P.41 침묵도 소통의 방식이다.

침묵도 소통의 방식이다.

 침묵을 그저 말을 닫는거라고 생각하면 이 책을 이해할수 없다. 침묵도 소통에 방식이라는 것을 이해하고 받아들여야 지만 이 책을 이해 할 수 있었다. 

 남보다 말이 많다고 내가 잘나보이지 않는다는 점. 침묵해야 할 때 내가 더욱 돋보일수 있다는 점. 침묵은 또 다른 설득에 방법이라는 점을 이 책을 통해서 깨달았다. 

 말이 많아 짐으로써 말 실수하고 감점요인을 되었던 경험. 반복된 얘기를 지속적으로 듣게 됨으로써 말에 뜻보다는 짜증과 잔소리로 와닿게 되었던 경험. 그외에 말과 관련된 다양한 경험 가운데 우리가 침묵 함으로써 얻는 것은 역설적이게도 상대와의 소통이다. 즉, 경청을 통한 상대와의 소통이 성립되는 것이다. 그리고 이 경청은 설득에 힘과 더불어 작은 말 한 마디에 힘을 실어 주는 강력한 무기가 된다.

 저자는 침묵이라는 소통 방식을 통해서 자신을 높이고, 말에 힘을 덧붙이며, 설득하는 방법에 대해 얘기하고 있다.


p.267  고요를 찾으면 의미를 발견할 수 있고, 힘을 발견할 수 있으며, 자기 자신을 발견할 수 있다. 자, 그러니 이제 떠드는 것은 멈추고 펜을 집어 들거나 노트북을 펼치자. 그리고 글을 써보자. 당신을 표현하라!

고요

 침묵이라는 고요함. 

 침묵을 통해서 나를 높이고, 남을 설득하는것은 부가적인 것이다. 저자가 진정으로 나에게 전달하고자 했던것은, 침묵을 통해 자기 자신을 찾을라는 것이 아니었을까 싶다.

 말이 너무 많은 세상속에 살고 있다. 정보도 넘쳐난다. 하루에 쏟아지는 뉴스와 SNS, YouTube 등 얼마나 많은 정보속에 노출되어 있는가. 이러한 정보속에 빠져있고, 말 많은 세상속에 살고 있다보니 우리는 나는 나 자신을 잃어 버린것이다.

 저자는 이러한 세상속에서 말을 멈추고, 나에 대해 진정으로 생각해 보라고 말하고 있다. 즉, 침묵을 통해서 내가 누구인지 그리고 자기자신이 어떠한 사람인지 내가 추가하는 가치는 무엇인지 자신에 내면을 살펴보라고 전하고 있는 듯 하다.


P.S

- 자신이 말이 너무 많다고 생각하면 한번쯤 읽어 볼 만한 자기계발 서적이다.


 

' > 자기계발' 카테고리의 다른 글

[Book] 완벽한 하루  (0) 2019.07.11
[Book] Grit - 그릿  (0) 2019.06.05

완벽한 하루
완벽한 하루 플래너 속지.pdf
0.09MB

출판사 : 샘앤파커스

저자 : 류랑도


"반복되는 하루속에서 나를 변화시키고 하루를 성공적으로 마무리하고 싶은분 들에게 정말 강력 추천한다."


 하루라는 의미는 사람마다 다르다. 어떤 사람에게는 행복한 하루가, 보람찬 하루가, 슬픈 하루가, 즐거운 하루가.

다양한 하루가 쌓이고 모이면 우리는 그것을 추억이라 부른다. 그리고 또 다른 말로는 현재의 나의 모습이라 표현하기도 한다. 즉, 하루하루가 쌓여서 오늘의 나에 모습이 된것이다.

 현재 나에 모습을 보았을때, 더 발전하고 싶었고, 변화되고 싶었다. 그때 읽은 책이다. 온전하고 완벽한 나에 하루를 만들기 위해서.

 

 이 책이 다른 책과 다른 점은 실현 가능 하면서도 구체적이라는 점이다. 구체적이라고 해서, 과외를 받는것 처럼 꼼꼼히 지도해주지는 않는다. 보편타당한, 누구에게나 적용가능한 범위에서 자기 자신을 돌아보는 성찰을 통해서 독자만에 완벽한 하루를 만들어가게 끔 나침판 역활을 하는 책 이다. 

 

이 책의 핵심 키워드는 7개이다.

  • 단절 : 변화는 과거와의 단절로부터 온다
  • 방향 : 무엇을 위해 오늘을 살 것인가?
  • 목표 : 과녁이 없으면 화살을 제대로 쏠 수 없다
  • 시간 : 무엇으로 채우느냐가 아니라 '무엇을 위해' 쓰느냐다
  • 지원군 : 진정한 강자는 지원군이 많다
  • 실행 : 실행력의 차원을 높여라
  • 성장 : 돌아보고 내다보면 내일은 더 완벽하다 

핵심 키워드를 바탕으로한 책의 목차

 위에 언급한 7가지 키워드는 시간관리 자기계발 서적에서 흔히 인용되는 문구 일 수 있다. 하지만, 저자 류랑도 작가님이 전해주는 문체는 그 나름에 깊이와 큰 울림이 있다. 진정으로 나를 뒤돌아 보게하는 깊은 울림. 그 울림을 통한 나만에 시간계획과 성찰 그리고 완벽한 하루에 대한 첫걸음이 그것이다.

 

P.109 [과거의 기억을 조작하는가?] 오늘은 과거를 회상하는 하루가 아니라 객관적인 사실로 현실을 직시하면서 목표에 한 걸음씩 다가가는 하루여야 한다.

 이 책을 읽으면 변화 된 나에 모습은 완벽한 하루를 위한 시도이고, 그리고 실패이다.

이 책을 읽었다고 완벽한 하루를 실천할수 있을거라고는 전혀 생각하지 않는다. 하지만 위에 키워드를 상기하며 매번 도전할 것 이다. 그중 현재 실천하는 것은 꾸준한 플래너 작성과 일기이다. 

 

플래너는 하루동안 내가 해야하는 일을 기록하고, 작은 것에서 시작하여 큰 그림이 그려지도록 작성하고 있다.

일기는 나에 하루에 대한 분석이며, 실패노트이다. 하루동안 생활하며 잘한것과 잘못한것을 기록하고, 성찰하며 실수에 대한 기록을 통해 성장하기 위함이다.

오늘에 대한 분석

P.91 [길을 아는 것과 길을 걸어가는 것] 반드시 오늘에 대한 분석이 있어야 내일의 목표를 제대로 세울 수 있다.
P.254 [학습 포인트를 찾았다면 그것은 실패가 아니다] '실패해도 좋은 경험이니까'하고 너무 쉽게 받아들이지 말고, 한 번 실패할 때마다 자신이 들인 노력과 시간을 아까워하며 이를 악물고 원통해 해야 한다.

 부족하지만, 실천함으로써 변화되는 것. 

 완벽한 하루를 살아가는 그 시작점.

 

P.S.

플래너

이 책에서는 마지막 페이지에 플래너가 있다.

참고하면 정말 좋을듯 싶다.

링크 : http://www.samnparkers.com/customer/data_view.do?num=2¤tPage=1&searchQuery=

 

기타자료 < 자료실 < 고객 지원 < 쌤앤파커스

이메일 무단 수집 금지 본 사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나 그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며 이를 위반 시 정보통신망 법에 의해 형사처벌 됨을 유념하시기 바랍니다.

www.samnparkers.com

 

' > 자기계발' 카테고리의 다른 글

[Book]침묵이라는 무기  (0) 2020.03.11
[Book] Grit - 그릿  (0) 2019.06.05

+ Recent posts