데이터 분석


6주자 : 2025.08.11 ~ 2025.08.17

과제 
(1) p.344의 손코딩(맷플롯립에서 bar()함수로 막대 그래프 그리기)을 코랩에서 그래프 출력하고 화면 캡쳐하기
(2) p.356 ~ 359의 스택 영역 그래프를 그리는 과정 정리하기


(1) p.344의 손코딩(맷플롯립에서 bar()함수로 막대 그래프 그리기)을 코랩에서 그래프 출력하고 화면 캡쳐하기

과제인증

import gdown
import pandas as pd
from matplotlib.font_manager import findSystemFonts

# 실습자료 다운로드
# gdown.download('https://bit.ly/3pK7iuu', 'ns_book7.csv', quiet=False)

# CSV 파일로 저장
ns_book7 = pd.read_csv('ns_book7.csv', low_memory=False)
ns_book7.head()

top30_pubs = ns_book7['출판사'].value_counts()[:30]
top30_pubs

top30_pubs_idx = ns_book7['출판사'].isin(top30_pubs.index)
top30_pubs_idx

top30_pubs_idx.sum()

ns_book8 = ns_book7[top30_pubs_idx].sample(1000, random_state=42)
ns_book8.head()

# 그래프 출력
"""
# 1
fig, ax = plt.subplots(figsize=(10, 8))
ax.scatter(ns_book8['발행년도'], ns_book8['출판사'])
ax.set_title('출판사별 발행도서')
#fig.show()
plt.rcParams['lines.markersize']

# 2
fig, ax = plt.subplots(figsize=(10, 8))
ax.scatter(ns_book8['발행년도'], ns_book8['출판사'], s=ns_book8['대출건수'])
ax.set_title('출판사별 발행도서')
#fig.show()

# 3
fig, ax = plt.subplots(figsize=(10, 8))
ax.scatter(ns_book8['발행년도'], ns_book8['출판사'],
           linewidths=0.5, edgecolors='k', alpha=0.3,
           s=ns_book8['대출건수']*2, c=ns_book8['대출건수'])
ax.set_title('출판사별 발행도서')
#fig.show()
"""

# 4
fig, ax = plt.subplots(figsize=(10, 8))
sc = ax.scatter(ns_book8['발행년도'], ns_book8['출판사'],
                linewidths=0.5, edgecolors='k', alpha=0.3,
                s=ns_book8['대출건수']**1.3, c=ns_book8['대출건수'], cmap='jet')
ax.set_title('출판사별 발행도서')
fig.colorbar(sc)
fig.show()

Chapter06복잡한 데이터를 표기하는 방법에 대해서 학습하였다. 실무에서도 당연하게 겪을수 있는 한글 인코딩 문제와 손코딩을 통한 실제 코딩 실습을 통한 데이터 분석에 대한 아이디어 학습을 할 수 있었다. 


+ Recent posts