본문 바로가기
IT 서적

데이터 분석을 위한 파이썬 철저 입문

by choies1 2021. 2. 27.

책 표지

파이썬 기초 문법부터, 데이터 분석을 위한 다양한 실무예제까지 설명합니다!

파이썬은 문법이 간결해서 프로그래밍을 처음 시작하는 초보자가 배우기 쉬운 언어입니다. 이 책은 다양한 예제를 바탕으로 기본적인 파이썬 문법에서부터 실무에 필요한 데이터 분석 기법까지 상세히 설명하고 있어서 파이썬을 처음 배우는 초보자뿐만 아니라 실무에 바로 적용할 수 있는 데이터 처리 방법을 찾고 있는 분들에게 좋은 기본서가 될 것입니다.

이 책에서 배운 내용을 각자의 업무에 적용하면 복잡한 데이터 처리 과정은 단순해지고, 지루하고 반복적인 작업은 자동화할 수 있습니다.

특히, 이번 개정판에서는 마지막 장에 '실전 데이터 분석 프로젝트'를 추가하여 데이터 분석 프로세스 및 심화 분석 기법을 배우고 서울시 업무추진비 데이터를 통해 데이터 수집, 결측치 처리, 데이터 요약/재구성 등 실제 데이터를 분석하는 전체 과정을 학습해 볼 수 있게 구성하였습니다.

★ 이 책에서 다루는 내용 ★

  • 아나콘다(Anaconda)를 활용한 파이썬 개발 환경 설치 및 기본 문법
  • 문자열 데이터 처리(분리, 삭제, 연결, 찾기, 바꾸기), 객체와 클래스의 개념 및 활용
  • NumPy와 Pandas를 이용한 배열 및 구조적 데이터 처리와 분석
  • Matplotlib을 이용한 데이터 시각화(다양한 그래프 출력, 꾸미기, 한글 폰트 사용)
  • 엑셀 파일 다루기(데이터 읽기, 쓰기, 통합, 계산, 시각화)
  • Requests와 Beautiful Soup를 이용한 웹 데이터(HTML 파일) 수집 및 처리(웹 스크레이핑)
  • 웹 API를 이용한 데이터 요청 및 응답 데이터(JSON 및 XML 형식) 처리
  • 트위터에 트윗을 작성하고 메시지 가져오기, 정부의 공개 데이터 획득을 위한 Open API 활용
  • 데이터 분석 프로세스 및 분석 기법 심화, 서울시 업무추진비 데이터를 활용한 실전 데이터 분석

판매처 링크

YES 24
교보문고
인터파크
알리딘

 


목 차

  • ▣ 01장: 파이썬 프로그래밍 언어
    • 1.1 왜 프로그래밍 언어를 배워야 하나요?
    • 1.2 프로그래밍 언어란?
    • 1.3 왜 파이썬인가요?
    •  
  • ▣ 02장: 파이썬 시작하기
    • 2.1 파이썬 개발 환경 설치
      • 아나콘다 배포판 내려받기
      • 아나콘다 설치
    • 2.2 첫 번째 코드 작성하기
    • 2.3 코드 저장 및 실행
      • 파이썬 코드 저장
      • 파이썬 코드 실행
    • 2.4 통합 개발 환경에서 코딩하기
      • 통합 개발 환경의 필요성
      • Spyder 실행 및 설정
      • Spyder 에디터에서 코드 작성
    • 2.5 주피터 노트북에서 코딩하기
      • 주피터 노트북 실행
      • 주피터 노트북 사용법
      • 주피터 노트북에서 코드 작성
    • 2.6 정리
    •  
  • ▣ 03장: 파이썬을 계산기처럼 이용하기
    • 3.1 간단한 사칙 연산
    • 3.2 거듭 제곱과 나머지
    • 3.3 과학적 표기법
    • 3.4 진수 표현과 변환
    • 3.5 논리 연산 및 비교 연산
    • 3.6 정리
    •  
  • ▣ 04장: 변수와 자료형
    • 4.1 변수
    • 4.2 문자열
      • 문자열 만들기
      • 문자열 다루기
    • 4.3 리스트
      • 리스트 만들기
      • 리스트 다루기
    • 4.4 튜플
      • 튜플 만들기
      • 튜플 다루기
    • 4.5 세트
      • 세트 만들기
      • 세트의 교집합, 합집합, 차집합 구하기
      • 리스트, 튜플, 세트 간 타입 변환
    • 4.6 딕셔너리
      • 딕셔너리 만들기
      • 딕셔너리 다루기
    • 4.7 정리
    •  
  • ▣ 05장: 제어문
    • 5.1 조건에 따라 분기하는 if 문
      • 단일 조건에 따른 분기(if)
      • 단일 조건 및 그 외 조건에 따른 분기(i f ~ else)
      • 여러 조건에 따른 분기(if ~ elif ~ else)
      • 중첩 조건에 따른 분기
    • 5.2 지정된 범위만큼 반복하는 for 문
      • 반복문의 필요성
      • for 문의 구조
      • 반복 범위 지정
      • 중첩 for 문
      • 여러 개의 리스트 다루기
    • 5.3 조건에 따라 반복하는 while 문
      • while 문의 구조
      • 무한 반복 while 문
    • 5.4 반복문을 제어하는 break와 continue
      • 반복문을 빠져나오는 break
      • 다음 반복을 실행하는 continue
    • 5.5 간단하게 반복하는 한 줄 for 문
      • 리스트 컴프리헨션의 기본 구조
      • 조건문을 포함한 리스트 컴프리헨션
    • 5.6 정리
    •  
  • ▣ 06장: 입력과 출력
    • 6.1 화면 출력
      • 기본 출력
      • 형식 지정 출력
    • 6.2 키보드 입력
    • 6.3 파일 읽고 쓰기
      • 파일 열기
      • 파일 쓰기
      • 파일 읽기
    • 6.4 반복문을 이용해 파일 읽고 쓰기
      • 파일에 문자열 한 줄씩 쓰기
      • 파일에서 문자열 한 줄씩 읽기
    • 6.5 with 문을 활용해 파일 읽고 쓰기
      • with 문의 구조
      • with 문의 활용
    • 6.6 정리
    •  
  • ▣ 07장: 함수
    • 7.1 함수 정의와 호출
      • 함수의 기본 구조
      • 인자도 반환 값도 없는 함수
      • 인자는 있으나 반환 값이 없는 함수
      • 인자도 있고 반환 값도 있는 함수
    • 7.2 변수의 유효 범위
    • 7.3 람다(lambda) 함수
    • 7.4 유용한 내장 함수
      • 형 변환 함수
      • bool 함수
      • 최솟값과 최댓값을 구하는 함수
      • 절댓값과 전체 합을 구하는 함수
      • 항목의 개수를 구하는 함수
      • 내장 함수의 활용
    • 7.5 정리
    •  
  • ▣ 08장: 객체와 클래스
    • 8.1 클래스 선언과 객체 생성
      • 객체란?
      • 클래스 선언
      • 객체 생성 및 활용
      • 객체 초기화
    • 8.2 클래스를 구성하는 변수와 함수
      • 클래스에서 사용하는 변수
      • 클래스에서 사용하는 함수
    • 8.3 객체와 클래스를 사용하는 이유
    • 8.4 클래스 상속
    • 8.5 정리
    •  
  • ▣ 09장: 문자열과 텍스트 파일 데이터 다루기
    • 9.1 문자열 다루기
      • 문자열 분리하기
      • 필요없는 문자열 삭제하기
      • 문자열 연결하기
      • 문자열 찾기
      • 문자열 바꾸기
      • 문자열의 구성 확인하기
      • 대소문자로 변경하기
      • 데이터 파일 준비 및 읽기
    • 9.2 텍스트 파일의 데이터를 읽고 처리하기
      • 파일에서 읽은 문자열 데이터 처리
    • 9.3 정리
    •  
  • ▣ 10장: 모듈
    • 10.1 모듈을 사용하는 이유
    • 10.2 모듈 생성 및 호출
      • 모듈 만들기
      • 모듈 불러오기
      • 모듈을 불러오는 다른 형식
    • 10.3 모듈을 직접 실행하는 경우와 임포트한 후 실행하는 경우 구분하기
    • 10.4 내장 모듈
      • 난수 발생 모듈
      • 날짜 및 시간 관련 처리 모듈
      • 달력 생성 및 처리 모듈
    • 10.5 패키지
      • 패키지의 구조
      • 패키지 만들기
      • 패키지 사용하기
    • 10.6 정리
    •  
  • ▣ 11장: 데이터 분석을 위한 패키지
    • 11.1 배열 데이터를 효과적으로 다루는 NumPy
      • 배열 생성하기
      • 배열의 연산
      • 배열의 인덱싱과 슬라이싱
    • 11.2 구조적 데이터 표시와 처리에 강한 pandas
      • 구조적 데이터 생성하기
      • 데이터 연산
      • 데이터를 원하는 대로 출력하기
      • 데이터 통합하기
      • 데이터 파일을 읽고 쓰기
    • 11.3 정리
    •  
  • ▣ 12장: 데이터 시각화
    • 12.1 matplotlib로 그래프 그리기
      • 선 그래프
      • 그래프 꾸미기
      • 산점도
      • 막대 그래프
      • 히스토그램
      • 파이 그래프
      • 그래프 저장하기
    • 12.2 pandas로 그래프 그리기
      • pandas의 그래프 구조
      • pandas의 선 그래프
      • pandas의 산점도
      • pandas의 막대 그래프
      • pandas의 히스토그램
      • pandas의 파이 그래프
    • 12.3 정리
    •  
  • ▣ 13장: 엑셀 파일 다루기
    • 13.1 엑셀 파일을 읽고 쓰기
      • 엑셀 파일의 데이터 읽기
      • 데이터를 엑셀 파일로 쓰기
    • 13.2 엑셀 파일 통합하기
      • 효율적인 데이터 처리를 위한 엑셀 데이터 구조
      • 여러 개의 엑셀 파일 데이터를 통합하기
      • 통합 결과를 엑셀 파일로 저장하기
    • 13.3 엑셀 파일로 읽어온 데이터 다루기
      • 데이터를 추가하고 변경하기
      • 여러 개의 엑셀 파일에서 데이터 수정하기
      • 엑셀의 필터 기능 수행하기
      • 조건을 설정해 원하는 행만 선택하기
      • 원하는 열만 선택하기
      • 엑셀 데이터 계산하기
    • 13.4 엑셀 데이터의 시각화
      • 그래프를 엑셀 파일에 넣기
      • 엑셀 차트 만들기
    • 13.5 정리
    •  
  • ▣ 14장: 웹 스크레이핑
    • 14.1 웹 브라우저로 웹 사이트 접속하기
      • 하나의 웹 사이트에 접속하기
      • 여러 개의 웹 사이트에 접속하기
    • 14.2 웹 스크레이핑을 위한 기본 지식
      • 데이터의 요청과 응답 과정
      • HTML의 기본 구조
      • 웹 페이지의 HTML 소스 갖고 오기
      • HTML 소스코드를 분석하고 처리하기
    • 14.3 웹 사이트에서 데이터 가져오기
      • 웹 스크레이핑 시 주의 사항
      • 순위 데이터를 가져오기
      • 웹 페이지에서 이미지 가져오기
    • 14.4 정리
    •  
  • ▣ 15장: 웹 API
    • 15.1 웹 API의 이해
      • 웹 API의 데이터 획득 과정
      • 웹 API의 인증 방식
      • 응답 데이터의 형식 및 처리
      • 웹 사이트 주소에 부가 정보 추가하기
    • 15.2 API 키를 사용하지 않고 데이터 가져오기
      • 국제 우주 정거장의 정보 가져오기
      • 국가 정보 가져오기
    • 15.3 트위터에 메시지 작성하고 가져오기
      • API 키 및 접속 토큰 생성
      • Tweepy 설치 및 인증
      • 트윗 작성하기
      • 타임라인에서 메시지 가져오기
      • 키워드를 지정해 데이터 가져오기
    • 15.4 정부의 공공 데이터 가져오기
      • 회원 가입 및 서비스 신청
      • 주소 및 우편번호 가져오기
      • 날씨 정보 가져오기
      • 대기 오염 정보 가져오기
    • 15.5 정리
    •  
  • ▣ 16장: 실전 데이터 분석 프로젝트
    • 16.1 데이터 분석 프로세스
    • 16.2 데이터 획득, 처리, 시각화 심화
      • 깃허브에서 파일 내려받기
      • 데이터에서 결측치 확인 및 처리
      • 데이터의 요약 및 재구성
      • 워드 클라우드를 이용한 데이터 시각화
    • 16.3 실전 데이터(서울시 업무추진비) 분석
      • 데이터 분석의 주제 선정
      • 데이터 수집
      • 데이터 처리
      • 데이터 분석
    • 16.4 정리

'IT 서적' 카테고리의 다른 글

일 잘하는 직장인을 위한 엑셀 자동화 with 파이썬  (0) 2021.02.27