봉지라면의 봉지 속 이야기

BongjiNoodle's Packet Inside Story

나의 진솔담백한 이야기
반응형

컴퓨터공학/데이터분석기초실습 7

데이터분석기초실습] 7. 데이터 조작② (Numpy)

데이터 조작 (Numpy) Numpy 라이브러리 - Numpy란? - Numpy vs. Python - 인덱싱과 슬라이싱 - Numpy 연산 - 다차원배열 - Numpy 함수 Numpy란? NumPy: Numerical Python 데이터 분석(수치 계산, 통계 등)을 위해 만들어진 파이썬 라이브러리 - ex) 선형대수, 푸리에(Fouerier) 변환, 유사 난수 생성 가능 Numpy의 자료구조는 Pandas 라이브러리, matplotlib(시각화) 라이브러리의 기본 데이터 타입으로 사용 - ex) 배열 생성, 저장, 색인(index) 처리, 벡터 연산 가능 NumPy는 C언어로 구현된 파이썬 라이브러리로, 메모리를 적게 차지하고 속도가 빠름 Numpy 사용이유 Python List vs. Numpy 파..

데이터분석기초실습] 6. 데이터 조작① (Pandas 활용 실습)

데이터 조작(Pandas) Pandas 라이브러리 활용 실습 Pandas 활용 실습 행정안전부 연령별 인구현황 자료 분석 데이터 내려 받기 행정 안전부(https://www.mois.go.kr)사이트 내 정책자료 메뉴 선택 후 통계 카테고리 내 '주민등록인구 통계' 클릭 (바로가기- https://jumin.mois.go.kr/index.jsp) 왼쪽 주민등록 인구통계 메뉴에서 '연령별 인구현황'을 선택하고 아래의 그림과 같이 설정 후 검색 버튼 누른 뒤, CSV 파일 다운로드 다운로드 받은 CSV파일을 Excel을 통해 열어서 확인 후, 전체 선택(Ctrl+A) 후 숫자로 변경 이후 파일 이름을 age.csv로 변환 후 저장 age.csv를 Jupyter Notebook에 업로드 데이터 읽어오기 rea..

데이터분석기초실습] 5. 데이터 조작① (Pandas 라이브러리)

데이터 조작(Pandas) Pandas 라이브러리 - 데이터 입출력 - Series - DataFrame Pandas란? Pandas는 데이터 분석용 라이브러리로 데이터를 다루는 패키지 중 하나 데이터 분석 및 조작을 위한 효율적인 데이터 구조를 제공 - 행과 열로 이루어진 데이터 객체를 다룸 - 안정적으로 대용량 데이터들을 처리 - 누락된 데이터를 유연하게 처리할 수 있는 기능 제공 - SQL과 같은 DBMS처럼 데이터를 합치고 관계연산을 수행할 수 있는 기능 제공 Pandas의 자료구조 - Series: 1차원 자료구조 - DataFrame: 2차원 자료구조 - Pannel: 3차원 자료구조 import pandas as pd 데이터 입출력 (Pandas로 데이터 읽기) CSV모듈과 판다스 차이 CS..

데이터분석기초실습] 4. 데이터 입출력

데이터 입출력 패키지와 라이브러리 CSV파일 활용 Python Package vs. Library 라이브러리란? 서브루틴이나 함수들의 집합 일반적으로 라이브러리(Library)는 파이썬 내부에 있는 정적 라이브러리(내장 라이브러리)를 가리킴 정적/내장 라이브러리: 외부에서 호출하지 않고 내부적으로 파이썬 자체에 포함된 라이브러리 다른 패키지의 코드를 가져올 수 있는 동적 라이브러리(외장 라이브러리)는 패키지(Package)라 함 동적/외장 라이브러리: 외부의 패키지를 파이썬 내부에서 설치하여 사용하는 것 import [package]#패키지 전체를 호출하는 경우 from [package] import [function]#패키지 중 일부 함수만 호출하는 경우 Python 내장함수(Built-in Funct..

데이터분석기초실습] 3. 파이썬 되짚기② (자료구조, 제어 및 반복문, 함수)

파이썬 되짚기② 자료구조 튜플, 세트(집합), 딕셔너리 제어 및 반복문 if, while, for 문 함수 객체, 함수 자료구조 튜플(Tuple)이란? 리스트와 유사한 구조를 가진 자료구조 리스트에 비해 구조가 단순하고 접근 속도가 빠름 튜플은 불변속성(속성의 내용을 변경할 수 없는) 객체 직접 변경할 수 없으며 리스트와 같이 append, insert 등의 함수 사용 불가 (read-only) tuple=(1,2,3,4,5) print(tuple) print(type(tuple)) print(tuple[0]) ''' 출력 결과 (1, 2, 3, 4, 5) 1 ''' 불변속성 객체(immutable object)이므로 튜플의 요소를 변경하게 되면 에러 발생 튜플을 사용하는 주요 이유 (Comparison..

데이터분석기초실습] 2. 파이썬 되짚기① (기본 문법, 변수, 자료형, 자료구조(리스트))

파이썬 되짚기 ① Python 기본 문법 PEPL, 들여쓰기, 세미콜론, 주석, import 문 변수 변수 선언, 변수의 예, 여러가지 변수 생성방법 자료형 Scalar: 기본 자료형, 문자열 자료구조 리스트 파이썬 기초문법 REPL(Read Evaluate Print Loop) 사용 콘솔 화면에서 파이썬 구문을 입력하면 바로 결과를 반환하고, 다시 입력할 수 있음 들여쓰기 if, for, class, def 등의 코드블럭 작성 ":" 표시 후 줄 바꿔서 들여쓰기 같은 블록 내에서는 들여쓰기 칸 수가 같아야 함 공백과 탭을 섞어 쓰면 안 됨 세미콜론 한 줄에 여러 명령문을 쓰려면 세미콜론 사용 주석 프로그램의 하는 일을 설명하는 설명 글 (코드에 대한 내용 해석 및 이해) 한 줄 주석은 #으로 표기 여러..

데이터분석기초실습] 1. 소개

소개 개요 학습 목표 교재 및 참고서적 데이터사이언스 소개 및 이해 데이터사이언스 적용 예시 데이터분석 과정 데이터분석 필요능력 데이터사이언스와 Python (vs. R) 데이터 분석 기법을 이해하기 위해 데이터 처리 및 편집, 통계적 분석, 시각화 예측 등 데이터 사이언스의 기본적인 개념 및 기술 학습 Python을 활용하여 데이터 수집, 가공, 분석, 시각화하는 능력 배양 머신러닝 이론 학습을 통해 예측적 데이터 분석 방법 학습 학습 목표 데이터 분석을 위한 알고리즘/기법 등을 살펴보고, 프로그래밍 언어를 활용하여 실제 컴퓨터 환경에서 구현 및 실습 Python Review Data Manipulation Data Visualization Data Prediction/Estimation 주교재 Pyt..

반응형