본문 바로가기

전체 글28

Pandas의 기초 - 데이터 선택 1. 특정 컬럼 조회 : df["컬럼"], df[["컬럼1", "컬럼2"]] df["메뉴"] # 1개(시리즈로 반환) df[["메뉴", "가격"]] # 2개 이상 시(데이터 프레임으로 반환) 2. 조건에 맞는 행 조회 : df[T/F로 이루어진 시리즈] cond1 = df["메뉴"] == "짜장면" # True, False 시리즈들을 반환 df[cond1] ★ 다중조건 조회 방법 - 조건 생성 condi_price = df["가격"] >= 7500 # 충족하는 것은 "짬뽕", "볶음밥" condi_name = df["메뉴"].isin(["짜장면", "짬뽕"]) # 충족하는 것은 "짜장면", "짬뽕" - And(True + False = False) 와 Or(True + False = True) 을 실행한.. 2023. 11. 20.
Pandas의 기초 - 데이터 확인 1. 위 아래 데이터 확인 df.head(1) # 위쪽에서 {1}번째 줄까지 보고 싶을 때(생략 시 5줄 까지) df.tail(1) # 아래쪽에서 {1}번째 줄까지 보고 싶을 때(생략 시 5줄 까지) 2. 컬럼 데이터 정보 확인 df.info() df.describe() # 컬럼별 기술 통계값(숫자형 데이터 컬럼만) 3. 행과 컬럼 개수 조회 df.shape # (행 개수, 열 개수) 반환 4. 컬럼의 값 조회(중복제거) df["메뉴"].unique() # 다수 컬럼 동시 진행 불가 2023. 11. 20.
Pandas의 기초 - Series와 DataFrame 만들기 1. Python 자료형을 활용 import Pandas as pd # pandas 라이브러리 임포트, 별칭 pd sample_cate = ["짜장면", "짬뽕", "볶음밥"] # 리스트 sample_price = [7000, 7500, 7500] # 리스트 1) 시리즈를 만들기 cate = pd.Series(sample_cate) # cate라는 시리즈 price = pd.Series(sample_price) # price라는 시리즈 display(cate, price) 2) 데이터프레임 만들기 (1) 두 개의 시리즈를 통해 만들기 df = pd.DataFrame({ "메뉴" : cate, "가격" : price}) display(df) (2) dictionary를 통해 만들기 menu_dic = {".. 2023. 11. 20.
Pandas의 기초 - Series와 DataFrame 1. Pandas란 무엇인가? 파이썬의 데이터 분석 라이브러리! 2. Pandas의 데이터 구조 2가지 - 시리즈(Series) : [엑셀] 하나의 열, [파이썬] 하나의 리스트 (로 이해하면 좋다) - 데이터프레임(DataFrame) : [엑셀] 행과 열로 이루어진 테이블 / [파이썬] 이중 리스트 (로 이해하면 좋다) * 데이터프레임은 여러개의 시리즈로 이루어졌다고 보면 된다. 2023. 11. 20.