[pandas] 데이터프레임 생성, CSV 파일 읽기/저장하기

파이썬 라이브러리 pandas로 데이터 프레임을 생성하는 법, csv 파일 형식의 파일을 읽고 저장하는 방법에 대해 정리했다.

DataFrame 만들기

1) 딕셔너리

pd.DataFrame()안에는 딕셔너리를 넣어서 데이터프레임을 만들 수 있다.

딕셔너리의 key에는 열 이름이 들어가고, value에는 그 열에 해당하는 값들은 리스트의 형태로 들어가면 된다. (단, value에 해당하는 리스트의 길이가 다르면 오류가 난다.)

import pandas as pd
df1 = pd.DataFrame({'Color': ['blue', 'green', 'red', 'black'], \
        'Product ID': [1, 2, 3, 4], \
        'Product Name': ['t-shirt', 't-shirt', 'skirt', 'skirt']})
print(df1)

2. 리스트

pd.DataFrame() 안에는 리스트의 리스트를 넣어도 데이터프레임을 만들 수 있다.

리스트 1개가 곧 하나의 행에 해당한다. 열 이름은 columns라는 인자로 별도로 포함시켜야 한다. (이것도 리스트로 넣는다.) 열 이름을 지정하지 않으면 인덱스처럼 0,1,2,3,…으로 나온다.

import pandas as pd
df2 = pd.DataFrame([\
    [1, 'San Diego', 100],\
    [2, 'Los Angeles', 120],\
    [3, 'San Francisco', 90],\
    [4, 'Sacramento', 115]],\
    columns = ['Store ID', 'Location', 'Number of Employees'])
print(df2)

CSV 파일 읽기

csv 파일을 pandas의 데이터 프레임으로 불러오려면 pd.read_csv()를 사용하면 된다.

import pandas as pd
df = pd.read_csv('sample.csv')
print(df)

CSV 파일로 저장하기

pandas의 dataframe을 csv 파일로 저장하려면 pd.to_csv()를 사용하면 된다.

df.to_csv('sample.csv')

추천 글

댓글 남기기