"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."


[Pandas] 데이터 프레임 생성하기
728x90

 

판단스로 데이터 프레임을 만드는 방법에 대해서 알아보겠습니다.

 

데이터 직접 입력해서 데이터 프레임 생성하기

데이터 프레임을 생성 할 때 데이터를 직접 입력해서 만드는 방법입니다.

import pandas as pd

df=pd.DataFrame(
    {'id':[1,2,3,4,5,6,7,8],
     'fruit':['apple','apple','mango','orange','strawberry','orange','mango','pear'],
     'count':[10,3,2,4,5,9,20,1],
     'weight':[3.1,5.92,0.4,5.0,5.1129,3.442,2.1,9.999]
    })

DataFrame 선언할 때 값을 직접 입력해서 만드는 방법입니다.

딕셔너리 형태로 입력하고 딕셔너리의 키가 id, fruit, count, weight로 컬럼이 됩니다.

딕셔너리 값이 리스트에 같은 index에 있는 값이 하나의 행을 형성합니다.

아래와 같이 데이터 프레임이 만들어집니다.

 

딕셔너리로 데이터 프레임 생성하기

import pandas as pd

dict_data = {'id':[1,2,3,4,5,6,7,8],
     'fruit':['apple','apple','mango','orange','strawberry','orange','mango','pear'],
     'count':[10,3,2,4,5,9,20,1],
     'weight':[3.1,5.92,0.4,5.0,5.1129,3.442,2.1,9.999]
    }
    
df = pd.DataFrame(dict_data)

데이터 프레임 선언 시 바로 딕셔너리 값을 입력한 것으로 딕셔너리 변수를 만들어서도 사용할 수 있습니다.

이전에 만들었던 데이터 프레임과 동일하게 생성됩니다.

 

반응형

 

리스트로 데이터 프레임 생성하기

import pandas as pd

list_column = ['id', 'fruit', 'count', 'weight']
list_id = [1,2,3,4,5,6,7,8]
list_fruit = ['apple','apple','mango','orange','strawberry','orange','mango','pear']
list_count = [10,3,2,4,5,9,20,1]
list_weight = [3.1,5.92,0.4,5.0,5.1129,3.442,2.1,9.999]

df = pd.DataFrame(list(zip(list_id, list_fruit, list_count, list_weight)), columns=list_column)

각 컬럼의 값을 리스트로 선언한 후 각각의 리스트를 묶어서 데이터 프레임으로 생성하는 방법도 있습니니다.

이때는 zip 함수로 리스트끼리 묶은 후 그 리스트의 묶음을 리스트로 만들어서 데이터 프레임의 인자로 넣습니다. 이때 colums 인자로 컬럼값을 넣어주면 이전과 동일한 데이터 프레임을 만들 수 있습니다.

 

이상 판다스로 데이터 프레임을 생성하는 방법에 대해서 알아보았습니다.

728x90
728x90
LIST