
DataFrame에 결측치(NaN)가 들어 있는 라인을 추출하고 싶은 경우 어떻게 해야할 지 알아보겠습니다. 데이터 프레임 결측치 확인 방법우선 다음과 같이 결측치가 들어 있는 데이터 프레임을 만들어서 설명하겠습니다.import numpy as npimport pandas as pdraw_data = {'first_name': ['Jason', np.nan, 'Tina', 'Jake', 'Amy'], 'last_name': ['Miller', np.nan, 'Ali', 'Milner', 'Cooze'], 'age': [42, np.nan, 36, 24, 73], 'sex': ['m', np.nan, 'f'..

판다스로 csv 파일을 읽어 왔을 때 Error tokenizing data. C error가 발생하는 경우 해결 방법에 대해서 알아보겠습니다. Error tokenizing data. C error 발생 원인read_csv로 csv 파일을 로딩할 떄 Error tokenizing data. C error가 발생하는 경우가 있습니다.해당 오류는 쉼표로 분리되는 각 컬럼의 개수가 서로 다른 행이 존재하기 때문에 발생하는 에러로 csv 내 모든 데이터가 동일한 개수의 쉼표로 구분되어 있어야 하는데, 쉼표의 개수가 다른 행이 존재해서 발생하는 오류 입니다. Error tokenizing data. C error 해결 방법오류가 발생한 라인을 찾아서 삭제해도 해결할 수 있지만 이렇게 하면 해당 라인의 데이터..

주피터 노트북 사용 시 데이터 프레임의 데이터량이 많으면 ... 으로 생략되어 출력됩니다. 모든 컬럼명을 보고 싶을 때 pd_name.info() 명령을 사용하면 되지만 컬럼과 데이터를 같이 보고 싶은 경우가 있습니다. 이때 사용하면 좋을 옵션 설정을 알려드리겠습니다. pandas 옵션 확인하기 데이터 프레임의 모든 컬럼을 출력하기 위해서는 pandas의 옵션을 바꿔야 하기 때문에 우선 어떤 옵션이 있는지 확인해봅니다. pd.describe_option() 판다스 공식 홈페이지에 들어가면 옵션 설명을 볼 수 있습니다. https://pandas.pydata.org/pandas-docs/stable/user_guide/options.html Options and settings — pandas 1.5.2 ..
Comment