728x90
728x90


"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."


[Pandas] read_csv 시 tokenizing 에러 해결 방법
IT/Machine Learning 2024. 5. 30. 16:50

판다스로 csv 파일을 읽어 왔을 때 Error tokenizing data. C error가 발생하는 경우 해결 방법에 대해서 알아보겠습니다.  Error tokenizing data. C error 발생 원인read_csv로 csv 파일을 로딩할 떄 Error tokenizing data. C error가 발생하는 경우가 있습니다.해당 오류는 쉼표로 분리되는 각 컬럼의 개수가 서로 다른 행이 존재하기 때문에 발생하는 에러로 csv 내 모든 데이터가 동일한 개수의 쉼표로 구분되어 있어야 하는데, 쉼표의 개수가 다른 행이 존재해서 발생하는 오류 입니다.  Error tokenizing data. C error 해결 방법오류가 발생한 라인을 찾아서 삭제해도 해결할 수 있지만 이렇게 하면 해당 라인의 데이터..

[Pandas] 판다스로 csv 로드 시 인덱스 컬럼 제거하기
IT/Machine Learning 2022. 2. 11. 15:18

pandas로 csv 파일을 읽어오면 인덱스 열이 맨 첫번째 컬럼으로 들어갑니다. 위와 같은 csv의 인덱스 컬럼을 제거하는 방법을 알아보겠습니다. read_csv 옵션으로 제거하기 pandas 패키지의 read_csv를 이용하면 csv 파일을 읽어와서 데이터 프레임으로 바로 변환합니다. 이때 index_col 옵션을 이용하면 위와 같은 인덱스 컬럼을 제거할 수 있습니다. import pandas as pd df = pd.read_csv("data.csv", index_col=0) df data.csv 파일을 읽어서 df 데이터 프레임을 만드는 코드입니다. 이때 index_col 값을 0으로 지정하면 Unnamed: 0 컬럼이 없어집니다. 이미 csv 파일을 로드하여 데이터 프레임을 만들었으면 다음 방법..

728x90
728x90