데이터 프레임의 컬럼을 삭제하고, 추가하는 방법을 알아보겠습니다.다음의 데이터 프레임에서 컬럼을 삭제하고, 추가해 볼 예정입니다. 데이터 프레임의 컬럼 삭제하기drop 함수를 이용하면 컬럼을 삭제할 수 있습니다.df.drop('col1', axis=1)컬럼 col1이 삭제된 것을 볼 수 있습니다.이렇게 한 후 df 데이터 프레임을 조회해보면, 실제 df 데이터 프레임에서는 컬럼이 삭제되지는 않음을 확인할 수 있습니다.drop 한 후 다시 해당 데이터 프레임이 할당 해야 컬럼이 삭제됩니다. df = df.drop(['col1','col2'],axis=1)dfdrop 후 df에 할 당하면 col1, col2이 데이터프레임 df에서 삭제되었음을 확인 할 수 있습니다. 데이터 프레임 컬럼 추가하기데이터 프레임..
데이터프레임의 컬럼값을 확인하는 방법을 알아보겠습니다. 데이터 프레임 특정 컬럼값 확인하기데이터 프레임 특정 컬럼의 값을 확인하기 위해서는 해당 컬럼에 접근하면 됩니다.df['A']df.A위의 방법을 사용하거나 아래의 방법처럼 컬럼명으로 컬럼의 값을 가져올 수 있습니다. 가져오는 컬럼의 값을 시리즈형으로 리턴 합니다.주의할 사항은 점(.)을 이용하여 접근하는 경우 컬럼명이 파이썬의 명령어와 동일하면 동작하지 않을 수 있기 때문에 위의 방법을 사용해야 합니다. 데이터 프레임의 모든 컬럼의 값 확인하기데이터 프레임의 모든 컬럼값을 확인하기 위해서는 데이터 프레임을 그대로 출력하면 됩니다.df 이상 데이터프레임에서 컬럼의 내용을 확인하는 방법을 알아보았습니다.
데이터프레임의 컬럼명 확인하는 방법과 컬럼명을 변경하는 방법을 알아보겠습니다. 데이터 프레임 컬럼명 확인하기우선은 예제로 사용할 데이터 프레임을 생성해보겠습니다.import pandas as pddf = pd.DataFrame({ 'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}) 생성한 데이터 프레임의 컬럼을 가져오기 위해서는 데이터프레임 이름에 columns로 접근 합니다.print(df.columns)columns를 사용하면 Index로 컬럼값을 가져옵니다. 이를 리스트 형태로 바꾸기 위해서는 to_list() 함수를 이용합니다.column_names = df.columns.tolist()print(column_names) 컬럼명 변경하기전체 컬..
머신러닝의 비지도 학습 중 군집화에 대해서 알아보겠습니다. 군집화 (Clustering)군집화(Clustering)은 사전 정의 범주가 없는 상태에서 어떤 대상들의 특징을 구분해서 그룹으로 묶는 과정 입니다. 군집들 사이의 관계를 분석하고, 데이터 전체의 구조에 대한 이해를 돕고자 하는 탐색적 분석 방법 입니다. 군집화는 다음과 같은 특징이 있습니다.유사한 데이터 그룹을 찾아냄전체 특징이 아닌 일부 특징만을 이용하여 군집화를 수행할 수 있음범주형 데이터를 군집화 하는 방법도 있음 군집화의 종류 (Clustering Algorithm)군집 방법에 따라서 다양한 군집화 알고리즘이 있습니다. 대표적인 군집 방법으로 계층적 군집( Hierarchical Clustering) 과 분할적 군집(Partional ..
DataFrame에 결측치(NaN)가 들어 있는 라인을 추출하고 싶은 경우 어떻게 해야할 지 알아보겠습니다. 데이터 프레임 결측치 확인 방법우선 다음과 같이 결측치가 들어 있는 데이터 프레임을 만들어서 설명하겠습니다.import numpy as npimport pandas as pdraw_data = {'first_name': ['Jason', np.nan, 'Tina', 'Jake', 'Amy'], 'last_name': ['Miller', np.nan, 'Ali', 'Milner', 'Cooze'], 'age': [42, np.nan, 36, 24, 73], 'sex': ['m', np.nan, 'f'..
판다스로 csv 파일을 읽어 왔을 때 Error tokenizing data. C error가 발생하는 경우 해결 방법에 대해서 알아보겠습니다. Error tokenizing data. C error 발생 원인read_csv로 csv 파일을 로딩할 떄 Error tokenizing data. C error가 발생하는 경우가 있습니다.해당 오류는 쉼표로 분리되는 각 컬럼의 개수가 서로 다른 행이 존재하기 때문에 발생하는 에러로 csv 내 모든 데이터가 동일한 개수의 쉼표로 구분되어 있어야 하는데, 쉼표의 개수가 다른 행이 존재해서 발생하는 오류 입니다. Error tokenizing data. C error 해결 방법오류가 발생한 라인을 찾아서 삭제해도 해결할 수 있지만 이렇게 하면 해당 라인의 데이터..
Comment