반응형

10-12. 고유한 요소의 수 (nunique)

DataFrame.nunique(axis=0, dropna=True)

 

개요


nunique메서드는 선택된 축에 대해서 고유한 요소의 수를 구하는 메서드입니다.

 

사용법


기본 사용법
df.nunique(axis=0, dropna=True)
axis : 기준이 되는 축 입니다.
dropna : 결측치를 무시할지 여부 입니다. False일경우 하나의 요소로 간주합니다.

반응형

 

예시


먼저 3x3짜리 데이터 객체를 하나 만들어보겠습니다.

idx =  ['row1','row2','row3']
col =  ['col1','col2','col3']
data = [[1,1,n],[1,2,6],[1,3,n]]
df = pd.DataFrame(data, idx, col)
print(df)
>>
      col1  col2  col3
row1     1     1   NaN
row2     1     2   6.0
row3     1     3   NaN

기본적인 사용법
기본값인 axis=0으로 실행할 경우 각 축에 대해서 고유값의 갯수를 출력합니다.
즉, 각 열에 대해서 값의 종류의 수를 반환합니다.

print(df.nunique(axis=0))
>>
col1    1 # col1의 경우 1 한종류만 있음
col2    3 # col2의 경우 1,2,3으로 3 종류있음
col3    1 # col3의 경우 na를 제외하고 6 한종류만 있음
dtype: int64

만약 dropna=False로 할 경우 NaN도 하나의 요소로 간주합니다.

print(df.nunique(axis=0,dropna=False))
>>
col1    1
col2    3
col3    2 # col3에는 NaN과 6, 2 종류가 있음
dtype: int64

axis=1로 하면 행 기준으로 메서드가 실행됩니다.

print(df.nunique(axis=1))
>>
row1    1
row2    3
row3    2
dtype: int64
반응형

+ 최근 글