반응형
10-12. 고유한 요소의 수 (nunique)
DataFrame.nunique(axis=0, dropna=True)
개요
nunique메서드는 선택된 축에 대해서 고유한 요소의 수를 구하는 메서드입니다.
사용법
기본 사용법
df.nunique(axis=0, dropna=True)
axis : 기준이 되는 축 입니다.
dropna : 결측치를 무시할지 여부 입니다. False일경우 하나의 요소로 간주합니다.
반응형
예시
먼저 3x3짜리 데이터 객체를 하나 만들어보겠습니다.
idx = ['row1','row2','row3']
col = ['col1','col2','col3']
data = [[1,1,n],[1,2,6],[1,3,n]]
df = pd.DataFrame(data, idx, col)
print(df)
>>
col1 col2 col3
row1 1 1 NaN
row2 1 2 6.0
row3 1 3 NaN
기본적인 사용법
기본값인 axis=0으로 실행할 경우 각 축에 대해서 고유값의 갯수를 출력합니다.
즉, 각 열에 대해서 값의 종류의 수를 반환합니다.
print(df.nunique(axis=0))
>>
col1 1 # col1의 경우 1 한종류만 있음
col2 3 # col2의 경우 1,2,3으로 3 종류있음
col3 1 # col3의 경우 na를 제외하고 6 한종류만 있음
dtype: int64
만약 dropna=False로 할 경우 NaN도 하나의 요소로 간주합니다.
print(df.nunique(axis=0,dropna=False))
>>
col1 1
col2 3
col3 2 # col3에는 NaN과 6, 2 종류가 있음
dtype: int64
axis=1로 하면 행 기준으로 메서드가 실행됩니다.
print(df.nunique(axis=1))
>>
row1 1
row2 3
row3 2
dtype: int64
반응형
'파이썬완전정복-Pandas DataFrame > 10. 정보' 카테고리의 다른 글
Pandas DataFrame 10-11. 고유한 행의 수 (value_counts) (0) | 2022.01.24 |
---|---|
Pandas DataFrame 10-10. 비교 (compare) (0) | 2022.01.24 |
Pandas DataFrame 10-09. 키값(열의 요소) 반환 (get) (0) | 2022.01.24 |
Pandas DataFrame 10-08. 정보축 (keys) (0) | 2022.01.24 |
Pandas DataFrame 10-07. 차원의 형태 (shape) (0) | 2022.01.24 |