반응형
14-02 평균 (mean)
DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, kwargs)
개요
mean메서드는 행/열의 값들의 평균을 구하는 메서드입니다.
사용법
기본 사용법
※ 자세한 내용은 아래 예시를 참고 바랍니다.
df.mean(axis=None, skipna=None, level=None, numeric_only=None, kwargs)
axis : {0 : index / 1 : columns} 계산의 기준이 될 축입니다.
skipna : 결측치를 무시할지 여부입니다.
level : Multi Index의 경우 연산을 수행할 레벨입니다.
numeric_only : 숫자, 소수, 부울만 이용할지 여부입니다.
kwargs : 함수에 전달할 추가 키워드입니다.
반응형
예시
먼저 기본적인 사용법 예시를 위해 Multi Index 객체를 생성하겠습니다.
idx = [['IDX1','IDX1','IDX2','IDX2'],['row1','row2','row3','row4']]
col = [['COL1','COL1','COL2','COL2'],['val1','val2','val3','val4']]
data = [[N,13,3,4],[5,7,10,8],[15,6,N,3],[2,14,9,1]]
df = pd.DataFrame(data,idx,col)
print(df)
>>
COL1 COL2
val1 val2 val3 val4
IDX1 row1 NaN 13 3.0 4
row2 5.0 7 10.0 8
IDX2 row3 15.0 6 NaN 3
row4 2.0 14 9.0 1
기본적인 사용법(+axis)
기본적으로 mean을 그대로 사용할 경우 모든 행/열에 대해서 연산을 수행합니다.
print(df.mean())
>>
COL1 val1 7.333333
val2 10.000000
COL2 val3 7.333333
val4 4.000000
dtype: float64
axis 인수를 이용하여 대상 축을 지정할 수 있습니다.
print(df.mean(axis=1))
>>
IDX1 row1 6.666667
row2 7.500000
IDX2 row3 8.000000
row4 6.500000
dtype: float64
skipna인수의 사용
skipna인수를 이용하여 결측치를 무시할지 정할 수 있습니다.
print(df.mean(skipna=True))
>>
COL1 val1 7.333333
val2 10.000000
COL2 val3 7.333333
val4 4.000000
dtype: float64
print(df.mean(skipna=False))
>>
COL1 val1 NaN
val2 10.0
COL2 val3 NaN
val4 4.0
dtype: float64
level인수의 사용
Multi Index의 경우 대상 level을 지정할 수 있습니다.
print(df.mean(level=0))
>>
COL1 COL2
val1 val2 val3 val4
IDX1 5.0 10.0 6.5 6.0
IDX2 8.5 10.0 9.0 2.0
# print(df.groupby(level=0).mean())와 완전히 동일합니다.
반응형
'파이썬완전정복-Pandas DataFrame > 14. 통계(기초)' 카테고리의 다른 글
Pandas DataFrame 14-06 분산 (var) (0) | 2022.02.07 |
---|---|
Pandas DataFrame 14-05 표준편차 (std) (0) | 2022.02.07 |
Pandas DataFrame 14-04 최빈값 (mode) (0) | 2022.02.07 |
Pandas DataFrame 14-03 중앙값 (median) (0) | 2022.02.07 |
Pandas DataFrame 14-01 최대/최소 (max / min) (0) | 2022.02.07 |