포스트

Pandas DataFrame에서 두 열에 함수 적용하기

개요

Pandas는 데이터 처리와 분석에 사용되는 Python 라이브러리입니다. 이 라이브러리는 다양한 데이터 구조와 분석 도구를 제공하며, 특히 DataFrame이라는 2차원 표 구조를 사용하여 데이터를 쉽게 조작할 수 있습니다. 이 글에서는 Pandas DataFrame에서 두 열에 함수를 적용하는 방법에 대해 설명합니다.

apply 메서드 이해하기

Pandas DataFrame에는 apply라는 메서드가 있습니다. 이 메서드를 사용하면 DataFrame의 행 또는 열에 함수를 적용할 수 있습니다. ‘메서드’란 객체에 특정 작업을 수행하는 함수를 의미합니다.

예제 코드

아래의 예제 코드를 보면, DataFrame의 ‘A’ 열과 ‘B’ 열에 더하기(add) 함수를 적용한 것을 확인할 수 있습니다.

1
2
3
4
import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df['C'] = df.apply(lambda row: row['A'] + row['B'], axis=1)

이 코드에서 lambda row: row['A'] + row['B']는 간단한 무명 함수입니다. 이 함수는 각 행의 ‘A’ 값과 ‘B’ 값을 더하고 있습니다. axis=1은 함수가 행에 적용되어야 함을 의미합니다.

주의할 점과 Error 이름

이 방법을 사용할 때 주의해야 할 점은 모든 열이 같은 데이터 타입을 가져야 한다는 것입니다. 만약 이를 지키지 않으면 TypeError라는 오류가 발생할 수 있습니다.

요약

Pandas DataFrame에서 두 열에 함수를 적용하는 것은 apply 메서드를 사용하여 간단하게 수행할 수 있습니다. 이 메서드는 매우 유연하며 다양한 데이터 처리 작업에 활용될 수 있습니다. 주의해야 할 점은 열의 데이터 타입이 일치해야 한다는 것이며, 그렇지 않을 경우 TypeError가 발생할 수 있습니다.

이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.