Pandas에서 셀이 비어 있는지 확인

Olorunfemi Akinlua 2023년6월21일
  1. isnull() 함수를 사용하여 셀이 비어 있는지 확인
  2. any() 함수를 사용하여 셀이 비어 있는지 확인
  3. isnan 기능을 사용하여 셀이 비어 있는지 확인
Pandas에서 셀이 비어 있는지 확인

빈 데이터는 유용한 정보를 비교, 결합 또는 추출해야 할 때 좋지 않고 좋지 않으므로 존재 여부를 아는 것이 중요합니다.

CSV 데이터를 Pandas에 데이터 프레임으로 로드하면 각 데이터 조각이 셀 내에 존재하고 모든 빈 셀은 빈 데이터를 나타냅니다. 이 기사에서는 Pandas에서 셀이 비어 있는지 확인하는 데 사용할 수 있는 세 가지 접근 방식을 보여줍니다.

isnull() 함수를 사용하여 셀이 비어 있는지 확인

작동 중인 기능을 보여주기 위해 일부 빈 셀 내에 Pandas 데이터 프레임을 생성합니다.

암호:

import pandas as pd
import numpy as np

df = pd.DataFrame([[1, 2, 3], [3, 4], [3, 4, 5, 6]], columns=list("ABCD"))
print(df)

출력:

A  B    C    D
0  1  2  3.0  NaN
1  3  4  NaN  NaN
2  3  4  5.0  6.0

이제 3개의 빈 셀이 있는 데이터 프레임이 있으므로 isnull() 함수를 사용할 수 있습니다. 이 기능은 NaN, None 또는 NaT와 같은 배열과 같은 개체에 대한 누락된 값을 찾도록 설계되었습니다. - 누락된 값이 있는지 여부를 나타내는 Boolean 값을 반환합니다. 전체 데이터 프레임, 특정 열 또는 특정 셀에 isnull() 함수를 적용할 수 있습니다.

데이터 프레임 또는 특정 열을 확인하기 위해 데이터 프레임을 인수로 전달합니다.

print(pd.isnull(df))
print(pd.isnull(df["C"]))

출력:

A      B      C      D
0  False  False  False   True
1  False  False   True   True
2  False  False  False  False

0    False
1     True
2    False
Name: C, dtype: bool

데이터 프레임은 빈 값이 있는지 여부를 나타내는 부울 값으로 표시됩니다. 여기서 False는 비어 있지 않은 값을 의미하고 True는 빈 값을 의미합니다.

그러나 셀이 비어 있는지 확인하는 것과 관련하여 isnull() 메서드와 함께 lociloc 메서드를 사용할 수 있습니다.

셀을 확인하려는 경우(C열의 인덱스 1, NaN 보유) 다음 코드는 선택하고 확인하는 데 적합합니다.

암호:

print(pd.isnull(df.loc[1, "C"]))
print(pd.isnull(df["C"].iloc[1]))

출력:

True
True

any() 함수를 사용하여 셀이 비어 있는지 확인

데이터 프레임의 셀이 비어 있는지 확인할 수 있는 또 다른 기능은 any() 함수입니다. 하나의 셀이 비어 있는 한 함수는 True를 반환하고 그렇지 않은 경우 False를 반환합니다.

작동하려면 isnull() 함수와 values 속성을 사용해야 합니다.

이전 섹션의 동일한 데이터 프레임을 사용하는 다음 코드는 데이터 프레임에서 isnull() 함수를 사용하고 이제 비어 있음을 나타내는 부울 값만 포함하며 부울 값은 연결할 수 있는 values 속성을 통해 액세스할 수 있습니다. any() 함수.

암호:

print(df.isnull().values.any())

출력:

True

isnan 기능을 사용하여 셀이 비어 있는지 확인

indexapply() 함수와 테스트 numpy.isnan을 사용하여 열에서 셀이 비어 있는 인덱스를 목록에 저장할 수 있습니다.

열을 선택한 다음 이를 달성하기 위해 인덱스 기능을 사용합니다. index 메서드 내에서 동일한 열을 다시 선택하여 numpy.isnan 테스트와 함께 apply() 함수를 사용합니다.

이들은 list() 함수로 전달됩니다.

암호:

list(df["D"].index[df["D"].apply(np.isnan)])

출력:

[0, 1]

이를 통해 D 열 내 빈 셀의 인덱스(01)가 있습니다.

Olorunfemi Akinlua avatar Olorunfemi Akinlua avatar

Olorunfemi is a lover of technology and computers. In addition, I write technology and coding content for developers and hobbyists. When not working, I learn to design, among other things.

LinkedIn