Pandas에서 열의 하위 문자열 가져오기
- Pandas에서 열의 하위 문자열 가져오기
-
str.slice()
함수를 사용하여 Pandas에서 열의 하위 문자열 가져오기 - 대괄호를 사용하여 Pandas에서 열의 하위 문자열 가져오기
-
str.extract()
함수를 사용하여 Pandas에서 열의 하위 문자열 가져오기
이 튜토리얼에서는 Pandas에서 열의 하위 문자열을 얻는 방법을 배웁니다.
Pandas에서 열의 하위 문자열 가져오기
이 추출은 데이터와 함께 작업할 때 많은 시나리오에서 유용할 수 있습니다. 예를 들어 사용자의 이름에서 사용자 이름을 생성하려는 경우를 생각해 보십시오.
이를 수행하기 위해 여러 접근 방식을 사용할 것입니다.
먼저 튜토리얼 전체에서 작업할 Pandas 데이터 프레임을 생성해 보겠습니다. 데이터 프레임에 이름
열을 포함하고 해당 열에서 사용자 이름을 추출하는 것을 목표로 합니다.
암호:
import pandas as pd
dict = {"Name": ["Shivesh Jha", "Sanay Shah", "Rutwik Sonawane"]}
df = pd.DataFrame.from_dict(dict)
데이터 프레임을 살펴보겠습니다.
print(df)
출력:
Name
0 Shivesh Jha
1 Sanay Shah
2 Rutwik Sonawane
이제 열에서 하위 문자열을 얻기 위해 사용할 수 있는 다양한 방법을 살펴보겠습니다.
str.slice()
함수를 사용하여 Pandas에서 열의 하위 문자열 가져오기
이 접근 방식에서는 str.slice()
함수를 사용하여 name
열에서 처음 세 문자를 가져와 특정 사용자의 사용자 이름으로 사용합니다. slice()
함수에서 추출하려는 문자열의 시작 및 끝 인덱스를 전달해야 합니다.
아래 코드를 사용하여 이 기능을 수행합니다.
df["UserName"] = df["Name"].str.slice(0, 3)
print(df)
이제 이름
열의 처음 세 문자를 포함하는 새 사용자 이름
열이 있는 업데이트된 데이터 프레임을 살펴보겠습니다.
출력:
Name UserName
0 Shivesh Jha Shi
1 Sanay Shah San
2 Rutwik Sonawane Rut
출력에서 이름
열에서 처음 세 문자를 성공적으로 추출하여 새 사용자 이름
열에서 사용한 것을 볼 수 있습니다.
대괄호를 사용하여 Pandas에서 열의 하위 문자열 가져오기
대괄호를 사용하여 문자열에 액세스하고 이 접근 방식에서 추출하려는 문자를 얻습니다. 아래 코드를 사용하여 이 작업을 수행합니다.
df["UserName"] = df["Name"].str[:3]
출력:
Name UserName
0 Shivesh Jha Shi
1 Sanay Shah San
2 Rutwik Sonawane Rut
이 코드에서 기존 열의 처음 3자로 새 열을 얻은 것을 볼 수 있습니다.
str.extract()
함수를 사용하여 Pandas에서 열의 하위 문자열 가져오기
이 접근 방식은 이름에서 사용자의 성을 추출합니다. 이를 구현하기 위해 str.extract()
함수를 사용할 것입니다.
암호:
df["LastName"] = df.Name.str.extract(r"\b(\w+)$", expand=True)
이제 업데이트된 데이터 프레임을 확인하겠습니다.
print(df)
출력:
Name LastName
0 Shivesh Jha Jha
1 Sanay Shah Shah
2 Rutwik Sonawane Sonawane
위와 같이 원하는 결과를 성공적으로 얻었습니다. 따라서 위의 기술을 사용하여 Pandas에서 열의 하위 문자열을 얻을 수 있습니다.