Python에서 목록을 Pandas DataFrame으로 변환

Ankur Baral 2023년1월30일
  1. Python에서 목록을 Pandas DataFrame으로 변환
  2. Python에서 Pandas DataFrame의 열에 목록 저장
  3. Python에서 인덱스를 사용하여 목록을 DataFrame으로 변환
  4. Python에서 zip()을 사용하여 두 개의 목록을 단일 DataFrame으로 압축
  5. Python에서 다차원 목록을 Pandas DataFrame으로 변환
Python에서 목록을 Pandas DataFrame으로 변환

이 기사에서는 목록의 항목을 Pandas DataFrame으로 변환하는 방법을 소개합니다.

Python에서 목록을 Pandas DataFrame으로 변환

데이터 프레임은 일반적으로 레이블이 지정된 2차원 데이터 구조입니다. Pandas는 데이터 과학에 매우 유용한 오픈 소스 Python 패키지입니다.

여기서는 먼저 pandas 패키지를 가져옵니다. 이 특정 프로그램에서 pandas 패키지를 pd로 정의합니다. 그런 다음 목록 값 Tom, Mark, Tony를 저장하기 위해 my_list 목록을 생성합니다. 이들은 임의의 이름일 뿐입니다. 그런 다음 pd.DataFrame(my_list)을 변수 df에 할당합니다. DataFrame(my_list) 메소드는 my_list의 값을 가져와서 데이터 프레임을 생성합니다. 프로그램의 마지막 줄에서 변수 df에 저장한 인쇄된 데이터 프레임을 호출했습니다. 데이터 프레임을 보기 위해 print(df) 대신 df를 작성할 수도 있습니다.

예제 코드:

# python 3.x
import pandas as pd

my_list = ["Tom", "Mark", "Tony"]
df = pd.DataFrame(my_list)
print(df)

출력:

    0
0   Tom
1   Mark
2   Tony

목록에서 제공한 항목이 이제 위 출력의 열에 있음을 알 수 있습니다.

Python에서 Pandas DataFrame의 열에 목록 저장

DataFrame에 열을 만들고 변환된 데이터를 열에 저장하여 목록을 pandas DataFrame으로 변환할 수 있습니다.

목록을 pandas DataFrame 열의 데이터로 변환하기 위해 my_list 목록을 만들고 목록에 값으로 임의의 이름을 지정합니다. 우리의 목표는 목록 요소가 Names라는 제목의 열 항목이 되도록 하는 것입니다. 이를 위해 my_list 변수를 아래와 같이 columns = ['Names']와 함께 pd.DataFrame()에 전달합니다. 그런 다음 df 변수를 인쇄하고 코드를 실행하여 출력을 확인합니다.

예제 코드:

# python 3.x
import pandas as pd

my_list = ["Tom", "Mark", "Tony"]
df = pd.DataFrame(my_list, columns=["Names"])
print(df)

출력:

    Names
0   Tom
1   Mark
2   Tony

columns = ['Names'] 속성을 추가한 후 my_list의 이름이 DataFrame의 Names 열 값으로 사용되었음을 알 수 있습니다.

Python에서 인덱스를 사용하여 목록을 DataFrame으로 변환

목록 항목을 DataFrame으로 변환하는 동안 색인을 생성할 수도 있습니다.

my_list 목록을 생성합니다. 우리의 목표는 목록 요소가 미리 정의된 행 단위 인덱스가 있는 이름이라는 제목의 열 항목이 되도록 하는 것입니다. 이를 위해 index 목록을 만들고 i, iiiii으로 채웁니다. pd.DataFrame()의 두 번째 매개변수로 목록을 사용할 수 있습니다. 첫 번째 및 세 번째 매개변수는 my_listcolumns =['Names']입니다. 그런 다음 작성한 표현식이 저장된 변수 df를 인쇄합니다.

예제 코드:

# python 3.x
import pandas as pd

my_list = [" Tom", "Mark", "Tony"]
df = pd.DataFrame(my_list, index=["i.", "ii.", "iii."], columns=["Names"])
print(df)

출력:

     Names
i.    Tom
ii.   Mark
iii.  Tony

목록 index 안의 값이 기본 pandas 인덱스를 대체했음을 알 수 있습니다. index 안에 값을 입력하고 그에 따라 결과를 생성할 수 있습니다.

Python에서 zip()을 사용하여 두 개의 목록을 단일 DataFrame으로 압축

zip() 함수는 동일한 색인을 가진 목록의 값을 함께 그룹화하여 두 개의 다른 목록 값을 하나로 결합합니다. DataFrame을 생성하기 전에 먼저 zip()이 어떻게 작동하는지 봅시다.

예제 코드:

# python 3.x
a = ["1", "2", "3"]
b = ["4", "5", "6"]
c = zip(a, b)
list1 = list(c)
print(list1)

출력:

[('1', '4'), ('2', '5'), ('3', '6')]

zip() 함수가 ab 목록을 유사한 색인 항목을 그룹화하여 결합하는 데 도움이 되었음을 알 수 있습니다. ab 목록의 압축 상태를 c에 저장한 다음 list1을 만들고 압축 목록 c를 저장했습니다. 다음 예제에서 zip()을 사용하여 pandas DataFrame을 생성합니다.

name_listheight_list라는 두 개의 서로 다른 목록을 만들고 일부 이름과 높이를 각각 저장합니다. 그런 다음 name_listheight_listzip(name_list, height_list)으로 압축하여 pandas DataFrame을 만듭니다.

인덱스 목록 안의 항목이 무엇이든 될 수 있는 다른 속성 index = [ 'index1', 'index2', 'index3' ]을 추가하기만 하면 데이터를 인덱싱할 수도 있습니다.

예제 코드:

# python 3.x
import pandas as pd

name_list = ["Tom", "Mark", "Tony"]
height_list = ["150", "151", "152"]
df = pd.DataFrame((zip(name_list, height_list)), columns=["Name", "Height"])
print(df)

출력:

    Name    Height
0   Tom     150
1   Mark    151
2   Tony    152

형성된 DataFrame이 name_listheight_list 값으로 올바른 순서로 구성되어 있음을 알 수 있습니다.

이 기술을 사용하여 두 개 이상의 목록을 압축할 수도 있습니다.

Python에서 다차원 목록을 Pandas DataFrame으로 변환

다차원 목록을 pandas DataFrame으로 변환할 수도 있습니다. 다차원 목록의 목록 항목에 대한 열 이름을 설정할 수 있습니다. 이 방법을 2차원 목록으로 시연하겠습니다.

다차원 목록을 pandas DataFrame으로 변환하려면 먼저 내부에 여러 목록이 있는 목록을 만들어야 합니다. 따라서 먼저 pandas를 가져온 다음 info 목록을 생성하여 세 명의 다른 개인의 이름과 나이를 세 개의 개별 목록에 저장할 것입니다. 그런 다음 pd.DataFrame()을 호출하고 목록을 처리하고 데이터에 대해 NameAge라는 두 개의 열 제목을 지정합니다.

예제 코드:

# python 3.x
import pandas as pd

info = [["Tom", 18], ["Mark", 25], ["Tony", 68]]
df = pd.DataFrame(info, columns=["Name", "Age"])
print(df)

출력:

    Name    Age
0   Tom     18
1   Mark    25
2   Tony    68

이름과 나이가 각각의 순서대로 출력되는 두 개의 열이 있습니다. info 안의 개별 목록에 다른 값을 추가하고 열 제목을 지정하여 DataFrame에서 더 많은 열을 얻을 수 있습니다.

관련 문장 - Python List