Pandas DataFrame의 모든 열 표시
실제 예에서는 수백, 수천 개의 행과 열이 포함 된 대규모 데이터 세트가 있습니다. 이러한 큰 데이터 청크에 대해 작업하려면 데이터의 행, 열 및 유형에 익숙해야합니다. 대부분의 경우 나중에 요소를 쉽게 추출하거나 다른 용도로 사용할 수 있도록 열 이름을 저장해야합니다.
일반적인 상황에서 우리는 일반적으로 dataframe.columns
를 사용하여 DataFrame의 열 이름을 추출합니다. 이것은 작은 데이터 세트에서 작동 할 수 있지만 100 개가 넘는 열이있는 DataFrame을 처리하는 경우이 방법이 그다지 효율적이지 않음을 입증 할 수 있습니다.
다음 예는dataframe.columns
의 문제를 보여줍니다.
import pandas as pd
import numpy as np
df = pd.DataFrame(columns=np.arange(150))
print(df.columns)
type(df.columns)
출력:
Int64Index([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,
...
140, 141, 142, 143, 144, 145, 146, 147, 148, 149],
dtype='int64', length=150)
pandas.core.indexes.numeric.Int64Index
위의 예에서는 0-149의 150 개 열이있는 빈 DataFrame을 생성하고 출력에서 볼 수 있듯이 모든 열을 볼 수 없습니다. 처음 몇 개와 마지막 몇 개의 열 이름 만 볼 수 있으며 출력은 나중에 사용하기 위해 쉽게 저장하고 액세스 할 수있는 목록 또는시리즈
가 아닙니다.
위의 문제에 대한 간단한 수정이 있습니다. dataframe.columns
의 결과를 목록이나 NumPy 배열로 간단히 변환 할 수 있습니다.
목록을 사용하여 Pandas DataFrame의 모든 열 표시
이를 위해tolist()
또는list()
의 두 가지 메소드를 사용할 수 있습니다. 이 두 함수는 모두 열 이름을 목록으로 변환하고 동일한 출력을 제공합니다.
tolist()
를 사용한 예:
import pandas as pd
import numpy as np
df = pd.DataFrame(columns=np.arange(150))
print(df.columns.tolist())
type(df.columns.tolist())
출력:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149]
list
list()
를 사용한 예 :
import pandas as pd
import numpy as np
df = pd.DataFrame(columns=np.arange(150))
print(list(df.columns))
type(list(df.columns))
출력:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149]
list
NumPy 배열을 사용하여 Pandas DataFrame의 모든 열 표시
values()
함수를 사용하여dataframe.columns
의 결과를 NumPy 배열로 변환 할 수 있습니다.
예:
import pandas as pd
import numpy as np
df = pd.DataFrame(columns=np.arange(150))
print(df.columns.values)
type(df.columns.values)
출력:
[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53
54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71
72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89
90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107
108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125
126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143
144 145 146 147 148 149]
numpy.ndarray
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn