Pandas read_csv() 함수

Suraj Joshi 2023년1월30일
  1. pandas.read_csv()의 구문 :
  2. 예제 코드: Pandas는pandas.read_csv()함수를 사용하여CSV 파일을 읽습니다
  3. 예제 코드: pandas.read_csv()함수에서usecols 매개 변수 설정
  4. 예제 코드: 헤더가있는pandas.read_csv()함수
  5. 예제 코드: 행을 건너 뛰는pandas.read_csv()함수
Pandas read_csv() 함수

Pandas read_csv() 메서드는 지정된 쉼표로 구분 된 값 (CSV) 파일을DataFrame으로 읽는다.

pandas.read_csv()의 구문 :

pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
                sep=',',
                delimiter=None,
                header='infer',
                names=None,
                index_col=None,
                usecols=None,
                squeeze=False,
                prefix=None,
                mangle_dupe_cols=True,
                dtype=None,
                engine=None,
                converters=None,
                true_values=None,
                false_values=None,
                skipinitialspace=False,
                skiprows=None,
                skipfooter=0,
                nrows=None,
                na_values=None,
                keep_default_na=True,
                na_filter=True,
                verbose=False,
                skip_blank_lines=True,
                parse_dates=False,
                infer_datetime_format=False,
                keep_date_col=False,
                date_parser=None,
                dayfirst=False,
                cache_dates=True,
                iterator=False,
                chunksize=None,
                compression='infer',
                thousands=None,
                decimal: str='.',
                lineterminator=None,
                quotechar='"',
                quoting=0,
                doublequote=True,
                escapechar=None,
                comment=None,
                encoding=None,
                dialect=None,
                error_bad_lines=True,
                warn_bad_lines=True,
                delim_whitespace=False,
                low_memory=True,
                memory_map=False,
                float_precision=None)

매개 변수

filepath_or_buffer 가져올csv 파일의 위치
delimiter csv파일의 내용을 구문 분석하는 데 사용할 구분 기호
usecols 열 이름은csv 파일에서DataFrame을 구성하는 동안 만 포함됩니다.
header 헤더의 열 이름으로 사용할 행 / 행
squeeze 파싱된 데이터에 열이 하나만 포함 된 경우 Pandas 시리즈를 반환합니다.
skiprows 건너뛸 행/행

반환

레이블이 지정된 축이있는 CSV파일로 구성된 DataFrame.

예제 코드: Pandas는pandas.read_csv()함수를 사용하여CSV 파일을 읽습니다

import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)

출력:

       Country      Item Type Sales Channel Order Priority
0       Tuvalu      Baby Food       Offline              H
1   East Timor           Meat        Online              L
2       Norway      Baby Food        Online              L
3     Portugal      Baby Food        Online              H
4     Honduras         Snacks        Online              L
5  New Zealand         Fruits        Online              H
6     Moldova   Personal Care        Online              L

이 메소드는CSV 파일을DataFrame에로드합니다. 여기에서 절대 경로와 상대 경로를 모두 사용하여pandas.read_csv()함수에 대한 인수로 파일 경로를 제공 할 수 있습니다.

이 경우dataset.csv는 프로그램 파일과 동일한 디렉토리에 있습니다. 즉,CSV 파일의 이름을 파일 경로로 사용할 수 있습니다.

예제 코드: pandas.read_csv()함수에서usecols 매개 변수 설정

import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)

출력:

       Country Sales Channel Order Priority
0       Tuvalu       Offline              H
1   East Timor        Online              L
2       Norway        Online              L
3     Portugal        Online              H
4     Honduras        Online              L
5  New Zealand        Online              H
6     Moldova         Online              L

이 경우usecols 매개 변수에 지정된 열만 포함하여CSV 파일을DataFrame에로드합니다.

Country, Sales Channel, Order Priority열은 매개 변수로만 전달되므로 DataFrame에만 포함됩니다.

예제 코드: 헤더가있는pandas.read_csv()함수

import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)

출력:

        Tuvalu      Baby Food Offline  H
0   East Timor           Meat  Online  L
1       Norway      Baby Food  Online  L
2     Portugal      Baby Food  Online  H
3     Honduras         Snacks  Online  L
4  New Zealand         Fruits  Online  H
5     Moldova   Personal Care  Online  L

이 프로세스는 첫 번째 행을 헤더로 설정하여CSV 파일을DataFrame에로드합니다.

여기서 첫 번째 행 요소는 전체DataFrame의 열 이름으로 사용됩니다.

예제 코드: 행을 건너 뛰는pandas.read_csv()함수

import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)

출력:

        Norway      Baby Food  Online  L
0     Portugal      Baby Food  Online  H
1     Honduras         Snacks  Online  L
2  New Zealand         Fruits  Online  H
3     Moldova   Personal Care  Online  L

이 절차는 처음 3 개 행을 건너 뛰어 CSV파일을 DataFrame에로드합니다.

작가: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

관련 문장 - Pandas Core