Pandas read_csv() Função

Suraj Joshi 30 janeiro 2023
  1. A sintaxe de pandas.read_csv():
  2. Códigos de exemplo: Pandas Ler CSV Ficheiro utilizando pandas.read_csv() Função
  3. Códigos de exemplo:Definir o parâmetro usecols em pandas.read_csv() função
  4. Códigos de exemplo: pandas.read_csv() Função com cabeçalho
  5. Códigos de exemplo: pandas.read_csv() Função com Linhas de Saltar
Pandas read_csv() Função

O métodoPandas read_csv() lê o ficheiro de valores separados por vírgulas (csv) especificado em DataFrame.

A sintaxe de pandas.read_csv():

pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
                sep=',',
                delimiter=None,
                header='infer',
                names=None,
                index_col=None,
                usecols=None,
                squeeze=False,
                prefix=None,
                mangle_dupe_cols=True,
                dtype=None,
                engine=None,
                converters=None,
                true_values=None,
                false_values=None,
                skipinitialspace=False,
                skiprows=None,
                skipfooter=0,
                nrows=None,
                na_values=None,
                keep_default_na=True,
                na_filter=True,
                verbose=False,
                skip_blank_lines=True,
                parse_dates=False,
                infer_datetime_format=False,
                keep_date_col=False,
                date_parser=None,
                dayfirst=False,
                cache_dates=True,
                iterator=False,
                chunksize=None,
                compression='infer',
                thousands=None,
                decimal: str='.',
                lineterminator=None,
                quotechar='"',
                quoting=0,
                doublequote=True,
                escapechar=None,
                comment=None,
                encoding=None,
                dialect=None,
                error_bad_lines=True,
                warn_bad_lines=True,
                delim_whitespace=False,
                low_memory=True,
                memory_map=False,
                float_precision=None)

Parâmetros

filepath_or_buffer localização do ficheiro csv a importar
delimiter Delimitador a utilizar para analisar o conteúdo do ficheiro csv
usecols Os nomes das colunas só devem ser incluídos durante a formação do DataFrame do ficheiro csv.
header qual a linha/linha a utilizar como nome de coluna do cabeçalho
squeeze devolve a série Pandas se os dados analisados contiverem apenas uma coluna.
skiprows que fila/linha a saltar

Devolver

DataFrame formado a partir de ficheiro CSV com eixos etiquetados.

Códigos de exemplo: Pandas Ler CSV Ficheiro utilizando pandas.read_csv() Função

import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)

Resultado:

       Country      Item Type Sales Channel Order Priority
0       Tuvalu      Baby Food       Offline              H
1   East Timor           Meat        Online              L
2       Norway      Baby Food        Online              L
3     Portugal      Baby Food        Online              H
4     Honduras         Snacks        Online              L
5  New Zealand         Fruits        Online              H
6     Moldova   Personal Care        Online              L

Este método carrega o ficheiro CSV para o DataFrame. Aqui, podemos utilizar tanto os caminhos absolutos como os relativos para fornecer um caminho de ficheiro como argumento à função pandas.read_csv().

Neste caso, o dataset.csv encontra-se no mesmo directório que o ficheiro do programa; isto significa que pode utilizar o nome do ficheiro CSV como um caminho de ficheiro.

Códigos de exemplo:Definir o parâmetro usecols em pandas.read_csv() função

import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)

Resultado:

       Country Sales Channel Order Priority
0       Tuvalu       Offline              H
1   East Timor        Online              L
2       Norway        Online              L
3     Portugal        Online              H
4     Honduras        Online              L
5  New Zealand        Online              H
6     Moldova         Online              L

Este caso carrega o ficheiro CSV para o DataFrame, incluindo apenas as colunas especificadas no parâmetro usecols.

As colunas Country, Sales Channel, e Order Priority são apenas passadas como parâmetros, pelo que só são incluídas no parâmetro DataFrame.

Códigos de exemplo: pandas.read_csv() Função com cabeçalho

import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)

Resultado:

        Tuvalu      Baby Food Offline  H
0   East Timor           Meat  Online  L
1       Norway      Baby Food  Online  L
2     Portugal      Baby Food  Online  H
3     Honduras         Snacks  Online  L
4  New Zealand         Fruits  Online  H
5     Moldova   Personal Care  Online  L

Este processo carrega o ficheiro CSV para o DataFrame, definindo a 1ª linha como cabeçalho.

Aqui, os elementos da 1ª linha servem como nomes de coluna para todo o DataFrame.

Códigos de exemplo: pandas.read_csv() Função com Linhas de Saltar

import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)

Resultado:

        Norway      Baby Food  Online  L
0     Portugal      Baby Food  Online  H
1     Honduras         Snacks  Online  L
2  New Zealand         Fruits  Online  H
3     Moldova   Personal Care  Online  L

Este procedimento carrega o ficheiro CSV no DataFrame saltando as 3 primeiras filas.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Artigo relacionado - Pandas Core