Fonction Pandas DataFrame DataFrame.to_csv()

Minahil Noor 30 janvier 2023
  1. Syntaxe de la fonction pandas.DataFrame.to_csv()
  2. Exemple de codes : DataFrame.to_csv()
  3. Exemples de codes : DataFrame.to_csv() pour spécifier un séparateur pour les données CSV
  4. Exemples de codes : DataFrame.to_csv() pour sélectionner quelques colonnes et renommer les colonnes
Fonction Pandas DataFrame DataFrame.to_csv()

La fonction Python Pandas DataFrame.to_csv() enregistre les valeurs contenues dans les lignes et les colonnes d’un DataFrame dans un fichier CSV. Nous pouvons également convertir un DataFrame en une chaîne CSV.

Syntaxe de la fonction pandas.DataFrame.to_csv()

DataFrame.to_csv(
    path_or_buf=None,
    sep=",",
    na_rep="",
    float_format=None,
    columns=None,
    header=True,
    index=True,
    index_label=None,
    mode="w",
    encoding=None,
    compression="infer",
    quoting=None,
    quotechar='""',
    line_terminator=None,
    chunksize=None,
    date_format=None,
    doublequote=True,
    escapechar=None,
    decimal=".",
)

Paramètres

Cette fonction a plusieurs paramètres. Les valeurs par défaut de tous les paramètres sont mentionnées ci-dessus.

path_or_buf Il s’agit d’une chaîne de caractères ou d’un gestionnaire de fichiers. Il représente le nom d’un fichier ou d’un objet de fichier. Si sa valeur est “None”, alors le DataFrame est converti en une chaîne CSV.
sep Il s’agit d’une chaîne de caractères. Elle représente le séparateur utilisé dans le fichier CSV.
na_rep Il s’agit d’une chaîne de caractères. Elle représente les données manquantes.
float_format Il s’agit d’une chaîne de caractères. Elle représente le format des nombres à virgule flottante.
columns Il s’agit d’une séquence. Elle représente les colonnes de la DataFrame qui seront enregistrées dans le fichier CSV.
header Il s’agit d’une valeur booléenne ou d’une liste de chaînes. Si sa valeur est fixée à False, alors les noms des colonnes ne sont pas enregistrés dans le fichier CSV. Si une liste de chaînes de caractères est passée, alors ces chaînes sont enregistrées sous forme de noms de colonnes.
index Il s’agit d’une valeur booléenne. Si sa valeur est True, alors les noms des lignes, c’est-à-dire l’index, sont enregistrés.
index_label Il s’agit d’une chaîne ou d’une séquence. Elle représente le nom de la colonne pour un index spécifique.
mode Il s’agit d’une chaîne de caractères. Elle représente le mode du processus. Comme nous écrivons une DataFrame dans un fichier CSV, sa valeur est le mode d’écriture Python w.
encoding Il s’agit d’une chaîne de caractères. Elle représente le schéma d’encodage à utiliser dans le fichier CSV. Le schéma d’encodage par défaut est utf-8.
compression Il s’agit d’une chaîne ou d’un dictionnaire. Si c’est une chaîne de caractères, elle représente le mode de compression. Si c’est un dictionnaire, alors la valeur de la “méthode” représente le mode de compression. Il existe plusieurs modes de compression. Vous pouvez consulter ici.
quoting Il représente une constante d’un module CSV.
quotechar Il s’agit d’une chaîne de caractères. Elle a une longueur de 1. Elle représente le caractère utilisé pour citer les champs.
line_terminator Il s’agit d’une chaîne de caractères. Elle représente le caractère d’une nouvelle ligne dans le fichier CSV.
chunksize C’est un nombre entier. Il représente le nombre de lignes à écrire dans le fichier CSV à la fois.
date_format Il s’agit d’une chaîne de caractères. Elle représente le format des objets DateTime.
doublequote Il s’agit d’une valeur booléenne. Elle contrôle la citation de quotechar.
escapechar Il s’agit d’une chaîne de caractères. Elle a une longueur de 1. Elle représente le caractère utilisé pour échapper à sep et quotechar.
decimal Il s’agit d’une chaîne de caractères. Elle représente le caractère utilisé pour un point décimal.

Renvoie

Il retourne None ou une chaîne de caractères. Si path_or_buf est None, alors il convertit le DataFrame en une chaîne de caractères et retourne la chaîne. Sinon, il retourne None.

Exemple de codes : DataFrame.to_csv()

Nous implémenterons cette fonction de différentes manières dans les prochains codes.

import pandas as pd

dataframe=pd.DataFrame({
                        'Attendance': 
                            {0: 60, 
                            1: 100, 
                            2: 80,
                            3: 78,
                            4: 95},
                        'Name': 
                            {0: 'Olivia', 
                            1: 'John', 
                            2: 'Laura',
                            3: 'Ben',
                            4: 'Kevin'},
                        'Obtained Marks': 
                            {0: 90, 
                            1: 75, 
                            2: 82, 
                            3: 64, 
                            4: 45}
                        })

print(dataframe)

L’exemple DataFrame est,

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45

Tous les paramètres de cette fonction sont facultatifs. Si nous exécutons cette fonction sans passer aucun paramètre, elle produit la sortie suivante.

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

csvstring = dataframe.to_csv()
print(csvstring)

Production:

,Attendance,Name,Obtained Marks
0,60,Olivia,90
1,100,John,75
2,80,Laura,82
3,78,Ben,64
4,95,Kevin,45

La fonction a produit la sortie en utilisant toutes les valeurs par défaut. Elle a renvoyé une chaîne CSV. Nous allons maintenant enregistrer les données dans le fichier CSV.

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

returnValue = dataframe.to_csv("myfile.csv")
print(returnValue)

Production:

None

La fonction a créé un nouveau fichier CSV dans le répertoire où ce programme est enregistré.

Exemples de codes : DataFrame.to_csv() pour spécifier un séparateur pour les données CSV

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

returnValue = dataframe.to_csv(sep="@")
print(returnValue)

Production:

@Attendance@Name@Obtained Marks

0@60@Olivia@90

1@100@John@75

2@80@Laura@82

3@78@Ben@64

4@95@Kevin@45

Exemples de codes : DataFrame.to_csv() pour sélectionner quelques colonnes et renommer les colonnes

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

returnValue = dataframe.to_csv(
    "myfile.csv", columns=["Name", "Obtained Marks"], header=["Full Name", "Marks"]
)
print(returnValue)

Production:

None

Pandas DataFrame to_csv

Tout comme les codes ci-dessus, nous pouvons personnaliser notre fichier CSV en utilisant les différents paramètres. Cette fonction fournit plusieurs paramètres à utiliser.

Article connexe - Pandas DataFrame