Fonction Pandas DataFrame DataFrame.to_csv()
-
Syntaxe de la fonction
pandas.DataFrame.to_csv()
-
Exemple de codes :
DataFrame.to_csv()
-
Exemples de codes :
DataFrame.to_csv()
pour spécifier un séparateur pour les données CSV -
Exemples de codes :
DataFrame.to_csv()
pour sélectionner quelques colonnes et renommer les colonnes
La fonction Python Pandas DataFrame.to_csv()
enregistre les valeurs contenues dans les lignes et les colonnes d’un DataFrame
dans un fichier CSV. Nous pouvons également convertir un DataFrame
en une chaîne CSV.
Syntaxe de la fonction pandas.DataFrame.to_csv()
DataFrame.to_csv(
path_or_buf=None,
sep=",",
na_rep="",
float_format=None,
columns=None,
header=True,
index=True,
index_label=None,
mode="w",
encoding=None,
compression="infer",
quoting=None,
quotechar='""',
line_terminator=None,
chunksize=None,
date_format=None,
doublequote=True,
escapechar=None,
decimal=".",
)
Paramètres
Cette fonction a plusieurs paramètres. Les valeurs par défaut de tous les paramètres sont mentionnées ci-dessus.
path_or_buf |
Il s’agit d’une chaîne de caractères ou d’un gestionnaire de fichiers. Il représente le nom d’un fichier ou d’un objet de fichier. Si sa valeur est “None”, alors le DataFrame est converti en une chaîne CSV. |
sep |
Il s’agit d’une chaîne de caractères. Elle représente le séparateur utilisé dans le fichier CSV. |
na_rep |
Il s’agit d’une chaîne de caractères. Elle représente les données manquantes. |
float_format |
Il s’agit d’une chaîne de caractères. Elle représente le format des nombres à virgule flottante. |
columns |
Il s’agit d’une séquence. Elle représente les colonnes de la DataFrame qui seront enregistrées dans le fichier CSV. |
header |
Il s’agit d’une valeur booléenne ou d’une liste de chaînes. Si sa valeur est fixée à False , alors les noms des colonnes ne sont pas enregistrés dans le fichier CSV. Si une liste de chaînes de caractères est passée, alors ces chaînes sont enregistrées sous forme de noms de colonnes. |
index |
Il s’agit d’une valeur booléenne. Si sa valeur est True , alors les noms des lignes, c’est-à-dire l’index, sont enregistrés. |
index_label |
Il s’agit d’une chaîne ou d’une séquence. Elle représente le nom de la colonne pour un index spécifique. |
mode |
Il s’agit d’une chaîne de caractères. Elle représente le mode du processus. Comme nous écrivons une DataFrame dans un fichier CSV, sa valeur est le mode d’écriture Python w . |
encoding |
Il s’agit d’une chaîne de caractères. Elle représente le schéma d’encodage à utiliser dans le fichier CSV. Le schéma d’encodage par défaut est utf-8 . |
compression |
Il s’agit d’une chaîne ou d’un dictionnaire. Si c’est une chaîne de caractères, elle représente le mode de compression. Si c’est un dictionnaire, alors la valeur de la “méthode” représente le mode de compression. Il existe plusieurs modes de compression. Vous pouvez consulter ici. |
quoting |
Il représente une constante d’un module CSV. |
quotechar |
Il s’agit d’une chaîne de caractères. Elle a une longueur de 1. Elle représente le caractère utilisé pour citer les champs. |
line_terminator |
Il s’agit d’une chaîne de caractères. Elle représente le caractère d’une nouvelle ligne dans le fichier CSV. |
chunksize |
C’est un nombre entier. Il représente le nombre de lignes à écrire dans le fichier CSV à la fois. |
date_format |
Il s’agit d’une chaîne de caractères. Elle représente le format des objets DateTime . |
doublequote |
Il s’agit d’une valeur booléenne. Elle contrôle la citation de quotechar . |
escapechar |
Il s’agit d’une chaîne de caractères. Elle a une longueur de 1. Elle représente le caractère utilisé pour échapper à sep et quotechar . |
decimal |
Il s’agit d’une chaîne de caractères. Elle représente le caractère utilisé pour un point décimal. |
Renvoie
Il retourne None
ou une chaîne de caractères. Si path_or_buf
est None, alors il convertit le DataFrame
en une chaîne de caractères et retourne la chaîne. Sinon, il retourne None
.
Exemple de codes : DataFrame.to_csv()
Nous implémenterons cette fonction de différentes manières dans les prochains codes.
import pandas as pd
dataframe=pd.DataFrame({
'Attendance':
{0: 60,
1: 100,
2: 80,
3: 78,
4: 95},
'Name':
{0: 'Olivia',
1: 'John',
2: 'Laura',
3: 'Ben',
4: 'Kevin'},
'Obtained Marks':
{0: 90,
1: 75,
2: 82,
3: 64,
4: 45}
})
print(dataframe)
L’exemple DataFrame est,
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Tous les paramètres de cette fonction sont facultatifs. Si nous exécutons cette fonction sans passer aucun paramètre, elle produit la sortie suivante.
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
csvstring = dataframe.to_csv()
print(csvstring)
Production:
,Attendance,Name,Obtained Marks
0,60,Olivia,90
1,100,John,75
2,80,Laura,82
3,78,Ben,64
4,95,Kevin,45
La fonction a produit la sortie en utilisant toutes les valeurs par défaut. Elle a renvoyé une chaîne CSV. Nous allons maintenant enregistrer les données dans le fichier CSV.
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
returnValue = dataframe.to_csv("myfile.csv")
print(returnValue)
Production:
None
La fonction a créé un nouveau fichier CSV dans le répertoire où ce programme est enregistré.
Exemples de codes : DataFrame.to_csv()
pour spécifier un séparateur pour les données CSV
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
returnValue = dataframe.to_csv(sep="@")
print(returnValue)
Production:
@Attendance@Name@Obtained Marks
0@60@Olivia@90
1@100@John@75
2@80@Laura@82
3@78@Ben@64
4@95@Kevin@45
Exemples de codes : DataFrame.to_csv()
pour sélectionner quelques colonnes et renommer les colonnes
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
returnValue = dataframe.to_csv(
"myfile.csv", columns=["Name", "Obtained Marks"], header=["Full Name", "Marks"]
)
print(returnValue)
Production:
None
Tout comme les codes ci-dessus, nous pouvons personnaliser notre fichier CSV en utilisant les différents paramètres. Cette fonction fournit plusieurs paramètres à utiliser.