Pandas DataFrame DataFrame.to_csv()-Funktion

Minahil Noor 30 Januar 2023
  1. Syntax von pandas.DataFrame.to_csv()
  2. Beispiel-Codes: DataFrame.to_csv()
  3. Beispielcodes: DataFrame.to_csv() zur Angabe eines Trennzeichens für CSV-Daten
  4. Beispielcodes: DataFrame.to_csv() zum Auswählen weniger Spalten und Umbenennen der Spalten
Pandas DataFrame DataFrame.to_csv()-Funktion

Die Funktion Python Pandas DataFrame.to_csv() speichert die in den Zeilen und Spalten eines DataFrame enthaltenen Werte in eine CSV-Datei. Wir können einen DataFrame auch in eine CSV-Zeichenkette konvertieren.

Syntax von pandas.DataFrame.to_csv()

DataFrame.to_csv(
    path_or_buf=None,
    sep=",",
    na_rep="",
    float_format=None,
    columns=None,
    header=True,
    index=True,
    index_label=None,
    mode="w",
    encoding=None,
    compression="infer",
    quoting=None,
    quotechar='""',
    line_terminator=None,
    chunksize=None,
    date_format=None,
    doublequote=True,
    escapechar=None,
    decimal=".",
)

Parameter

Diese Funktion hat mehrere Parameter. Die Standardwerte aller Parameter sind oben erwähnt.

path_or_buf Es ist eine Zeichenkette oder ein Datei-Handle. Es stellt den Namen einer Datei oder eines Dateiobjekts dar. Wenn sein Wert None ist, wird der DataFrame in eine CSV-Zeichenkette konvertiert.
sep Es ist eine Zeichenkette. Sie stellt das in der CSV-Datei verwendete Trennzeichen dar.
na_rep Es ist eine Zeichenkette. Sie stellt die fehlenden Daten dar.
float_format Es ist eine Zeichenkette. Sie stellt das Format für die Fließkommazahlen dar.
columns Es ist eine Sequenz. Sie repräsentiert die Spalten des DataFrame, die in der CSV-Datei gespeichert werden.
header Es ist ein boolescher Wert oder eine Liste von Zeichenketten. Wenn sein Wert auf False gesetzt ist, werden die Namen der Spalten nicht in der CSV-Datei gespeichert. Wenn eine Liste von Zeichenketten übergeben wird, werden diese Zeichenketten als Spaltennamen gespeichert.
index Es ist ein boolescher Wert. Wenn sein Wert True ist, werden die Namen der Zeilen, d.h. der Index, gespeichert.
index_label Es ist eine Zeichenkette oder eine Sequenz. Sie stellt den Spaltennamen für einen bestimmten Index dar.
mode Es ist eine Zeichenkette. Sie repräsentiert den Modus des Prozesses. Wenn wir einen DataFrame in eine CSV-Datei schreiben, ist sein Wert der Python-Schreibmodus w.
encoding Es ist eine Zeichenkette. Sie stellt das in der CSV-Datei zu verwendende Kodierungsschema dar. Das Standardkodierungsschema ist utf-8.
compression Es ist eine Zeichenkette oder ein Dictionary. Wenn es sich um eine Zeichenkette handelt, stellt es den Komprimierungsmodus dar. Wenn es ein Dictionary ist, dann repräsentiert der Wert bei der “Methode” den Komprimierungsmodus. Es gibt mehrere Komprimierungsmodi. Sie können hier nachsehen.
quoting Sie stellt eine Konstante aus einem CSV-Modul dar.
quotechar Es ist eine Zeichenkette. Sie hat eine Länge von 1 und stellt das Zeichen dar, mit dem Felder in Anführungszeichen gesetzt werden.
line_terminator Es ist eine Zeichenkette. Sie stellt das Zeichen für eine neue Zeile in der CSV-Datei dar.
chunksize Es ist eine ganze Zahl. Sie gibt die Anzahl der Zeilen an, die gleichzeitig in die CSV-Datei geschrieben werden müssen.
date_format Es ist eine Zeichenkette. Sie repräsentiert das Format für DateTime-Objekte.
doublequote Es ist ein boolescher Wert. Er kontrolliert das Zitieren von quotechar.
escapechar Es ist eine Zeichenkette. Sie hat eine Länge von 1 und repräsentiert das Zeichen, das verwendet wird, um sep und quotechar zu entkommen.
decimal Es ist eine Zeichenkette. Sie repräsentiert das für einen Dezimalpunkt verwendete Zeichen.

Zurück

Es gibt None oder eine Zeichenkette zurück. Wenn path_or_buf None ist, konvertiert es den DataFrame in eine Zeichenkette und gibt die Zeichenkette zurück. Andernfalls wird None zurückgegeben.

Beispiel-Codes: DataFrame.to_csv()

Wir werden diese Funktion in den nächsten Codes auf unterschiedliche Weise implementieren.

import pandas as pd

dataframe=pd.DataFrame({
                        'Attendance': 
                            {0: 60, 
                            1: 100, 
                            2: 80,
                            3: 78,
                            4: 95},
                        'Name': 
                            {0: 'Olivia', 
                            1: 'John', 
                            2: 'Laura',
                            3: 'Ben',
                            4: 'Kevin'},
                        'Obtained Marks': 
                            {0: 90, 
                            1: 75, 
                            2: 82, 
                            3: 64, 
                            4: 45}
                        })

print(dataframe)

Das Beispiel DataFrame ist,

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45

Alle Parameter dieser Funktion sind optional. Wenn wir diese Funktion ausführen, ohne einen Parameter zu übergeben, erzeugt sie die folgende Ausgabe.

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

csvstring = dataframe.to_csv()
print(csvstring)

Ausgabe:

,Attendance,Name,Obtained Marks
0,60,Olivia,90
1,100,John,75
2,80,Laura,82
3,78,Ben,64
4,95,Kevin,45

Die Funktion hat die Ausgabe mit allen Standardwerten erzeugt. Sie hat eine CSV-Zeichenkette zurückgegeben. Nun werden wir die Daten in der CSV-Datei speichern.

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

returnValue = dataframe.to_csv("myfile.csv")
print(returnValue)

Ausgabe:

None

Die Funktion hat eine neue CSV-Datei in dem Verzeichnis erstellt, in dem dieses Programm gespeichert ist.

Beispielcodes: DataFrame.to_csv() zur Angabe eines Trennzeichens für CSV-Daten

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

returnValue = dataframe.to_csv(sep="@")
print(returnValue)

Ausgabe:

@Attendance@Name@Obtained Marks

0@60@Olivia@90

1@100@John@75

2@80@Laura@82

3@78@Ben@64

4@95@Kevin@45

Beispielcodes: DataFrame.to_csv() zum Auswählen weniger Spalten und Umbenennen der Spalten

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

returnValue = dataframe.to_csv(
    "myfile.csv", columns=["Name", "Obtained Marks"], header=["Full Name", "Marks"]
)
print(returnValue)

Ausgabe:

None

Pandas-DatenFrame zu_csv

Genau wie die obigen Codes können wir unsere CSV-Datei mit den verschiedenen Parametern anpassen. Diese Funktion stellt mehrere Parameter zur Verfügung.

Verwandter Artikel - Pandas DataFrame