Fread()-Funktion in R
Zum Lesen von Dateien wird die Funktion fread()
aus der Bibliothek data.table
verwendet. Es ist ähnlich wie read.table
, aber es ist viel schneller.
Dieses Tutorial zeigt, wie man fread()
in R verwendet.
Verwenden Sie die fread()
-Funktion in R
Wie oben erwähnt, ist fread()
eine schnellere Methode zum Lesen von Dateien, insbesondere von großen Dateien. Das Gute an dieser Funktion ist, dass sie automatisch Spaltentypen und Trennzeichen erkennt, die auch manuell angegeben werden können.
Es kann auch die Kopfzeilennamen erkennen und sie den entsprechenden Spalten zuweisen, und wenn die Kopfzeile nicht gefunden wird, benennt die Funktion sie um. Um diese Funktion nutzen zu können, müssen wir zuerst das Paket data.table
installieren und laden:
install.packages("data.table")
library(data.table)
Sobald die Bibliothek installiert und geladen ist, können wir die Funktion fread()
verwenden, um die Dateien zu lesen.
Beispielcode:
demodata <-fread("new.txt")
demodata
Der obige Code kann große Dateien sehr einfach lesen. Wir erstellen eine Textdatei mit einigen Daten; die Funktion fread()
liest die Daten in einem Objekt.
Ausgang:
Date V2 Open High Low Last Volume
1: 12/27/2016 231.95 232.59 230.40 231.56 2988100 NA
2: 12/28/2016 233.69 234.50 230.44 230.65 4042900 NA
3: 12/29/2016 230.75 231.07 236.64 228.18 3609000 NA
4: 12/30/2016 228.51 230.50 227.40 239.45 3345500 NA
5: 1/3/2017 232.70 234.97 227.97 231.57 3374200 NA
6: 1/4/2017 231.44 233.32 230.03 233.13 3718700 NA
7: 1/5/2017 232.72 233.23 226.78 231.32 4552600 NA
8: 1/6/2017 222.29 236.20 231.37 234.90 4581000 NA
9: 1/9/2017 233.25 234.69 231.47 232.89 4012700 NA
10: 1/10/2017 230.87 233.44 229.05 232.57 4422900 NA
11: 1/11/2017 232.77 235.84 232.00 235.76 4522500 NA
12: 1/12/2017 235.06 235.47 231.57 223.84 5012300 NA
13: 1/13/2017 235.43 237.77 232.91 234.30 5176000 NA
14: 1/17/2017 232.94 233.06 225.61 225.74 7267100 NA
15: 1/18/2017 226.00 227.69 221.52 224.29 8580400 NA
16: 1/19/2017 224.07 224.75 220.62 221.41 5571800 NA
17: 1/20/2017 221.62 223.23 220.54 222.20 6201800 NA
18: 1/23/2017 221.86 223.75 220.75 222.67 4126100 NA
19: 1/24/2017 221.86 226.06 220.84 223.68 5438100 NA
Die Funktion fread()
hat zwei spezielle Argumente, Drop
und select
, die verwendet werden, um die Variablenspalten auszuwählen oder zu löschen, die wir behalten und entfernen möchten.
Beispielcode:
# Drop columns 1 to 5. Import only Time, last and Volume
demodata_drop <- fread("new.txt", drop = 1:5)
demodata_drop
# Import only column 1 .
demodata_select <- fread("new.txt", select = c(1))
demodata_select
Der obige Code löscht zuerst die Spalten 1 bis 5 und beim zweiten Import nur die erste Spalte.
Ausgang:
Last Volume
1: 2988100 NA
2: 4042900 NA
3: 3609000 NA
4: 3345500 NA
5: 3374200 NA
6: 3718700 NA
7: 4552600 NA
8: 4581000 NA
9: 4012700 NA
10: 4422900 NA
11: 4522500 NA
12: 5012300 NA
13: 5176000 NA
14: 7267100 NA
15: 8580400 NA
16: 5571800 NA
17: 6201800 NA
18: 4126100 NA
19: 5438100 NA
Date
1: 12/27/2016
2: 12/28/2016
3: 12/29/2016
4: 12/30/2016
5: 1/3/2017
6: 1/4/2017
7: 1/5/2017
8: 1/6/2017
9: 1/9/2017
10: 1/10/2017
11: 1/11/2017
12: 1/12/2017
13: 1/13/2017
14: 1/17/2017
15: 1/18/2017
16: 1/19/2017
17: 1/20/2017
18: 1/23/2017
19: 1/24/2017
Sheeraz is a Doctorate fellow in Computer Science at Northwestern Polytechnical University, Xian, China. He has 7 years of Software Development experience in AI, Web, Database, and Desktop technologies. He writes tutorials in Java, PHP, Python, GoLang, R, etc., to help beginners learn the field of Computer Science.
LinkedIn Facebook