String durch Trennzeichen in R aufteilen
-
Verwenden Sie
strsplit
, um die Zeichenkette durch Trennzeichen in R . aufzuteilen -
Verwenden Sie
str_split
, um String durch Trennzeichen in R . aufzuteilen
In diesem Artikel wird erläutert, wie Sie Strings nach Trennzeichen in R aufteilen.
Verwenden Sie strsplit
, um die Zeichenkette durch Trennzeichen in R . aufzuteilen
strsplit
wird mit der R-Basisbibliothek bereitgestellt und sollte bei den meisten Installationen ohne zusätzliche Pakete verfügbar sein. strsplit
teilt den Zeichenvektor durch das gegebene Trennzeichen in TeilZeichenketten auf, das ebenfalls mit einem Zeichenvektor versehen ist. Das erste Argument der Funktion ist der aufzuteilende Zeichenvektor. In diesem Fall geben wir das Leerzeichen an, um jedes Wort im gegebenen Satz zu trennen. Beachten Sie, dass die Ausgabe als Liste von Zeichenvektoren erfolgt.
library(dplyr)
library(stringr)
str <- "Lorem Ipsum is simply dummied text of the printing and typesetting industry."
strsplit(str, " ")
Ausgabe:
> strsplit(str, " ")
[[1]]
[1] "Lorem" "Ipsum" "is" "simply" "dummied" "text"
[7] "of" "the" "printing" "and" "typesetting" "industry."
Verwenden Sie str_split
, um String durch Trennzeichen in R . aufzuteilen
Alternativ kann auch die Funktion str_split
verwendet werden, um Strings durch Trennzeichen aufzuteilen. str_split
ist Teil des stringr
-Pakets. Es funktioniert fast genauso wie strsplit
, nur dass str_split
auch reguläre Ausdrücke als Muster verwendet. Im folgenden Beispiel übergeben wir nur die feste Zeichenkette, die übereinstimmen soll. Beachten Sie, dass die Funktion optional das dritte Argument annehmen kann, das die Anzahl der zurückzugebenden TeilZeichenketten angibt.
library(dplyr)
library(stringr)
str <- "Lorem Ipsum is simply dummied text of the printing and typesetting industry."
str_split(str, " ")
Ausgabe:
> str_split(str, " ")
[[1]]
[1] "Lorem" "Ipsum" "is" "simply" "dummied" "text"
[7] "of" "the" "printing" "and" "typesetting" "industry."
Ein weiterer optionaler Parameter in der Funktion str_split
ist simplify
, der an vierter Stelle steht. Dieser Parameter hat standardmäßig den Wert FALSE
, was die Funktion zwingt, Teilstrings als Liste von Zeichenvektoren zurückzugeben. Wenn wir dem angegebenen Argument TRUE
zuweisen, gibt str_split
eine Zeichenmatrix zurück.
library(dplyr)
library(stringr)
fruits <- c(
"apples and oranges and pears and bananas",
"pineapples and mangos and raspberries"
)
str_split(fruits, " and ")
str_split(fruits, " and ", simplify = TRUE)
Ausgabe:
> str_split(fruits, " and ")
[[1]]
[1] "apples" "oranges" "pears" "bananas"
[[2]]
[1] "pineapples" "mangos" "raspberries"
> str_split(fruits, " and ", simplify = TRUE)
[,1] [,2] [,3] [,4]
[1,] "apples" "oranges" "pears" "bananas"
[2,] "pineapples" "mangos" "raspberries" ""
Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.
LinkedIn Facebook