String durch Trennzeichen in R aufteilen

Jinku Hu 30 Januar 2023
  1. Verwenden Sie strsplit, um die Zeichenkette durch Trennzeichen in R . aufzuteilen
  2. Verwenden Sie str_split, um String durch Trennzeichen in R . aufzuteilen
String durch Trennzeichen in R aufteilen

In diesem Artikel wird erläutert, wie Sie Strings nach Trennzeichen in R aufteilen.

Verwenden Sie strsplit, um die Zeichenkette durch Trennzeichen in R . aufzuteilen

strsplit wird mit der R-Basisbibliothek bereitgestellt und sollte bei den meisten Installationen ohne zusätzliche Pakete verfügbar sein. strsplit teilt den Zeichenvektor durch das gegebene Trennzeichen in TeilZeichenketten auf, das ebenfalls mit einem Zeichenvektor versehen ist. Das erste Argument der Funktion ist der aufzuteilende Zeichenvektor. In diesem Fall geben wir das Leerzeichen an, um jedes Wort im gegebenen Satz zu trennen. Beachten Sie, dass die Ausgabe als Liste von Zeichenvektoren erfolgt.

library(dplyr)
library(stringr)

str <- "Lorem Ipsum is simply dummied text of the printing and typesetting industry."

strsplit(str, " ")

Ausgabe:

> strsplit(str, " ")
[[1]]
 [1] "Lorem"       "Ipsum"       "is"          "simply"      "dummied"       "text"       
 [7] "of"          "the"         "printing"    "and"         "typesetting" "industry."  

Verwenden Sie str_split, um String durch Trennzeichen in R . aufzuteilen

Alternativ kann auch die Funktion str_split verwendet werden, um Strings durch Trennzeichen aufzuteilen. str_split ist Teil des stringr-Pakets. Es funktioniert fast genauso wie strsplit, nur dass str_split auch reguläre Ausdrücke als Muster verwendet. Im folgenden Beispiel übergeben wir nur die feste Zeichenkette, die übereinstimmen soll. Beachten Sie, dass die Funktion optional das dritte Argument annehmen kann, das die Anzahl der zurückzugebenden TeilZeichenketten angibt.

library(dplyr)
library(stringr)

str <- "Lorem Ipsum is simply dummied text of the printing and typesetting industry."

str_split(str, " ")

Ausgabe:

> str_split(str, " ")
[[1]]
 [1] "Lorem"       "Ipsum"       "is"          "simply"      "dummied"       "text"       
 [7] "of"          "the"         "printing"    "and"         "typesetting" "industry."  

Ein weiterer optionaler Parameter in der Funktion str_split ist simplify, der an vierter Stelle steht. Dieser Parameter hat standardmäßig den Wert FALSE, was die Funktion zwingt, Teilstrings als Liste von Zeichenvektoren zurückzugeben. Wenn wir dem angegebenen Argument TRUE zuweisen, gibt str_split eine Zeichenmatrix zurück.

library(dplyr)
library(stringr)

fruits <- c(
  "apples and oranges and pears and bananas",
  "pineapples and mangos and raspberries"
)

str_split(fruits, " and ")
str_split(fruits, " and ", simplify = TRUE)

Ausgabe:

> str_split(fruits, " and ")
[[1]]
[1] "apples"  "oranges" "pears"   "bananas"

[[2]]
[1] "pineapples"  "mangos"      "raspberries"


> str_split(fruits, " and ", simplify = TRUE)
     [,1]         [,2]      [,3]          [,4]     
[1,] "apples"     "oranges" "pears"       "bananas"
[2,] "pineapples" "mangos"  "raspberries" ""
Autor: Jinku Hu
Jinku Hu avatar Jinku Hu avatar

Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.

LinkedIn Facebook

Verwandter Artikel - R String