Mesclar dois quadros de dados com número diferente de linhas em R

Jinku Hu 30 janeiro 2023
  1. Use a função full_join para mesclar dois quadros de dados R com um número diferente de linhas
  2. Use a função left_join para mesclar dois quadros de dados R com um número diferente de linhas
  3. Use a função right_join para mesclar dois quadros de dados R com um número diferente de linhas
Mesclar dois quadros de dados com número diferente de linhas em R

Este artigo demonstrará vários métodos de mesclar dois quadros de dados com um número diferente de linhas em R.

Use a função full_join para mesclar dois quadros de dados R com um número diferente de linhas

full_join é parte do pacote dplyr e pode ser usado para mesclar dois frames de dados com um número diferente de linhas. A função usa frames de dados para serem mesclados como os dois primeiros argumentos e retorna o mesmo tipo de objeto que o primeiro argumento. Esta função pode operar em tipos de extensão de quadro de dados como tibble ou quadros de dados preguiçosos. full_join extrai todas as linhas e colunas de ambos os argumentos do quadro de dados. Ele preenche os elementos com NA-s quando não há valores correspondentes.

library(dplyr)

v1 <- c(1.1, 1.2, 1.3, 2.1, 2.2, 2.3)
v2 <- c(11, 12, 13, 21, 22, 23)

df1 <- data.frame(v1, v2)

v1 <- c(9.1, 9.2, 9.3, 9.1, 9.2, 9.3, 9.3, 9.2, 9.1)
v2 <- c(101, 102, 103, 201, 202, 203, 204, 403, 404)
wday <- factor(c("Wed", "Thu", "Mon", "Wed", "Thu", "Fri", "Mon", "Tue", "Wed"))

df2 <- data.frame(v1, v2, wday)

dff <- df1 %>% full_join(df2)
dff
   v1  v2 wday
1  1.1  11 <NA>
2  1.2  12 <NA>
3  1.3  13 <NA>
4  2.1  21 <NA>
5  2.2  22 <NA>
6  2.3  23 <NA>
7  9.1 101  Wed
8  9.2 102  Thu
9  9.3 103  Mon
10 9.1 201  Wed
11 9.2 202  Thu
12 9.3 203  Fri
13 9.3 204  Mon
14 9.2 403  Tue
15 9.1 404  Wed

Use a função left_join para mesclar dois quadros de dados R com um número diferente de linhas

left_join é outro método do pacote dplyr. Recebe argumentos semelhantes à função full_join, mas left_join extrai todas as linhas do primeiro quadro de dados e todas as colunas de ambos.

library(dplyr)

v1 <- c(1.1, 1.2, 1.3, 2.1, 2.2, 2.3)
v2 <- c(11, 12, 13, 21, 22, 23)

df1 <- data.frame(v1, v2)

v1 <- c(9.1, 9.2, 9.3, 9.1, 9.2, 9.3, 9.3, 9.2, 9.1)
v2 <- c(101, 102, 103, 201, 202, 203, 204, 403, 404)
wday <- factor(c("Wed", "Thu", "Mon", "Wed", "Thu", "Fri", "Mon", "Tue", "Wed"))

df2 <- data.frame(v1, v2, wday)

dfl <- df1 %>% left_join(df2)
dfl

Resultado:

  v1 v2 wday
1 1.1 11 <NA>
2 1.2 12 <NA>
3 1.3 13 <NA>
4 2.1 21 <NA>
5 2.2 22 <NA>
6 2.3 23 <NA>

Use a função right_join para mesclar dois quadros de dados R com um número diferente de linhas

right_join funciona de forma semelhante à função left_join, exceto pela extração de todas as linhas do segundo argumento do quadro de dados em vez do primeiro. A função também copia todas as colunas de ambos os quadros de dados para um objeto recém-construído.

library(dplyr)

v1 <- c(1.1, 1.2, 1.3, 2.1, 2.2, 2.3)
v2 <- c(11, 12, 13, 21, 22, 23)

df1 <- data.frame(v1, v2)

v1 <- c(9.1, 9.2, 9.3, 9.1, 9.2, 9.3, 9.3, 9.2, 9.1)
v2 <- c(101, 102, 103, 201, 202, 203, 204, 403, 404)
wday <- factor(c("Wed", "Thu", "Mon", "Wed", "Thu", "Fri", "Mon", "Tue", "Wed"))

df2 <- data.frame(v1, v2, wday)

dfr <- df1 %>% right_join(df2)
dfr

Resultado:

  v1  v2 wday
1 9.1 101  Wed
2 9.2 102  Thu
3 9.3 103  Mon
4 9.1 201  Wed
5 9.2 202  Thu
6 9.3 203  Fri
7 9.3 204  Mon
8 9.2 403  Tue
9 9.1 404  Wed
Autor: Jinku Hu
Jinku Hu avatar Jinku Hu avatar

Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.

LinkedIn Facebook

Artigo relacionado - R Data Frame