Tabla de contingencia en R

Sheeraz Gul 26 mayo 2022
Tabla de contingencia en R

Las tablas de contingencia, también conocidas como tabulaciones cruzadas, son las tablas para resumir la relación entre dos variables. Este tutorial demuestra cómo crear tablas de contingencia en R.

Tabla de contingencia en R

En R, es muy fácil crear una tabla de contingencia. Supongamos que tenemos un conjunto de datos que tiene la información de 20 empleados, incluida la identificación, el nombre de la oficina y el puesto del empleado.

Para crear la tabla de contingencia, usamos la función de tabla en R. Vea el ejemplo:

#create the dataset
Delftstack <- data.frame(employee_id = 1:20,
                 office_name=rep(c("Main", "Site", "Office Two"), times=c(9, 6, 5)),
                 position=rep(c('Senior Developer', 'Junior Developer', 'Trainee', 'Intern'), times=5))

#view the dataset
Delftstack

#create the contingency table
delftstack_table <- table(Delftstack$office_name, Delftstack$position)

#view the contingency table
delftstack_table

El código anterior primero creará un conjunto de datos con 20 registros y luego creará una tabla de contingencia a partir del conjunto de datos. Ver salida:

   employee_id office_name         position
1            1        Main Senior Developer
2            2        Main Junior Developer
3            3        Main          Trainee
4            4        Main           Intern
5            5        Main Senior Developer
6            6        Main Junior Developer
7            7        Main          Trainee
8            8        Main           Intern
9            9        Main Senior Developer
10          10        Site Junior Developer
11          11        Site          Trainee
12          12        Site           Intern
13          13        Site Senior Developer
14          14        Site Junior Developer
15          15        Site          Trainee
16          16  Office Two           Intern
17          17  Office Two Senior Developer
18          18  Office Two Junior Developer
19          19  Office Two          Trainee
20          20  Office Two           Intern

             Intern Junior Developer Senior Developer Trainee
  Main            2                2                3       2
  Office Two      2                1                1       1
  Site            1                2                1       2

Podemos usar la función addmargins() para agregar margen a la tabla de contingencia. Ver ejemplo:

#add margins to contingency table
delftstack_margins <- addmargins(delftstack_table)

#view contingency table
delftstack_margins

El código anterior agregará márgenes a la tabla de contingencia. Ver salida:

             Intern Junior Developer Senior Developer Trainee Sum
  Main            2                2                3       2   9
  Office Two      2                1                1       1   5
  Site            1                2                1       2   6
  Sum             5                5                5       5  20

Este resultado muestra que el número total de empleados es 20; los valores por encima de 20 muestran el número total de empleados en la oficina correspondiente, lo que significa que la oficina tiene 9 empleados, la oficina dos tiene 5 y la oficina del sitio tiene 6 empleados. Y las columnas intermedias muestran el número de empleados con su puesto.

Sheeraz Gul avatar Sheeraz Gul avatar

Sheeraz is a Doctorate fellow in Computer Science at Northwestern Polytechnical University, Xian, China. He has 7 years of Software Development experience in AI, Web, Database, and Desktop technologies. He writes tutorials in Java, PHP, Python, GoLang, R, etc., to help beginners learn the field of Computer Science.

LinkedIn Facebook