Tabla de contingencia en R
Las tablas de contingencia, también conocidas como tabulaciones cruzadas, son las tablas para resumir la relación entre dos variables. Este tutorial demuestra cómo crear tablas de contingencia en R.
Tabla de contingencia en R
En R, es muy fácil crear una tabla de contingencia. Supongamos que tenemos un conjunto de datos que tiene la información de 20 empleados, incluida la identificación, el nombre de la oficina y el puesto del empleado.
Para crear la tabla de contingencia, usamos la función de tabla en R. Vea el ejemplo:
#create the dataset
Delftstack <- data.frame(employee_id = 1:20,
office_name=rep(c("Main", "Site", "Office Two"), times=c(9, 6, 5)),
position=rep(c('Senior Developer', 'Junior Developer', 'Trainee', 'Intern'), times=5))
#view the dataset
Delftstack
#create the contingency table
delftstack_table <- table(Delftstack$office_name, Delftstack$position)
#view the contingency table
delftstack_table
El código anterior primero creará un conjunto de datos con 20 registros y luego creará una tabla de contingencia a partir del conjunto de datos. Ver salida:
employee_id office_name position
1 1 Main Senior Developer
2 2 Main Junior Developer
3 3 Main Trainee
4 4 Main Intern
5 5 Main Senior Developer
6 6 Main Junior Developer
7 7 Main Trainee
8 8 Main Intern
9 9 Main Senior Developer
10 10 Site Junior Developer
11 11 Site Trainee
12 12 Site Intern
13 13 Site Senior Developer
14 14 Site Junior Developer
15 15 Site Trainee
16 16 Office Two Intern
17 17 Office Two Senior Developer
18 18 Office Two Junior Developer
19 19 Office Two Trainee
20 20 Office Two Intern
Intern Junior Developer Senior Developer Trainee
Main 2 2 3 2
Office Two 2 1 1 1
Site 1 2 1 2
Podemos usar la función addmargins()
para agregar margen a la tabla de contingencia. Ver ejemplo:
#add margins to contingency table
delftstack_margins <- addmargins(delftstack_table)
#view contingency table
delftstack_margins
El código anterior agregará márgenes a la tabla de contingencia. Ver salida:
Intern Junior Developer Senior Developer Trainee Sum
Main 2 2 3 2 9
Office Two 2 1 1 1 5
Site 1 2 1 2 6
Sum 5 5 5 5 20
Este resultado muestra que el número total de empleados es 20; los valores por encima de 20 muestran el número total de empleados en la oficina correspondiente, lo que significa que la oficina tiene 9 empleados, la oficina dos tiene 5 y la oficina del sitio tiene 6 empleados. Y las columnas intermedias muestran el número de empleados con su puesto.
Sheeraz is a Doctorate fellow in Computer Science at Northwestern Polytechnical University, Xian, China. He has 7 years of Software Development experience in AI, Web, Database, and Desktop technologies. He writes tutorials in Java, PHP, Python, GoLang, R, etc., to help beginners learn the field of Computer Science.
LinkedIn Facebook