Tableau de contingence en R

Sheeraz Gul 26 mai 2022
Tableau de contingence en R

Le tableau de contingence, également connu sous le nom de tableaux croisés, sont les tableaux qui résument la relation entre deux variables. Ce didacticiel montre comment créer des tableaux de contingence dans R.

Tableau de contingence en R

Dans R, il est très facile de créer un tableau de contingence. Supposons que nous ayons un ensemble de données contenant les informations de 20 employés, y compris l’identifiant, le nom du bureau et le poste de l’employé.

Pour créer le tableau de contingence, nous utilisons la fonction table dans R. Voir l’exemple :

#create the dataset
Delftstack <- data.frame(employee_id = 1:20,
                 office_name=rep(c("Main", "Site", "Office Two"), times=c(9, 6, 5)),
                 position=rep(c('Senior Developer', 'Junior Developer', 'Trainee', 'Intern'), times=5))

#view the dataset
Delftstack

#create the contingency table
delftstack_table <- table(Delftstack$office_name, Delftstack$position)

#view the contingency table
delftstack_table

Le code ci-dessus créera d’abord un ensemble de données avec 20 enregistrements, puis créera un tableau de contingence à partir de l’ensemble de données. Voir le résultat :

   employee_id office_name         position
1            1        Main Senior Developer
2            2        Main Junior Developer
3            3        Main          Trainee
4            4        Main           Intern
5            5        Main Senior Developer
6            6        Main Junior Developer
7            7        Main          Trainee
8            8        Main           Intern
9            9        Main Senior Developer
10          10        Site Junior Developer
11          11        Site          Trainee
12          12        Site           Intern
13          13        Site Senior Developer
14          14        Site Junior Developer
15          15        Site          Trainee
16          16  Office Two           Intern
17          17  Office Two Senior Developer
18          18  Office Two Junior Developer
19          19  Office Two          Trainee
20          20  Office Two           Intern

             Intern Junior Developer Senior Developer Trainee
  Main            2                2                3       2
  Office Two      2                1                1       1
  Site            1                2                1       2

Nous pouvons utiliser la fonction addmargins() pour ajouter une marge au tableau de contingence. Voir exemple :

#add margins to contingency table
delftstack_margins <- addmargins(delftstack_table)

#view contingency table
delftstack_margins

Le code ci-dessus ajoutera des marges au tableau de contingence. Voir la sortie :

             Intern Junior Developer Senior Developer Trainee Sum
  Main            2                2                3       2   9
  Office Two      2                1                1       1   5
  Site            1                2                1       2   6
  Sum             5                5                5       5  20

Cette sortie montre que le nombre total d’employés est de 20 ; les valeurs supérieures à 20 indiquent le nombre total d’employés dans le bureau correspondant, ce qui signifie que le bureau compte 9 employés, le bureau deux en a 5 et le bureau du site compte 6 employés. Et les colonnes intermédiaires indiquent le nombre d’employés avec leur poste.

Auteur: Sheeraz Gul
Sheeraz Gul avatar Sheeraz Gul avatar

Sheeraz is a Doctorate fellow in Computer Science at Northwestern Polytechnical University, Xian, China. He has 7 years of Software Development experience in AI, Web, Database, and Desktop technologies. He writes tutorials in Java, PHP, Python, GoLang, R, etc., to help beginners learn the field of Computer Science.

LinkedIn Facebook