T Distribución en R

Sheeraz Gul 21 junio 2023
T Distribución en R

La distribución t es una distribución de probabilidad utilizada para muestrear una población distribuida normalmente donde el tamaño de la muestra es pequeño y se desconoce la desviación estándar. Este tutorial demuestra cómo realizar la distribución t en R.

Distribución T de Student en R

La distribución t, generalmente conocida como distribución t de Student, tiene múltiples funciones para realizar diferentes operaciones de distribución t, por ejemplo, dt, pt y qt.

Donde dt() se usa para encontrar la función de densidad de probabilidad de la PDF de la distribución t con la variable aleatoria dada, toma dos parámetros, un vector cuantil y el otro son grados de libertad. La sintaxis es dt(x, df).

La función pt() obtiene la función de distribución acumulativa de la CDF de la distribución t.

Toma tres parámetros, el primero es el vector cuantil, el segundo son los grados de libertad, y el tercero es el lower.trail, que puede ser true o false. La sintaxis es pt(q, df, lower.tail = TRUE).

La función qt() obtiene la función de densidad acumulada inversa de la distribución t.

Toma tres parámetros; el primero es el vector de probabilidades, el segundo son los grados de libertad, y el tercero es el camino.inferior. La sintaxis es qt(p, df, lower.tail = TRUE).

Aquí está el proceso paso a paso para realizar la distribución t de Student en R.

  • En primer lugar, establezca los grados de libertad.
  • Lo siguiente es trazar la función de densidad para la distribución t de Student.
  • Para graficar la función de densidad, primero, cree un cuantil vectorial, luego use el método dt() para encontrar los valores de la distribución t y, finalmente, usando los valores, grafique la función de densidad para la distribución t de Student.
  • Ahora, use el método pt() para obtener la función de distribución acumulada de la distribución t y use la función qt() para obtener la función de densidad acumulada inversa de la distribución t.

Una vez que conocemos el proceso, intentemos implementar la distribución t de Student en R. Busquemos el valor de la distribución t en x=1 y los grados de libertad 50.

Ver ejemplo:

# value of t-distribution probality density function at x=1 and df = 50
dt(x = 1, df = 50)

El código anterior mostrará el valor de la función de densidad de probabilidad de la distribución t en x=1 y df = 50. Ver salida:

[1] 0.2395711

Ahora encontremos el valor p y el intervalo de confianza de la distribución t usando el método pt(). Ver ejemplo:

# area to the right of a t-statistic with the value of 3.1 quantile and 30 degrees of freedom
pt(q = 3.1, df = 30, lower.tail = FALSE)

El código anterior usará el método pt para encontrar el área a la derecha de una estadística t con el valor de 3.1 cuantiles y 30 grados de libertad. Ver salida:

[1] 0.002092242

Encontramos que el valor p unilateral aquí es 0.2%. Si queremos construir un intervalo de confianza del 50 % de dos caras, podemos usar la función qt() para encontrar la puntuación t y el valor t para una confianza del 50 %.

# value in each tail is 0.2% and confidence is 50%, we will find 0.2th percentile of t-distribution with 30 degrees of freedom
qt(p = 0.002, df = 30, lower.tail = TRUE)

El qt encontrará el valor t, que se puede utilizar como valor crítico para el intervalo de confianza del 50%. Ver salida:

[1] -3.117682

Ahora comparemos funciones de densidad de probabilidad con diferentes grados de libertad. Hacemos eso porque mostrará que cuanto mayor sea el número de grados de libertad, más cerca estará la gráfica de la distribución normal.

Ver ejemplo:

# vector of 200 values between -9 and 9
a <- seq(-9, 9, length = 200)

# Degrees of freedom with maximum 50 degrees
df = c(1,5,15,50)

#plot line colors
colour = c("blue", "red", "green", "orange","pink")

# the normal distribution
plot(a, dnorm(a), type = "l", lty = 2, xlab = "T-value", ylab = "Density",
     main = "The t-distributions Comparison", col = "darkblue")

# Adding t-distributions to the plot
for (i in 1:4){
  lines(a, dt(a, df[i]), col = colour[i])
}

# Adding legend
legend("topright", c("df = 1", "df = 5", "df = 15", "df = 50", "Normal"),
       col = colour, title = "T-distributions", lty = c(1,1,1,1,2))

El código anterior mostrará la gráfica de comparación para las distribuciones t de diferentes grados de libertad. Ver la trama:

Comparación de distribuciones T

Sheeraz Gul avatar Sheeraz Gul avatar

Sheeraz is a Doctorate fellow in Computer Science at Northwestern Polytechnical University, Xian, China. He has 7 years of Software Development experience in AI, Web, Database, and Desktop technologies. He writes tutorials in Java, PHP, Python, GoLang, R, etc., to help beginners learn the field of Computer Science.

LinkedIn Facebook

Artículo relacionado - R Distribution