R cuadrado (R2) es una métrica de error es­ta­dí­s­ti­co que se utiliza en pa­r­ti­cu­lar para medir la calidad de las re­gre­sio­nes lineales. En pro­gra­ma­ción en R, puede ca­l­cu­lar­se mediante una simple llamada a una función.

¿Para qué es im­po­r­ta­n­te R cuadrado en R?

R cuadrado es una medida es­ta­dí­s­ti­ca que mide la calidad de ajuste de un modelo de regresión lineal a los datos. Asume valores entre 0 y 1 y es una medida central de la calidad de los modelos de regresión.

Una in­te­r­pre­ta­ción de R cuadrado pro­po­r­cio­na in­fo­r­ma­ción sobre lo cerca que están los datos ob­se­r­va­dos de una línea de regresión calculada. Cuanto mayor sea el valor R cuadrado, mejor explica el modelo los datos. Un valor bajo de R cuadrado indica un mal ajuste del modelo.

Consejo

Con R puedes programar toda una serie de apli­ca­cio­nes. Si deseas alojar alguna de ellas, te hará falta tu propio espacio web. En IONOS puedes disponer de hosting con espacio web ilimitado que se ajusta a tus ne­ce­si­da­des in­di­vi­dua­les gracias a diversas tarifas.

R cuadrado en R con regresión lineal

R cuadrado en R se utiliza a menudo en el contexto de regresión lineal. Dado que R es un lenguaje de pro­gra­ma­ción que se utiliza a menudo en es­ta­dí­s­ti­ca, no es de extrañar que existan varias funciones de R que ayudan a realizar el cálculo:

x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 4, 5)
# Regresión lineal
model <- lm(y ~ x)
R

En el ejemplo de código anterior, primero se crearon dos vectores en R de­no­mi­na­dos x e y, que contienen los conjuntos de datos sobre los que se va a realizar la regresión lineal. En este caso, la variable de­pe­n­die­n­te es la variable y. A co­n­ti­nua­ción se calcula el modelo de regresión mediante la función de R lm() y se guarda en la variable model.

Cómo calcular R cuadrado en R

El valor R cuadrado en R puede ca­l­cu­lar­se uti­li­za­n­do una función. Para ello no es necesario tener co­no­ci­mie­n­tos avanzados de ma­te­má­ti­cas, solo utilizar la función correcta. Es muy fácil incluso si estás aún apre­n­die­n­do a programar.

La función que puede uti­li­zar­se para calcular la medida es­ta­dí­s­ti­ca se denomina summary(). Como su nombre indica, pro­po­r­cio­na un resumen del análisis de regresión, incluido el valor R cuadrado. El siguiente ejemplo de código, que se basa en la regresión lineal ya calculada, muestra la función summary() en acción:

# Recuperar el valor R cuadrado
summary(model)$r.squared
R

Puedes utilizar este código para extraer el valor R cuadrado del modelo de regresión lineal lm_model. El valor de R cuadrado indica qué tan bien el modelo explica la variación en la variable de­pe­n­die­n­te y, basándose en la variable in­de­pe­n­die­n­te x.

En el ejemplo de código anterior, la función summary() se aplica al modelo de regresión ya calculado. Al mismo tiempo, el operador R $ se utiliza para mostrar solo el valor R cuadrado de los valores devueltos por la llamada a la función. En nuestro ejemplo, el valor es 0,6.

Consejo

¿Te gustaría pro­fu­n­di­zar en el mundo del de­sa­rro­llo en R? Nuestros artículos pueden ayudarte:

In­te­r­pre­ta­ción del valor R cuadrado

Una vez de­te­r­mi­na­do el valor R cuadrado, se plantea la cuestión de cómo debe in­te­r­pre­tar­se el resultado. Tiene sentido fijarnos en ciertos in­te­r­va­los que puede asumir el valor. Como ya se ha me­n­cio­na­do, el intervalo de valores del valor R cuadrado se sitúa entre 0 y 1.

  • 0 (sin ajuste): un valor de R cuadrado de 0 significa que el modelo no se ajusta en absoluto a los datos. En este caso, no existe una relación lineal entre las variables ana­li­za­das.
  • 1 (ajuste perfecto): un valor R cuadrado de 1 indica que todas las ob­se­r­va­cio­nes se sitúan pe­r­fe­c­ta­me­n­te en la línea de regresión. Esto es muy inusual y puede indicar un exceso de ajuste.
  • Entre 0,7 y 0,9 (buen ajuste): un valor R cuadrado en este intervalo indica que el modelo tiene una alta pro­ba­bi­li­dad de ser un modelo que describe los datos su­fi­cie­n­te­me­n­te bien.
  • Entre 0,5 y 0,7 (ajuste aceptable): un valor de R cuadrado co­m­pre­n­di­do entre 0,5 y 0,7 es aceptable, pero indica que aún puede mejorarse.
  • Por debajo de 0,5 (mal ajuste): un valor de R cuadrado inferior a 0,5 indica que el modelo calculado no describe con su­fi­cie­n­te precisión los datos su­b­ya­ce­n­tes. En este caso, el modelo debe ajustarse para obtener re­su­l­ta­dos si­g­ni­fi­ca­ti­vos.
Nota

Un valor elevado de R cuadrado no basta por sí solo para juzgar la calidad del modelo. Por lo tanto, al de­te­r­mi­nar la calidad de un modelo de regresión también deben tenerse en cuenta otros factores, como la va­li­da­ción del modelo, el análisis de los residuos y el ajuste a los re­qui­si­tos es­pe­cí­fi­cos de los datos. La función summary() ya mostrada te ofrece otros ratios que puedes utilizar en la eva­lua­ción.

Ir al menú principal