Variable

En estadística, una variable es cualquier característica, propiedad o atributo que puede tomar diferentes valores. Estos valores pueden ser numéricos o categóricos dependiendo del tipo de variable.

Tipos de variables

Varibles categóricas o cualitativas:

Son aquellas que expresan cualidades, atributos o categorías sin un valor numérico asociado.

Tipos de variables categóricas o cualitativas:

✅ Nominales: No tienen un orden específico.

Ejemplo: Color de ojos (azul, verde, marrón), estado civil (soltero, casado, divorciado).

✅ Ordinales: Poseen un orden lógico, pero la diferencia entre categorías no es cuantificable.

Ejemplo: Nivel de educación (básico, medio, superior), nivel de satisfacción (bajo, medio, alto).

Varibles numéricas o cuantitativas

Son aquellas que representan cantidades y pueden medirse numéricamente.

Tipos de variables numéricas o cuantitativas:

✅ Discretas: Toman valores enteros y no admiten valores intermedios.

Ejemplo: Número de hijos en una familia (0, 1, 2, 3, …), cantidad de autos en un estacionamiento. ✅ Continuas: Pueden tomar valores dentro de un rango infinito, incluyendo decimales.

Ejemplo: Peso de una persona (65.7 kg, 70.2 kg, etc.), temperatura de una ciudad (20.5°C, 23.1°C).

Ejercicio 1

La base de datos “Felicidad” (World Happiness Report) contiene información sobre los niveles de felicidad en diferentes países, basada en diversas variables.

Analiza los tipos de variables que se encuentran en la base de datos “Felicidad”. Clasifícalas en cualitativas o cuantitativas y justifica tu respuesta.

Explora las variables

library(rio)
felicidad=import("felicidad.xlsx")

library(rio)
felicidad=import("felicidad.xlsx")

Reto - Nivel 1

Resume la cantidad de países por continente

# Calcular la cantidad de países por continente
library(tidyverse)
conteo_continente <- felicidad %>%
  group_by(Continente) %>%
  summarise(Cantidad = n()) %>%
  arrange(desc(Cantidad))

# Calcular la cantidad de países por continente
library(tidyverse)
conteo_continente <- felicidad %>%
  group_by(Continente) %>%
  summarise(Cantidad = n()) %>%
  arrange(desc(Cantidad))
conteo_continente

## # A tibble: 6 × 2
##   Continente    Cantidad
##   <chr>            <int>
## 1 Africa              41
## 2 Asia                41
## 3 Europe              40
## 4 South America       12
## 5 North America       11
## 6 Oceania              2

library(ggplot2)
ggplot(conteo_continente, aes(x = Continente, y = Cantidad, fill = Continente)) +
  geom_bar(stat = "identity", show.legend = FALSE) +
  scale_fill_brewer(palette = "Set2") +  # Colores atractivos
  labs(title = "Cantidad de Países por Continente", x = "Continente", y = "Número de Países") +
  theme_minimal() + 
  theme(plot.title = element_text(hjust=0.5, face="bold", size=14))

library(ggplot2)
ggplot(conteo_continente, aes(x = Continente, y = Cantidad, fill = Continente)) +
  geom_bar(stat = "identity", show.legend = FALSE) +
  scale_fill_brewer(palette = "Set2") +  # Colores atractivos
  labs(title = "Cantidad de Países por Continente", x = "Continente", y = "Número de Países") +
  theme_minimal() + 
  theme(plot.title = element_text(hjust=0.5, face="bold", size=14))

Resume el índice de felicidad.

summary(felicidad$Indice_de_felicidad)

summary(felicidad$Indice_de_felicidad)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.364   4.702   5.868   5.578   6.479   7.736

library(ggplot2)
ggplot(felicidad, aes(x=Indice_de_felicidad)) +
  geom_histogram(binwidth=0.5, fill="skyblue", color="black") +
  labs(title="Histograma de Felicidad", x="Puntuación de Felicidad", y="Frecuencia") +
  theme_minimal()

library(ggplot2)
ggplot(felicidad, aes(x=Indice_de_felicidad)) +
  geom_histogram(binwidth=0.5, fill="skyblue", color="black") +
  labs(title="Histograma de Felicidad", x="Puntuación de Felicidad", y="Frecuencia") +
  theme_minimal()

library(ggplot2)
ggplot(felicidad, aes(x=Indice_de_felicidad, fill=..count..)) +
  geom_histogram(binwidth=0.5, color="black") +
  scale_fill_gradient(low="blue", high="red") +
  labs(title="Histograma de Felicidad con Colores", x="Puntuación de Felicidad", y="Frecuencia") +
  theme_classic() +
  theme(plot.title = element_text(hjust = 0.5, face="bold", size=14),
        axis.title = element_text(face="bold"),
        legend.position = "none")  # Ocultar leyenda para estética

ggplot(felicidad, aes(x=Indice_de_felicidad, fill=..count..)) +
  geom_histogram(binwidth=0.5, color="black") +
  scale_fill_gradient(low="blue", high="red") +
  labs(title="Histograma de Felicidad con Colores", x="Puntuación de Felicidad", y="Frecuencia") +
  theme_classic() +
  theme(plot.title = element_text(hjust = 0.5, face="bold", size=14),
        axis.title = element_text(face="bold"),
        legend.position = "none")  # Ocultar leyenda para estética

Reto - Nivel 2

Crea una variable ordinal a partir de su puntaje de felicidad.

felicidad <- felicidad %>%
  mutate(Grados_felicidad = cut(Indice_de_felicidad, 
                             breaks = c(1, 3, 5, 7, 10),  # Definir los cortes
                             labels = c("Bajo", "Medio-Bajo", "Medio-Alto", "Alto"), 
                             ordered_result = TRUE))  # Variable ordinal

felicidad <- felicidad %>%
  mutate(Grados_felicidad = cut(Indice_de_felicidad, 
                             breaks = c(1, 3, 5, 7, 10),  # Definir los cortes
                             labels = c("Bajo", "Medio-Bajo", "Medio-Alto", "Alto"), 
                             ordered_result = TRUE))  # Variable ordinal

# Crear una tabla de frecuencia
tabla_frecuencia <- felicidad %>%
  count(Grados_felicidad) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 1))
tabla_frecuencia

# Crear una tabla de frecuencia
tabla_frecuencia <- felicidad %>%
  count(Grados_felicidad) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 1))
tabla_frecuencia

##   Grados_felicidad  n Porcentaje
## 1             Bajo  2        1.4
## 2       Medio-Bajo 45       30.6
## 3       Medio-Alto 91       61.9
## 4             Alto  9        6.1

Reto - Nivel 3

Elegir una variable categórica y otra numérica (la numérica puede ser una escala likert de 1 a 7) del Barómetro de las Américas 2023. Recuerda revisar el cuestionario.

https://www.vanderbilt.edu/lapop/peru.php

📂 Materiales de consulta:

📜 Cuestionario LAPOP
🎥 Ver Video

Semana 1 - Sesión Teórica