Instalación de R y R Studio

Instalar R y R Studio de acuerdo a las siguientes indicaciones: https://posit.co/download/rstudio-desktop/

🧮 Aspectos básicos:

  • Entorno de R Studio:

  • Objetos:

Son las estructuras de datos donde se almacenan valores en R. Pueden ser vectores, listas, matrices, factores, data frames, entre otros. Se crean asignando valores con <- o =.

Ejemplo:

x=100
z=200
y=x+z
y
x=100
z=200
y=x+z
y
## [1] 300
  • Funciones: Son bloques de código reutilizables que realizan tareas específicas. Pueden ser funciones predefinidas o personalizadas por el usuario.

Ejemplo:

suma <- function(a, b) {
  return(a + b)
}
suma(3, 5)  # Devuelve 8
suma <- function(a, b) {
  return(a + b)
}
suma(3, 5)  # Devuelve 8
## [1] 8

Lista de funciones básicas en R

c() → Crea un vector

x=c(1,2,3,4)
x
x=c(1,2,3,4)
x
## [1] 1 2 3 4

length() → Devuelve la longitud de un vector

length(x)
length(x)
## [1] 4

sum() → Suma los elementos de un vector

sum(x)
sum(x)
## [1] 10

mean() → Calcula la media

mean(x)
mean(x)
## [1] 2.5

median() → Calcula la mediana

median(x)
median(x)
## [1] 2.5

sd() → Calcula la desviación estándar

sd(x)
sd(x)
## [1] 1.290994

sqrt() → Raíz cuadrada

sqrt(x)
sqrt(x)
## [1] 1.000000 1.414214 1.732051 2.000000

round() → Redondeo

round(x)
round(x)
## [1] 1 2 3 4
  • Paquetes: Son colecciones de funciones, datos y documentación que amplían las capacidades de R. Se instalan con install.packages(“nombre_del_paquete”) y se cargan con library(nombre_del_paquete).

Por ejemplo, el paquete ggplot2 sirve para la creación de gráficos.

install.packages("ggplot2")
library(ggplot2)

A lo largo del curso aprenderemos distintos paquetes, te recomendamos aprender para que sirve cada uno y cuando se sugiere emplearlos.

  • Bases de datos: Son estructuras de datos tabulares similares a las hojas de cálculo, donde cada columna es un vector del mismo tamaño pero puede contener distintos tipos de datos. Se crean con data.frame().
datos <- data.frame(
  Nombre = c("Ana", "Luis", "Carlos"),
  Edad = c(25, 30, 28),
  Ciudad = c("Madrid", "Barcelona", "Valencia")
)
datos <- data.frame(
  Nombre = c("Ana", "Luis", "Carlos"),
  Edad = c(25, 30, 28),
  Ciudad = c("Arequipa", "Loreto", "Tacna")
)
datos
##   Nombre Edad   Ciudad
## 1    Ana   25 Arequipa
## 2   Luis   30   Loreto
## 3 Carlos   28    Tacna

Abrir una base de datos desde el archivo

library(rio)
felicidad=import("felicidad.xlsx")
library(rio)
felicidad=import("felicidad.xlsx")

Comandos básicos para explorar una base de datos

names() → Muestra los nombres de las variables del Data Frame

names(felicidad)
names(felicidad)
## [1] "Country"             "Indice_de_felicidad" "Continente"

head() → Muestra las primeras filas

head(felicidad)
head(felicidad)
##       Country Indice_de_felicidad    Continente
## 1     Finland               7.736        Europe
## 2     Denmark               7.521        Europe
## 3     Iceland               7.515        Europe
## 4      Sweden               7.345        Europe
## 5 Netherlands               7.306        Europe
## 6  Costa Rica               7.274 North America

tail() → Muestra las últimas filas

tail(felicidad)
tail(felicidad)
##          Country Indice_de_felicidad Continente
## 142     Botswana               3.438     Africa
## 143     Zimbabwe               3.396     Africa
## 144       Malawi               3.260     Africa
## 145      Lebanon               3.188       Asia
## 146 Sierra Leone               2.998     Africa
## 147  Afghanistan               1.364       Asia

str() → Muestra la estructura del Data Frame

str(felicidad)
str(felicidad)
## 'data.frame':    147 obs. of  3 variables:
##  $ Country            : chr  "Finland" "Denmark" "Iceland" "Sweden" ...
##  $ Indice_de_felicidad: num  7.74 7.52 7.51 7.34 7.31 ...
##  $ Continente         : chr  "Europe" "Europe" "Europe" "Europe" ...

summary() → Muestra la estructura del Data Frame

summary(felicidad)
summary(felicidad)
##    Country          Indice_de_felicidad  Continente       
##  Length:147         Min.   :1.364       Length:147        
##  Class :character   1st Qu.:4.702       Class :character  
##  Mode  :character   Median :5.868       Mode  :character  
##                     Mean   :5.578                         
##                     3rd Qu.:6.479                         
##                     Max.   :7.736

max() → Muestra el máximo valor de una variable de una Data Frame

max(felicidad$Indice_de_felicidad, na.rm = TRUE)
max(felicidad$Indice_de_felicidad, na.rm = TRUE)
## [1] 7.736

which.maxx() → Muestra cual es el máximo valor de una variable de una Data Frame

which.max(felicidad$Indice_de_felicidad)

Funciones de ayuda

help() → Muestra la documentación de una función

help(mean)

ls() → Lista los objetos en el entorno

ls()

rm() → Elimina un objeto

rm()

📂 Materiales de consulta: