Artículo de  datadata

R es un lenguaje de programación y un entorno de cómputo estadístico que facilita el análisis de datos y la creación de gráficos. Es un software libre y de código abierto, lo que significa que su código es accesible para inspección y modificación por parte de la comunidad. Esto promueve la innovación y el desarrollo constante de nuevas funcionalidades.

Cuando instalamos R, obtenemos la base del lenguaje, pero gran parte de la funcionalidad adicional proviene de paquetes desarrollados por la comunidad. Los paquetes son colecciones de funciones y datos documentados que extienden las capacidades básicas de R. Actualmente, en el repositorio CRAN (Comprehensive R Archive Network) hay más de 10,000 paquetes disponibles para diferentes tipos de análisis y visualización.

👇👇👇

¿Quiénes usan R?

R es utilizado por una amplia variedad de profesionales y sectores debido a su capacidad de análisis avanzado y su versatilidad. Algunos de los principales usuarios incluyen:

  • Facebook: Usa R para analizar la manera en que los usuarios interactúan con sus publicaciones y para optimizar la publicidad. También lo emplea en su división de recursos humanos para estudiar la interacción entre empleados.
  • Google: Aplica R para evaluar la efectividad de sus campañas publicitarias y realizar predicciones económicas.
  • Microsoft: Ha desarrollado su propia versión de R, llamada OpenR, utilizada en análisis estadísticos, incluyendo el emparejamiento de jugadores en Xbox Live.
  • Empresas financieras y de tecnología: Compañías como American Express, IBM, Citibank, HP y Roche emplean R en análisis de riesgos, investigación de mercado y optimización de operaciones.
  • Investigadores académicos y científicos de datos: Utilizan R para modelado predictivo, visualización de datos y análisis estadísticos avanzados.
  • Gobiernos e instituciones públicas: Aplican R en estudios económicos, políticas públicas y análisis de datos masivos.

¿Cómo iniciar con R?

Para comenzar a utilizar R, es necesario instalar tanto el lenguaje R como un entorno de desarrollo integrado (IDE) que facilite la escritura y ejecución de código.

  1. Instalar R: Puedes descargar la última versión de R desde el sitio oficial de CRAN: https://cran.r-project.org/

 

  1. Instalar RStudio: Aunque R puede ejecutarse desde la consola, se recomienda utilizar RStudio, un entorno más amigable y potente: https://posit.co/download/rstudio-desktop/

 

  1. Instalar paquetes: Una vez instalado R y RStudio, puedes instalar paquetes adicionales para ampliar sus capacidades. Para ello, ejecuta en la consola:

 

install.packages("nombre_del_paquete")

 

¿Qué paquetes debería descargar?

Uno de los ecosistemas más importantes dentro de R es tidyverse, una colección de paquetes diseñados para facilitar la manipulación, transformación, visualización y modelado de datos de manera eficiente. Dentro de tidyverse, los ocho paquetes principales son:

  • ggplot2: Permite crear visualizaciones de alta calidad y altamente personalizables utilizando una sintaxis basada en la gramática de los gráficos.
  • dplyr: Facilita la manipulación de datos con funciones intuitivas para filtrar, seleccionar, agrupar y resumir datos de manera eficiente.
  • tidyr: Ayuda a estructurar los datos en un formato ordenado, facilitando su manipulación y análisis.
  • readr: Proporciona funciones rápidas y eficientes para la importación de datos en formato CSV y otros archivos de texto.
  • purrr: Extiende las capacidades funcionales de R permitiendo aplicar funciones a estructuras de datos de manera elegante y eficiente.
  • tibble: Una versión mejorada de los data frames base de R, con mejor impresión y funcionalidades adicionales.
  • stringr: Proporciona funciones intuitivas para la manipulación de cadenas de texto.
  • forcats: Facilita el manejo de factores en R, permitiendo ordenarlos y transformarlos de manera eficiente.

 

Estos paquetes trabajan de manera integrada y siguen una filosofía coherente de código limpio y fácil de leer.

 

Instalación de tidyverse:

          

¿Por qué usar R?

  • Multiplataforma: Funciona en casi todos los sistemas operativos (Windows, Mac, Linux) e incluso en plataformas como PlayStation 3.
  • Código abierto: La transparencia y la posibilidad de inspeccionar y modificar el código facilitan la personalización y adaptación a necesidades específicas.
  • Comunidad activa: La comunidad de R es una de las más activas en el mundo de la programación, con contribuciones constantes de paquetes y soluciones para nuevas necesidades.
  • Capacidades gráficas avanzadas: R permite crear gráficos de alta calidad para explorar y presentar datos de manera efectiva.
  • Integración: R se puede combinar fácilmente con otros lenguajes de programación (como Python) y herramientas (como Power BI y bases de datos SQL).
  • Promueve la investigación reproducible: Los análisis realizados en R son fácilmente documentables y reproducibles gracias al uso de scripts y herramientas como RMarkdown y knitr.

 

R en Power BI

El lenguaje R se puede integrar con Power BI mediante scripts, desde la importación de datos, transformación y creación de objetos visuales.

Para comenzar a utilizar scripts de R en Power BI es necesario tener R instalado. Después de instalar R, Power BI Desktop lo habilita de forma automática. Para comprobar que Power BI Desktop ha habilitado R en la ubicación correcta, dirígete a la pestaña “Archivo”>” Opciones y configuración”>”Opciones”>”Script de R”:

Importación de datos

A través del script de R en Power BI, se pueden cargar datos desde múltiples fuentes como archivos CSV, Excel, bases de datos SQL, API y servicios web. Además, R permite realizar preprocesamiento antes de importar los datos al modelo de Power BI.

Transformación de datos

Dentro del Editor de Power Query, se pueden ejecutar scripts de R para realizar operaciones complejas como limpieza de datos, imputación de valores faltantes, normalización y transformación de variables

 

 

Creación de objetos visuales

Power BI permite integrar gráficos creados en R mediante el objeto visual de R. Con librerías como ggplot2, plotly y shiny, se pueden generar gráficos personalizados y visualizaciones interactivas que complementan las capacidades nativas de Power BI.

R se ha consolidado como una herramienta poderosa para el análisis de datos, especialmente en el ámbito de las bases de datos y la ciencia de datos. Su capacidad para realizar análisis complejos, crear gráficos avanzados y automatizar procesos lo convierte en una opción ideal para analistas y científicos de datos. Además, su naturaleza de código abierto y su comunidad activa aseguran que R continúe evolucionando y adaptándose a las nuevas necesidades del mundo del análisis de datos.

Síguenos en @datdata para aprender más.

 
 
Ver esta publicación en Instagram

Una publicación compartida por datdata | Power BI (@datdata)

 


 👉 También te recomendamos nuestros artículos de Power Query vs Power Pivot y Prepara tu LinkedIn para conseguir trabajo en análisis de datos 

🖱️ Visita nuestro  canal de YouTube para aprender Power BI, y síguenos en Instagram , Linkedin y Facebook  para aprender en tus tiempos libres.               

Te vemos en otro artículo 💪