Presentadoras: Roxana Noelia Villafañe, Ana Laura Diedrichs y Patricia Loto.
🗓️ Jueves 24 de septiembre del 2020
⏰ Horario a definir (por la Tarde)
🤖 https://ml-tidy-wibds.netlify.app/
🌎 Primer Congreso de Mujeres en Bionformática y Ciencia de Datos en Latinoamérica
La modelización de datos en estos últimos años ha despertado una gran atención debido al acceso a datos no antes visto. Esto trae aparejado el interés creciente de aprender herramientas útiles que permitan realizar análisis de manera simple, eficaz y reproducible. Tidymodels es un conjunto de paquetes dedicado a aprendizaje automático, que proporciona una gramática para modelado de datos y se incorpora sin problemas con los demás paquetes de tidyverse. Este workshop es una introducción al aprendizaje automático y a los paquetes de tidymodels. Nos centraremos en aprender a entrenar y evaluar modelos modelos de machine learning.
- Tienes conocimientos básicos del lenguaje R y la IDE de Rstudio.
- Quieres aprender especificamente sobre modelado de datos utilizando el conjunto de paquetes comprendidos en Tidymodels.
- Tienes conocimientos básicos de ggplot2.
- Tienes un manejo básico de tidyverse.
- Quieres conocer cuáles son los modelos más comúnmente utilizados y cómo implementarlos con tidymodels.
Si crees que debes reforzar algún punto de los enunciados anteriormente, podes practicar con los primers de Rstudio.
Los estudiantes aprenderan a entrenar, supervisar y generar predicciones con modelos de Machine Learning con los paquetes de Tidymodels.
Gracias por inscribirte a este workshop, en el mismo trabajaremos con la versión más reciente de R y Rstudio, por lo que, para aprovecharlo deberás traer una pc portátil con lo siguiente instalado:
Instalación de R and RStudio
-
Una versión reciente de R (>=3.6.4) disponible de manera gratuita para su descarga en CRAN.
-
Una versión reciente de Rstudio Desktop (>= 1.3.959) disponible de manera gratuita para su descarga en Rstudio.
En ambos casos, ten en cuenta cuál es el Sistema Operativo que utilizas y la versión del mismo (32 o 64 bits) para descargar la versión correcta tanto de R como de Rstudio.
- Los paquetes que utilizaremos pueden instalarse, abriendo Rstudio y ejecutando las siguientes sentencias:
mis_paquetes <- c("tidyverse", "tidymodels","devtools", "datos", "kknn", "rpart", "rpart.plot", "rattle", "AmesHousing", "ranger", "partykit", "vip")
install.packages(mis_paquetes, repos = "http://cran.rstudio.com")
Para poder instalar de manera exitosa los paquetes, es necesario que estés conectado a Internet.
¿Cómo verifico que los paquetes se instalaron correctamente?
Para verificar que los paquetes se cargaron correctamente, por favor ejecutá las sentencias que están a continuación:
easypackages::libraries("tidyverse", "tidymodels","devtools", "datos", "kknn", "rpart", "rattle", "AmesHousing", "ranger", "partykit", "vip")
Tanto la presentación como los archivos rmarkdown se encuentran en la carpeta Material.
Para la elaboración tanto del material teórico como de los ejercicios prácticos se utilizaron como referencia, los libros descriptos a continuación:
-
Página oficial del proyecto Tidymodels de Rstudio
-
Introduction to ML con Tidymodels de Allison Hill en la rstudio::conf 2020
-
Tutoriales de Max Kuhn en la rstudio::conf 2017-2020- Repositorio
-
Canal de Youtube de Julia Silge y el código en su blog personal
-
Three reasons to use Tidymodels por Julia Silge en Youtube
-
Free book Hands on Machine Learning with R
-
Max Kuhn & Johnson Kjell. Feature Engineering
-
Max Kuhn & Johnson Kjell. Applied Predictive Modeling
-
CME 106 - Introduction to Probability and Statistics for Engineers