Skip to content

Latest commit

 

History

History
189 lines (126 loc) · 6.06 KB

intro.md

File metadata and controls

189 lines (126 loc) · 6.06 KB

R Intro

author: I. Bartomeus date: March 2018 autosize: true

Como serán los siguientes 5 días de vuestra vida?

  • Introducción (yo hablando; 45')
  • Programación en R (Nacho) + Visualización de datos (Paco)
  • GLM & Modelos mixtos (Paco)
  • Multivariante (Nacho) + Modelos nulos (Nacho)
  • RMarkdown, git y GitHub + GIS (Paco)

Feedback: Email: [email protected]

Twitter @ibartomeus

Cómo se estructuran las clases

  • Cursos de R online y libros hay a patadas.
  • Aquí venimos a equivocarnos cuanto más mejor
  • Resolveremos cuantos más problemas mejor

Objetivos

  • Entender las ventajas de usar R (u otros lenguages de programación)
  • Que descubráis que con R se puede hacer casi todo (desde esta presentación hasta pedir pizza)
  • Saber suficiente R para poder "googlear" lo que necesiteis aprender/resolver a partir de ahora.
  • Que le perdais el respeto a R!

Los Básicos

Y si no sé algo? Uso de Stackoverflow.

Baremo del problema:

  • consulta (hasta 5 pestañas abiertas)
  • problema (hasta 10 pestañas abiertas)
  • marrón (> 10 pestañas)

Por qué R?

R has simple and obvious appeal. Through R, you can sift through complex data sets, manipulate data through sophisticated modeling functions, and create sleek graphics to represent the numbers, in just a few lines of code...R’s greatest asset is the vibrant ecosystem has developed around it: The R community is constantly adding new packages and features to its already rich function sets.

-- The 9 Best Languages For Crunching Data

Seguro que R es la herramienta adecuada?

No siempre. R tiene limitaciones y debilidades:

  • Curva de aprendizaje; sintaxis inconsistente
  • Documentación fragmentada (?help, vignettes, etc...)
  • Calidad de los paquetes varía
  • Inicialmente no diseñado para grandes bases de datos

Hay otras herramientas:

  • Julia, Python, C++, bash, ...
  • Excel? Casi nunca.

La verdadera ventaja de usar R: Reproducibilidad

It’s important to make a workflow that you can use time and time again, and even pass on to others in such a way that you don’t have to be there to walk them through it. Source

Your closest collaborator is you 6 months ago, and you don't respond to emails. P. Wilson

Interested: read our paper

No puedes reproducir

...Lo que no existe.

  • Gozilla se ha comido mi ordenador
    • backup
    • idealmente de forma continua
  • Godzilla se ha comido mi oficina
    • cloud

No puedes reproducir

...lo que has perdido. Y si necesitas un archivo que existió hace 1, 10 ó 100 días?

  • Incremental backups (mínimo)
  • Version control (mejor). Git (y GitHub) es el más popular

Estadística

  • Es una ciencia dinámica.
  • Es una ciencia compleja y con diversas filosofías.
  • Es una herramienta, no un fin.
  • No puede solucionar malos datos (e.g. baja replicación).
  • No puede solucionar un mal diseño experimental.

Abrir R studio

  • scripts
  • consola
  • environment
  • files/plots

Trabajando con proyectos.

Directorio tipico:

1-get_data.R
2-process_data.R
3-analyze_data.R
4-make_graphs.R
data/
figures/

Guias de estilo

Da igual cual sigas, lo importante es tener uno I. Bartomeus

El mio es este

El de google este

Resources

  • CRAN - The Comprehensive R Archive Network. Ground zero for R.
  • GitHub - The GitHub page.
  • RStudio - the integrated development environment for R. Makes many things easier.
  • Advanced R - the companion website for “Advanced R”, a book in Chapman & Hall’s R Series. Detailed, in depth look at many of the issues covered here.

Resources

Resources

Más?

y el grupo de usuarios de R de Sevilla