author: I. Bartomeus date: March 2018 autosize: true
- Introducción (yo hablando; 45')
- Programación en R (Nacho) + Visualización de datos (Paco)
- GLM & Modelos mixtos (Paco)
- Multivariante (Nacho) + Modelos nulos (Nacho)
- RMarkdown, git y GitHub + GIS (Paco)
Feedback: Email: [email protected]
- Cursos de R online y libros hay a patadas.
- Aquí venimos a equivocarnos cuanto más mejor
- Resolveremos cuantos más problemas mejor
- Entender las ventajas de usar R (u otros lenguages de programación)
- Que descubráis que con R se puede hacer casi todo (desde esta presentación hasta pedir pizza)
- Saber suficiente R para poder "googlear" lo que necesiteis aprender/resolver a partir de ahora.
- Que le perdais el respeto a R!
- Download R
- R desde Rstudio (download Rstudio)
- Material del curso
- *_apuntes
- StackOverflow
- How do I ask a good question?
- Google (e.g. error message + r)
Baremo del problema:
- consulta (hasta 5 pestañas abiertas)
- problema (hasta 10 pestañas abiertas)
- marrón (> 10 pestañas)
R has simple and obvious appeal. Through R, you can sift through complex data sets, manipulate data through sophisticated modeling functions, and create sleek graphics to represent the numbers, in just a few lines of code...R’s greatest asset is the vibrant ecosystem has developed around it: The R community is constantly adding new packages and features to its already rich function sets.
No siempre. R tiene limitaciones y debilidades:
- Curva de aprendizaje; sintaxis inconsistente
- Documentación fragmentada (?help, vignettes, etc...)
- Calidad de los paquetes varía
- Inicialmente no diseñado para grandes bases de datos
Hay otras herramientas:
- Julia, Python, C++, bash, ...
- Excel? Casi nunca.
It’s important to make a workflow that you can use time and time again, and even pass on to others in such a way that you don’t have to be there to walk them through it. Source
Your closest collaborator is you 6 months ago, and you don't respond to emails. P. Wilson
Interested: read our paper
...Lo que no existe.
- Gozilla se ha comido mi ordenador
- backup
- idealmente de forma continua
- Godzilla se ha comido mi oficina
- cloud
...lo que has perdido. Y si necesitas un archivo que existió hace 1, 10 ó 100 días?
- Incremental backups (mínimo)
- Version control (mejor). Git (y GitHub) es el más popular
- Es una ciencia dinámica.
- Es una ciencia compleja y con diversas filosofías.
- Es una herramienta, no un fin.
- No puede solucionar malos datos (e.g. baja replicación).
- No puede solucionar un mal diseño experimental.
- scripts
- consola
- environment
- files/plots
Directorio tipico:
1-get_data.R
2-process_data.R
3-analyze_data.R
4-make_graphs.R
data/
figures/
Da igual cual sigas, lo importante es tener uno I. Bartomeus
El mio es este
El de google este
- CRAN - The Comprehensive R Archive Network. Ground zero for R.
- GitHub - The GitHub page.
- RStudio - the integrated development environment for R. Makes many things easier.
- Advanced R - the companion website for “Advanced R”, a book in Chapman & Hall’s R Series. Detailed, in depth look at many of the issues covered here.
- CRAN task views resúmenes de tareas (e.g. Bayesiano)
- e.g. Reproducible Research
- RopenScience. Paquetes brutales para hacer ciencia abierta
- Quick-R: Donde yo voy a consultar las recetas (PCA's, glm's, etc...)
- Cursos para empezar: *r for cats *r-bio *datacamp *http://luiscayuela.blogspot.com.es/