-
Notifications
You must be signed in to change notification settings - Fork 2
/
Copy pathindex.Rmd
344 lines (249 loc) · 27 KB
/
index.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
---
title: "Curso básico de introdução à linguagem R"
subtitle: "Disciplina BOT89 - PPGBOT INPA"
author: "Alberto Vicentini e Ricardo de Oliveira Perdiz"
date: "Última atualização: `r Sys.Date()`"
site: bookdown::bookdown_site
knit: bookdown::render_book
documentclass: krantz
# documentclass: book
bibliography: bot89-introR.bib
biblio-style: apalike
link-citations: true
links-as-notes: true
colorlinks: true
always_allow_html: true
lot: yes
lof: yes
fontsize: 12pt
lang: pt-br
url: 'https\://intror.netlify.app/'
github-repo: LABOTAM/IntroR
description: "Este livro é um guia básico para conhecer a sintaxe básica da linguagem de programação R e o potencial de utilizá-la como ferramenta científica."
---
```{r, setup, include = FALSE}
knitr::opts_template$set(evalF = list(echo = TRUE,
eval = FALSE))
knitr::opts_template$set(executa = list(echo = FALSE,
eval = TRUE))
knitr::opts_template$set(executa_mostra = list(echo = TRUE,
eval = TRUE))
options(knitr.duplicate.label = "allow")
options(
knitr.table.format = function() {
if (knitr::is_latex_output()) {
"latex"
} else if (knitr::is_html_output()) {
"html"
} else {
"pipe"
}
}
)
```
```{r load_packages, eval = TRUE, include = FALSE, echo = FALSE, message = FALSE}
description <- readr::read_lines("DESCRIPTION")
libs <- unlist(stringr::str_split(gsub("Imports: ", "", grep("Imports: ", description, value = TRUE)), ", "))
sapply(libs, library, logical.return = T, character.only = T)
```
```{r build-pkg-bib, eval = TRUE, include = FALSE, echo = FALSE, message = FALSE}
knitr::write_bib(
c(.packages(), "readxl", "data.table", "rgdal", "taxize", "lattice"),
'pkg-bib.bib')
```
```{r compila-readme, eval = FALSE, include = FALSE, echo = FALSE, message = FALSE}
rmarkdown::render("README.Rmd", output_format = "md_document", encoding = 'UTF-8')
```
```{r converte-rmd-r, eval = TRUE, include = FALSE, echo = FALSE, message = FALSE}
capitulos <- list.files(pattern = "^[0-9]")
capitulos_out <- gsub("\\.Rmd", ".R", capitulos)
capitulosR_output_names <- paste0("codigo/", capitulos_out)
purrr::walk2(
capitulos,
capitulosR_output_names,
~knitr::purl(.x, output = .y, documentation = 2)
)
```
# Prefácio {-}
Este livro foi criado inicialmente para servir como um material de apoio básico aos estudantes da disciplina Preparação de dados para Análises Estatísticas - Introdução ao R (BOT-89) do [Programa de Pós-Graduação em Ciências Biológicas (Botânica)](http://www.portais.atrio.scire.net.br/inpa-ppgbot/index.php/pt/) do INPA, ofertada desde o ano de 2011.
Inicialmente, a disciplina consistiu de uma modificação da documentação do curso de [Introdução à Linguagem R](http://ecor.ib.usp.br/doku.php) oferecida pelo [Programa de Pós-graduação em Ecologia](https://posecologia.ib.usp.br/) do Instituto de Biociências da Universidade de São Paulo, atualmente ministrada pelo professor Dr. [Alexandre Adalardo de Oliveira](http://labtrop.ib.usp.br/), e que contem aulas de autoria dos professores Drs. A. A. de Oliveira, [João Luís Ferreira Batista](http://cmq.esalq.usp.br/), [Paulo Inácio K. L. Prado](http://ecologia.ib.usp.br/let/doku.php?id=prado:start), e Rodrigo Augusto Santinelo Pereira [@Batista2009].
Como exemplo, parte dos dados (dados de [avistamento de aves no Cerrado](https://github.com/LABOTAM/IntroR/blob/main/dados/aves_cerrado.csv) e [Levantamento em Caixetais](https://github.com/LABOTAM/IntroR/blob/main/dados/caixeta.csv)) utilizados em nossas aulas são originários desta disciplina da Ecologia da USP.
Modificações nessa estrutura foram feitas por Alberto Vicentini ao longo dos últimos 10 anos em disciplinas anuais ofertadas no Programa de pós-graduação em Ciências Biológicas (Botânica) do Instituto Nacional de Pesquisas da Amazônia (INPA).
Ricardo Perdiz transpôs as aulas originais formatadas em `dokuwiki` para o formato [Rmarkdown](https://rmarkdown.rstudio.com/).
Também fez correções e acrescentou (poucos) novos conteúdos.
Nossa meta é prover uma introdução básica da linguagem de programação R, que é extremamente poderosa para manipulação de dados, análises estatísticas, produção de gráficos e de documentos dinâmicos, e cujo domínio oferece um grande ganho de produtividade a todo cientista e facilita o entendimento de métodos analíticos.
Ressaltamos que **isto não é um curso de estatística**.
## Estrutura do livro {-}
```{block2, type = "rmdwarning"}
Este livro está em constante atualização. Você pode encontrar os arquivos de Rmarkdown que geraram este livro neste endereço:
<https://github.com/LABOTAM/IntroR/tree/main>. Se você tiver alguma contribuição a fazer, seja na forma de correções, críticas, ou o desejo de contribuir ativamente com o projeto, sinta-se à vontade para abrir um problema no repositório do livro: <https://github.com/LABOTAM/IntroR/issues>. Grato!
```
O livro está dividido em três partes.
A primeira parte contem 10 capítulos e aborda os ensinamentos básicos para o usuário aprender a usar a linguagem como uma ferramenta científica.
* **Capítulo \@ref(intro)** aborda os aspectos básicos da linguagem R, o software que utilizamos para usar a linguagem, pacotes com funções, como solicitar ajuda sobre funções, dicas de organização das pastas, e o R como uma calculadora.
* **Capítulo \@ref(vetores)** aborda a criação, indexação, e operações matemáticas com vetores no R.
* **Capítulo \@ref(mat-dframe)** aborda a criação, indexação, filtragem, importação e exportação de matrizes e data.frames.
* **Capítulo \@ref(lista-objcompl)** ensina a criar, indexar, e filtrar listas e objetos complexos.
* **Capítulo \@ref(func-graf)** aborda as funções gráficas do pacote `base` do R.
* **Capítulo \@ref(iter-cflux)** aborda dois conceitos chave em qualquer linguagem de programação: iteração e controles de fluxo.
* **Capítulo \@ref(sumar-dados)** abrange o tópico de sumarização de dados, explicando tabelas de contagem, tabelas dinâmicas e junção de tabelas.<!-- NOTA! Junção de tabelas não parece se encaixar aqui, hein, Beto? -->
* **Capítulo \@ref(manip-txt-arq-pasta)** ensina ferramentas básicas para a manipulação de textos, arquivos e pastas.
* **Capítulo \@ref(amost-aleat)** ensina de maneira breve funções para amostragens aleatórias e distribuições de valores.
* **Capítulo \@ref(extr-dados)** abrange o uso de funções customizadas para extração de variáveis morfológicas de notas de texto obtidas de espécimes de plantas.
A segunda parte contem tutoriais curtos de análise exploratória de dado (AED).
A AED **deve ser iniciada ainda durante a coleta de dados**, pois através dela podemos conhecer nossos dados e acompanhar como estamos coletando esses dados.
AED baseia-se largamente em técnicas visuais (gráficos) e pode levar entre 20 a 50% do tempo das análises.
Os capítulos abaixo exemplificam algumas ferramentas do R para fazer AED:
* **Capítulo \@ref(aed-checa-dados)** aborda a checagem inicial dos dados.
* **Capítulo \@ref(aed-univar)** aborda a AED em dados univariados.
* **Capítulo \@ref(aed-bivar)** aborda a AED em dados biivariados.
* **Capítulo \@ref(aed-multivar)** aborda a AED em dados multivariados.
Por fim, temos o apêndice contendo materiais suplementares:
* **Apêndice \@ref(base-tidyverse)** inclui uma discussão breve sobre o universo de pacotes conhecidos como [Tidyverse](https://www.tidyverse.org/), comparando-os com o pacote `base` do R.
* **Apêndice \@ref(unzip)** apresenta um tutorial para baixar e descomprimir arquivos `.zip` dentro R.
* **Apêndice \@ref(videos)** apresenta uma lista de vídeos gravados por nós, autores, abordando diversos tópicos deste livro e que podem auxiliar o aprendizado da linguagem.
* **Apêndice \@ref(chernoff)** apresenta um código para gerar as [caras de Chernoff](http://www.fics.edu.br/index.php/augusto_guzzo/article/view/67/78), que é uma maneira divertida de aprender a lidar com dados multivariados.
<!-- Outra maneira é usar a opção de editar os arquivos fonte diretamente no GitHub, acessando o botão **Edit** disponível na versão digital do livro. -->
<!-- Ao optar por esse caminho, você será levado à página do código fonte e poderá editar o arquivo diretamente no GitHub. -->
<!-- Após as modificações, você terá a possibilidade de gerar um **[Pull request](https://docs.github.com/pt/github/collaborating-with-issues-and-pull-requests/about-pull-requests)** que será analisado por nós. -->
<!-- Caso aceitemos a modificação proposta, seu nome será incluído entre os contribuidores do livro. -->
## Agradecimentos {-}
Agradecemos aos Drs. Alexandre Oliveira, João Luís Ferreira Batista, Paulo Inácio K. L. Prado, e Rodrigo Augusto Santinelo Pereira, por permitirem o uso de conteúdo parcial da disciplina introdutória ministrada por eles na USP como base para a criação deste livro.
## Pré-requisitos {-}
Devido ao modo como foi construído, este livro pode ser tanto lido quanto "executado", uma vez que seus arquivos são o que chamamos de *Rmarkdown*, uma linguagem que mistura texto com código.
Sendo assim, o livro pode ser visualizado em computadores, em celulares modernos, e em *tablets*.
Não é necessário ter um computador próprio, apesar de que possuir um facilita o aprendizado.
Entendemos que nosso país ainda carece de muito investimento na melhora da qualidade de vida da população em geral, o que inclui acesso facilitado aos bens de informática.
Desta forma, providenciamos duas maneiras de o leitor deste livro fazer bem uso das informações aqui contidas.
## Caso você possua um computador {-}
### Instale o R {-}
Baixe e instale o [R](https://www.r-project.org/), próprio para o seu sistema operacional.
### Instale um ambiente de desenvolvimento integrado - IDE {-}
Recomendamos que o software [RStudio](https://www.rstudio.com/products/rstudio/download/) seja instalado no seu computador, pois ele foi criado facilitar a interação do usuário com os múltiplos recursos oferecidos pela linguagem, em especial os inúmeros pacotes desenvolvidos por funcionários desta empresa, entre os quais se inclui o pacote [bookdown](https://github.com/rstudio/bookdown), utilizado para construir este livro online.
Ademais, ambientes de desenvolvimento integrado (do inglês *Integrated Development Environment*, **IDE**) como este software têm o objetivo de prover ao usuário mais ferramentas na interação entre o código e o resultado da execução do código, além de facilitar o uso de ferramentas alternativas para construção de texto mesclado com códigos (e.g., LaTeX, Markdown etc), o que permite uma dinamicidade na construção de textos acadêmicos.
Existem outras alternativas de software, tais como o [Atom](https://atom.io/) e o [Visual Studio Code](https://code.visualstudio.com/). Fique à vontade para escolher.
### Baixe os pacotes abaixo {-}
Serão necessários o uso de alguns pacotes de R (veja seção \@ref(base-pacotes) para entender o que são pacotes de R) para poder fazer uso tanto do repositório localmente quanto fazer uso das próprias aulas.
Então, rode o comando abaixo para instalar esses pacotes em seu computador:
```{r, eval = FALSE}
install.packages(c('rmarkdown', 'bookdown', 'knitr', 'kableExtra', 'ape', 'labdsv', 'vegan', 'maps', 'readxl', 'readr', 'data.table', 'rgdal', 'taxize'))
```
Há uma lista de pacotes que serão utilizados apenas no apêndice \@ref(base-tidyverse).
Eles não são necessários para acompanhar o curso, mas caso você chegue a este apêndice, eles serão necessários.
Portanto, caso queira já instalá-los, execute o comando abaixo:
```{r, eval = FALSE}
install.packages(c('ggplot2', 'dplyr', 'tibble', 'tidyr', 'purrr', 'magrittr'))
```
### Baixe o repositório para seu computador {-}
Acesse a [página do repositório](https://github.com/LABOTAM/IntroR) contendo os código fonte deste livro (Fig. \@ref(fig:repo)).
```{r repo, fig.cap = 'Imagem inicial do repositório hospedado no GitHub contendo o código fonte deste livro.', eval = TRUE, echo = FALSE, out.width="80%"}
knitr::include_graphics("figuras/repo.png")
```
Busque um botão de cor **verde** chamado *Code* (Fig. \@ref(fig:baixa-repo)).
Clique neste botão e aparecerão algumas opções.
Clique no botão **Download Zip**, destacado em vermelho na figura \@ref(fig:baixa-repo), e escolha onde você quer salvar o arquivo.
```{r baixa-repo, fig.cap = 'Destaque do botão "Code" (retângulo "azul" pontilhado circundando o botão, com uma seta "azul" apontando para o mesmo botão) presente na página inicial do repositório hospedado no GitHub contendo o código fonte deste livro. Há um outro retângulo de cor "vermelha" destacando a opção `Download Zip.`', eval = TRUE, echo = FALSE, out.width="60%"}
knitr::include_graphics("figuras/baixa_repo.png")
```
Após baixar, descomprima este arquivo `.zip`, escolha onde você deseja guardar a pasta, e comece a acessar os arquivos.
Os arquivos contendo cada capítulo deste livro são listados abaixo e podem ser encontrados na [página inicial do repositório](https://github.com/LABOTAM/IntroR):
```{r, eval = TRUE, echo = FALSE}
cat(capitulos, sep = "\n")
```
Você pode tanto utilizar os arquivos escritos em formato [Rmarkdown](http://www.botanicaamazonica.wiki.br/labotam/doku.php?id=bot89:precurso:rmarkdown:inicio) e executar os códigos em cada célula de código (**code chunks**) ou usar os scripts contidos na pasta `codigo`, que nada mais são do que os capítulos do livro convertidos para um script de R, isto é, em formato `.R`.
Nesses scripts, todos os pedaços de texto, incluindo cabeçalhos e comentários estão precedidos de `#'`; o que for código aparecerá sem `#'` precedentes.
Clique no nome dos scripts abaixo para levá-lo direto ao arquivo dentro do repositório.
```{r mostra-scrpt-r, eval=TRUE, echo=FALSE, message=FALSE, results='asis'}
cat(paste0("* [", gsub("codigo/", "", capitulosR_output_names), "](https://github.com/LABOTAM/IntroR/tree/main/", capitulosR_output_names, ")"),
sep = "\n")
```
## Caso você não possua um computador {-}
O Google oferece um serviço chamado [Google Colab](https://research.google.com/colaboratory/faq.html) que pode ser utilizado em computadores, em celulares modernos com acesso à internet e possuídores de um navegador, e em tablets.
Em breve, apresentaremos aqui um endereço contendo todo o conteúdo deste livro já convertido para o formato de um Jupyter Notebook, que é o modelo de arquivo utilizado pelo Google Colab.
<!-- Nós convertemos o conteúdo deste livro para um Jupyter Notebook e o colocamos nesta plataforma. -->
<!-- Você pode acessar este arquivo pelo endereço XXX INCLUIR ENDERECO AQUI. -->
<!-- Por ser uma ferramenta nova, nós não sabemos de possíveis erros que possam ocorrer ao executar os comandos deste livro nesta plataforma. -->
<!-- Caso você encontre algum erro, abra um problema em nosso repositório e nos informe do ocorrido. -->
## O que é o R e por qual razão você deve se preocupar em programar {-}
### O R em poucas palavras {-}
> *O R é um software livre e gratuito de desenvolvimento coletivo e é muito útil para quem trabalha com ciências e precisa manipular e analisar dados, gerar gráficos e publicações dinâmicas. Tem uma comunidade enorme de usuários e colaboradores e está disponível gratuitamente em diversos repositórios espalhados pelo mundo* (https://cran.r-project.org/).
> *O R foi criado para permitir a melhor e mais ampla exploração de dados possível, (...) mas sempre explicando a natureza dos métodos utilizados, num formato aberto (livre) e compreensível* [@Chambers2008].
> *O R é uma linguagem de programação; você conversa com o R através de um código*.
> Por ser uma linguagem de programação, **no R você pode fazer tudo**. A pergunta não é sobre **SE** o R faz alguma coisa, mas **COMO** fazer no R alguma coisa. E há várias maneiras de fazer a mesma coisa no R. É fundamental aprender a falar R, pois sabendo falar você pode dizer do seu jeito.
> *Todo estudante de ciências deveria aprender a programar, porque programar lhe ensina a pensar* (Steve Jobs). Usar o R é a melhor forma de aprender estatística porque você precisa de fato entender o que está fazendo ao escrever um código.
> **Aprender a programar é como aprender um novo idioma**; aprendendo o R fica mais fácil aprender outras linguagens de programação e lhe ajuda a aprender inglês, e o inglês lhe facilita falar R.
> **O R é uma fantástica ferramenta para fazer gráficos**; veja exemplos em http://www.r-graph-gallery.com.
> Com o desenvolvimento da linguagem na última década, você pode gerar aplicativos ([Shiny](https://shiny.rstudio.com/)) e relatório dinâmicos usando [Rmarkdown](http://www.botanicaamazonica.wiki.br/labotam/doku.php?id=bot89:precurso:rmarkdown:inicio), facilitando a formatação gráfica e a reprodutibilidade dos seus artigos, relatórios e projetos científicos.
### Por que programar? {-}
> A maioria dos programas de computador não é muito boa. O código no seu laptop, televisor, telefone, carro é geralmente mal documentado, inconsistente e pouco testado. Por que isso importa para a ciência? Porque transformar dados brutos (`raw data`) em artigos científicos geralmente requer um pouco de programação, o que significa que a maioria dos cientistas escreve software (Nick Barnes, 2010, [Publish your computer code](http://www.nature.com/news/2010/101013/full/467753a.html), Nature News).
> **É tentador tratar todas as coisas como se fossem pregos, se a única ferramenta que você tem é um martelo** (Abraham Maslow, 1996, [Lei do Instrumento](https://en.wikipedia.org/wiki/Law_of_the_instrument))! Liberte-se da camisa de força dos softwares de estatística que limitam as análises que você pode fazer e como pode fazer.
> *Um dos objetivos da análise estatística é o de destilar um conjunto longo e complicado de dados em um número pequeno de estatísticas descritivas que façam sentido. Muitos dos pacotes estatísticos de computadores modernos, no entanto, fazem exatamente o oposto disso. Eles produzem automaticamente um número excessivo de resultados que termina sendo aceito sem crítica; pode levar à super interpretação dos dados; e incentiva o mal hábito de __jogar dados e cuspir resultados__ (data trawling). O R, por outro lado, não lhe diz nada a não ser aquilo que você peça explicitamente* [@Crawley2007].
> (...) aprender a programar é importante porque desenvolve habilidades analíticas e de resolução de problemas. É uma atividade criativa, um meio de expressar idéias abstratas. Assim, programar é divertido e é muito mais do que uma habilidade profissional. Ao projetar programas, aprendemos muitas habilidades que são importantes para todas as profissões. Essas habilidades podem ser resumidas como: (1) Leitura crítica, (2) Pensamento analítico, (3) Síntese criativa ([Why programming is important](http://programmingstage.blogspot.com.br/2012/05/why-programming-is-important.html)).
> *Uma das coisas mais importantes que você (como cientista) pode fazer é dedicar um tempo para aprender uma linguagem de programação de verdade. Aprender a programar é como aprender outro idioma: exige tempo e treinamento, e não há resultados práticos imediatos. Mas se você supera essa primeira subida íngreme da curva de aprendizado, os ganhos como cientista são enormes. Programar não vai apenas livrar você da camisa de força dos pacotes estatísticos, mas também irá aguçar suas habilidades analíticas e ampliar os horizontes de modelagem (..) e estatística* [@Gotelli2013].
```{r, out.width="101%", fig.cap = "Curvas de aprendizagem do aluno Sabichão (Geek) e de um aluno que tem medo de código (non-geek).", eval = TRUE, echo = FALSE}
knitr::include_graphics("figuras/aprendizadogeekvsnongeek.png")
```
## Análise exploratória de dados (AED) {-}
### O que é AED e por que fazer AED? {-}
> Em estatística, análise exploratória de dados (AED) é uma abordagem para analisar conjuntos de dados visando resumir as suas principais características, particularmente com métodos gráficos e visuais.
Um modelo estatístico pode ou não ser usado, mas AED objetiva principalmente ver o que os dados podem nos dizer para além da modelagem ou de testes de hipóteses. A AED foi promovida por [John Tukey](https://en.wikipedia.org/wiki/John_Tukey) para incentivar estatísticos a explorar dados e, eventualmente, formular novas hipóteses que possam levar à nova coleta de dados e a experimentos.
AED é diferente de análise de dados inicial (AID), que foca mais estreitamente na verificação de suposições necessárias aos modelos de testes de hipóteses, manipulação de valores ausentes e transformações de variáveis, conforme necessário.
AED abrange AID (Texto traduzido da [WikiPedia](https://en.wikipedia.org/wiki/Exploratory_data_analysis)).
```{r, out.width="100%", eval = TRUE, echo = FALSE}
knitr::include_graphics("figuras/aed.png")
```
> Muitas vezes esquecemos como funciona a ciência e a engenharia. Idéias vêm mais frequentemente de exploração anterior do que de descargas atmosféricas. (...) **Encontrar a pergunta é muitas vezes mais importante do que encontrar a resposta**. Análise exploratória de dados é uma atitude, uma flexibilidade que depende de visualização gráfica, não é um conjunto de técnicas [@Tukey1980].
Em sistemática e taxonomia, uma ciência histórica, a análise exploratória é fundamental, pois é através dela que podemos postular boas hipóteses e usar teste de hipóteses para confirmá-las.
> Aplicar a análise exploratória de dados para criar hipóteses e então usar os mesmos dados para testar essas hipóteses deve ser evitado.
Se alguém tem conhecimento *a priori* limitado, então uma abordagem válida é criar dois conjuntos de dados: aplicar exploração de dados sobre o primeiro conjunto para criar hipóteses e usar o segundo conjunto de dados para testar essas hipóteses .
Tal processo, no entanto, só é prático para conjuntos de dados grandes.
Independentemente da situação específica, o uso constante e a estruturação de relatórios transparentes de exploração sistemática de dados melhorariam a qualidade da pesquisa ecológica e de quaisquer recomendações que ela produziria [@Zuuretal2010].
A análise exploratória não é *dragagem* de dados! Assume-se que o pesquisador formulou hipóteses biológicas plausíveis *a priori* amparadas pela teoria.
### Objetivos da AED {-}
* Controlar a qualidade dos dados;
* Sugerir hipóteses para os padrões observados (novos estudos);
* Apoiar a escolha dos procedimentos estatísticos de testes de hipótese;
* Avaliar se os dados atendem às premissas dos procedimentos estatísticos escolhidos.
### Para ler {-}
Dois artigos que você deveria ler: @Tukey1980 e @Zuuretal2010.
## Exercícios no **notaR** {-}
Ao fim de alguns capítulos, disponibilizaremos em seções chamadas **Exercícios** uma lista de endereços ligados ao [notaR](http://www.lage.ib.usp.br/notar/index.php), um sistema criado para auxiliar no aprendizado da linguagem R desenvolvido pelo laboratório de Ecologia Teórica da Universidade de São Paulo [@Chalometal2012].
### Conhecendo o **notaR** {-}
Os exercícios do notaR obrigam o usuário a construir um script de R a partir de um enunciado, acabando por fugir do tradicional **copia-cola** de tutoriais de R.
Muitos exercícios no sistema não obrigam o usuário a estar autenticado (estar logado usando login e senha) no sistema para poder fazê-los.
Leia com atenção o enunciado de cada exercício antes de iniciar a construir o seu script.
Uma lista de todos os exercícios **notaR** incluídos neste livro está relacionada abaixo:
* Resolva o exercício [101.01 Bem vindo ao notaR](http://notar.ib.usp.br/exercicio/29).
* Resolva o exercício [101.05 Remoção Com Critério](http://notar.ib.usp.br/exercicio/15).
* Resolva o exercício [102.04 Biomassa de Árvores](http://notar.ib.usp.br/exercicio/19).
* Resolva o exercício [102.02 Sequências](http://notar.ib.usp.br/exercicio/12).
* Resolva o exercício [102.03 Conta de Luz](http://notar.ib.usp.br/exercicio/4).
* Resolva o exercício [102.01 Área Basal](http://notar.ib.usp.br/exercicio/17).
* Resolva o exercício [102.05 Variância na Unha](http://notar.ib.usp.br/exercicio/5).
* Resolva o exercício [101.03 Objetos de Data](http://notar.ib.usp.br/exercicio/18).
* Resolva o exercício [103.01 Distância entre cidades](http://notar.ib.usp.br/exercicio/23).
* Resolva o exercício [103.02 Criação de um data frame](http://notar.ib.usp.br/exercicio/2).
* Resolva o exercício [103.03 Criando uma Matriz](http://notar.ib.usp.br/exercicio/13).
* Resolva o exercício [302.02 Histogramas (frequência)](http://notar.ib.usp.br/exercicio/66).
* Resolva o exercício [302.07 Gráficos com trechos selecionados do data.frame/matriz](http://notar.ib.usp.br/exercicio/71).
* Resolva o exercício [302.04 Box-plots](http://notar.ib.usp.br/exercicio/67).
* Resolva o exercício [302.05 Gráficos de dispersão](http://notar.ib.usp.br/exercicio/69).
* Resolva o exercício [302.06 Matriz de dispersão](http://notar.ib.usp.br/exercicio/70).
* Resolva o exercício [Editando parâmetros gráficos](http://notar.ib.usp.br/exercicio/75).
* Resolva o exercício [104.01 Sintetizando dados](http://notar.ib.usp.br/exercicio/14).
* Resolva o exercício [103.05 Classes de Objetos](http://notar.ib.usp.br/exercicio/21).
* Resolva o exercício [103.04 Lendo e salvando seus dados ](http://notar.ib.usp.br/exercicio/22).
* Resolva o exercício [103.7 Cara ou coroa](http://notar.ib.usp.br/exercicio/34).
* Resolva o exercício [103.9 Lembrando matrizes e listas](http://notar.ib.usp.br/exercicio/37).
<!-- Alunos inscritos na disciplina precisam estar autenticados para fazer os exercícios obrigatórios. O login de cada aluno inscrito na disciplina é o seu email informado na inscrição e a senha será informada pelos professores. Outros exercícios são opcionais e qualquer pessoa pode entrar no site e fazer exercícios sem autenticação. -->
<!-- Avaliação será baseada em: -->
<!-- Notas nos exercícios feitos no NotaR e indicados noTutorial de Introdução ao R. -->
<!-- Para validar a nota precisa estar logado no sistema. -->
<!-- Login, senha e prazos serão informados na sala virtual; -->
<!-- Entrega de uma análise exploratória de dados, seus ou dados que serão disponibilizados para a disciplina; -->
## Referências úteis {-}
Listamos abaixo algumas referências importantes para complementar o seu estudo:
* [Apostila USP-BIE-5782](http://ecologia.ib.usp.br/bie5782/doku.php?id=bie5782:02_tutoriais:tutorial4:start).
* [Introdução ao R no site do R](https://cran.r-project.org/doc/manuals/R-intro.html).
* [Introdução ao uso do programa R de Victor Landeiro e Fabricio Baccaro](https://6e938257-ec28-4b42-9917-4ed33b2f1d0b.filesusr.com/ugd/e086b2_0d0de99bbb204ca68e079b4ae11b87d6.docx?dn=A_apostila_de_introdu%C3%A7%C3%A3o_ao_R_vers%C3%A3o_6.3.1_2018.docx).
* [Relatórios dinâmicos com R Markdown](http://www.botanicaamazonica.wiki.br/labotam/doku.php?id=bot89:precurso:rmarkdown:inicio).