Começando

O que vamos precisar para iniciar o nosso curso?

Data Analysis Using R Software: Essential Approaches for Breeders

O minicurso Análises de dados usando o software R: Abordagens essenciais para melhoristas proporcionará uma introdução prática ao uso do R para conduzir análises estatísticas em experimentos de melhoramento genético. O conteúdo abordará desde a manipulação e limpeza de dados, análise exploratória, até a aplicação de técnicas avançadas, como a modelagem e análise de experimentos e métodos multivariados. O curso também incluirá visualizações gráficas treinando os participantes com as habilidades necessárias para otimizar o processamento e a interpretação de dados em programas de melhoramento.

Instalação do R e RSTudio

R e RStudio são dois softwares separados:

  • R é uma linguagem de programação e software usado para executar código escrito em R.

  • RStudio é um ambiente de desenvolvimento integrado (IDE) que torna o uso de R mais fácil. Neste curso, usamos RStudio para interagir com R.

Se você ainda não tiver o R ​​e o RStudio instalados, siga as instruções para seu sistema operacional abaixo. Você precisa instalar o R ​​antes de instalar o RStudio.

Instalação do R

  1. Para instalar o R para o Windows, é preciso realizar o download do instalador. Acesse o site do CRAN.

  2. Siga os seguintes passos clique em: download and install R> download R for Windows > base> install R for the first time > Download R-4.4.1 for Windows (64, bit).

  3. Selecione a versão adequada para o seu sistema operacional (Linux, Mac ou Windows) e siga as instruções de instalação.

  4. Realize o download em uma pasta da sua escolha no seu computador.

  5. Execute o arquivo clicando duas vezes com o botão esquerdo. Em seguida, o assistente de instalação vai guiar vocês durante o durante o processo. As configurações padrão são suficientes, então vá clicando em “Avançar e Próximo” até concluir.

    6. Pronto! Agora você já tem o R instalado no seu computador.

    Instalação do RSTudio

Agora você irá instalar o RStudio, ele é uma IDE (ambiente de desenvolvimento integrado) para linguagem de programação em R. É onde você irá escrever os códigos.

  1. Para instalar o RStudio realize o download do instalador. Acesse o site da Posit.

  2.  Em seguida role a página para baixo e procure a versão compatível com o sistema operacional de vocês. Na grande maioria o sistema operacional é (64-bit), no entanto, se for (32-bit), você usará outra versão do RStudio.

  3. Agora realize o download do instalador e é só executar.

  4. O assistente de instalação do RStudio vai conduzir vocês durante o processo. É só seguir as instruções para concluir a instalação.

  5. Após a instalação é só procurar o ícone do RStudio na pasta que você escolheu para fazer o download e clicar duas vezes com botão esquerdo e pronto.

Já tem os softwares instalados?

Se você já tem o R e o RStudio instalados, primeiro verifique se sua versão do R está atualizada.

Basta digitar no seu console:

#sessionInfo()

ou

#version

Se sua versão do R for 4.0.0 ou posterior, você não precisa atualizar o R. Se sua versão do R for mais antiga do que isso, baixe e instale a versão mais recente.

Baixando materiais.

  1. Acesse o link do Github: https://github.com/JenniferLopes/SIGM
  2. Baixe o projeto SIGM.
  3. Acesse <> Code > Download ZIP.

Projeto com os scripts.

Projeto com os scripts.
  1. Extraia o documento em ZIP em qualquer pasta do seu computador.
  2. Com duplo clique abra o SIGM_scripts.

Pronto, seu projeto estará aberto no RStudio.

Instalação de pacotes

Pacote {pacman}

Um pacote bastante interessante disponível é o pacman. Ele age como um gerenciador de pacotes no ambiente R, consolidando a funcionalidade das funções relacionadas à biblioteca base em funções com nomes intuitivos.

Uma das funções mais valiosas oferecidas pelo pacote pacman é a p_load() (carregamento de pacotes). Essa função verifica se um pacote está instalado e, se estiver, o carrega da mesma maneira que a função library() faria. No caso de o pacote não estar instalado, ela procederá à instalação antes de carregá-lo.

Agora, sigamos para a etapa de instalação (para aqueles que estão usando o R pela primeira vez) ou de carregamento (para aqueles que já o têm instalado) dos pacotes necessários para este material.

No início dos seus scripts use a função pacman::p_load(), assim se caso você não tenha o pacote instalado, o pacman irá fazer isso para você. De mesmo modo, uma vez instalado, ele somente carregará o pacote.

if (!requireNamespace("pacman", quietly = TRUE)) install.packages("pacman")
pacman::p_load(
  broom,
  broom.mixed,
  desplot,
  dplyr,
  DT,
  emmeans,
  factoextra,
  ggplot2,
  ggpubr,
  ggtext,
  ggthemes,
  ggridges,
  glue,
  janitor,
  lme4,
  lmerTest,
  metan,
  multcomp,
  multcompView,
  openxlsx,
  patchwork,
  plotly,
  readr,
  readxl,
  tibble,
  tidyverse,
  viridis,
  writexl)

Funções dos pacotes

  1. broom: Organiza os resultados de modelos estatísticos em data.frames, facilitando a interpretação e manipulação dos resultados.

  2. broom.mixed: Extensão do broom para modelos mistos; facilita a obtenção de resultados detalhados de modelos mistos em um formato organizado.

  3. desplot: Gera visualizações de experimentos com blocos, como grids de parcelas e blocos, facilitando a inspeção visual do delineamento experimental.

  4. dplyr: Parte do tidyverse, fornece uma gramática intuitiva para manipulação de dados, incluindo funções para seleção, filtragem, agrupamento e mutação de variáveis.

  5. DT: Cria tabelas interativas em HTML, tornando mais fácil a visualização de grandes tabelas de dados em relatórios ou aplicações Shiny.

  6. emmeans: Gera médias estimadas para modelos lineares e mistos, incluindo intervalos de confiança e comparações múltiplas entre tratamentos.

  7. factoextra: Visualiza análises multivariadas como PCA e clustering, oferecendo gráficos intuitivos para entender a estrutura dos dados.

  8. ggplot2: Pacote principal para visualização de dados em R, permite a criação de gráficos altamente personalizáveis usando a gramática de gráficos.

  9. ggpubr: Fornece funções para visualização de dados com ggplot2, facilitando a criação de gráficos prontos para publicação.

  10. ggtext: Permite a formatação avançada de texto em gráficos ggplot2, incluindo suporte a HTML e Markdown.

  11. ggthemes: Adiciona temas adicionais ao ggplot2, adequados para apresentações, publicações e customização avançada.

  12. ggridges: Cria gráficos de densidade em forma de “ridge”, úteis para comparar distribuições em várias categorias.

  13. glue: Manipula strings com eficiência, permitindo a inserção dinâmica de variáveis em textos, útil para criar legendas e rótulos personalizados.

  14. janitor: Limpa dados rapidamente, incluindo a padronização de nomes de colunas e remoção de valores duplicados.

  15. lme4: Ajusta modelos lineares e lineares generalizados mistos, amplamente usado em experimentos com efeitos aleatórios.

  16. lmerTest: Extensão de lme4 para adicionar testes de significância em modelos mistos, fornecendo ANOVA e outras inferências estatísticas.

  17. metan: Ferramentas para análise de experimentos agrícolas, incluindo análises de médias e estatísticas descritivas.

  18. multcomp: Realiza comparações múltiplas entre médias em experimentos, com ajustes de p-valor para testes de hipóteses.

  19. multcompView: Complementa o multcomp para criar visualizações das comparações múltiplas, identificando grupos significativos.

  20. openxlsx: Cria e edita arquivos Excel diretamente do R, com controle sobre formatação e estrutura dos dados exportados.

  21. patchwork: Combina múltiplos gráficos do ggplot2 em layouts customizados, ideal para painéis e figuras compostas.

  22. plotly: Gera gráficos interativos, incluindo integrações com ggplot2, útil para explorar dados dinamicamente.

  23. readr: Parte do tidyverse, otimiza a leitura de dados em formatos como .csv e .tsv, com controle sobre tipos de variáveis.

  24. readxl: Lê arquivos Excel (.xls e .xlsx), permitindo importar dados do Excel diretamente para o R.

  25. tibble: Estrutura de dados otimizada para manipulação no tidyverse, oferece tabelas organizadas e de fácil leitura.

  26. tidyverse: Conjunto abrangente de pacotes para manipulação, visualização e análise de dados em R, incluindo dplyr, ggplot2, readr, tibble, entre outros.

  27. viridis: Fornece paletas de cores perceptualmente uniformes, ideais para mapas e gráficos acessíveis a pessoas com deficiência visual.

  28. writexl: Exporta dados do R para arquivos Excel (.xlsx), adequado para a criação de relatórios em Excel diretamente do R.

Vamos iniciar?

Confira as Ilustrações da Alisson Horst.

Back to top