Tutorial 1: Festival de Instalação

Intro

Para participar do nosso curso Introdução a Métodos Computacionais Para Ciências Sociais será necessários que os alunos possuam um conjunto de programas instalado em seus laptops. Neste primeiro tutorial, ensino aos alunos como instalar estes programas.

R

Usaremos R como software e linguagem de programação neste curso. O R é uma linguagem de programação gratuita, extremamente flexível e com uma comunidade de suporte excelente. É hoje um dos softwares mais utilizado por cientistas sociais e cientistas de dados em geral. Por isto, optei pelo uso do R.

Uma pergunta super frequente quando ensino cursos como este é: Porquê o R?. A resposta para mim é simples: o R é imbatível no que se refere a manipular bancos de dados – daqueles retangulares estilo excel – visualização de dados e modelagem estatística. Junto disso, o R é uma linguagem de programação, o que permite a você fazer tudo que outras linguagens mais gerais fazem, e ainda ter os benefícios de manipulação, visualização e modelagem acima citados.

Windows

Para instalar o R no Windows, o primeiro passo é fazer o download do programa. Para isso, entre neste link e clique em “Download R 4.03 for Windows”.

Você fará o Download, e o arquivo estará salvo, provavelmente, na sua pasta de Downloads. Vá nesta pasta, clique duas vezes no arquivo e inicie a instalação do R.

Mac OS

RStudio.

O R é uma linguagem de programação que, após instalada, pode ser utilizada de formas variadas em seu computador. Você pode usá-lo a partir da sua linha de comando, como programadores mais experientes costumam fazer, ou você pode usar softwares desenvolvidos com o intuito de faciliar o uso de determinada linguagem de programação. Estes softwares são chamados ambiente de desenvolvimento integrado (IDE)

O IDE mais utilizado em R chamasse RStudio. Sem aprofundar em conceitos da ciência computação, o R Studio consiste em um programa que integra o R com outras ferramentas, e torna o uso do R mais intuitivo. Por exemplo, o R Studio possui integrações com outros softwares, permite que várias tarefas sejam feitas com point-and-click, permite auto-completion das funções e indica quando há erros em seu código.

Para fazer o download do RStudio, você clica aqui. Escolha a versão correspondente ao seu sistema operacional.

Depois de instalado, para usar o R, você pode abrir diretamente o R Studio, e estaremos prontos para começar a programar.

Entendendo o RStudio.

Esta seção é uma breve introdução ao RStudio. Vamos discutir isso mais vezes na próxima semana.

Noções básicas: Navegando no RStudio

Abra o RStudio! Em seguida, abra um novo script clicando em “Arquivo -> Novo arquivo -> Script R” ou pressionando Ctrl + Shift + N (PC) oucommand + shift + N (Mac). Depois de abrir um novo script, você verá quatro “painéis”.

Painel superior esquerdo (entrada / script)

Neste painel, você escreve seu código. Digite 2 + 2 no seu script e execute uma linha de código pressionandocommand + enter (Mac) ou Ctrl + enter (PC). Ou clique no botão “Executar” na parte superior do script.

Uma hashtag # diz ao R que você não deseja que essa linha ou bloco de código seja executado - isso é chamado de comentando seu código. Isso é útil para você fazer anotações e pode até adicionar hashtags após linhas de código executável, na mesma linha.

O nome do seu arquivo de script está na guia na parte superior da janela do script - o nome padrão é Untitled1. Certifique-se de salvar seu script clicando em “Arquivo -> Salvar” ou command + s (Mac) ouCtrl + s (PC). Você também pode clicar no ícone de disquete para salvar.

Painel inferior esquerdo (saída / console)

O resultado do código é exibido no `console ’no painel inferior esquerdo. Esse espaço também é bom para procurar e experimentar o código que você não deseja salvar em seu script.

No console, o prompt > aparece um símbolo maior que. Se o seu prompt começar a parecer um símbolo + por engano, basta clicar no console e pressionar a tecla esc no teclado quantas vezes forem necessárias para retornar ao prompt.

R usa + quando o código é dividido em várias linhas e R ainda espera mais código. Uma linha de código geralmente não termina até que R encontre um parâmetro ou pontuação de parada apropriado que conclua algum código, como parêntese fechado fechado ), colchete ], colchete } ou aspas `.

Painel superior direito (ambiente global)

Os dados são salvos na memória de R como objetos. Os objetos são simplesmente espaços reservados para um valor, expressão matemática, palavra, função ou conjunto de dados! A guia “Ambiente” global no painel superior direito exibe as variáveis que você atribuiu / salvou.

Painel inferior direito (arquivos, plotagens, pacotes e ajuda)

Aqui você encontra guias úteis para navegar no sistema de arquivos, exibir gráficos, instalar pacotes e visualizar páginas de ajuda. Pressione a tecla control e um número (1 a 9) no teclado para atalho entre esses painéis e guias.

EXTRA: Instalando pacotes no R

Existem vários pacotes que são fornecidos com a distribuição R. Eles são conhecidos como pacotes básicos. Porém, há pacotes criados por desenvolvedores que precisamos instalar e ativar no R.

Pacotes são coleções de funções em R, dados e códigos compilados juntamente. Os passos para instalar e ativar um pacote são os seguintes.

  1. Instalar o pacote – somente uma vez.
  2. Ativar (library) o pacote – sempre que utilizar o R.

Por diversas vezes, aparecem alguns conflitos entre pacotes, ou de pacotes com outras dependências em seu R. Por isso, adicionei essa sessão extra em que você poderá instalar alguns pacotes bastantes úteis em seus R.

Copie e cole essas linhas abaixo e rode (command + enter(Mac) ouCtrl + enter` (PC)) cada linha para instalar os pacotes.

# Instalando um pacote. 
# Instalando um pacote.
install.packages("tidyverse") # conjunto de pacotes para manipulação e visualizaco
install.packages("quanteda") # análise de texto
install.packages("tidytext") # análise de texto
install,packages("rebus") # análise de texto
install.packages("ggthemes") # Visualização
install.packages("ggrepel") # Visualizacao
install.packages("here") # código reproduzível
install.packages("stm") # modelo de topics
install.packages("tidystm") # modelo de topicos
install.packages("RColorBrewer") # Cores bonitas
install.packages("tidymodels") # modelagem
install.packages("estimatr") # modelagem
install.packages("rjson") #manipular json
install.packages("rtweet") # twitter
install.packages("rvest") #scrapping
install.packages("httr") #scrapping
install.packages("xml2") # scrapping
install.packages("electionsBR") # dados eleitorais no Brasil

EXTRA II: Apareceu algum erro?

Não se preocupe! Erros na instalação de pacotes são muito comuns. E umas coisas coisas mais sensacionais do uso do R é o grande número de recursos disponíveis on-line e uma excelente comunidade de programadores dispostos-as a ajudar a solucionar estes problemas.

Em primeiro lugar, Se você tiver problemas para instalar pacotes, certifique-se de que está conectado à internet e que https://cloud.r-project.org/ não está bloqueado por seu firewall ou proxy.

Em segundo lugar, busque ajuda no google. Eu programo em R há quase dez anos, e não faço absolutamente nada sem utilizar pedir ajuda no google. Pedir ajuda on-line é simples: copie e cole a mensagem de R no google. E vá buscar as soluções. O principal site de soluções se chama stackoverlflow. Boa parte das soluções de lá resolverão seus problemas.

RMarkdown

Daqui há duas semanas, iremos aprender sobre as potencialidades do pacote Rmarkdown. Este pacote é extremamente útil para produção científica e apresentação de resultados utilizando R. Em síntese, o R Markdown permite a integração em um único documento de texto básico, código de análise, tabelas, gráficos e equações. E mais importante, esta integração pdoe ser convertida em diversos formatos: html, pdf, doc.

Essa combinação parece simples, mas esta potencialidade é super útil. Por exemplo, este tutorial, assim como o website do curso, e a ementa, foram todos feitos usando Rmarkdown. Iremos desbravar juntos as potencialidades do Rmarkdown nas próximas aulas. Por enquanto, vamos somente instalar o pacote

Abra um script de R em seu laptop e rode o seguinte código.

# Install from CRAN
install.packages('rmarkdown')

Para produzirmos documentos usando Rmarkdown em formato PDF, precisamos ter LaTeX instalado em nosso sistema operacional. Latex é uma linguagem de marcação de texto, isto é, uma sintaxe na qual você escreve textos já com as indicações de layout, como deve aparecer na página final. Ao invés de usar point-and-click do word, o LaTeX usa uma série de funções para produzir seus layouts, o que, por consequência, o torna mais flexível, e muito utilizado para produção de textos acadêmicos.

Para usuários de R Markdown que não são usuários de LaTeX, sugere-se que você instale TinyTeX (https://yihui.name/tinytex/).

install.packages('tinytex')
tinytex::install_tinytex()  # install TinyTeX

Google Chrome

Você precisará ter um navegador da web moderno instalado para realizar algumas das tarefas desta aula. O navegador recomendado para esta aula é o Google Chrome.

Selector Gadget.

Como parte do processo de raspagem de dados (semanas 7 e 8), você precisará examinar os elementos HTML em seus dados. Nesta aula, usaremos o Selector Gadget para essa finalidade. Esta ferramenta nos permite examinar facilmente os elementos por trás de cada página da web.

Se estiver usando o Google Chrome, você pode simplesmente instalar a extensão Selector Gadget no Chrome. Se por algum motivo você não puder usar as extensões do Chrome (incluindo no próprio Chrome), você pode instalar o Selector Gadget seguindo as instruções no site do Selector Gadget.