Programação em R Flashcards
Decompor uma série temporal
decompose(variável, start=, frequency=)
Dessazonalizar uma série temporal
stl(variável, s.window=”period”)
Fazer uma previsão Holtwinters
Holtwinters(variável)
Transformar um “vetor” em uma série temporal
ts(variável, frequency=)
Gráfico ACF
plot(acf(variável))
Gráfico PACF
plot(pacf(variável))
Verificar a acurácia de uma previsão
accuracy(forecast(variável, número de períodos preditos))
Obs: a varíavel precisa já ter recebido o resultado da previsão
Descobrir o valor numérico das previsões
forecast(variável, número de períodos preditos)
Visualizar os primeiros dados de uma variável
head(variável)
Visualizar os últimos dados de uma variável
tail(variável)
Ler arquivo csv
read.csv(nome do arquivo, header = TRUE, sep =“,”)
Ler algum arquivo
read.table(arquivo, header = TRUE, sep =“ ”)
Importa arquivo em formato de planilha e cria data.frame com o mesmo. O nome do arquivo tem de estar entre aspas e conter a extensão (e.g., .txt)
Criar um arquivo com os valores de um objeto do R
write.table(x, arquivo, row.names = TRUE, col.names = TRUE, sep =“”)
x = (nome do objeto no R),
arquivo = Ex : “meus.dados.txt”
primeira linha = (row.names = TRUE),
primeira coluna = (col.names = TRUE)
o tipo de separador de colunas = (sep = “”)
Criação genérica de um vetor
c()
Criando um data frame
data.frame ()
Criar uma lista
list(variável)
Exibir a estrutura interna de um objeto
str(variável)
Selecionar todas as linhas e determinada coluna j
variável[ , j ]
ou, para as dez primeiras linhas:
variável[ 1:10, ]
Transforma uma tabela ou matriz em data frame
as.data.frame()
Retornar a distribuição de frequência absoluta de uma variável
table(variável)
Resumo de uma variável quantitativa contínua
summary(variável)
Desvio padrão de uma variável
sd(variável)
Obs: complementa summary()
Fazer histograma de uma variável
hist(variável)
Exibir graficamente um boxplot
boxplot(y ~ x)
Exibe graficamente a distribuição de frequência da variável quantitativa contínua (y) segundo as categorias da variável x.
Gráfico da matriz de dispersão de uma planilha de dados(data frame)
pairs(variável)
Exibir matriz de correlação
cor(variável)
Excluir linhas com valores vazios (Na)
na.omit()
Fazer regressão lineal ou múltipla
lm(y~x)
Obter valores aleatórios de uma Distribuição Normal
rnorm(variável, mean =, sd =)
Criar uma sequência
seq(from, to, by=, length)
by = específica o incremento. length = específica o tamanho desejado da sequência
Criar um repetição
rep(x, times)
repete x vezes; use each=para repetir cada elemento x vezes. Exemplo: rep(c(1,2,3)2) -> 1 2 3 1 2 3. Exemplo 2: rep(c(1,2,3)each=2) -> 1 1 2 2 3 3
Seleciona todos os elementos do vetor maiores que três
Seleciona todos os elementos do vetor x entre 3 e 5.
variável[variável>3]
variável [variável>3 & variável<5]
Seleciona uma coluna do data frame
variável$nome
Retornar o índice do maior e menor elemento da variável
Retorna o valor máximo e mínimo
whichmax(variável)
which.min(variável)
max(variável)
min(variável)
Ele cruza x com y. Ele retorna um vetor do tamanho de x,
informando o índice em y no qual se encontram os elementos de x. Caso
contrário, ele informa NA.
match(x,y)
Retorna um objeto com a exclusão de elementos duplicados em um vetor ou matriz
unique(variável)
Arredonda os elementos da variável para n casas decimais
round(variável, n)
Padronizar um vetor/matriz
scale(variável)
Juntar dois data frames aumentando colunas
merge(variável x, variável y)
Juntar dois data frames aumentando linhas
rbind(x,y)
Nomear colunas do data.frame
names(variável)
Selecionar um nome na string de um data.frame
variável[grep(“Palavra”, coluna do data frame que está a string), ]
Ordenar um data.frame por coluna
data
Agregar um data.frame por uma coluna do data.frame
data
Como contornar a não igualdade entre uma variável inteira e uma contínua
near( objeto1 da igualdade, objeto2 da igualdade)
Retorna o valor TRUE ou FALSE
Fazer um or múltiplas vezes
variável %in% c( valor1, valor2)
Divisão inteira
Resto da Divisão
%/%
%%
Calcular a acumulativa da soma
cumsum(data$variável)
Chamar função dentro de funções de modo a não precisar criar variáveis intermediárias
Pipe:
data %>% função %>% função %>%