Estatística e Probabilidade Flashcards
Variáveis Categóricas
Variáveis que representam qualidades ou características e podem ser divididas em categorias distintas.
Variáveis Quantitativas (Discretas e Contínuas)
Variáveis que representam quantidades numéricas, onde discretas são contáveis e contínuas podem assumir qualquer valor dentro de um intervalo.
Tabelas de Frequência e Contingência
Tabelas de frequência mostram quantas vezes cada valor ocorre em um conjunto de dados; tabelas de contingência mostram a relação entre duas ou mais variáveis categóricas.
Média, Moda e Mediana
A média é a soma de todos os valores dividida pelo número de valores; a moda é o valor que aparece com mais frequência; a mediana é o valor do meio quando os dados são ordenados.
Amplitude, Variância, Desvio Padrão, Intervalo Interquartil (IQR)
A amplitude é a diferença entre o maior e o menor valor; a variância mede a dispersão dos dados em torno da média; o desvio padrão é a raiz quadrada da variância; o IQR é a diferença entre o terceiro e o primeiro quartil, medindo a dispersão do meio dos dados.
Quartis e Percentis
Quartis dividem os dados em quatro partes iguais; percentis dividem os dados em cem partes iguais, indicando a posição relativa de um valor.
One-Hot Encoding
Uma técnica para converter variáveis categóricas em um formato que pode ser fornecido a algoritmos de aprendizado de máquina, criando uma nova coluna para cada categoria possível e atribuindo um valor binário.
Ordinal Label Encoding
Atribui um número inteiro a cada categoria em uma variável ordinal, preservando a ordem das categorias.
Engenharia de Atributos
O processo de criar novas variáveis (features) a partir dos dados existentes para melhorar o desempenho de modelos de aprendizado de máquina.
Variáveis Alvo x Preditoras
A variável alvo é a variável que queremos prever ou modelar; as variáveis preditoras são as variáveis que usamos para fazer essa previsão.
Multicolinearidade
Uma situação em que duas ou mais variáveis preditoras em um modelo de regressão são altamente correlacionadas, tornando difícil isolar o efeito individual de cada variável no resultado.
Probabilidade
Medida numérica da chance de um evento ocorrer, variando de 0 (impossível) a 1 (certo). É uma ferramenta fundamental para lidar com incertezas.
Probabilidade - Experimento Aleatório
Um experimento aleatório é um processo ou procedimento que, quando realizado, pode gerar diferentes resultados, e não podemos prever com certeza qual resultado específico ocorrerá. Exemplos comuns de experimentos aleatórios incluem lançar um dado, lançar uma moeda, escolher uma carta de um baralho, entre outros.
Probabilidade - Eventos
Um evento é um conjunto de resultados possíveis de um experimento aleatório. Em outras palavras, um evento é o que pode acontecer dentro das opções consideradas.Por exemplo, no experimento de lançar um dado, um evento pode ser “obter um número par” ou “obter um número ímpar”.
Probabilidade - Espaço Amostral
O espaço amostral de um experimento aleatório é o conjunto de todos os resultados possíveis desse experimento. É importante notar que cada resultado possível deve ser único e mutuamente exclusivo. Por exemplo, ao lançar um dado de seis faces, o espaço amostral é o conjunto {1, 2, 3, 4, 5, 6}, pois estes são todos os resultados possíveis desse experimento.
Probabilidade - Variável Aleatória Discreta
assume um conjunto finito ou infinito contável de valores. Por exemplo, o número de caras em 3 lançamentos de uma moeda é uma variável aleatória discreta, pois pode assumir apenas valores inteiros (0, 1, 2 ou 3) e não pode assumir valores entre esses números.
Probabilidade - Variável Aleatória Contínua
Uma variável aleatória contínua é uma variável que pode assumir qualquer valor numérico em um ou mais intervalos. Ela possui um número infinito de valores possíveis. Por exemplo, a altura de uma pessoa, o peso de um objeto ou o tempo levado para correr uma corrida podem ser representados como variáveis contínuas, pois esses valores podem variar infinitamente dentro de um intervalo específico.
Probabilidade - Distribuição Uniforme
Todos os resultados possíveis têm a mesma probabilidade de ocorrência. Por exemplo, ao lançar uma moeda justa, a distribuição de probabilidade para cara e coroa seria uniforme.
Probabilidade - Distribuição Binomial
Modela o número de sucessos em uma série de tentativas independentes, onde cada tentativa tem apenas dois resultados possíveis (por exemplo, sucesso ou fracasso), com uma probabilidade constante de sucesso em cada tentativa.
Distribuição Normal
Uma das distribuições mais importantes e amplamente utilizadas, que descreve muitos fenômenos naturais. É caracterizada por uma forma de sino e é completamente determinada por sua média e desvio padrão.
Probabilidade - Função de Densidade de Probabilidade (FDP)
Função que descreve a probabilidade relativa de uma variável aleatória contínua assumir um determinado valor. A área sob a curva da FDP representa a probabilidade.
Inferência Estatística
Conjunto de métodos para tirar conclusões ou fazer previsões sobre uma população com base em uma amostra de dados. Envolve estimativa e teste de hipóteses.