Flu Dad Flashcards

Question

Em Python a primeira posição é 0 ou 1?

Answer 1

Converte o primeiro caractere em maiúscula. x.capitalize()

Answer 2

Retorna a posição da primeira ocorrência de um valor ou uma string ou -1 se não existir. x.fin()

Answer 3

Retorna a posição da primeira ocorrência de um valor ou uma string ou "ValueError" se não existir. x.index()

Answer 4

Retorna o tamanho da string. len(x)

Answer 5

Divide substrings encontradas a partir de um separador especificado e retorna uma lista. x.split(",")

Answer 6

Remove espaços em branco (ou caracteres dentro do parênteses) do início/ fim da string. x.strip()

Answer 7

*LISTA: valores ordenados, mutáveis e indexáveis. Pode conter valores duplicados; *TUPLA: valores ordenados, imutáveis e indexáveis. Pode conter valores duplicados; *CONJUNTO: valores desordenados, mutáveis e não indexáveis. Não pode conter valores duplicados; *DICIONÁRIO: valores desordenados, mutáveis e indexáveis. Não pode conter valores duplicados.

Answer 8

Adiciona um item no final da lista. x.append("a")

Answer 9

Adiciona um item a um índice especificado. x.insert(5,"a")

Answer 10

Remove a primeira ocorrência de um item. x.remove(a)

Answer 11

Remove item em posição especificada, ou o último se não especificado. x.pop(5)

Answer 12

Deleta item especificado ou a lista se não especificar. del x del x(5)

Answer 13

Esvazia uma lsita. x.clear()

Answer 14

Copia uma lista. x.copy()

Answer 15

Cria uma nova lista. x = list((a))

Answer 16

Saber quantas vezes aparece um elemento. x.count(a)

Answer 17

Adiciona elementos específicos de uma lista ao final de outra lista. x.extend()

Answer 18

Retorna o índice da primeira ocorrência de um valor específico. x.index(a)

Answer 19

Inverte a ordem dos elementos de uma lista. x.reverse()

Answer 20

Ordenar uma lista simples em ordem ascendente se não colocar parâmetro, ou descendente com o parâmetro "reverse=True". x.sort() x.sort(reverse=True)

Answer 21

Retorna uma lista de números começando do zero por padrão, ou com começo, fim e intervalos (step) definidos. x = range (start, stop, step) x = range (6) : [0, 1, 2, 3, 4, 5] x = range (4, 10) : [4, 5, 6, 7, 8, 9] x = range (5, 20, 3) : [5, 8, 11, 14, 17]

Answer 22

Cria uma nova tupla. x = tuple((a))

Answer 23

Datasets, textos, registros orais, documentos.

Answer 24

Documentos semelhantes tendem a possuir palavras semelhantes e assim, vetores semelhantes.

Answer 25

PCA (Principal Component Analysis). t-SNE (t-Distributed Stochastic Neighbourhood Embedding).

Answer 26

Usa probabilidade para descobrir qual palavra completa a frase ou expressão.

Answer 27

As palavras do texto são contadas e um vetor é criado.

Answer 28

Utiliza um peso de acordo com o inverso da frequência. Uma palavra muito frequente é pouco relevante.

Answer 29

Utiliza a probabilidade para o cálculo da frequência.

Answer 30

1) Divide o documento em partes menores; 2) Identifica os sentimentos relacionados a cada frase; 3) Atribui uma pontuação com a polaridade de sentimentos, de -1 a 1; 4) Em casos avançados, combina as pontuações com camadas de deep learning.

Answer 31

Não. Há frases neutras.

Answer 32

Sim. Sentir por sensores, por exemplo.

Answer 33

Um subconjunto do aprendizado de máquina em que o software é capaz de treinar a si mesmo.

Answer 34

Depois da etapa de treinamento. É menos custosa e utiliza programação próxima à tradicional mas com regras aprendidas na etapa de treinamento. É probabilística e não determinística.

Answer 35

Tem dados manualmente rotulados. Diz qual é a saída esperada para cada dado histórico utilizado no treinamento. O supervisor escolhe os rótulos.

Answer 36

O aprendizado supervisionado.

Answer 37

Categoria, classe, sinal, variável, alvo, target, label, tag.

Answer 38

De regressão.

Answer 39

Classificação.

Answer 40

*Árvore de decisão; *Regressão linear; *Regressão logística ; *Redes neurais; *KNN (K-nearest neighbors); *SVM (Support Vector Machines)

Answer 41

Treina um modelo que não se sabe a saída esperada a cada dado usado. Não utiliza um professor/ supervisor para rotular dados. Algoritmos encontram estruturas e padrões por conta própria. O objetivo não é prever, mas sim organizar.

Answer 42

*Agrupamento (clustering): encontra padrões em um conjunto de dados e agrupa em sub-conjuntos; *Regras de associação (Association rules): verifica como determinados elementos de um conjunto estão intimamente relacionados.

Answer 43

*Apriori; *PCA (Principal component analysis)

Answer 44

*K-means; *Agrupamento hierárquico.

Answer 45

O não supervisionado.

Answer 46

Usa uma pequena quantidade de dados rotulados e uma grande quantidade de dados rotulados.

Answer 47

Um conjunto de técnicas que utilizam tentativa e erro para descobrir decisões ótimas de como interagir com o ambiente ou outros agentes. Recompensa uma ação positiva e pune uma negativa.

Answer 48

Serve para avaliar o percentual de acertos do algoritmo. De todas as previsões quantas acertou? Divide o número de acertos pelo total predições. VP + VN/ (VP + FP + VN + FN)

Answer 49

Avalia a capacidade do classificador de detectar com sucessos resultados positivos. Sensibilidade/ Revocação. Dentre os valores realmente positivos, quanto acertou? Usada quando falsos-negativos são mais prejudiciais. Ex: vacinas. VP / VP + FN

Answer 50

Mensura o proporção de previsões positivas corretas sobre a soma de todos os valores positivos. Dentre os modelos previstos como positivos, quantos realmente acertou? Usada quando falsos-positivos são mais prejudiciais. Ex: ações na bolsa. VP / VP + FP

Answer 51

Média harmônica calculada com base na precisão e sensibilidade. 2 * (Precisão * Recall/Precisão+Recall)

Answer 52

*Erro tipo 1: falso positivo; *Erro tipo 2: falso negativo.

Answer 53

O cientista de dados.

Answer 54

*Acurácia; *Recall/ Sensibilidade; *Precisão; *F1-score.

Answer 55

Uma das principais ferramentas de classificação. Uma representação gráfica das regras de classificação, por meio de estruturas que contém nó raiz, nós folhas e nós finais, representados por quadrado, círculos e triângulos. Cada nó é um teste, cada ramificação um resultado e cada folha é um rótulo. O processo de construção da árvore se chama indução.

Answer 56

A medida que nos diz o quanto um conjunto de dados está desorganizado ou misturado. Redução de entropia = ganho de informação.

Answer 57

Índice de Gini, Redução de variância.

Answer 58

Com muitas classes e um número relativamente pequeno de exemplos de treinamento.

Answer 59

*Propensas a overfitting; *Uma única árvore não faz grandes previsões. Várias árvores podem ser combinadas (random forest); *Só fornece resultados promissores se as informações forem precisas e exatas; *Se o conjunto de dados for enorme a tarefa de projetar a árvore é muito complexa; *Se uma regra estiver incorreta gerará decisões equivocadas, fazendo o erro se propagar.

Answer 60

*Dependentes/ alvo contínuas: resultado esperado; *Independentes: entradas

Answer 61

*REGRESSÃO LINEAR: relação entre variável específica e um resultado que nos interessa enquanto controlamos outros fatores. Utiliza os mínimos quadrados ordinários. tem como resultado uma equação linear simples; *REGRESSÃO LOGÍSTICA: utiliza função sigmóide.

Answer 62

Minimiza a soma dos residuais (distância vertical a partir da reta de regressão) elevados ao quadrado.

Answer 63

Não somente quantitativos (contínuos). A regressão lógica trabalha com categóricos.

Answer 64

É a unidade básica de uma RNA (Rede neural artificial), sendo equivalente a um neurônio.

Answer 65

Entradas são multiplicadas por pesos, são somadas, e somado com um viés (bias). O resultado passa por uma função de ativação para definir se o nó será ou não ativado.

Answer 66

*LIMITES: se resultado da função é maior ou igual a limite retorna 1 (nó ativado). Funções desse tipo tem formato de um degrau. (valores discretos, binários); *SIGMÓIDES: recebe valor qualquer de entrada e retorna saída entre 0 e 1. F(x): 1/ (1+e^-x). Ou saídas de -1 a 1. F(x): (e^x - e^-x)/(e^x + e^-x) ](tangente hiperbólica)

Answer 67

Não, somente MLP (multi layer perceptron) tem.

Answer 68

É muito simples, rápido e escalável. Usado quando a velocidade é preferível à precisão. Desvantagem: parte do princípio que as variáveis são independentes.

Answer 69

Variáveis indisponíveis, variações, aleatoriedades e erros.

Answer 70

É a forma mais simples. Divide em dois grupos, um para treinamento e outro para testes. Problema: não é certeza que o conjunto de dados de validação seja representativo da amostra e tem pouca eficiência quando se tem poucos dados.

Answer 71

Divide em conjuntos de treinamentos e testes diversas vezes. Sendo o de treinamento maior.

Answer 72

*Não lineares: Baixo viés e alta variância; *Lineares: Alto viés e baixa variância.

Answer 73

Parâmetro cujo valor é definido antes do início do processo de aprendizagem. Uma característica ou restrição inserido no algoritmo de aprendizagem. A escolha é denominada otimização (tunning)

Answer 74

Grid search, random search, bayesiana search

Answer 75

*Seleção de variáveis / atributos: seleciona as variáveis mais importantes; *Fatoração de matrizes: decompõe a matriz original em outras mais simples.

Answer 76

Não. O tamanho importa em todos os tipos de redes neurais.

Flu Dad Flashcards

(113 cards)