Visão Computacional Flashcards

1
Q

Visão Computacional:

A

Campo da inteligência artificial que permite a computadores
interpretar e entender o mundo visual, processando imagens e vídeos para obter
informações.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Processamento de Imagem:

A

Conjunto de técnicas utilizadas para realizar operações em
imagens digitais, com o objetivo de melhorar a qualidade ou extrair informações úteis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

RGB:

A

Modelo de cor aditivo em que luzes vermelha, verde e azul são combinadas de
várias maneiras para reproduzir uma ampla gama de cores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Visão Humana:

A

O sistema biológico pelo qual os seres humanos interpretam e
entendem seu ambiente visual, através dos olhos e do processamento cerebral.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

HSV:

A

Modelo de cor que representa as dimensões de matiz (hue), saturação (saturation)
e valor (value/brightness), frequentemente utilizado em aplicações de processamento
de imagem por ser mais alinhado com a percepção humana de cores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

JPEG:

A

Formato de arquivo de imagem comum que utiliza compressão com perda,
adequado para fotografias e imagens com transições suaves de cor.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

PNG:

A

Formato de arquivo de imagem que suporta compressão sem perda de dados,
transparência e é adequado para imagens com textos ou bordas nítidas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

TIFF:

A

Formato de arquivo de imagem usado principalmente em fotografia e gráficos
profissionais, suportando várias profundidades de cor e compressão sem perda

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

GIF:

A

Formato de arquivo de imagem usado para gráficos simples e animações,
suportando um número limitado de cores e transparência.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Profundidade de Bit:

A

Refere-se ao número de bits usados para representar a cor de
cada pixel em uma imagem, afetando a quantidade de cores que podem ser
representadas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Filtro de Blurring: .

A

Técnica de processamento de imagem que suaviza os detalhes e
reduz o ruído, criando uma aparência de “borrão”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Filtro de Sharpening:

A

Processo de aumentar a clareza ou definição de uma imagem,
realçando as bordas e os detalhes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Rotação:

A

Transformação geométrica que gira uma imagem em torno de um ponto
central.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Escala:

A

Transformação geométrica que aumenta ou diminui o tamanho de uma
imagem.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Translação:

A

Movimento de uma imagem em uma direção específica (vertical ou
horizontal).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

CNN (Convolutional Neural Network):

A

Tipo de rede neural profunda especialmente
eficaz para análise e reconhecimento de imagens e padrões visuais

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Mapa de Recursos (Feature Map):

A

Imagem gerada na CNN após a aplicação de filtros,
que destaca características específicas da imagem original.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Max Pooling:

A

Operação em CNNs que reduz as dimensões espaciais (altura e largura)
dos mapas de recursos, mantendo apenas os valores máximos de uma região
específica

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Visão computaciona

A

é um campo da inteligência artificial que foca em capacitar
computadores para interpretar e entender o mundo visual. Isso envolve a aquisição, o
processamento, a análise e a compreensão de imagens digitais e padrões de dados
visuais. O objetivo final é que as máquinas possam identificar e processar imagens de
maneira semelhante ao olho humano, mas com a capacidade de análise e
processamento de dados que ultrapassam as limitações humanas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Histórico da Visão Computacional

A

Década de 1950 e 1960: As raízes da visão computacional podem ser traçadas até os
primeiros dias da inteligência artificial. Pesquisadores começaram a experimentar
maneiras de permitir que as máquinas “vissem” e reconhecessem padrões em
imagens. Estes primeiros esforços foram bastante básicos devido às limitações da
tecnologia de computação da época.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Década de 1970:

A

Houve um progresso significativo no campo, com pesquisadores
desenvolvendo algoritmos mais avançados para reconhecimento de formas e
objetos. Durante este período, a visão computacional começou a se diferenciar do processamento de imagens, com um foco maior na interpretação de cenas visuais,
em vez de apenas processar e manipular imagens digitais.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Décadas de 1980 e 1990

A

Com o advento de computadores mais poderosos e o
desenvolvimento da teoria dos algoritmos, a visão computacional começou a se
tornar mais sofisticada. Neste período, começaram a surgir aplicações práticas, como
sistemas de inspeção industrial e reconhecimento facial.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Século 21

A

A ascensão da aprendizagem profunda e das redes neurais convolucionais
(CNNs) revolucionou o campo da visão computacional. Estas tecnologias permitiram
avanços significativos na precisão e na eficiência do reconhecimento e classificação
de imagens, tornando possíveis aplicações como carros autônomos, diagnósticos
médicos automatizados e sistemas de segurança avançados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Reconhecimento Facial e Biometria:

A

Uma das aplicações mais conhecidas da visão
computacional é o reconhecimento facial, utilizado em sistemas de segurança,
desbloqueio de smartphones e verificação de identidade. Além disso, a biometria,
que pode incluir a identificação de impressões digitais, íris e até características
comportamentais, depende em grande parte de técnicas de visão computacional.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Veículos Autônomos:

A

Carros, drones e outros veículos autônomos usam visão
computacional para navegar pelo ambiente. Eles utilizam câmeras e sensores para
detectar obstáculos, ler sinais de trânsito, e entender o contexto da via, como a
presença de pedestres e outros veículos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Diagnóstico Médico:

A

A visão computacional está revolucionando a área da saúde,
especialmente na análise de imagens médicas. Algoritmos de visão computacional
podem identificar padrões em radiografias, ressonâncias magnéticas e outras
imagens médicas, auxiliando na detecção precoce de doenças como câncer, doenças
cardíacas e mais

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Inspeção Industrial e Controle de Qualidade:

A

Em ambientes industriais, a visão
computacional é utilizada para inspecionar produtos em linhas de montagem,
garantindo que eles atendam a padrões de qualidade específicos. Isso inclui a
verificação de defeitos, a conformidade com as especificações e até a embalagem
dos produtos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Sistemas de Vigilância:

A

A visão computacional permite o monitoramento de vídeo
mais inteligente, com a capacidade de detectar atividades suspeitas, identificar
indivíduos em listas de observação ou até analisar padrões de tráfego em espaços
públicos para segurança e planejamento urbano.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Comércio e Publicidade:

A

No varejo, a visão computacional está sendo usada para
análise de comportamento do consumidor, gestão de estoque e até experimentação virtual de produtos, como óculos e roupas. Na publicidade, permite a criação de
experiências imersivas e personalizadas para os consumidores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Agricultura:

A

A tecnologia de visão computacional está sendo empregada na
agricultura para monitorar culturas, identificar doenças nas plantas, e otimizar a
colheita. Drones equipados com câmeras podem analisar extensas áreas de plantio,
fornecendo dados valiosos para agricultores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Robótica

A

Na robótica, a visão computacional é crucial para a interação do robô com
o ambiente. Ela permite que os robôs realizem tarefas complexas, como montagem
de componentes, manipulação de objetos e navegação em ambientes variados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Entretenimento e Mídia:

A

Em filmes e jogos, a visão computacional é usada para
captura de movimento, criando animações realistas de personagens. Também é
utilizada em realidade aumentada e realidade virtual, criando experiências imersivas
para os usuários.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Análise de Imagens de Satélite

A

Para monitoramento ambiental, planejamento urbano
e coleta de informações geográficas, a análise de imagens de satélite através da
visão computacional é fundamental. Ela permite a identificação de mudanças na
paisagem, monitoramento de desastres naturais, e mapeamento de recursos naturais.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Processamento de Imagem

A
  1. Definição: Processamento de imagem refere-se a técnicas que são aplicadas para
    realizar transformações em imagens. O objetivo principal é melhorar a qualidade da
    imagem ou extrair informações úteis dela.
  2. Operações: Inclui operações como ajuste de contraste, filtragem, realce de bordas,
    redução de ruído, compressão de imagem, e conversão entre diferentes formatos de
    imagem.
  3. Aplicações: Utilizado em fotografia digital, impressão, transmissão de televisão,
    médicos que precisam melhorar a qualidade de imagens radiográficas, entre outros.
  4. Foco: Está mais concentrado em manipular e melhorar a qualidade visual das
    imagens. Não tenta interpretar o conteúdo da imagem ou entender o que está sendo
    representado.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Visão Computacional

A

. Definição: Visão computacional é um campo da inteligência artificial que visa ensinar
máquinas a interpretar e entender o mundo visual. Ela envolve não apenas o
processamento de imagens, mas também a extração de informações significativas
delas.
2. Operações: Abrange identificação de objetos, detecção e reconhecimento de
padrões, classificação de imagens, percepção de profundidade, e compreensão de
cenas.
3. Aplicações: Usada em reconhecimento facial, veículos autônomos, vigilância,
diagnóstico médico automatizado, e sistemas de interação homem-computador.
4. Foco: O objetivo é que a máquina “veja” e “entenda” a imagem de maneira
semelhante aos seres humanos. Vai além do processamento básico de imagens e
busca interpretar o que as imagens representam no mundo real.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Relação entre os Dois Campos

A

Embora distintos, processamento de imagem e visão computacional são campos
complementares. O processamento de imagem muitas vezes serve como um passo
preliminar para a visão computacional, preparando imagens para uma análise mais
complexa. Por exemplo, antes de uma máquina poder reconhecer um rosto em uma
imagem, pode ser necessário primeiro melhorar a qualidade da imagem através de
técnicas de processamento de imagem.
Ou seja, enquanto o processamento de imagem se concentra em manipular e melhorar
imagens, a visão computacional busca entender e interpretar o conteúdo dessas
imagens.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Álgebra Linear Básica

A

Álgebra linear é a base para operações com imagens e gráficos em visão
computacional. Ela lida com vetores, matrizes, espaços vetoriais e transformações
lineares, que são essenciais para representar e manipular imagens e formas.

Usada em operações como rotação, escala e transformações de imagens; também é
fundamental em algoritmos de aprendizado de máquina, como redes neurais, que são
amplamente usadas em visão computacional.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Fundamentos Matemáticos

A

Visão computacional é baseada em alguns fundamentos matemáticos que são
importantes de mencionar antes de entrarmos em conceitos mais avançados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Estatística e Probabilidade

A

Estes conceitos são usados para lidar com incertezas e variabilidades inerentes às
imagens do mundo real. A probabilidade ajuda a modelar a incerteza, enquanto a
estatística é crucial para analisar e interpretar os dados visuais.
Crucial em tarefas como reconhecimento de padrões, classificação de imagens, e
inferências sobre os dados coletados por câmeras e sensores.

40
Q

Transformações Geométricas

A

Transformações geométricas são usadas para modificar a geometria de uma imagem
ou forma. Elas incluem operações como translação, rotação, escala e distorção.
Essenciais para corrigir a perspectiva em imagens, alinhar imagens em visão estéreo, e
para a reconstrução 3D a partir de múltiplas imagens.

41
Q

Conceitos de Processamento de Sinais

A

O processamento de sinais fornece as ferramentas para filtrar, restaurar e interpretar
sinais visuais (imagens e vídeos). Conceitos como a transformada de Fourier e a
convolução são fundamentais.

Usado para redução de ruído, realce de imagem, detecção de bordas, e compressão
de imagem. Também é a base para muitos algoritmos de visão computacional,
incluindo aqueles usados em redes neurais convolucionais.

42
Q

Processamento de Imagens Digitais

A

Uma imagem digital é uma representação numérica de uma imagem visual. Ela é
composta por pixels, os menores elementos de uma imagem, dispostos em uma grade
bidimensional. Cada pixel em uma imagem digital tem um valor específico que
representa a cor nesse ponto da imagem. A quantidade de pixels em uma imagem
determina sua resolução; quanto maior o número de pixels, maior é a resolução e mais
detalhada é a imagem.

43
Q

Sistemas de Cores:

A

Escala de Cinza: Em imagens em escala de cinza, cada pixel representa uma
tonalidade de cinza, geralmente variando de 0 (preto) a 255 (branco).
● RGB (Vermelho, Verde, Azul): Em imagens coloridas, os valores de pixel são
frequentemente representados no formato RGB, onde cada pixel tem três valores
correspondentes à intensidade das cores vermelha, verde e azul. Combinando estas
três cores em diferentes intensidades, é possível representar uma ampla gama de
cores.
● Outros Modelos de Cor: Existem outros modelos de cores, como CMYK (usado em
impressão), HSV (Hue, Saturation, Value), entre outros, cada um adequado para
diferentes aplicações.

44
Q

imagens digitais podem ser armazenadas

A

em vários formatos de arquivo, como
JPEG, PNG, GIF, TIFF, entre outros. Cada formato tem suas próprias características em
termos de compressão, qualidade e suporte a cores.

45
Q

Etapas

A

A visão computacional atua de maneira conjunta com o processamento de imagens.
Para que possa funcionar adequadamente, são necessárias as seguintes etapas que
devem ser seguidas

46
Q
  1. Aquisição
A

É o primeiro passo, onde a imagem ou o vídeo é capturado por um dispositivo, como
uma câmera digital, uma câmera de infravermelho, sensores LIDAR, entre outros. A qualidade e o tipo de dados de imagem adquiridos são fundamentais, pois
determinam o que pode ser feito nas etapas subsequentes.

47
Q

Pré-Processamento

A

O objetivo é melhorar a qualidade da imagem sem alterar o conteúdo fundamental.
Isso facilita as etapas subsequentes de processamento.
● Operações Comuns:
● Redução de ruído: Remover artefatos indesejados da imagem.
● Melhoria do contraste: Ajustar os níveis de brilho e contraste.
● Correção de cor: Ajustar o balanço de cores.
● Normalização: Padronizar o tamanho, a escala ou o valor dos pixels

48
Q

Segmentação

A

Segmentação envolve dividir a imagem em regiões ou objetos de interesse.
● Técnicas:
● Segmentação baseada em limiar: Dividir a imagem com base em valores de
intensidade.
● Segmentação baseada em bordas: Detectar bordas para delinear objetos.
● Segmentação baseada em regiões: Agrupar pixels com características
semelhantes.
● Resultado: Gera conjuntos de pixels (segmentos) que representam diferentes partes
da imagem, como objetos individuais ou fundo.

49
Q

Representação e Descrição

A

O propósito é Converter os segmentos brutos em um formato adequado para análise
posterior. É importante porque facilita o reconhecimento ao reduzir a complexidade
dos dados visuais a formas mais simples e mais facilmente analisáveis
● Representação:
● Contornos: Representar as formas dos objetos.
● Regiões: Descrever as áreas dos objetos.
● Descrição: Descrever os segmentos em termos de características, como forma, cor,
textura.

50
Q

Reconhecimento e Interpretação

A

Reconhecimento: Identificar objetos ou padrões conhecidos na imagem com base
nas descrições.
● Interpretação: Atribuir significado aos objetos reconhecidos, integrando-os ao
contexto maior da cena.
● Processos:
● Comparação com modelos conhecidos.
● Uso de técnicas de aprendizado de máquina para classificar e identificar
objetos.
● Aplicações: Desde a identificação de rostos e objetos até a compreensão de cenas
complexas em aplicações como vigilância, diagnósticos médicos e sistemas
autônomos.

51
Q

AQUISIÇÃO

A

A aquisição é o primeiro passo no processamento digital de imagens. Ela é
geralmente composta por uma câmera digital fotográfica ou de vídeo que
captura a imagem real e a transforma em uma imagem digital. Dependendo
do dispositivo utilizado para a aquisição da imagem, esta pode variar entre
uma imagem bidimensional ou uma tridimensional.

52
Q

PRÉ-PROCESSAME
NTO

A

O pré-processamento da imagem é o passo seguinte a aquisição. Antes de
ser aplicado um método de visão computacional é necessário fazer um
pré-processamento para melhorar a imagem, de maneira a atenuar ou
suavizar algumas das características, como contraste ou ruídos existentes.
Esta etapa é realizada conforme a necessidade específica de cada aplicação.

53
Q

SEGMENTAÇÃO

A

Após realizar o pré-processamento das imagens, é necessário fazer a
segmentação das mesmas. Segmentar é dividir a imagem nos objetos que a
compõem, selecionando assim as partes que interessam da imagem. A etapa
da segmentação é considerada uma das mais importantes do
processamento, pois, é nela que são definidas quais serão as áreas e os
objetos utilizados e analisados nas próximas etapas.

54
Q

REPRESENTAÇÃO E
DESCRIÇÃO

A

Na etapa de representação e descrição são extraídas as informações úteis da
imagem, para poder realizar a classificação entre as possíveis classes de
objetos. Existem duas formas para se representar os dados: por fronteira,
como o número de objetos ou por região, como a forma de cada objeto.

55
Q

RECONHECIMENT
O E
INTERPRETAÇÃO

A

A última etapa de processamento é a etapa de reconhecimento e
interpretação. Nesta etapa são atribuídos sentidos aos resultados, são
analisadas todas as informações contidas na imagem, fazendo o reconhecimento e a classificação de objetos e seus padrões, atribuindo
assim um significado ao conjunto de dados.

56
Q

Detecção e Reconhecimento de Objetos

A

Na detecção de objetos, o objetivo é identificar e localizar objetos específicos dentro
de uma imagem. Isso é feito através de algoritmos que podem diferenciar entre
diversas classes de objetos, como carros, pessoas ou sinais de trânsito. Esses métodos
variam desde abordagens baseadas em características, que procuram por elementos
visuais distintos, até modelos de aprendizado profundo como redes neurais
convolucionais (CNNs), que aprendem a identificar objetos a partir de grandes
conjuntos de dados de treinamento.

O rastreamento de objetos em vídeo estende a detecção de objetos para sequências
de imagens, mantendo a identificação e o posicionamento dos objetos ao longo do
tempo. Isso é especialmente desafiador devido a mudanças na orientação, iluminação
e ocultação parcial dos objetos. Algoritmos de rastreamento precisam ser robustos a
essas variações e capazes de manter a consistência na identificação dos objetos em
diferentes quadros do vídeo.

57
Q

Reconhecimento Facial

A

Funcionamento do Reconhecimento Facial

58
Q

Detecção de Rosto:

A

O primeiro passo é detectar a presença de um rosto na imagem.
Isso geralmente é feito usando algoritmos que podem identificar padrões típicos da
estrutura facial humana, como olhos, nariz e boca.

59
Q

Extração de Características:

A

Uma vez que um rosto é detectado, o sistema extrai
características faciais únicas do indivíduo. Essas características incluem pontos de
referência (ou landmarks) como a posição dos olhos, nariz, boca e contorno do rosto.

60
Q

Comparação e Reconhecimento:

A

As características extraídas são então comparadas
com um banco de dados de rostos conhecidos. Em sistemas de verificação, como
desbloqueio de smartphones, o rosto é comparado com um rosto previamente
registrado. Em sistemas de identificação, como em aplicações de segurança, o rosto
é comparado com muitos outros em um banco de dados.

61
Q

Tecnologias Envolvidas

A

Redes Neurais Convolucionais (CNNs): São amplamente utilizadas no
reconhecimento facial moderno devido à sua eficiência na análise e classificação de
imagens.

62
Q

Aprendizado Profundo:

A

Algoritmos de aprendizado profundo permitem que o
sistema melhore continuamente sua capacidade de reconhecer rostos, mesmo em
condições variáveis de iluminação ou ângulo.

63
Q

Desafios e Considerações

A

Variação nas Condições de Imagem: Mudanças na iluminação, expressões faciais,
acessórios (como óculos ou chapéus) e envelhecimento podem afetar a precisão do
reconhecimento facial.

64
Q

Preocupações com Privacidade e Ética

A

O uso de reconhecimento facial levanta
questões significativas sobre privacidade e consentimento, especialmente quando
utilizado em espaços públicos ou para fins de vigilância.
Viés e Precisão: Tem havido preocupações sobre o viés em sistemas de
reconhecimento facial, onde certos grupos demográficos podem ter menos precisão
devido a desequilíbrios nos dados de treinamento.

65
Q

Aplicações Práticas

A

Segurança e Vigilância: Usado para identificar indivíduos em aeroportos, eventos e
outros locais públicos

66
Q

Autenticação Pessoal:

A

Como desbloqueio de smartphones e sistemas de acesso
seguro.

67
Q

Análise de Sentimentos e Interações Sociais:

A

Para interpretar emoções e reações a
partir de expressões faciais em diversos campos, incluindo marketing e saúde mental.

68
Q

Mapa de Recursos e Max Pooling

A

Mapa de recursos e o max pooling permitem que as redes convolucionais aprendam a identificar características visuais complexas e variadas, fazendo deles componentes essenciais para tarefas como reconhecimento de objetos, detecção de rostos e análise
de cenas. Eles ajudam a rede a se concentrar nas características mais relevantes de
uma imagem, ao mesmo tempo em que mantêm a eficiência computacional e a
robustez contra pequenas variações nas imagens de entrada

69
Q

Mapa de Recursos (Feature Map)

A

Definição: Um mapa de recursos é o resultado da aplicação de um filtro ou kernel a
uma imagem. Em termos simples, é uma imagem processada que destaca certas
características, como bordas, texturas ou padrões específicos.

70
Q

Funcionamento:

A

Durante o treinamento de uma CNN, diferentes filtros são aplicados
à imagem de entrada. Cada filtro é projetado para detectar um tipo específico de
característica. Quando um filtro passa sobre a imagem, ele cria um mapa de recursos
que representa a resposta do filtro em cada posição da imagem.

71
Q

Importância:

A

Os mapas de recursos são cruciais para entender o que a rede está
“vendo” ou detectando na imagem. À medida que a informação passa por camadas
sucessivas da CNN, os mapas de recursos começam a representar características cada
vez mais complexas, movendo-se de simples bordas e texturas para partes
específicas de objetos ou até objetos inteiros.

72
Q

Max Pooling

A

Definição: Max pooling é uma técnica de redução de dimensionalidade aplicada após
a extração de características. Ela reduz a resolução espacial dos mapas de recursos
(diminuindo seu tamanho), mantendo as informações mais importantes.

73
Q

Funcionamento:

A

Em max pooling, uma janela (geralmente de tamanho 2x2) é
passada sobre o mapa de recursos. Em cada posição da janela, o valor máximo dos
pixels dentro dessa janela é mantido, enquanto os outros são descartados.

74
Q

Objetivos:

A

Reduzir a Complexidade Computacional: Ao diminuir o tamanho dos mapas
de recursos, o max pooling reduz a quantidade de cálculos necessários nas
camadas subsequentes da rede.
Evitar Overfitting: Reduzindo a quantidade de informações, o max pooling
ajuda a evitar que a rede se ajuste demais aos dados de treinamento.

Invariância a Pequenas Translações: Como somente o valor máximo é mantido,
pequenas variações e deslocamentos na posição das características não
afetam o resultado final.

75
Q

visão computacional

A

Um dos conceitos fundamentais em visão computacional é o de redes neurais
convolucionais (CNNs), uma classe de redes neurais profundas otimizadas para analisar
dados visuais. As CNNs são especialmente eficazes no processamento de imagens
devido à sua arquitetura que imita a forma como o córtex visual humano interpreta
informações visuais. Essas redes empregam camadas de convolução que aplicam filtros
variados para extrair características importantes de imagens, como bordas, cantos e
texturas, em diferentes níveis de complexidade. Além disso, operações como max
pooling e funções de ativação introduzem não-linearidade e invariância a pequenas
variações e distorções na imagem, o que aumenta a robustez e eficiência do modelo.
Essa capacidade de capturar a essência estrutural e hierárquica das imagens torna as
CNNs extremamente eficientes para tarefas que vão desde o reconhecimento facial até
a classificação de objetos e análise de cenas.

76
Q

Max-pooling

A

O max-pooling é uma técnica de redução de dimensionalidade que
segue as camadas de convolução em uma CNN. Durante o processo de
max-pooling, a rede percorre os mapas de características (feature maps)
gerados pela convolução com uma janela pequena (geralmente 2x2 ou 3x3) e
extrai o valor máximo de cada região da janela. Esta operação reduz as
dimensões espaciais dos mapas de características - altura e largura - mantendo
apenas os aspectos mais proeminentes (valores máximos) e descartando os
demais. Essa redução de dimensionalidade resulta em menor quantidade de
dados a serem processados nas camadas subsequentes, o que aumenta a
eficiência computacional da rede e diminui o risco de overfitting, tornando a
rede mais geral e apta a generalizar a partir de dados de treinamento.

77
Q

O que é visão computacional?

A

Resposta: Visão computacional é um campo da inteligência artificial que envolve a
interpretação e entendimento do mundo visual por computadores, através do
processamento de imagens digitais e vídeos.

78
Q

Como a visão computacional difere do processamento de imagem?

A

Resposta: A visão computacional foca na interpretação e análise de imagens para
entender o que elas representam, enquanto o processamento de imagem está mais
preocupado com a manipulação e melhoria de imagens digitais.

79
Q

Qual é a importância da álgebra linear em visão computacional?

A

Resposta: A álgebra linear é fundamental em visão computacional para operações
com imagens e gráficos, como transformações geométricas e manipulação de
imagens.

80
Q

Por que estatísticas e probabilidade são importantes na visão computacional?

A

Resposta: Estatísticas e probabilidade ajudam a modelar incertezas e variabilidades
em dados visuais, sendo cruciais para tarefas como reconhecimento de padrões e
análise de imagens.

81
Q

O que são transformações geométricas em processamento de imagens?

A

Resposta: Transformações geométricas são operações matemáticas aplicadas a
imagens para alterar sua posição ou orientação, como rotação, escala e translação.

82
Q

Como o processamento de sinais se relaciona com a visão computacional?

A

Resposta: O processamento de sinais fornece técnicas para filtrar, restaurar e
interpretar sinais visuais, sendo a base para muitos algoritmos de visão
computacional.

83
Q

O que são histogramas em processamento de imagens?

A

Resposta: Histogramas são representações gráficas da distribuição de intensidades
de pixels em uma imagem, usados para analisar o contraste e o brilho.

84
Q

Qual é o propósito do ajuste de contraste em imagens?

A

Resposta: O ajuste de contraste visa melhorar a visibilidade e clareza de uma
imagem, ajustando a gama de tons escuros e claros.

85
Q

Como funciona o reconhecimento facial em termos de processamento de imagem?

A

Resposta: O reconhecimento facial envolve a detecção de rostos em imagens,
seguida pela extração e comparação de características faciais únicas com um banco
de dados para identificação.

86
Q

O que é um mapa de recursos em uma CNN?
Resposta: Um mapa de recursos é o resultado da aplicação de um filtro em uma
CNN, destacando características específicas de uma imagem, como bordas ou
texturas.

A

Resposta: Um mapa de recursos é o resultado da aplicação de um filtro em uma
CNN, destacando características específicas de uma imagem, como bordas ou
texturas.

87
Q

Qual é a função do max pooling em uma CNN?

A

Resposta: O max pooling reduz as dimensões dos mapas de recursos, diminuindo a
quantidade de dados a serem processados e mantendo apenas as informações mais
importantes.

88
Q

O que é um filtro de blurring e qual sua utilidade?

A

Resposta: Um filtro de blurring é usado para suavizar uma imagem, reduzindo
detalhes e ruído, criando um efeito de borrão.

89
Q

Para que serve um filtro de sharpening em processamento de imagens?

A

Resposta: Um filtro de sharpening é utilizado para realçar detalhes e bordas em uma
imagem, melhorando sua clareza e definição.

90
Q

O que significa a sigla RGB em processamento de imagens?

A

Resposta: RGB significa Vermelho, Verde, Azul (Red, Green, Blue) e é um modelo de
cor usado para representar imagens em dispositivos digitais.

91
Q

Qual é a diferença entre os formatos de imagem JPEG e PNG?

A

Resposta: JPEG é um formato que utiliza compressão com perda, ideal para
fotografias, enquanto PNG suporta compressão sem perda e transparência, sendo
adequado para gráficos com bordas nítidas.

92
Q

Como a profundidade de bit afeta uma imagem digital?

A

Resposta: A profundidade de bit determina o número de bits usados para representar
a cor de cada pixel, influenciando a quantidade de cores que a imagem pode
representar

93
Q

Qual é a aplicação prática da segmentação de imagem na visão computacional?

A

Resposta: A segmentação de imagem é usada para dividir uma imagem em partes ou
regiões significativas, facilitando tarefas como reconhecimento de objetos e análise
de cenas.

94
Q

Como a visão humana se compara à visão de máquina?

A

Resposta: A visão humana é adaptável e capaz de interpretação contextual, enquanto
a visão de máquina, baseada em algoritmos, é mais rápida e consistente, mas ainda
enfrenta desafios na interpretação contextual complexa.

95
Q

Por que o modelo HSV de cor é frequentemente usado em processamento de
imagens?

A

Resposta: O modelo HSV é usado porque é mais alinhado com a percepção humana
de cores, facilitando tarefas como ajuste de cor e segmentação com base em
tonalidades.

96
Q

Qual é a importância da visão computacional em aplicações práticas?

A

Resposta: A visão computacional é crucial em diversas aplicações, como
reconhecimento facial, veículos autônomos, diagnósticos médicos automatizados e
sistemas de vigilância, devido à sua capacidade de interpretar e entender visuais
complexos.