Visão Computacional Flashcards
Visão Computacional:
Campo da inteligência artificial que permite a computadores
interpretar e entender o mundo visual, processando imagens e vídeos para obter
informações.
Processamento de Imagem:
Conjunto de técnicas utilizadas para realizar operações em
imagens digitais, com o objetivo de melhorar a qualidade ou extrair informações úteis.
RGB:
Modelo de cor aditivo em que luzes vermelha, verde e azul são combinadas de
várias maneiras para reproduzir uma ampla gama de cores.
Visão Humana:
O sistema biológico pelo qual os seres humanos interpretam e
entendem seu ambiente visual, através dos olhos e do processamento cerebral.
HSV:
Modelo de cor que representa as dimensões de matiz (hue), saturação (saturation)
e valor (value/brightness), frequentemente utilizado em aplicações de processamento
de imagem por ser mais alinhado com a percepção humana de cores.
JPEG:
Formato de arquivo de imagem comum que utiliza compressão com perda,
adequado para fotografias e imagens com transições suaves de cor.
PNG:
Formato de arquivo de imagem que suporta compressão sem perda de dados,
transparência e é adequado para imagens com textos ou bordas nítidas.
TIFF:
Formato de arquivo de imagem usado principalmente em fotografia e gráficos
profissionais, suportando várias profundidades de cor e compressão sem perda
GIF:
Formato de arquivo de imagem usado para gráficos simples e animações,
suportando um número limitado de cores e transparência.
Profundidade de Bit:
Refere-se ao número de bits usados para representar a cor de
cada pixel em uma imagem, afetando a quantidade de cores que podem ser
representadas.
Filtro de Blurring: .
Técnica de processamento de imagem que suaviza os detalhes e
reduz o ruído, criando uma aparência de “borrão”
Filtro de Sharpening:
Processo de aumentar a clareza ou definição de uma imagem,
realçando as bordas e os detalhes.
Rotação:
Transformação geométrica que gira uma imagem em torno de um ponto
central.
Escala:
Transformação geométrica que aumenta ou diminui o tamanho de uma
imagem.
Translação:
Movimento de uma imagem em uma direção específica (vertical ou
horizontal).
CNN (Convolutional Neural Network):
Tipo de rede neural profunda especialmente
eficaz para análise e reconhecimento de imagens e padrões visuais
Mapa de Recursos (Feature Map):
Imagem gerada na CNN após a aplicação de filtros,
que destaca características específicas da imagem original.
Max Pooling:
Operação em CNNs que reduz as dimensões espaciais (altura e largura)
dos mapas de recursos, mantendo apenas os valores máximos de uma região
específica
Visão computaciona
é um campo da inteligência artificial que foca em capacitar
computadores para interpretar e entender o mundo visual. Isso envolve a aquisição, o
processamento, a análise e a compreensão de imagens digitais e padrões de dados
visuais. O objetivo final é que as máquinas possam identificar e processar imagens de
maneira semelhante ao olho humano, mas com a capacidade de análise e
processamento de dados que ultrapassam as limitações humanas.
Histórico da Visão Computacional
Década de 1950 e 1960: As raízes da visão computacional podem ser traçadas até os
primeiros dias da inteligência artificial. Pesquisadores começaram a experimentar
maneiras de permitir que as máquinas “vissem” e reconhecessem padrões em
imagens. Estes primeiros esforços foram bastante básicos devido às limitações da
tecnologia de computação da época.
Década de 1970:
Houve um progresso significativo no campo, com pesquisadores
desenvolvendo algoritmos mais avançados para reconhecimento de formas e
objetos. Durante este período, a visão computacional começou a se diferenciar do processamento de imagens, com um foco maior na interpretação de cenas visuais,
em vez de apenas processar e manipular imagens digitais.
Décadas de 1980 e 1990
Com o advento de computadores mais poderosos e o
desenvolvimento da teoria dos algoritmos, a visão computacional começou a se
tornar mais sofisticada. Neste período, começaram a surgir aplicações práticas, como
sistemas de inspeção industrial e reconhecimento facial.
Século 21
A ascensão da aprendizagem profunda e das redes neurais convolucionais
(CNNs) revolucionou o campo da visão computacional. Estas tecnologias permitiram
avanços significativos na precisão e na eficiência do reconhecimento e classificação
de imagens, tornando possíveis aplicações como carros autônomos, diagnósticos
médicos automatizados e sistemas de segurança avançados.
Reconhecimento Facial e Biometria:
Uma das aplicações mais conhecidas da visão
computacional é o reconhecimento facial, utilizado em sistemas de segurança,
desbloqueio de smartphones e verificação de identidade. Além disso, a biometria,
que pode incluir a identificação de impressões digitais, íris e até características
comportamentais, depende em grande parte de técnicas de visão computacional.
Veículos Autônomos:
Carros, drones e outros veículos autônomos usam visão
computacional para navegar pelo ambiente. Eles utilizam câmeras e sensores para
detectar obstáculos, ler sinais de trânsito, e entender o contexto da via, como a
presença de pedestres e outros veículos.
Diagnóstico Médico:
A visão computacional está revolucionando a área da saúde,
especialmente na análise de imagens médicas. Algoritmos de visão computacional
podem identificar padrões em radiografias, ressonâncias magnéticas e outras
imagens médicas, auxiliando na detecção precoce de doenças como câncer, doenças
cardíacas e mais
Inspeção Industrial e Controle de Qualidade:
Em ambientes industriais, a visão
computacional é utilizada para inspecionar produtos em linhas de montagem,
garantindo que eles atendam a padrões de qualidade específicos. Isso inclui a
verificação de defeitos, a conformidade com as especificações e até a embalagem
dos produtos.
Sistemas de Vigilância:
A visão computacional permite o monitoramento de vídeo
mais inteligente, com a capacidade de detectar atividades suspeitas, identificar
indivíduos em listas de observação ou até analisar padrões de tráfego em espaços
públicos para segurança e planejamento urbano.
Comércio e Publicidade:
No varejo, a visão computacional está sendo usada para
análise de comportamento do consumidor, gestão de estoque e até experimentação virtual de produtos, como óculos e roupas. Na publicidade, permite a criação de
experiências imersivas e personalizadas para os consumidores.
Agricultura:
A tecnologia de visão computacional está sendo empregada na
agricultura para monitorar culturas, identificar doenças nas plantas, e otimizar a
colheita. Drones equipados com câmeras podem analisar extensas áreas de plantio,
fornecendo dados valiosos para agricultores
Robótica
Na robótica, a visão computacional é crucial para a interação do robô com
o ambiente. Ela permite que os robôs realizem tarefas complexas, como montagem
de componentes, manipulação de objetos e navegação em ambientes variados.
Entretenimento e Mídia:
Em filmes e jogos, a visão computacional é usada para
captura de movimento, criando animações realistas de personagens. Também é
utilizada em realidade aumentada e realidade virtual, criando experiências imersivas
para os usuários.
Análise de Imagens de Satélite
Para monitoramento ambiental, planejamento urbano
e coleta de informações geográficas, a análise de imagens de satélite através da
visão computacional é fundamental. Ela permite a identificação de mudanças na
paisagem, monitoramento de desastres naturais, e mapeamento de recursos naturais.
Processamento de Imagem
- Definição: Processamento de imagem refere-se a técnicas que são aplicadas para
realizar transformações em imagens. O objetivo principal é melhorar a qualidade da
imagem ou extrair informações úteis dela. - Operações: Inclui operações como ajuste de contraste, filtragem, realce de bordas,
redução de ruído, compressão de imagem, e conversão entre diferentes formatos de
imagem. - Aplicações: Utilizado em fotografia digital, impressão, transmissão de televisão,
médicos que precisam melhorar a qualidade de imagens radiográficas, entre outros. - Foco: Está mais concentrado em manipular e melhorar a qualidade visual das
imagens. Não tenta interpretar o conteúdo da imagem ou entender o que está sendo
representado.
Visão Computacional
. Definição: Visão computacional é um campo da inteligência artificial que visa ensinar
máquinas a interpretar e entender o mundo visual. Ela envolve não apenas o
processamento de imagens, mas também a extração de informações significativas
delas.
2. Operações: Abrange identificação de objetos, detecção e reconhecimento de
padrões, classificação de imagens, percepção de profundidade, e compreensão de
cenas.
3. Aplicações: Usada em reconhecimento facial, veículos autônomos, vigilância,
diagnóstico médico automatizado, e sistemas de interação homem-computador.
4. Foco: O objetivo é que a máquina “veja” e “entenda” a imagem de maneira
semelhante aos seres humanos. Vai além do processamento básico de imagens e
busca interpretar o que as imagens representam no mundo real.
Relação entre os Dois Campos
Embora distintos, processamento de imagem e visão computacional são campos
complementares. O processamento de imagem muitas vezes serve como um passo
preliminar para a visão computacional, preparando imagens para uma análise mais
complexa. Por exemplo, antes de uma máquina poder reconhecer um rosto em uma
imagem, pode ser necessário primeiro melhorar a qualidade da imagem através de
técnicas de processamento de imagem.
Ou seja, enquanto o processamento de imagem se concentra em manipular e melhorar
imagens, a visão computacional busca entender e interpretar o conteúdo dessas
imagens.
Álgebra Linear Básica
Álgebra linear é a base para operações com imagens e gráficos em visão
computacional. Ela lida com vetores, matrizes, espaços vetoriais e transformações
lineares, que são essenciais para representar e manipular imagens e formas.
Usada em operações como rotação, escala e transformações de imagens; também é
fundamental em algoritmos de aprendizado de máquina, como redes neurais, que são
amplamente usadas em visão computacional.
Fundamentos Matemáticos
Visão computacional é baseada em alguns fundamentos matemáticos que são
importantes de mencionar antes de entrarmos em conceitos mais avançados.