Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Aula 12: Análise de Blob, Processamento de Imagem Binária, Teorema de Green, Derivada e Integral
Aula 12: Análise de Blob, Processamento de Imagem Binária, Teorema de Green, Derivada e Integral
Nesta palestra, o professor aborda uma variedade de tópicos, incluindo propriedade intelectual, patentes, marcas registradas e técnicas de processamento de imagem para detecção de bordas. A palestra enfatiza a importância da precisão na visão de máquina 2D e os desafios de detectar bordas difusas ou desfocadas. O professor aborda métodos para encontrar derivadas parciais mistas, laplacianos e detecção de borda usando interpolação de subpixel, juntamente com técnicas para compensação de viés e calibração correcional na localização de pico. No geral, a palestra fornece uma visão abrangente desses tópicos e suas aplicações práticas.
Nesta palestra sobre processamento de imagem, o palestrante discute vários métodos para evitar a quantização das direções de gradiente e melhorar a precisão na determinação da posição da borda. A interpolação é sugerida como um método preferencial sobre tabelas de pesquisa e quantização para uma determinação mais precisa da direção do gradiente. Além disso, a fixação do tamanho do passo com um círculo e o uso da análise multiescala são discutidos como métodos alternativos de cálculo de gradiente. O palestrante também explica uma abordagem iterativa para girar uma imagem para reduzir o componente y do gradiente a zero e apresenta o conceito de côrdico para girar através de ângulos especiais. Os alunos são lembrados de começar cedo no questionário, pois é mais trabalho do que o típico problema de lição de casa.
Aula 13: Detecção de objetos, reconhecimento e determinação de pose, PatQuick (Patente dos EUA 7016539)
Aula 13: Detecção de objetos, reconhecimento e determinação de pose, PatQuick (Patente dos EUA 7016539)
A palestra enfoca a detecção de objetos, reconhecimento e determinação de pose, com ênfase na patente PatQuick (US 7.016.539). A patente visa detectar e determinar a pose de objetos no espaço e oferece uma melhoria em relação aos métodos anteriores, usando uma representação abstrata chamada modelo que é comparada a uma imagem em tempo de execução em diferentes poses e rotações. A patente também incorpora uma lista de graus de liberdade generalizados para aumentar a precisão e usa filtragem passa-baixa e detecção de borda para obter pontos de limite, adiando a limiarização até os estágios finais. Além disso, a palestra discute o processo de criação de modelos usando detecção de borda e sondas com espaçamento e contraste desejados para representar esses modelos, explicando a importância de considerar graus de liberdade como translação, rotação, escala e proporção, que permitem variações em dimensões e perspectivas do objeto.
O vídeo discute os padrões de pesquisa hexagonal utilizados para pesquisa translacional eficiente e escalável na detecção de objetos, incluindo detecção de pico e uma solução para detectar objetos adjacentes. O vídeo também discute o PatQuick, uma patente para determinar a presença de padrões predeterminados em imagens de tempo de execução e sua localização multidimensional. O método usa sondas e um gradiente pré-computado para corresponder à pose de um objeto, e a integração da função de pontuação remove erros do resultado. O vídeo explora um método alternativo para determinar as diferenças angulares usando produtos pontuais e enfatiza as complexidades das operações em várias escalas e a seleção de sondas para diferentes granularidades. A precisão do método é limitada pela quantização do espaço de busca.
Aula 14: Inspeção em PatQuick, Transformada de Hough, Homografia, Determinação de Posição, Multiescala
Aula 14: Inspeção em PatQuick, Transformada de Hough, Homografia, Determinação de Posição, Multiescala
Nesta palestra, o algoritmo PatQuick é discutido, com foco no uso de sondas para produzir uma função de pontuação em um espaço multidimensional, que determina a pose de um objeto em imagens em tempo real. A função de correspondência usada para classificar a qualidade da correspondência em termos de direção e magnitude do gradiente também é examinada, com diferentes funções de pontuação discutidas para compensações entre precisão e velocidade. A palestra também aborda diferentes métodos usados para tornar o processo de correspondência de padrões mais eficiente, incluindo ajustar a granularidade da computação e enfrentar o desafio de acertar as direções, especialmente ao realizar transformações que alteram a proporção de uma imagem. A palestra também aborda o tema da homografia e a transformada de Hough para detectar linhas em fotografias.
A palestra abrange uma variedade de tópicos relacionados à visão computacional, incluindo Hough Transform, Extended Gauss Half Transform, determinação de posição, subamostragem multiescala e SIFT. A Transformada Hough é usada para detecção de linhas e bordas, enquanto a Metade Gauss Estendida é uma versão mais sofisticada da Transformada Hough. A palestra também explica como usar a Transformada Hough para detectar círculos, como a localização de uma torre de celular. Além disso, o palestrante discute a subamostragem de imagens para diminuir a carga de trabalho sem sacrificar a qualidade e apresenta o SIFT, um método para encontrar pontos correspondentes em diferentes imagens de uma cena, amplamente utilizado na produção de informações 3D a partir de várias imagens. Por fim, o palestrante discute brevemente a teoria musical e termina com um lembrete para enviar propostas e uma citação sobre não atrasar.
Aula 15: Alinhamento, PatMax, Campo de Distância, Filtragem e Subamostragem (patente dos EUA 7065262)
Aula 15: Alinhamento, PatMax, Campo de Distância, Filtragem e Subamostragem (patente dos EUA 7065262)
O vídeo discute várias técnicas e patentes relacionadas ao reconhecimento de padrões e detecção de objetos. Uma dessas técnicas é o PatMax, que melhora iterativamente a pose de uma imagem em tempo de execução usando um sistema atraente baseado em força. Outra técnica envolve a geração de um campo vetorial em uma grade de pixels para melhorar o alinhamento da imagem em tempo de execução. A palestra também aborda o uso de campos de distância para detecção de arestas e expansão de arestas semeadas observando vetores de força no campo vetorial. O palestrante também discute o uso de correspondência de padrões multiescala e as etapas matemáticas envolvidas no ajuste de linhas a conjuntos de coordenadas de imagem. Por fim, é apresentada uma patente para o cálculo eficiente de escalas múltiplas.
Na Aula 15, o palestrante aborda várias técnicas e atalhos para convolução, filtragem e subamostragem eficientes de imagens. Isso inclui a aproximação de kernels de filtro usando polinômios spline por partes, usando derivados como convoluções, compactando imagens tomando repetidamente a terceira diferença e combinando convoluções de direção x e y. O palestrante também menciona a importância da filtragem passa-baixa antes da amostragem da imagem para evitar interferências e aliasing nas imagens.
Aula 16: Convolução rápida, aproximações de filtro passa-baixo, imagens integrais (Patente dos EUA 6457032)
Aula 16: Convolução rápida, aproximações de filtro passa-baixo, imagens integrais (Patente dos EUA 6457032)
A palestra abrange vários tópicos relacionados ao processamento de sinal, incluindo limitação de banda, aliasing, aproximações de filtro passa-baixo, desfoque, imagem integral, análise de Fourier e convolução. O alto-falante enfatiza a importância da filtragem passa-baixa dos sinais antes da amostragem para evitar artefatos de aliasing. A palestra também apresenta a ideia da imagem integral, que calcula eficientemente a soma dos pixels dentro de um bloco, e várias técnicas para reduzir a computação ao aproximar filtros passa-baixa. Por fim, a palestra discute a interpolação bicúbica, que é usada para aproximar a função sinc, e seus custos computacionais.
Nesta palestra, o palestrante discute vários tópicos relacionados à convolução, aproximações de filtro passa-baixo e imagens integrais. Eles explicam diferentes implementações de convolução, incluindo um método que economiza tempo de computação adicionando valores da esquerda para a direita e subtraindo para obter a média. As limitações da interpolação linear para aproximações de filtro passa-baixo e sua inferioridade em comparação com métodos mais avançados como a interpolação cúbica também são discutidas. O conceito de uma casamata e seu valor em limitar as faixas de frequência é apresentado, e o palestrante fala sobre o filtro passa-baixo ideal e como a desfocagem afeta a função de Bessel. A palestra também aborda o uso de aproximações de filtro passa-baixo para lentes de câmeras DSLR e o conceito de fotogrametria.
Aula 17: Fotogrametria, Orientação, Eixos de Inércia, Simetria, Orientação
Aula 17: Fotogrametria, Orientação, Eixos de Inércia, Simetria, Orientação
Esta palestra aborda vários tópicos relacionados à fotogrametria, incluindo dicas de profundidade, calibração de câmeras e estabelecimento da transformação entre dois sistemas de coordenadas. O palestrante explica como abordar o problema de encontrar a transformação de coordenadas entre dois sistemas usando medições correspondentes e destaca a importância de verificar o inverso exato da transformação. A palestra também discute como encontrar os eixos de inércia no espaço 2D e 3D e determinar a distância entre dois pontos projetados em um eixo. No geral, a seção fornece uma visão abrangente da fotogrametria e suas aplicações.
A fotogrametria requer a construção de um sistema de coordenadas em uma nuvem de pontos em sistemas de coordenadas à esquerda e à direita e relacionando os dois. O palestrante explica como determinar a matriz de inércia ou os eixos de inércia e estabelecer os vetores de base. Eles também discutem os desafios impostos por objetos simétricos e as propriedades de rotação, como a preservação de produtos escalares, comprimentos e ângulos. Além disso, a palestra aborda como simplificar o problema de encontrar a rotação, eliminando a translação e minimizando o termo de erro. Por fim, o palestrante explica como alinhar dois objetos com formas semelhantes usando cálculo vetorial e sugere explorar outras representações para rotação.
Aula 18: Rotação e como representá-la, unidade quaternions, o espaço das rotações
Aula 18: Rotação e como representá-la, unidade quaternions, o espaço das rotações
Esta palestra discute os desafios de representar rotações e apresenta a utilidade dos quatérnios de Hamilton. Os quaternions unitários são particularmente úteis, pois mapeiam diretamente as rotações em três espaços, permitindo uma discussão de um espaço de rotação e otimização nesse espaço. Os quatérnios têm propriedades semelhantes aos números complexos e são particularmente úteis para representar rotações, pois preservam produtos escalares, produtos triplos, comprimento, ângulos e lateralidade. A palestra também discute diferentes métodos de representação de rotação, a importância de poder rotacionar vetores e compor rotações e as limitações de métodos convencionais, como matrizes, ângulos de Euler e gimbal lock. Por fim, a palestra apresenta pesquisas em andamento no campo, incluindo otimização e ajuste de rotações a modelos e desenvolvimento de novos métodos para analisar e visualizar espaços de rotação.
Nesta palestra, o professor discute o problema de encontrar a transformação de coordenadas entre dois sistemas de coordenadas ou a melhor rotação e translação entre dois objetos com pontos correspondentes medidos nos dois sistemas de coordenadas. A palestra explora o uso de quaternions para alinhar câmeras de espaçonaves com direções de catálogo e resolver o problema de orientação relativa. A eficiência dos quaternions na representação de rotações é discutida, bem como diferentes métodos para abordar a representação de rotações no espaço quadridimensional. Além disso, a palestra explora vários grupos de rotação para diferentes poliedros, enfatizando a importância de selecionar o sistema de coordenadas correto para obter uma amostragem de espaço regular.
Aula 19: Orientação Absoluta na Forma Fechada, Outliers e Robustez, RANSAC
Aula 19: Orientação Absoluta na Forma Fechada, Outliers e Robustez, RANSAC
A palestra cobre vários aspectos da orientação absoluta, incluindo o uso de quaternions unitários para representar rotações em fotogrametria, conversão entre quaternions e representações de matrizes ortonormais, lidando com simetria de rotação e coordenação de translação, escala e rotação de maneira livre de correspondência. A palestra também discute o problema de outliers e robustez no ajuste de linha e processos de medição e apresenta o método RANSAC (Random Sample Consensus) como forma de melhorar a confiabilidade das medições quando outliers estão presentes. A palestra termina com uma discussão sobre como resolver o problema de orientação absoluta na forma fechada usando dois planos em um cenário coplanar, incluindo desafios relacionados a outliers e otimização.
Neste vídeo sobre orientação absoluta, o palestrante discute a questão dos outliers em dados reais e propõe o uso do RANSAC, um método de consenso envolvendo ajustes aleatórios de subconjuntos para lidar com outliers. O palestrante também discute métodos para obter uma distribuição uniforme de pontos em uma esfera, incluindo inscrever uma esfera em um cubo e projetar pontos aleatórios, pavimentar a superfície da esfera e gerar pontos em poliedros regulares. Além disso, o palestrante aborda maneiras de amostrar o espaço de rotações para reconhecimento eficiente de vários objetos em uma biblioteca, encontrando o número de rotações necessárias para alinhar um objeto consigo mesmo e abordando o problema de encontrar rotações por meio de exemplos ou multiplicação de quatérnios.
MIT 6.801 Machine Vision, outono de 2020. Aula 20: Espaço de rotações, mosaicos regulares, superfícies críticas, estéreo binocular
Aula 20: Espaço de Rotações, Pavimentações Regulares, Superfícies Críticas, Estéreo Binocular
Esta seção da palestra abrange tópicos como tesselações regulares, superfícies críticas, estéreo binocular e como encontrar os parâmetros de uma transformação no espaço tridimensional. O palestrante explica que a melhor maneira de tesselar uma esfera é usando o dual de uma tesselação triangular, criando formas aproximadamente hexagonais com alguns pentágonos. Eles também discutem superfícies críticas, que são difíceis para visão de máquina, mas podem ser usadas para criar móveis a partir de bastões retos. Na discussão do estéreo binocular, o palestrante explica a relação entre duas câmeras, o conceito de linhas epipolares e como encontrar a interseção de duas câmeras para determinar um ponto no mundo. Eles também explicam como calcular o erro entre dois raios para determinar sua interseção e minimizar o erro da imagem, levando em consideração o fator de conversão entre o erro no mundo e o erro na imagem. Finalmente, eles discutem como encontrar a linha de base e D para recuperar a posição e orientação de um objeto rígido no espaço usando um quaternion para representar a linha de base.
A palestra cobre vários tópicos, incluindo o espaço de rotações, mosaicos regulares, superfícies críticas e estéreo binocular. Para rotações, o instrutor discute o uso de abordagens numéricas, o problema das singularidades e os benefícios do uso de quaternions unitários. Com mosaicos regulares, eles mostram como certas superfícies podem causar problemas com o estéreo binocular e sugerem o uso de medidas e pesos de erro para mitigar os problemas. O palestrante também aborda superfícies quádricas e apresenta um novo problema de lição de casa que envolve "reflexão destemida".
Aula 21: Orientação Relativa, Estéreo Binocular, Estrutura, Quadrics, Calibração, Reprojeção
Aula 21: Orientação Relativa, Estéreo Binocular, Estrutura, Quadrics, Calibração, Reprojeção
Esta palestra aborda tópicos relacionados à fotogrametria, incluindo orientação relativa, superfícies quádricas, calibração de câmeras e correspondências entre pontos de imagem e objetos 3D conhecidos. O palestrante explica vários métodos para resolver problemas de distorção e obtenção de parâmetros como f e tz. Eles também enfatizam a importância dos vetores unitários ortogonais ao encontrar a matriz rotacional completa e fornecem soluções para encontrar k usando uma fórmula mais estável. O palestrante enfatiza a importância de entender as equações homogêneas, que são críticas na visão de máquina.
Esta palestra aborda vários tópicos relacionados à visão computacional e calibração, incluindo o uso de um alvo planar para calibração, a ambigüidade de calibrar a orientação externa, a redundância na representação de parâmetros de rotação e a determinação das propriedades estatísticas de determinados parâmetros por meio da taxa de ganho de ruído. A palestra explica a fórmula para resolver uma equação quadrática e apresenta um método de aproximação envolvendo iteração. O caso do alvo planar é discutido como um método comumente usado para aplicações de calibração e visão de máquina. A palestra também aborda a representação de forma e reconhecimento e determinação de atitude no espaço 3D.