Discussão do artigo "Redes neurais de maneira fácil (Parte 81): Análise da dinâmica dos dados considerando o contexto (CCMR)"

 

Novo artigo Redes neurais de maneira fácil (Parte 81): Análise da dinâmica dos dados considerando o contexto (CCMR) foi publicado:

Em trabalhos anteriores, sempre avaliamos o estado atual do ambiente. No entanto, a dinâmica das mudanças dos indicadores sempre ficou "nos bastidores". Neste artigo, quero apresentar a vocês um algoritmo que permite avaliar a mudança direta dos dados entre dois estados consecutivos do ambiente.

Nesta série, exploramos vários métodos de análise do estado do ambiente e algoritmos para usar os dados obtidos. Usamos modelos convolucionais para identificar padrões consistentes em dados históricos de movimento de preço e modelos de atenção para buscar dependências entre estados locais específicos do ambiente. No entanto, sempre avaliamos os estados do ambiente como "fotografias" em momentos específicos, sem analisar a dinâmica dos indicadores do estado do ambiente. Assumimos que o modelo, ao analisar e comparar os estados do ambiente, notaria as mudanças chave, mas não representamos explicitamente essa dinâmica de maneira quantitativa.

No entanto, no campo da visão computacional, existe uma tarefa importante chamada de avaliação do fluxo óptico, que mostra informações sobre o movimento dos objetos na cena. E em relação a essa tarefa, foi proposto uma série de algoritmos interessantes, amplamente aplicados. Os resultados da avaliação do fluxo óptico são aplicados em várias áreas, como condução autônoma, rastreamento e observação de objetos.

A maioria das abordagens atuais usa redes neurais convolucionais, embora elas não disponham de contexto global. Isso dificulta a análise da oclusão de objetos ou de grandes deslocamentos. Uma abordagem alternativa consiste no uso de transformadores e métodos de atenção, que permitem ir além do campo de visão fixo das CNN clássicas.

Um método particularmente interessante neste contexto é o CCMR, apresentado no artigo "CCMR: High Resolution Optical Flow Estimation via Coarse-to-Fine Context-Guided Motion Reasoning". Esta forma de avaliar o fluxo óptico combina as vantagens dos métodos focados na agregação de movimento e em técnicas multiescala de alta resolução. Ela integra passo a passo ideias de agrupamento de movimento (baseadas no contexto) em um esquema que avalia a resolução grosseira e fina. Isso permite ter campos de fluxo detalhados que também oferecem alta precisão em áreas oclusas. Nesse contexto, é proposta uma estratégia de agrupamento de movimento em duas etapas: primeiro estimamos características contextuais de auto-atenção global, que usamos, então, para orientar características de movimento iterativamente em todas as escalas. Assim, o raciocínio sobre o movimento orientado por contexto baseado no XCiT assegura o processamento em todas as escalas grosseiras e finas. Experimentos realizados pelos autores do método mostram que a abordagem proposta tem um desempenho forte e destacam as vantagens de seus principais conceitos.

Autor: Dmitriy Gizlyk