Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
AMD Developer Central: visão geral técnica do OpenCL. Episódio 2: O que é OpenCL™? (contínuo)
AMD Developer Central: visão geral técnica do OpenCL. Episódio 2: O que é OpenCL™? (contínuo)
Neste vídeo, Justin Hensley discute os modelos de plataforma e memória do OpenCL, que são importantes para entender ao usar o OpenCL para acelerar aplicativos. Ele explica que um host está conectado a um ou mais dispositivos OpenCL, como GPUs ou processadores multi-core, que possuem unidades de computação que executam código em um modelo de dados múltiplos de uma única instrução. Os itens de trabalho têm memória privada, enquanto os grupos de trabalho têm memória local compartilhada, cada dispositivo tem memória global e constante e os desenvolvedores devem gerenciar explicitamente a sincronização de memória e os dados para obter desempenho máximo. Além disso, Hensley discute objetos OpenCL como dispositivos, contextos, filas, buffers, imagens, programas, kernels e eventos, que são usados para enviar trabalho a dispositivos, sincronizar e criar perfis de dados. Por fim, ele descreve como executar um programa OpenCL em três etapas fáceis: criação de programas e objetos de kernel, criação de objetos de memória e criação de filas de comandos com eventos para garantir a ordem adequada de execução do kernel.
AMD Developer Central: visão geral técnica do OpenCL. Episódio 3: Configuração de recursos
AMD Developer Central: visão geral técnica do OpenCL. Episódio 3: Configuração de recursos
No Episódio 3 da série de tutoriais do OpenCL, o palestrante se aprofunda na configuração e gerenciamento de recursos no OpenCL, abordando tópicos como objetos de memória, contexto, dispositivos e filas de comandos. O processo de acesso e alocação de memória para imagens também é discutido, com foco nas chamadas de leitura e gravação de imagens e nos formatos suportados. As características das operações de memória síncronas e assíncronas são examinadas, com uma explicação de como o sistema de gerenciamento de eventos OpenCL pode ser usado para garantir a conclusão da transferência de dados. Por fim, os usuários são aconselhados a consultar as informações do dispositivo com a chamada CL get device info para escolher o melhor dispositivo para seu algoritmo.
para o espaço de endereço do host, o CL no buffer de mapa de fila é usado. Por fim, o buffer de cópia da fila CLN é usado para copiar a memória entre dois objetos de memória.
AMD Developer Central: visão geral técnica do OpenCL. Episódio 4: Execução do Kernel
AMD Developer Central: visão geral técnica do OpenCL. Episódio 4: Execução do Kernel
Nesta seção, Justin Hensley aborda o tópico de execução do kernel no OpenCL, explicando que os objetos do kernel contêm uma função específica do kernel e são declarados com o qualificador do kernel. Ele divide as etapas para executar um kernel, incluindo definir argumentos do kernel e enfileirar o kernel. Hensley enfatiza a importância de usar eventos para gerenciar vários kernels e evitar problemas de sincronização, e ele sugere usar CL wait for events para esperar que eles sejam concluídos antes de prosseguir. O vídeo também detalha a criação de perfil do aplicativo para otimizar os kernels que levam mais tempo para serem executados.
AMD Developer Central: visão geral técnica do OpenCL. Episódio 5: Programando com OpenCL™ C
AMD Developer Central: visão geral técnica do OpenCL. Episódio 5: Programando com OpenCL™ C
Este vídeo discute vários recursos da linguagem OpenCL™ C, incluindo funções de item de trabalho, funções de grupo de trabalho, tipos de vetores e funções de sincronização incorporadas. O vídeo enfatiza a importância do uso de qualificadores de espaço de endereçamento corretos para escrita de código paralelo eficiente e compartilhamento de memória entre grupos de trabalho. O conceito de tipos vetoriais é discutido em detalhes junto com o uso do espaço de memória correto para argumentos de ponteiro do kernel, variáveis locais e variáveis globais do programa. Além disso, funções matemáticas integradas e funções de grupo de trabalho, como barreiras e memfences, são cobertas com uma sugestão para verificar essas funções em tempo de execução.
Como usar OpenCL para trabalho de GPU
Como usar OpenCL para trabalho de GPU
O vídeo apresenta o OpenCL como uma ferramenta de padrão aberto que pode funcionar na maioria das novas placas gráficas no Windows com a instalação necessária de CUDA ou drivers gráficos específicos, dependendo da placa. O palestrante descreve um programa simples, o processo de criação de um kernel, buffers para dados, definição de argumentos do kernel e tamanho de trabalho global e execução da carga de trabalho no dispositivo em OpenCL, comparando-o com CUDA. Os parâmetros envolvidos na criação de um kernel em OpenCL para trabalho de GPU, buffer de leitura de enfileiramento, desalocação de memória foram explicados com códigos de amostra para verificar os cálculos. Ao apresentar um pequeno programa que aplica desfoque sutil a imagens em tons de cinza usando OpenCL, o apresentador destaca que OpenCL tem mais código padrão do que CUDA, mas é uma solução aberta e padrão aplicável a diferentes placas gráficas e pode ser reutilizada em diferentes sistemas, independentemente do fabricante.
EECE.6540 Computação Heterogênea (Universidade de Massachusetts Lowell)
1. Breve introdução ao processamento paralelo com exemplos
Este vídeo fornece uma breve introdução ao processamento paralelo com exemplos. O palestrante explica que a computação paralela envolve dividir uma tarefa maior em subtarefas menores para serem executadas em paralelo. Duas estratégias principais para alcançar isso são dividir e conquistar e espalhar e reunir. O vídeo fornece exemplos de aplicações naturais e artificiais que possuem inerentemente muito paralelismo, como sentidos humanos, carros autônomos e crescimento celular. O vídeo também discute os benefícios do processamento paralelo e demonstra como ele pode ser aplicado à classificação, multiplicação de vetores, processamento de imagens e localização do número de ocorrências de uma sequência de caracteres em um corpo de texto. Por fim, o vídeo apresenta o processo de redução, também conhecido como processo de soma, para coletar e processar os resultados obtidos de recursos paralelos.
2. Simultaneidade, Paralelismo, Decomposições de Dados e Tarefas
2. Simultaneidade, Paralelismo, Decomposições de Dados e Tarefas
O vídeo investiga os conceitos de simultaneidade e paralelismo, bem como o uso de tarefas e decomposições de dados e as técnicas de decomposição de dados para paralelismo e simultaneidade. A Lei de Amdahl é explorada como um meio de calcular a aceleração teórica ao executar tarefas em vários processadores. A importância dos gráficos de dependência de tarefas é destacada na identificação das dependências entre tarefas ao dividir um problema em subtarefas. Métodos para decomposição de dados, como dados de entrada e particionamento de vetores de linhas, são indicados como úteis para a realização de cálculos. Operações atômicas e sincronização são descritas como vitais para gerar o resultado correto após a conclusão de todas as subtarefas.
3. Computação Paralela: Software e Hardware
3. Computação Paralela: Software e Hardware
O vídeo discute diferentes abordagens para atingir altos níveis de paralelismo na computação. O palestrante descreve as técnicas de hardware e software usadas para executar computação paralela, incluindo paralelismo de nível de instrução (ILP), threads de software, CPUs multi-core, SIMD e processadores SPMD. O vídeo também explica a importância da densidade de paralelismo e o conceito de unidades de computação/processamento, que permitem uma computação paralela eficiente. Além disso, o palestrante discute os desafios de criar operações atômicas para fins de sincronização e a necessidade de reestruturar problemas para execução eficiente em GPUs.
4. Dois Documentos Importantes sobre Processadores Heterogêneos
4. Dois Documentos Importantes sobre Processadores Heterogêneos
O vídeo aborda vários artigos relacionados à computação heterogênea, incluindo tendências em design de processador e eficiência energética, os benefícios do uso de hardware personalizado e aceleradores especializados, a importância de balancear núcleos grandes e pequenos e os desafios da movimentação de dados e comunicação eficiente entre os núcleos. Os documentos também discutem a necessidade de entender o agendamento e a partição da carga de trabalho ao trabalhar com processadores heterogêneos e o uso de linguagens de programação e estruturas como OpenCL, CUDA e OpenMP. No geral, os documentos destacam os benefícios potenciais da utilização de vários núcleos e aceleradores para maximizar o desempenho e a eficiência energética em ambientes de computação heterogêneos.
5. Visão geral do hardware de computação
5. Visão geral do hardware de computação
O vídeo fornece uma visão geral do hardware de computação, discutindo tópicos como arquiteturas de processador, considerações de design, multithreading, cache, hierarquia de memória e design de lógica de controle. Também explica como um programa é um conjunto de instruções que um computador segue para executar uma tarefa e os diferentes tipos de programas, incluindo software de sistema e aplicativos. O vídeo enfatiza a importância dos componentes de hardware de um computador, como CPU e memória, que trabalham juntos para executar programas e realizar tarefas.