HPC Challenge é um pacote de benchmark de alto desempenho. O Desafio de HPC consiste basicamente sete benchmarks:
1. HPL - o benchmark Linpack TPP que mede a taxa de ponto flutuante de execução para resolver um sistema de equações lineares.
2. DGEMM - mede a taxa de ponto flutuante de precisão dupla execução de multiplicação de matriz-matriz real.
3. STREAM - um programa de benchmark sintético simples que mede a largura de banda de memória sustentável (em GB / s) ea taxa correspondente para a computação simples kernel do vetor.
4. PTRANS (transpor matriz paralela) - exerce as comunicações onde pares de processadores se comunicam uns com os outros ao mesmo tempo. É um teste útil da capacidade total das comunicações de rede.
5. RandomAccess - mede a taxa de atualização aleatórios inteiros de memória (GUPS).
6. FFTE - mede a taxa de execução de ponto flutuante de precisão dupla complexo unidimensional Discrete Fourier Transform (DFT).
7. Comunicação largura de banda e latência - um conjunto de testes para medir a latência e largura de banda de uma série de padrões de comunicação simultâneos; baseado em b_eff (benchmark largura de banda efetiva).
Compilando:
O primeiro passo é criar um arquivo de configuração que reflete as características da sua máquina. O arquivo de configuração deve ser criado no diretório HPL. Este diretório contém instruções (os arquivos leia-me e instalação) sobre como criar o arquivo de configuração. O diretório HPL / setup contém muitos exemplos de arquivos de configuração. Uma boa abordagem é copiar um deles para o diretório HPL e se ele não funcionar, então alterá-lo. Este arquivo é reutilizado por todos os componentes do conjunto HPC Challange.
Quando a configuração estiver concluída, um arquivo deve existir no diretório hpl cujo nome começa com a Marca. e termina com o nome para o sistema utilizado para os ensaios. Por exemplo, se o nome do sistema é Unix, o arquivo deve ser nomeado Make.Unix.
Para criar o arquivo executável de referência (para o sistema chamado Unix) digite: make arch = Unix. Este comando deve ser executado na pasta de topo (não no diretório HPL). Ele vai procurar no diretório hpl para o arquivo de configuração e usá-lo para construir o executável benchmark.
Configuração:
O HPC Challange é impulsionado por um arquivo de entrada curto nomeado hpccinf.txt que é quase o mesmo que o arquivo de entrada para HPL (habitualmente chamado HPL.dat). Consulte o arquivo de HPL / www / tuning.html para obter detalhes sobre o arquivo de entrada para HPL. Um arquivo de entrada de amostra está incluído com a distribuição HPC Challange.
As diferenças entre o ficheiro de entrada HPL e arquivo de entrada Challange HPC pode ser resumido como se segue:
* As linhas 3 e 4 são ignorados. A saída sempre vai para o arquivo nomeado hpccoutf.txt.
* Existem linhas adicionais (linha 33) que pode (mas não têm de) ser usado para personalizar o benchmark HPC Challenge. Eles encontram-se descritos abaixo.
As linhas adicionais no arquivo de entrada HPC Challenge (em comparação com o arquivo de entrada HPL) são:
Linhas 33 e 34 descrevem os tamanhos de matriz adicionais para ser usado para executar o benchmark PTRANS (um dos componentes do benchmark HPC Challange).
* Linhas 35 e 36 descrever os fatores de bloqueio adicionais para ser usado para a execução de PTRANS benchmark.
Apenas para completar, aqui está a lista de linhas de arquivo de entrada do HPC Challange com breves descrições de seu significado:
* Linha 1: ignorado
* Linha 2: ignorado
* Linha 3: ignorados
* Linha 4: ignorado
* Linha 5: número de tamanhos de matriz para HPL (e PTRANS)
* Linha 6: tamanhos de matriz para HPL (e PTRANS)
* Linha 7: número de factores de bloqueio para HPL (e PTRANS)
* Linha 8: fatores de bloqueio para HPL (e PTRANS)
* Linha 9: tipo de processo de encomenda para HPL
* Linha 10: número de grades de processo para HPL (e PTRANS)
* Linha 11: número de linhas de processo de cada grade processo para HPL (e
PTRANS)
* Linha 12: número de colunas de processo de cada grade processo para HPL
(E PTRANS)
* Linha 13: valor limite a não exceder pelo escalado para residual
HPL (e PTRANS)
* Linha 14: número de métodos painel de fatoração para HPL
* Linha 15: métodos painel de fatoração para HPL
* Linha 16: número de critérios de parada recursiva para HPL
* A linha 17: recursiva critérios de parada para HPL
* Linha 18: número de painel recursão conta para HPL
* Linha 19: Painel de recursão conta para HPL
* Linha 20: número de métodos de fatoração painel recursiva para HPL
* A linha 21: recursiva métodos painel de fatoração para HPL
* Linha 22: número de métodos de transmissão para HPL
* Linha 23: métodos de transmissão para HPL
* Linha 24: número de profundidades de look-ahead para HPL
* A linha 25: look-ahead profundidades para HPL
* Linha 26: métodos de swap para HPL
* Linha 27: trocando limiar para HPL
* Linha 28: forma de L1 para HPL
* Linha 29: forma de U para HPL
* Linha 30: valor que especifica se estabelecer o equilíbrio deve ser utilizada
por HPL
* Linha 31: alinhamento de memória para HPL
* Linha 32: ignorado
* Linha 33: número de problema adicional tamanhos para PTRANS
* Linha 34: problema adicional tamanhos para PTRANS
* Linha 35: número de fatores de bloqueio adicionais para PTRANS
* A linha 36: factores de bloqueio adicionais para PTRANS
O que é novo nesta versão:
- Esta versão adicionou otimizado variantes de RandomAccess que usar Linear congruential Generator para a geração de números aleatórios.
- A redução global foi adicionado ao erro de cálculo na MPI FFT para alcançar as estimativas dos erros mais precisos.
- A ordem de benchmarks foi reorganizada de modo que o componente HPL corre passado e pode ser abortada se o desempenho de outros componentes não foi satisfatória.
- RandomAccess é agora pela primeira vez para ajudar no ajuste do código.
- Assorted erros foram corrigidos.
Comentários não encontrado