...
Obliczenia GPGPU (General-Purpose computing on Graphics Processing Units) to wykorzystanie procesorów graficznych wspólnie z jednostką CPU do przyspieszenia obliczeń naukowych i inżynierskich. Infrastruktura PLGrid oferuje swoim użytkownikom dostęp do maszyny zawierającej karty GPU.
Lokalizacja | ACK CYFRONET AGH | |
---|---|---|
Nazwa systemu |
Zeus GPGPU
Prometheus K40XL | Prometheus V100 |
Nazwa maszyny dostępowej |
pro.cyfronet.pl | pro.cyfronet.pl | |
Port dostępowy | 22 | 22 |
Liczba rdzeni obliczeniowych |
Liczba kart GPU |
144 | 32 |
Kolejka |
plgrid-gpu | plgrid-gpu-v100 | |
Oprogramowanie | TeraChem, Gromacs, NAMD, GAMESS, TensorFlow, Keras, PyTorch | |
Opis konfiguracji zasobów obliczeniowych | www.plgrid.pl/oferta/zasoby_obliczeniowe/opis_zasobow/HPC | |
Opis systemów składowania danych | www.plgrid.pl/oferta/zasoby_obliczeniowe/opis_zasobow/storage | |
Informacje rozszerzone |
Dostęp do GPGPU jest możliwy po aktywacji usługi. Aby aktywować usługę, postępuj zgodnie z instrukcjami zawartymi w Katalogu Aplikacji i Usług po uprzednim wyszukaniu usługi.
...
Parametr | Wartość | |
---|---|---|
Dostępność | Promtheus (plgrid-gpu) | Promtheus (plgrid-gpu-v100) |
Producent | NVIDIA | NVIDIA |
Model | K40 XL | V100 |
Architektura | Kepler | Volta |
Szyna | PCI-Express 3.0 16x | NVLink |
Liczba rdzeni Tensor | - | 640 |
Liczba rdzeni CUDA | 2880 | 5120 |
Maksymalna częstotliwość | 928 MHz | 1290 MHz |
Moc obliczeniowa (HP) | - | 31.33 Tflops |
Moc obliczeniowa (DP) | 1,78 Tflops | 7,834 Tflops |
Moc obliczeniowa (SP) | 5,34 Tflops | 15,67 Tflops |
Pojemność i typ pamięci | 12 GB GDDR5 | 32 GB HBM2 |
Przepustowość pamięci | 288 GB/s | 900 GB/s |
Dla zadań korzystających w obliczeniach z kart GPGPU przeznaczona została specjalna partycja - plgrid-gpu. Aby móc przeprowadzać obliczenia z wykorzystaniem GPGPU na klastrze Prometheus konieczne jest złożenie wniosku o grant właściwy, który przeznaczony zostanie w całości wyłącznie na obliczenia z wykorzystaniem kart GPGPU. Grant taki nie powinien być używany do przeprowadzania obliczeń w partycjach innych niż plgrid-gpu. We wniosku o grant należy wyraźnie zaznaczyć, że wymagany jest dostęp do partycji plgrid-gpu. Zalecane jest także (ale nie jest to konieczne), aby grant taki posiadał w nazwie wyraz gpu (np. obliczeniagpu) - ułatwia to identyfikację grantów. Każdy wniosek o dostęp do partycji plgrid-gpu jest rozpatrywany indywidualnie przez dostawcę zasobów.
Dodatkowo dla obliczeń AI została udostępniona partycja plgrid-gpu-v100 posiadająca karty GPGPU NVIDIA Tesla V100. Dostęp do nich realizowany jest podobnie, jak opisano powyżej dla partycji plgrid-gpu.
Karty GPU w systemie kolejkowym SLURM są rodzajem tzw. generic resources (GRES), a ich identyfikatorem jest "gpu".
Informację o tym na których węzłach/partycjach znajdują się karty GPU można otrzymać np. przy pomocy komendy sinfo:
...
Code Block | ||
---|---|---|
| ||
#!/bin/bash # NAMD GPPGU requires exactly one working node #SBATCH -N 1 #SBATCH --ntasks-per-node=24 #SBATCH -p plgrid-gpu #SBATCH --gres=gpu:2 #SBATCH --time 1:00:00 module load plgrid/apps/namd/2.1314-ompi cd $SLURM_SUBMIT_DIR if [ ! -f stmv.tar.gz ]; then wget http://www.ks.uiuc.edu/Research/namd/utilities/stmv.tar.gz fi tar -xvf stmv.tar.gz -C $SCRATCHDIR cd $SCRATCHDIR/stmv sed -i 's/500/5000/g' stmv.namd sed -i 's/\/usr\/tmp\/stmv-output/\$env\(SCRATCHDIR\)\/stmv-output/g' stmv.namd namdrun stmv.namd |
...