Nvidia bietet ab sofort Version 6 seiner CUDA-Architektur für parallele Berechnungen als kostenlosen Download an. Hier die Versions-Highlights im Überblick:
Unified Memory
Die wichtigste Neuerung ermöglicht CUDA-Applikationen den Zugriff auf CPU und GPU, ohne dass Daten manuell hin und her kopiert werden müssen. Dies soll ordentlich Zeit sparen und es Pogrammierern leichter machen, GPU-Beschleunigung in Applikationen zu integrieren.
Drop-in Libraries
Diese sollen einfaches Beschleunigen von Applikationen bis zum Faktor 8x ermöglichen. Die neuen Drop-in Libraries beschleunigen automatisch BLAS- und FFTW-Kalkulationen, indem sie existierende CPU-only BLAS oder FFTW Libraries durch neue, GPU-beschleunigte Äquivalente ersetzen.
Multi-GPU Scaling
Re-designte BLAS und FFT GPU Libraries skalieren Leistung automatisch über bis zu acht GPUs in einer einzelnen Node. Dadurch erhält eine Node bis zu neun Teraflops Double-Precision-Rechenleistung und unterstützt größere Workloads (bis zu 512 GB).
Weitere Infos und Downloadmöglichkeit gibt es hier.
Bildrechte (C): NVIDIA