Изменения

Перейти к: навигация, поиск

Многопоточность в машинном обучении

446 байт добавлено, 17:28, 22 апреля 2020
Параллелизм GPU
Типичное число потоков обработки графического процессора - десятки тысяч, что позволяет вычислять одну и ту же операцию параллельно на множестве элементов.
Фреймворки машинного обучения, такие как TensorFlow, PyTorch и MxNet используют эти возможности через библиотеки от компаний производителей графических ускорителейи открытые фреймворки:* [https://developer.nvidia.com/cublas cuBLAS ] - библиотека от Nvidia позволяющая эффективно перемножать матрицы.* [https://developer.nvidia.com/cuda-toolkit CUDA ] - язык параллельного программирования/вычислительная платформа для вычислений общего назначения на графическом процессоре* [https://www.khronos.org/opencl/ OpenCL] - фреймворк для написания компьютерных программ, связанных с параллельными вычислениями на различных графических и центральных процессорах, а также FPGA
=== Параллелизм SGD ===
7
правок

Навигация