Изменения

Многопоточность в машинном обучении

291 байт добавлено, 07:36, 28 декабря 2020

Переделан пункт про broadcast операции

=== Параллелизм для ускорения линейной алгебры. ===

Многие операции линейной алгебры, например, векторное сложение, произведение матриц и вычисление нормы состоят из большого количества независимых операций. Поэтому можно сильно повысить их производительность как за счёт ILP и SIMD параллелизма для маленьких данных, так и за счёт многопоточности для больших данных. От ускорения линейной алгебры особенно выигрывают нейронные сети, так как большую часть времени их работы занимает умножение матриц.

Иногда необходимо выполнить операцию с объектам имеющими разнаю размерность, но которые можно привести к одной размерности повторением одного из объектов вдоль одной или нескольких осей. Например, если нужно прибавить к каждой строке матрицы вектор или домножить вектор на число. В таком случае можно не писать цикл в явном виде, а использовать broadcast операции. При этом задача оптимизации переходит к разработчику библиотеки, который может обеспечить лучший параллелизм операций за счет доступа к внутренностям библиотеки.

Примеры оптимизаций:

* Broadcast операции вместо циклов.

* Распараллеленные реализации некоторых специальных операций (таких как свертки для [[Сверточные нейронные сети | CNN]]).

~~==== Параллелизм broadcast операций ====~~

~~Просмотрите код наивной реализации поэлементное произведение двух векторов на Python~~

~~def elementwise_product(x, y):~~

~~assert(len(x) == len(y))~~

~~z = numpy.zeros(len(x))~~

~~for i in range(len(x)):~~

~~z[i] = x[i] * y[i]~~

~~return z~~

Такой код лучше заменять на broadcast операции из numpy, которые выигрывают от векторизации и ILP. Также такой код может быть легко распараллелен для больших векторов

=== Параллелизм в оптимизации гиперпараметров ===

Skozelko

10

правок

Изменения

Многопоточность в машинном обучении

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты