Дослідження розподілених тренувань на фізичних кластерах графічних процесорів є повільними та болісними. Ми зіткнулися з цією проблемою в @exolabs році, тому створили EXO Gym, бібліотеку для моделювання гетерогенних обчислювальних кластерів і швидкого і легкого проведення дослідницьких експериментів в будь-якому масштабі на одному MacBook.
Matt Beton
Matt Beton30 серп. 2025 р.
Анонс EXO Gym: моделюйте розподілені тренувальні середовища, використовуючи лише свій ноутбук. Раніше експерименти з розподіленим навчанням вимагали налаштування складних багатовузлових кластерів. За допомогою EXO Gym на одному пристрої створюється кілька віртуальних вузлів. 🧵
10,46K