пятница, 6 июня 2025 г.

ML-дайджест: железо, деньги и тренды

GPU-гонка, Windows ML и Gen AI.͏‌͏͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  
Selectel
AMD активно разрабатывает новое поколение серверных GPU
Важно отметить, что в сегменте малых кластеров NVIDIA значительно превосходит красных со своим решением NVL72 на базе GB200. С новым поколением AMD хочет составить конкуренцию зеленым, причем уже с решением NVL144. Для этого много ресурсов вкладывается в доработку интерконнекта между GPU-серверами.
 
Большое обновление технологического стека для ML-разработки на Windows
Раньше стек назывался DirectML (DML), но после обновления изменил название на Windows ML. В качестве основного формата ML-моделей используется ONNX Runtime Engine, а аппаратной базой могут служить NPU, CPU и GPU от AMD, Intel, NVIDIA and Qualcomm.
А еще заявлено, что повысилась производительность, появилось больше интеграций и полезных инструментов. 
 
Обработка данных с помощью обновленного NVIDIA DALI
У вас возникали ситуации, когда Data loader в PyTorch не успевает подготавливать данные для передачи в GPU?
Ситуация грустная, если нет возможности вынести предобработку на GPU. NVIDIA уже давно предложила свой вариант решения — NVIDIA DALI, а недавно вышло его обновление. Ключевым в нем является DALI Proxy, который просто интегрируется в логику работы с датасетами в PyTorch и позволяет решать проблемы производительности.
 
NVIDIA запускает 800V HVDC для «ИИ-фабрик» будущего
Если вы надеялись, что потребление GPU со временем будет снижаться, то пока радоваться нечему.
Вместо снижения потребления NVIDIA разработала новую схему питания, чтобы строить мегаваттные стойки.
К этой инициативе уже подключились производители энергооборудования, так что в 2027 году ждем линейку готовых решений NVL уже с новыми требованиями по питанию. 
 
Salesforce покупает Informatica за $8 млрд
Руководство Salesforce решило купить крупного игрока рынка обработки данных и ИИ. Теперь data-платформа Informatica и ее компетенции помогут Salesforce внедрить GenAI и повысить эффективность бизнеса.
 
Отчет CNCF о состоянии разработки в облаках
Пусть выводы нельзя напрямую перекладывать на реалии российского рынка, однако анализировать точно стоит. В отчете есть целая секция про ML, из которой становится понятно, что большая часть ML-проектов все еще делается не в Kubernetes. Хотя команды все больше хотят использовать именно его.
 
NVIDIA «отключает» CUDA для GTX 1080 и других старых GPU
Скоро прибавится проблем для тех, кто использует разные модели GPU для своей работы. Самое заметное — прекращение поддержки 1080. Теперь для нее придется собирать контейнеры с устаревшей версией CUDA.
 
Выбираем GPU для LLM: NVIDIA GenAI-Perf поможет с бенчмарками
Один из самых популярных запросов к Selectel в рамках ML-проектов: «Как подобрать GPU для запуска LLM-модели?»
Ответ на него помогает найти инструмент GenAI-Perf от NVIDIA. В нем можно указать параметры конкретного целевого запроса и получить бенчмарк с оценкой времени генерации токенов и прочих параметров.
Опыт Selectel можно узнать в докладе Антона Алексеева на митапе «MLечный путь 2025».
Присоединяйтесь к нашему сообществу ML- и MLOps-инженеров — обсуждаем продакшен ML, делимся инсайтами, находим решения вместе.
Присоединиться
Вы можете настроить вашу подписку или отписаться.
Приводите клиентов в Selectel и зарабатывайте до 15% от их затрат.
Академия   Community   Карьера   Соцсети
ВКонтакте Telegram Youtube
Лицензия на телематические услуги № 176267
© АО «Селектел», 2008–2025
999999999999999
999999999999999