Приглашаем на вебинар 22 августа в 16:00. Расскажем, как команда «Актион» сократила расходы на GPU на 60% и увеличила пропускную способность в 36 раз благодаря решению Compressa на инфраструктуре Selectel. |
|
|
|
| Вместе с коллегами из Compressa и «Актион» обсудим способы оптимизации open-source LLM-моделей на своем сервере и преимущества использования облака для инференса LLM. Сравним производительность LLM и стоимость токенов до и после оптимизации. Разберем кейс «Актион» и Compressa по обработке 100 000+ генераций в день всего на одной GPU-карте и узнаем, как удалось сократить расходы на инференс LLM. |
|
|
|
| | | Data Scientists и NLP-инженерам |
|
|
| | | CTO и менеджерам ML-проектов |
|
|
|
|
| | Если хотите пригласить на вебинар друга или коллегу, нажмите на кнопку ниже — вы одним кликом отправите приглашение через Telegram. |
|
| |
|