суббота, 6 июня 2026 г.

128 ГБ модель в ноутбуке, MiniMax M3, Anthropic идет на биржу

+ MiniMax обогнала Opus 4.7 на BrowseComp, Perplexity сократила расход токенов на 85% ͏‌͏͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  
⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌
+ MiniMax обогнала Opus 4.7 на BrowseComp, Perplexity сократила расход токенов на 85%
📰 Новости
1. MiniMax выпустила недорогую модель M3
Архитектура MSA поддерживает 1M токенов с гарантией минимум 512K. На BrowseComp выбила 83.5 против 79.3 у Opus 4.7. На PostTrainBench заняла третье место, обогнав всех, кроме Opus 4.7 и GPT-5.5.
2. Google опубликовала Gemma 4 12B
Мультимодальная модель, которая обрабатывает текст, изображения и аудио с меньшей задержкой, работает локально на 16 ГБ ОЗУ и выдает в бенчмарках результат на уровне 26B-моделей. Лицензия Apache 2.0.
3. RTX Spark: NVIDIA встроит 128 ГБ общей памяти и Blackwell в ноутбук
NVIDIA выпустила чип RTX Spark для Windows ПК: 1 петафлопс для задач AI, до 128 ГБ общей памяти, GPU Blackwell с 6144 ядрами CUDA плюс 20-ядерный CPU Grace (разработали совместно с MediaTek). С Microsoft сделали платформу под локальные агенты: новые security-примитивы Windows и runtime NVIDIA OpenShell, чтобы агенты крутились на устройстве.

Железо тянет 120B-модели, редактирование 12K-видео 4:2:2, рендер 3D-сцены объемом 90+ ГБ и AAA-игры в 1440p при 100+ fps. Adobe переписывает Photoshop и Premiere под Spark, обещают ×2 по AI и графике. Ноуты и мини-ПК обещают осенью от ASUS, Dell, HP, Lenovo, Surface и MSI. Покупаем ноут, гоняем локальные модели для Tier 0 задач и экономим на фронтире.
🎓 Хотите быть на волне AI-агентов?
30 июня стартует курс «Разработка AI-агентов»: 8 недель обучения, 12+ практических уроков.

О чем: Архитектура AI, AgentOps, мультиагентные паттерны, безопасность и контроль.

Промокод «FIRSTAGENT» на 10 000 руб. действует до 15 июня!
Кнопка
4. Search as Code: Perplexity превращает поиск в программируемый SDK для ИИ-агентов
Search as Code (SaC) — архитектура, где агенты собирают поисковые пайплайны из примитивов SDK через генерацию Python-кода вместо вызова монолитного API. Это дает контроль над каждым этапом поиска и снижает расход токенов до 85 % при росте точности на 12-20 процентных пунктов. 
5. Codex получил функцию Computer use
Автономное управление компьютером — теперь на винде.
6. OpenAI нанял разработчика Litter в команду Codex
Разработчик мобильного клиента Litter для удаленного доступа к Codex, Claude, Gemini и т. д. нанят в команду Codex.
7. Anthropic подала предварительную заявку на IPO
Подали конфиденциальный черновик заявления по форме S-1 в Комиссию по ценным бумагам. После рассмотрения заявки компания сможет провести IPO. Цену и число акций пока не определили.
8. Factory AI представила Router
Factory Router сам подбирает модель под задачу: простые запросы идут на дешевые модели, а сложные остаются на фронтирных. Если выбранная модель не тянет, сессия перекидывается на модель посильнее. При падении запроса роутер уходит на другую модель. Надежность 99.9%+. Правила роутинга задаются пользователем. Factory Router доступен в приватном превью в Factory CLI и Desktop App.
9. Семь моделей от Microsoft
Microsoft AI выпустила собственное семейство моделей:

Разработчики смогут тюнить веса под свои задачи через Microsoft Frontier Tuning — RL-среды, где модель обучается на реальных рабочих процессах организации.
10. Composer 2.5 теперь доступен в Grok Build
11. Liquid AI резинули LFM2.5-8B-A1B
MoE-модель с 128K контекстом. На бенчмарке Non-Hallucination набрала 63.47% — лучший результат в классе, Gemma-4-26B-A4B (10.75%) отстает в 6 раз.
12. Обновление PaddleOCR-VL 1.6
SOTA 96.3% на OmniDocBench v1.6: улучшено распознавание таблиц, редких символов, печатей и графиков.
13. Модель Qwopus3.6-27B-v2-MTP-GGUF
Qwopus3.6-27B-v2-MTP — файнтюн Qwen3.6-27B с Multi-Token Prediction, ускоряющий генерацию в 1.66 раза при работе с кодом, DevOps, логикой и математикой. Сокращает общее время ответа на 56.5% и уменьшает объем выходных токенов на 27.7%, сохраняя качество пошагового рассуждения. 
14. Из 2D в 3D
Déjà View (DVLT) — рекуррентный трансформер от NVIDIA, который по набору фотографий строит 3D-модель сцены с картами глубины.
 
🤖 Инструменты для AI
  • Crabbox берет ваш локальный проект, поднимает под него виртуальную машину, заливает туда код по SSH/rsync, запускает команды (тесты, билды, что угодно) и отдает результат обратно
  • GoalBuddy — помогает агентам (Codex, Claude Code) не терять контекст при длинных задачах: создает локальную «доску» с планом, прогрессом и чек-листом, чтобы работа не начиналась заново после каждого прерывания
  • composer-api — перенаправляет запросы от Cursor Composer к нужной модели через OpenAI API
  • Claude-Opus-4.[6-8]-Censorship-Remover — убирает цензуру из Claude
  • ai-agents — Docker-образы для Codex, Claude Code и OpenCode для запуска агентов в песочнице поверх любого проекта с пробросом учетных данных пользователя
  • scientific-agents — каждый файл AGENTS.md задает агенту схему рассуждений старшего специалиста конкретной профессии: формулировка задач, выбор инструментов и данных, проверка утверждений, формат выдачи результатов
  • UltraCode-Shim — прокси для запуска UltraCode-режима Claude Code на любой модели через /model. Позволяет раздельно выбирать модель для планировщика и исполнителя, а также автоматически направлять простые задачи на дешевые модели, сложные — на мощные
  • LogicPipe — фреймворк для распределенного LLM-инференса на нескольких GPU/edge-устройствах
  • Nullsec-S1 — PEFT/QLoRA-адаптер на Qwen2.5-Coder-7B-Instruct для аудита безопасности сгенерированного кода, возвращающий структурированный JSON-вердикт с уязвимостями, уровнем критичности и рекомендуемым исправлением
 
🛠🧑 Инструменты для людей
  • Odysseusself-hosted рабочее пространство, которое объединяет чат, агентов с инструментами, редактор документов, почту, календарь и менеджер задач. Работает с локальными моделями или внешними по API
  • vibe-remote подключает Claude Code, OpenCode и Codex к Slack, Discord, Telegram, WeChat, Lark. Пишешь задачу в чат, агент ковыряет код у тебя на машине, ты смотришь результат. Все локально, каждый тред отдельная сессия
  • kesha-voice-kitраспознает речь на 25 языках, озвучивает текст на 9 языках, определяет голосовую активность и распознает язык аудио. Написан на Rust, весит около 20 МБ. Без ffmpeg и Python
  • nbd-vramдобавляет к общей памяти RAM память видеокарты
  • ralphyсоздает вирусные видео с помощью агентов
  • openclaw-max-bridge — готовый мост между OpenClaw и мессенджером MAX :)))
  • Databox — платформа бизнес-аналитики с AI: датасеты, кастомные метрики, дашборды и AI-инсайты без сложной настройки и долгого обучения. Дает командам быстрые ответы по данным без дорогих BI-решений
  • Brief — единый источник правды для продуктовых команд: фиксирует решения и замысел продукта, отдает контекст людям и агентам через чат, Slack, CLI и MCP
  • Fundraisly — агент для фандрайзинга, который анализирует базу из 300K+ инвесторов и миллионы сделок, находит тех, кто инвестирует в вашу нишу, и связывает вас с ними через общие знакомства или напрямую
  • Elentaria — AI-оператор для B2B: анализирует бизнес, ранжирует 22 канала продаж, запускает подходящий план и оценивает, что реально принесло выручку, чтобы на следующую неделю работать точнее
  • Tokenwise — OpenAI-совместимый LLM-прокси показывает, где вы переплачиваете, и применяет оптимизацию в один клик с проверкой экономии в долларах.
  • Stella — локальный поиск по файлам на Mac на естественном языке: опишите файл словами и он найдется, даже если имя нечитаемое. Результат можно перетащить в Gmail, открыть или запустить приложение
  • Machine Learning Library — вручную отобранная библиотека из 923 ML-документов (~11 млн токенов): университетские курсы, статьи arXiv и канонические статьи, нормализованные в единый маркдаун с метаданными и полной атрибуцией
 
🤹 Скилы
  • thermo-nuclear-code-quality-review — запускает аудит качества кода. Ищет не мелкие баги, а структурные проблемы: раздувание файлов сверх 1000 строк, лишние абстракции и т. д. Каждое изменение проверяет по вопросу: нельзя ли выкинуть целый слой условий или оберток, переформулировав задачу. Не одобряет PR, который «работает», но засоряет кодовую базу

  • NVIDIA выложила каталог скилов. Перед публикацией каждый скил гоняют через SkillSpector: сканер ищет уязвимости, утечки данных, промпт-инъекции и скрытые инструкции

  • codex-dynamic-workflows — скил для оркестрации агентов превращает крупную задачу в управляемый workflow с планом, субагентами и верификацией результатов

  • mathVideoMaker — скил для Cursor, генерирующий по запросу математический видеоролик (Manim → MP4) и интерактивную веб-страницу (HTML с KaTeX + canvas) с общей концепцией и оформлением
 
🤹 Интересное
Frontier Intelligence — интерактивная карта 2870 проектов с хакатона Colosseum Frontier, размеченных AI. 
Протестировал mimo-v2.5-pro, mimo-v2.5 — получше GLM 5.1 в задачах разработки на Python и React. На тарифе «Лайт» в Pi получилось 4.2 млрд кредитов = 173 млн токенов. Получается дорого.
Вышедшая на днях MiniMax M3 потребляет значительно меньше токенов по сравнению с Mimo/GLM и по качеству им не уступает. Это субъективный взгляд: оцениваю, как часто модель ошибается, правильно ли понимает задачу, насколько быстро справляется с задачей. MiniMax теперь новая рабочая лошадка. Claude и ChatGPT, конечно, для китайцев недостижимы.
🎓 Бесплатный курс
zero2claude — учит работать в Claude Code людей, которые терминал никогда не открывали.
💡 Советы и лайфхаки
Davide Ciffa выложил PFlash: префилл 128K контекста на RTX 3090 ускорился в 10 раз. Маленькая модель Qwen3-0.6B оценивает важность токенов и оставляет 5% лучших, а тяжелая Qwen3.6-27B префиллит только их. 24.8 секунды вместо ~257 секунд у llama.cpp.
 
🆓 Халява
Qoder дает 200 бесплатных запросов Qwen 3.7 Max в день
В API NVIDIA завезли бесплатные Kimi K2.6, GLM 5.1, Deepseek v4 flash
Бесплатные модели в OpenCode
 
🤖 Роботы и устройства
LeRobot RGB/RGB-D VLA Dataset Toolkit — инструмент для слияния, проверки качества, очистки и публикации LeRobot-датасетов с поддержкой RGB-D камер Orbbec. Проводит датасет через полный цикл: запись → объединение → аудит → удаление брака → загрузка на Hugging Face.
Anima — опенсорсная Agent OS, которая превращает устройства умного дома в агентов с LLM-мозгом, скилами и долговременной памятью. Устройства сами принимают решения с учетом контекста, привычек и взаимодействия друг с другом.
Исследователи добились равномерности ускорения центра масс во всех направлениях, отказавшись от традиционной геометрической симметрии конструкции. Подход проверен на тысяче симуляций и на 20-ногом роботе Argus. Робот двигается одинаково в любом направлении, сам стабилизируется и не теряет работоспособность при поломке ног.
 
🌞🎉 Лето!
Отрываемся на hallucinate.site 
Автор: Мирослав Кунгуров
 
Вы получили данное письмо, так как регистрировались на вебинар «Нужна ли математика
на собеседованиях?» на сайте proglib.academy
Чтобы отписаться, нажмите сюда
999999999999999
999999999999999