воскресенье, 21 июня 2026 г.

Пока OpenAI считает убытки, ансамбли идут вперёд

Kimi открывает модели, Cursor уходит к SpaceX, чипы уходят под воду ͏‌͏͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  
⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌
Kimi открывает модели, Cursor уходит к SpaceX, чипы уходят под воду
📰 Новости
1. OpenRouter запустил Fusion Router
Один API-вызов отправляет промпт ансамблю моделей, те отвечают параллельно, а модель-судья выявляет совпадения и расхождения, фиксирует пробелы. Внешняя модель пишет финальный ответ на основе разбора. По умолчанию в ансамбле три модели: anthropic/claude-opus-latest, openai/gpt-latest, google/gemini-pro-latest. Стоимость примерно в 4-5 раз выше одиночного вызова. Можно настроить свой ансамбль и выбрать судью, максимум 8 моделей. Рекурсия заблокирована: вложенные вызовы не могут снова запустить Fusion.
2. Anthropic отключила Fable 5 и Mythos 5
По приказу правительства США, сославшись на директиву по экспортному контролю.
3. Anthropic сможет передавать данные полиции без решения суда
С 8 июля компания начнет требовать фото документов и селфи через Persona при подозрениях на злоупотребления. Anthropic сможет передавать логи правоохранителям по собственному усмотрению. Изменения затрагивают только личные тарифы, не Team/Enterprise и API.
🤯 Ты уже хороший разработчик, НО этого недостаточно…
Рынок быстро меняется: от разработчиков всё чаще ждут не просто умения писать код, а навыка внедрять AI в продукт.

На курсе по AI-агентам ты научишься собирать системы на базе LLM, API и RAG, которые решают реальные задачи бизнеса. Не теория ради галочки, а практический навык, который можно сразу добавить в своё резюме и рабочий стек.
Посмотреть программу курса
4. DeepSeek привлекла $7.4 млрд при оценке свыше $50 млрд
Инвесторы вкладывают в партнерство под управлением основателя — без права голоса и с пятилетним запретом на продажу акций.
5. Xiaomi зарелизила MiMo Code
MiMo Code — модифицированный форк OpenCode, который сохраняет качество на длинных задачах. Отдельный writer-агент сохраняет состояние на чекпоинтах, а не ждет пока контекст переполнится; отдельная проверка не дает агенту соврать что работа завершена. Max Mode гоняет 5 кандидатов параллельно и жрет в 4-5 раз больше токенов. В итоге на задачах дольше 200 шагов MiMo Code с MiMo-V2.5-Pro обходит Claude Code c Claude Sonnet 4.6 в 65%+ случаев.
6. Xiaomi анонсировала MiMo UltraSpeed
Заявленная скорость — 1000 tps. Подать заявку на подключение.
7. Moonshot AI выпустила модель Kimi K2.7-Code
MoE-модель на 1 трлн параметров, 384 экспертов и 32B активных параметра, контекст 256K, режим thinking не отключить. На Kimi Code Bench v2 прыгнула с 50.9 до 62.0, обошла Opus 4.8 на MCP Mark Verified (81,1 против 76,4). Тратит на треть меньше reasoning-токенов, чем K2.6, — на длинных агентных прогонах это дает экономию. Веса открыты (модифицированная MIT, 595 ГБ). Все бенчмарки от самого Moonshot, независимых нет.
8. Z.ai представила GLM-5.2
Флагманская модель с рабочим контекстом 1 млн токенов, ориентированная под длительные агентные задачи. На FrontierSWE отстает от Opus 4.8 всего на 0.7%; на Terminal-Bench 2.1 набирает 81.0 против 85.0 у Opus 4.8. Веса доступны под MIT-лицензией.
9. Утечка финансов OpenAI за 2025 год
Чистый убыток составил 38.5 млрд долларов при выручке 13.07 млрд, из которых 17.2 млрд ушло Microsoft, а основная дыра — списание 41.55 млрд при преобразовании из некоммерческой организации в коммерческую. Инвесторы впервые видят настоящие цифры перед возможным IPO при оценке в 852 млрд и плане вложить 600 млрд в инфраструктуру до 2030 года.
10. SpaceX покупает Cursor за $60 млрд
Сделка усиливает позиции xAI на рынке AI-инструментов для кодинга, где Cursor соперничает с Anthropic и OpenAI. Разработчики получат AI-агент Grok Build и модели Grok, которые Cursor может помочь улучшить за счет доступа к данным о кодинге, а сама платформа — вычислительные мощности SpaceX, которых ей не хватало.
11. Let's Encrypt внесла санкционный запрет в соглашение на сертификаты
Let's Encrypt добавила в пользовательское соглашение (pdf) пункт: сертификаты не выдаются лицам и организациям из стран/частей страны с полномасштабными санкциями США. Директор ISRG уточнил: частные лица и негосударственные компании из России и Ирана сертификаты получать продолжат, запрет коснется только госучреждений.
12. FastContext4: субагент для поиска по репо
FastContext от Microsoft — семейство субагентов (4B на Qwen3-Instruct и 30B-A3B на Qwen3-Coder, MoE), которые берут на себя поиск по репозиторию: делают параллельные READ/GLOB/GREP и возвращают компактный список цитат (файл + строки). Компактная FC-4B-RL на SWE-bench Pro обгоняет FC-30B-SFT (22.5 vs 20.0 с GLM-5.1) при меньшем расходе токенов. В целом FastContext снижает потребление токенов основным агентом на ~10-50% в зависимости от бенчмарка и варианта (например, GPT-5.4 на SWE-QA с FC-30B-SFT — ↓50.7%).
13. Open Knowledge Format: знания в маркдаун-файлах
Google выпустила спецификацию Open Knowledge Format (OKF): знания описываются каталогом markdown-файлов с YAML-frontmatter, где единственное обязательное поле — type. Файлы ссылаются друг на друга обычными markdown-ссылками, образуя граф.
 
🛠🤖 Инструменты для AI
  • Ponytail — заставляет агентов писать на 80-94% меньше кода
  • modelharness — плагин для Claude Code, добавляющий при старте сессии в системный промт 910 токенов: шесть практик Fable 5, три скила по запросу и агент-верификатор контекста. Снижает стоимость Opus 4.8 на 14% и увеличивает скорость на 16%
  • CodexQB — плагин для Codex, который делает планирование проекта на основе репозитория: мастер-план, разбор текущего состояния, подпланы по фазам и аудит готовности, а потом выдает промпт для реализации, но сам ничего не реализует. Все сохраняется в папку Planner-docs
  • bingo — набор пентест-инструментов, который скармливает URL любой из шести LLM (DeepSeek, Claude, GPT, GLM, Qwen, Ollama) и запускает 28-фазный пайплайн
  • omnigent — оркестратор объединяет Claude Code, Codex, Cursor, Pi и кастомных агентов в одной сессии
  • OpenLoop — универсальный фреймворк для конструирования циклов вокруг AI-агентов, реализующий play-test-fix-verify-improve циклы с логами, heartbeat'ами, бейзлайнами, ограничителями и аудитируемыми условиями остановки
  • figma-ai-bridge — опенсорсный мост между Figma Desktop и агентами
  • RL for Game — фреймворк обучения с подкреплением для автоматического управления в играх
 
🛠🧑 Инструменты для людей
  • IdeaScout — находит в чужих статьях идеи, которые можно перенести в твою задачу
  • Proxy Checker — проверяет и фильтрует прокси: получает список бесплатных прокси, тестит HTTP/HTTPS/SOCKS4/5 на связку «твой сервер → прокси → цель», живые прокси записывает в TXT/JSON
  • J.A.R.V.I.S — голосовой ассистент в стиле Iron Man поверх Hermes Agent: говорит с агентом через браузерный HUD с кольцом-реактором, агент реально выполняет действия (файлы, терминал, веб-поиск, 80+ скилов, память между сессиями), ответ возвращается речью за 3-5 секунд
  • LogicCut — опенсорсный CLI для видеомонтажа: принимает видео или ссылку, режет 15-30-секундные тематические отрывки, переводит субтитры, озвучивает и сводит все в один ролик
  • ccpocket — мобильный клиент для Codex и Claude
  • Grimoire — это локальный поисковик по 20+ базам знаний для пентестеров с MCP
 
🎓 Бесплатный курс
zero2claude — учит работать в Claude Code людей, которые терминал никогда не открывали.
 
🤹 Скилы
  • knowledge-base — создание и обогащение базы знаний LLM
  • ko-lesson — Codex-скилл для генерации курсов из учебных материалов Obsidian с обратной связью и экзаменационным циклом
  • qiaomu-goal-meta-skill превращает размытые запросы в исполняемые /goal для Codex
  • pixel2motion — делает из растровых логотипов анимированные HTML + SVG
  • qiaomu-ai-prd — превращает идею продукта в структурированный PRD для людей и AI-ассистентов
  • illo-skill — генерирует на основе статьи иллюстрации в газетном стиле с повторяющимся фирменным персонажем
  • COMPASS — три скилла, чтобы агент не терял контекст между сессиями и не начинал вслепую:
    •  task-clarifier: задать 1-3 ключевых вопроса до того, как делать работу
    • task-forest: держать в репо карту целей/подзадач/DAG с прогрессом и историей
    •  user-profile-keeper: помнить, как с тобой работать
  • threejs-game-skills9 скиллов для Three.js-игр в браузере. Зовешь threejs-game-director, он сам подтягивает специалистов: геймплей, графика, UI, дебаг, QA, генерация 3D/картинок/аудио
  • Harness Forge — скил для Claude Code, который запускает цикл автоматической оптимизации обвязки модели
💡 Советы и лайфхаки
1. Крон в 8 утра
Крон в 8 утра: claude -p "Hello" → просыпаешься в 10, работаешь до сброса лимитов в 13. Итого 3-6 продуктивных часов в день.
2. Ансамбли слабых моделей обогнали одиночные фронитры
На «Humanity's last exam» одиночные frontier-модели набрали ~20 баллов. Ансамбль из 2-5 моделей набрал ~50 баллов. Самый дешевый способ приблизиться к качеству Fable/Mythos сейчас: GPT 5.5 + Opus 4.8 + Gemini 3.1 Pro.
🆓 Бесплатный курс
Agentic Engineering Handbook — структурированная дорожная карта из 130 ресурсов по агентным системам. Покрывает OpenAI, Anthropic и Google, делит материалы на фазы с практическими заданиями и приоритетами P0/P1/P2.
  • Фаза 0: Agent Loop From Scratch. Ядро любого агента: модель + инструменты + один цикл. Поняв ядро, проще разбираться во всем остальном: когда планировать, а когда действовать сразу; зачем явный список задач; как субагенты экономят контекст; что такое скилы, MCP, хуки и т. д.
  • Фаза 1: Agent Foundations. Чем workflow отличается от одиночного агента, инструменты, передача задач, ограничители.
  • Фаза 2: MCP & Tool Ecosystem. Model Context Protocol: сервер/клиент, удаленные vs локальные инструменты, загрузка инструментов и одобрение действий.
  • Фаза 3: Context, Memory & Skills. Управление контекстным окном, кратковременной и долговременной памятью, скилами/плагинами, CLAUDE.md/AGENTS.md.
  • Фаза 4: Harness & Long-Running Agents. Рантайм агента: поток событий, треды, состояние, песочница, подтверждение, восстановление после сбоев. Долгоиграющие задачи через PLANS.md и аналоги.
  • Фаза 5: Coding & Workspace Agents. Сравнение Codex и Claude Code; изучение мультиагентного подхода, интеграция с IDE
  • Фаза 6: Evals, Safety & Production. Построение цикла оценок до и после запуска, отслеживание каждого шага агнета, ограничения и разрешения агента, мониторинг регрессий.
🤖 Железо
Ponytail1. Qwen превращает роботов в «языковые инструменты»
Qwen представила Qwen-Robot Suite — три базовые модели (RobotNav, RobotManip, RobotWorld), объединенные тем, что все они принимают и отдают команды на естественном языке. Это позволяет большой языковой модели-планировщику (Qwen3.7-Plus) вызывать их как функции и собирать из них агентные системы для длинных физических задач без переобучения под конкретного робота.
2. AMD купила стартап Mext для экономии на памяти
Вместо того чтобы держать все данные в дорогой DRAM, стартап Mext перекидывает те данные, что нужны редко, на обычный flash-накопитель — он дешевле на порядки. А чтобы приложения не тормозили, AI-алгоритм предсказывает, какие данные скоро понадобятся, и заранее грузит их обратно в DRAM.
3. KAIST научились охлаждать чипы изнутри: рекордная эффективность на обычной воде
Инженеры Корейского института KAIST вырезали микроскопические каналы прямо внутри кремниевых чипов и пустили по ним обычную воду комнатной температуры. Коэффициент охлаждения (COP) — 106 000, что в 10 раз выше прежнего рекорда Nature в 2020 году.
HEARD — ESP32 + u-blox GPS + LoRa-радио в 3D-печатном корпусе с e-ink дисплеем образуют автономную mesh-сеть и позволяют гиду отслеживать местоположение всей группы на маршруте без интернета и сотовой связи.
Built Robotics поставляет автономную технику на стройки. Один оператор управляет целым парком машин, роботы работают круглосуточно, а система из 8 уровней безопасности держит технику в заданных зонах.
 
 
Напоследок
Автор: Мирослав Кунгуров
 
Вы получили данное письмо, так как регистрировались на вебинар «Нужна ли математика
на собеседованиях?» на сайте proglib.academy
Чтобы отписаться, нажмите сюда
999999999999999
999999999999999