суббота, 16 мая 2026 г.

Новые LLM без интернета бесполезны? (Или мы их переоценили)

Плюс: десктоп-агент Perplexity, голосовой ИИ без пауз и куча инструментов для Codex. ͏‌͏͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  
⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌
Плюс: десктоп-агент Perplexity, голосовой ИИ без пауз и куча инструментов для Codex.
📰 Новости
ProgramBench* — новый бенчмарк от Meta*. Агент получает бинарник + документацию и должен восстановить программу без доступа к интернету. Claude Opus 4.7 и GPT 5.5 набрали 0% и 0.5% соответственно.
На реддите сравнили качество разных квантизаций Qwen 3.6 27B в задаче визуализации шахматной позиции в SVG и пришли к выводу, что IQ4_XS — оптимальный минимум для 16 ГБ VRAM, обеспечивающий приемлемое качество при скорости до 22 tps с TurboQuant-форком llama.cpp
Thinking Machines Lab выпустила MoE-модель на 276B параметров с 12B активных, которая слушает и говорит одновременно: каждые 200 мс она захватывает фрагмент вашей речи и выдает фрагмент ответа. Вы перебиваете ее, она перебивает вас, и никто не ждет своей очереди.
Introducing interaction models | Thinking Machines Lab
Borealis — 5B аудио-языковая модель (Whisper + адаптер + Qwen3) для RU/EN, обученная командой VikhrModels с нуля, с открытым исходным кодом, данными и инструкцией по воспроизведению
OpenAI запустила Daybreak — платформу на базе Codex для автоматического поиска уязвимостей и повышения защищенности кода.
С 15 июня 2026 года Claude Agent SDK больше не входит в подписку — programmatic usage теперь оплачивается по API-ценам сверх лимита. В качестве компенсации дают ежемесячный кредит в размере стоимости подписки.
Сэм Альтман анонсировал: компании, готовые перейти на Codex, получат два месяца бесплатного использования — предложение действует 30 дней.
Perplexity релизнула агента Personal Computer для всех пользователей Mac, который управляет приложениями, файлами и браузером прямо с рабочего стола, работая в фоне 24/7.
Anthropic и OpenAI генерируют больше выручки на одного сотрудника ($9 млн и $5.6 млн), чем любая публичная технологическая компания в мире.
Грег Кроа-Хартман, второй по значимости разработчик ядра Linux, использует локальный ИИ Clanker T1000 для поиска багов, что уже привело к ~20 исправлениям в основной ветке ядра.
Стартовал курс «AgentOps», успей присоединиться!
🤖 Инструменты для ИИ
Exo — объединяет все ваши устройства в единый AI-кластер для запуска моделей
Lago — добавляет Mermaid-диаграммы к код-ревью в PR
Lazyweb MCP — 257 000 скриншотов приложений и сайтов + 6 скилов
Multica — надстройка над процессами, распределяющая задачи между AI-агентами
CodexSaver — MCP-инструмент для роутинга задач между дорогими (Codex) и дешевыми (DeepSeek, Qwen) моделями
Kiro-proxy — локальный прокси для доступа к LLM (Claude, DeepSeek, Qwen, GLM и др.) через Kiro с OpenAI-совместимым API
Codex ACP CAS — подключает AI-агента Codex к Zed через протокол ACP
React-doctor — сканирует React-проект одной командой и выдает оценку качества кода от 0 до 100 с конкретными проблемами

 
🛠 Инструменты для людей
VibeTunnel — транслирует терминальные сессии вашего Mac в браузер, чтобы вы могли наблюдать за AI-агентами и управлять ими с любого устройства удаленно
Happy — мобильный и веб-клиент для Codex и Claude Code с шифрованием
HAPI — запускает AI-агенты локально и управляет ими через браузер, PWA или Telegram Mini App
Paseo — self-hosted решение для оркестрации агентов с телефона, десктопа, браузера и CLI
TouchGrass — позволяет управлять агентами через Telegram: отправлять промпты, одобрять действия и прикреплять файлы с телефона
TelePi — мост между Telegram и Pi, транскрибирует голосовые сообщения прямо в агента, бесшовное переключение между телефоном и терминалом
Remodex — управление Codex с iPhone
Nerd-Dictum — плавающий виджет голосового ввода, который правильно распознает технический жаргон, код и смешанные языки
OpenAI CLI — официальный CLI от OpenAI для работы с их REST API
Litter — нативный iOS и Android клиент для управления Codex с телефона
LazyPi — одной командой автоматически устанавливает и настраивает полноценную среду Pi со всеми необходимыми пакетами
UI Design Dictionary — 108 паттернов UI, разбитых по категориям
Chrome-расширение для Codex от OpenAI
Codex++ — неофициальные твики для десктопного приложения Codex
 
Pencil.dev — инструмент для dev-дизайна. Пока бесплатный. 
PetDex — открытая коллекция анимированных питомцев для Codex. Можно создавать своих.
Ratty — эмулятор терминала на Rust с GPU-рендерингом, 3D-режимом и вращающейся крысой-курсором.
codex-pet-limit-rings — два кольца вокруг питомца Codex, которые показывают остаток лимитов — без патчинга приложения, для macOS.
 
Cкиллы 
cybrix-skills — скил для Claude Code, который позволяет одной командой задеплоить статический сайт на хостинг
book-to-skill — скил для Claude Code, превращающий PDF и EPUB в структурированные скилы. На выходе директория ~/.claude/skills/<имя-книги>/ с файлами по главам, глоссарием, списком паттернов и шпаргалкой
skills — набор скилов для AI-агентов, решающих типичные проблемы разработки: непонимание задачи, многословность агента, нерабочий код и архитектурный хаос
hatch-pet — скил Codex для создания виртуального питомца
Taste-skill — это коллекция скилов, которая помогает создавать премиальные фронтенды с продуманной типографикой, анимацией и композициейGraphify — скил, который одной командой /graphify строит граф знаний всего проекта (код, документы, PDF, изображения, видео) и позволяет задавать вопросы по архитектуре проекта 
💡Советы и лайфхаки
Правильное планирование
Все говорят о стратегии, но мало кто умеет планировать. Felipe Bovolon, стратег с многолетним опытом, описывает разницу между двумя дисциплинами. Типичная картина: команда разработала стратегию, разошлись довольные. Через неделю появляется презентация на 50 слайдов: три финансовых сценария (базовый, оптимистичный, пессимистичный), список инициатив с временными рамками. Все кивают. Проблема в том, что во всех трех сценариях организация делает примерно одно и то же.
Что такое хороший план? Не список пожеланий, а набор конкретных обязательств с четырьмя слоями:
  • Допущения — ставки организации на будущее: рынок вырастет на 15%, конкурент не зайдет в этот сегмент, регулятор одобрит за 90 дней. Каждая ставка описана тремя измерениями: какой урон, если она неверна (влияние), насколько она хрупка (уязвимость), и по какому признаку мы поймем, что она не сыграла (ориентир).
  • Аллокация — реальные деньги и люди, привязанные к реальным приоритетам. Цели, прогнозы и размещения отслеживаются раздельно: цель — чего хотим, прогноз — чего ожидаем, размещение — что реально финансируем.
  • Координация — обязательства сцеплены друг с другом формально. Не просто «маркетинг и операционная деятельность описывают один план», а у каждого обязательства видны зависимости: это зависит от того, а то — от этого. Если зависимость рвется, видно, где именно.
  • Адаптация — что делать, если все идет лучше плана (кто станет узким местом?) и что делать, если хуже (что режем первым?). 
Большинство организаций кое-как справляются с третьим слоем, а первый, второй и четвертый отсутствуют почти везде. Стратегия решает, куда идти. Планирование решает, выживет ли этот выбор при столкновении с деньгами, временем и реальностью. 
Good Planning — скил, который реализует принципы планирования из статьи Felipe Bovolon. 
 
Бесплатный гайд по AI-инжинирингу
В 2026-м AI-инженер должен уметь строить обвязку (harness) вокруг модели. Anthropic проверили на практике: один и тот же Claude Opus 4.5 дает 78% точности в одной обвязке и 42% в другой. Обвязка — это как модель получает контекст, какие инструменты ей доступны, изолированы ли субагенты, что происходит когда что-то падает и т. д.
Гайд делит путь на 6 фаз: теория, первый агент с нуля, многошаговая система на LangGraph, своя обвязка с нуля, регрессионные тесты, продакшн-закалка.
Если лень читать 7862 слова, просто отправьте маркдаун-инструкцию своему агенту.
 
🆓 Халява
Commandcode.ai — Deepseek V4, 12 900 запросов, 660 млн токенов за 1$ до 31 мая.
Nvidia Build — бесплатный доступ к моделям по API. При регистрации требуется подтверждение по СМС, однако номера из РФ не поддерживаются. Сообщение удалось получить на американский номер одного из сервисов по приему СМС.
Qoder Teams Edition получил функцию BYOK — подключение API-ключей сторонних моделей. Плата за платформу временно отменена, но данные передаются провайдерам по их политике конфиденциальности. Тарифы будут объявлены позже.
🤖 Роботы
  1.  GENE-26.5 — это первая фундаментальная модель от Genesis AI, способная выполнять сложные задачи манипуляции на уровне человека за счет биомиметической руки с 20 степенями свободы, обучения на 200 000+ часах человеческих данных, сверхнизкой задержки управления (3 мс) и масштабируемой оценки в реалистичной симуляции.
    First look: Genesis GENE-26.5, short, no audio (May/2026)
  2. NASA раздвигает границы полетов на Марсе — инженеры разогнали лопасти роторов нового поколения до сверхзвуковых скоростей (число Маха 1.08) в специальной камере, имитирующей атмосферу Красной планеты.
    Testing the Next Generation of Mars Helicopter Rotor Blades
  3. Labububot — сфера из двенадцати голов Лабубу, игривая критика социальных роботов и актуальный вопрос: что монстры, которых мы создаем, говорят о монстрах внутри нас?
    Labububot — one of the rarest monsters on Earth
 
 
🍰 Напоследок
Кладбище стартапов, в которые YC вкладывал деньги, а они так и не взлетели. Отрезвляющее зрелище на фоне «успешных успехов». Особенно когда узнаешь, что некоторые из них не просто провалились, а прихватили с собой уголовные дела.

* Продукт компания Meta, которая признана экстремистской и запрещена на территории РФ.

Автор: Мирослав Кунгуров 
 
Вы получили данное письмо, так как регистрировались на вебинар «Нужна ли математика
на собеседованиях?» на сайте proglib.academy
Чтобы отписаться, нажмите сюда
999999999999999
999999999999999