суббота, 27 июня 2026 г.

Fugu Ultra тягается с Opus 4.8, AWS собирает бэкенд из блоков, Alibaba выпустила zvec

Kimi открывает модели, Cursor уходит к SpaceX, чипы уходят под воду ͏‌͏͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  ͏‌  
⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌
+ Unlimited OCR от Baidu, OCR 4 от Mistral, VibeThinker-3B как Gemini 3 Pro 
📰 Новости
1. Qwen выложила Qwen-AgentWorld-35B-A3B
Qwen-AgentWorld-35B-A3B — языковая модель мира на 35B (3B активных), обученная для симуляции окружений, в которых работают агенты. На основе действий и истории предсказывает следующее состояние окружения. Охватывает семь доменов в одной модели (MCP, Search, Terminal, SWE, Android, Web, OS). В AgentWorldBench обходит Qwen3.5-397B в Overall (56.39 vs 54.74).
2. LOGOS от Alibaba: модель для химии, биологии и материаловедения
LOGOS объединяет в одной архитектуре работу с белками, антителами, химическими реакциями и материалами вместо использования отдельных инструментов под каждую задачу. Доступна в 4 размерах (1B/3B/8B претрейн + 8B).
3. Sakana AI выпустила Fugu Ultra
Fugu Ultraмультиагентный оркестратор, где координатор сам собирает пул LLM под задачу и выдает единый ответ без привязки к одному вендору. По бенчмаркам тягается с Opus 4.8 / GPT 5.5 / Gemini 3.1 Pro, а Fugu Ultra местами обгоняет их (SWE-Bench Pro — 73.7, LiveCodeBench Pro — 90.8).
4. AWS анонсировала «Блоки»
Это конструктор бэкенда от AWS: берешь готовые блоки (авторизация, файлы, AI и т. п.), пишешь логику на TypeScript, и она одинаково крутится у тебя на ноутбуке без AWS-аккаунта и в облаке AWS — фреймворк сам разруливает, где какой сервис использовать.
5. Unlimited OCR от Baidu
Unlimited OCR парсит десятки страниц документа за один проход без просадки скорости, потому что использует новый attention (R-SWA) с константным KV cache. На бенчмарке OmniDocBench обходит DeepSeek OCR (93.23 vs 87.01) и берет SOTA среди фронтир моделей. Полезна, когда нужно прогнать книгу или длинный PDF целиком, а не склеивать результаты постранично.
6. Mistral AI представила OCR 4
OCR-модель с bounding boxes, классификацией блоков (заголовки, таблицы, уравнения, подписи) и confidence scores по страницам и словам, понимает 170 языков. На OlmOCRBench лидирует (85.20), в human-preference тестах аннотаторы в среднем в 72% случаев выбирают ее выдачу против конкурентов. Цена через API: $4 за 1000 страниц, через Batch API: $2 за 1000 страниц.
7. VibeThinker-3B на уровне GLM-5 и Kimi K2.5
VibeThinker-3Bризонинг-модель, обученная на математике, коде и достигающая на бенчмарках (AIME, HMMT, IMO-AnswerBench, LiveCodeBench) уровня GLM-5, Kimi K2.5, Gemini 3 Pro и Qwen3.6 Plus. Подойдет для олимпиадных задач и контестов по программированию (96.1% принятых решений на свежих LeetCode), но не для вызова инструментов и автономных агентов — на этих сценариях разработчики ее использовать не рекомендуют.
8. Exa открыла доступ к агентному сервису для глубокого веб-поиска
Exa Agent дробит задачу на субагентов по доменам и комбинирует фронтиры с дешевыми моделями. Выполнение задач обходится вдвое дешевле по сравнению с GPT 5.5 и Claude Opus.
🚀 Освойте AI-агентов и получите ещё 2 курса бесплатно!
Выберите свой стек, чтобы быстрее расти в карьере, проходить собеседования и создавать ИИ-решения. Старт — в июле.
Подробнее
9. Alibaba выпустила векторную БД zvec
Zvec ставится через pip/npm/go/rust/dart, живет в одном локальном файле, без отдельного сервера. Работает в ноутбуках, серверах и на edge. Ищет миллиарды векторов за миллисекунды, поддерживает гибрид (вектор + полнотекст + фильтры).
Уже сделали MCP-мост для семантического поиска по коду с использованием Zvec и локальных эмбеддингов.Он индексирует файлы проекта и позволяет искать по смыслу, а не только по ключевым словам, что особенно удобно для больших кодовых баз и быстрого поиска по похожим реализациям.
 
🛠🤖 Инструменты для AI
  • SDD-ProSpec-Driven Development для Claude Code, развернутый в полноценный фреймворк
  • pi-web-searchвеб-поиск для Pi: 5 API-Search провайдеров с фри тиром, которые переключаются когда кончаются лимиты
  • FlueTypeScript-харнесс дает агентам доступ к сессиям, инструментам, скилам, инструкциям, файлам и защищенным песочницам
  • Архитектура DCD разбивает базу знаний на три уровня (домены, коллекции, документы) и маршрутизирует запрос сверху вниз через LLM, чтобы искать только в семантически однородном сегменте, а не по всей базе сразу
  • shadcn/uiUI-кит для генерации консистентных интерфейсов
  • styles.refero.design — каталог из 2000+ дизайн-систем реальных продуктов, откуда можно извлечь цвета, типографику, отступы и компоненты любого сайта. Выдает DESIGN.md, который подсовываешь Cursor, Claude Code, Codex, v0 или Lovable, и агент сразу кодит в нужном стиле, а не выдумывает свой
  • Design DNA — вставляешь URL любого сайта и за ~12 секунд получаешь готовую спецификацию DESIGN.md : цветовые токены, типографику, отступы и паттерны компонентов
  • designmd.directory — еще один каталог дизайн-систем
  • getdesign.md — каталог DESIGN.md из GitHub-коллекции awesome-design-md: готовые разборы дизайн-систем известных сайтов
  • AgentStalker проверяет LLM-агента целиком, а не саму модель: читает исходники, рисует граф, как данные ползут от пользовательского ввода и RAG до SQL-запросов и командной строки, потом подбирает под этот граф атаки и по желанию прогоняет их в изолированном Docker с eBPF-мониторингом, чтобы вынести вердикт с доказательствами. Поддерживает агентов на Python и Rust, OWASP Agentic Top 10, три режима по глубине (быстрый статический, стандартный, глубокий с песочницей) и сам не принимает решения «починить и перезапустить» — это решает LLM-оркестратор.
  • serenaMCP инструменты для семантического поиска и редактирования кода
  • Windows Copilot API — мост к Copilot, превращающий чат на copilot.microsoft.com в OpenAI-совместимый API
  • Recall плагин памяти для Claude Code, который ведет журнал сессий и сжимает его в краткое резюме «с чего начали и где остановились» через классический TF-IDF + TextRank. Экономит токены Claude при старте новой сессии и сохраняет историю работы в .recall/history.md + .recall/context.md под проектом
  • Looper — превращает расплывчатую идею автоматизации в проверяемый loop со стадиями Goal → Plan → Review → Deliver → Judge → Stop: критикует цель, требует явной верификации и принудительно подключает ревьюера другой модели, после чего выдает loop.yaml + RUN_IN_SESSION.md для запуска. Полезен там, где встроенных /goal и /loop не хватает.
  • auto-improving-kernel — агент в автономном режиме оптимизирует CUDA-ядро MatMul: ему разрешено править только kernel.cu. На видеокарте NVIDIA L4 агент сделал 34 эксперимента за вечер, 9 улучшений оставил и довел ядро с 1.29 TFLOPS до 9.51 TFLOPS — ускорение в 7.4 раза
 
🛠🧑 Инструменты для людей
  • lightassay — пишешь агенту «проверь, что мой пайплайн работает корректно», он сам собирает тесты, прогоняет твой код и пишет отчет в файлы
  • ClipForge — локальный инструмент, который режет длинные YouTube-видео на вертикальные клипы 9:16 с транскрипцией через faster-whisper, вшитыми субтитрами
    и кропом по центру или в сторону лиц. Запускается через Docker Compose или Python+Node локально, отдает готовые MP4 и SRT
  • codex-lbпрокси и балансировщик для пула ChatGPT-аккаунтов. Раскидывает запросы по нескольким учеткам, считает токены/расход по 28 дням, раздает API-ключи с лимитами, все в веб-дашборде
  • AI в судебных спорах — практический разбор от от Романа Бузько, Кирилла Сереброва о том, где LLM реально усиливает позицию юриста (черновики, поиск противоречий, оценка перспектив через decision tree), а где оборачивается штрафами до $110 тыс. за выдуманные цитаты и потерей адвокатской привилегии (дело Heppner, 2026). Пригодится юристам, чтобы выстроить безопасный регламент работы с AI: какие задачи делегировать, что проверять вручную, как защитить тайну клиента и какие требования по раскрытию использования AI уже действуют в судах РФ, США, ЕС, Англии, Китая, Индии и ОАЭ.
  • Metis — превращает документы и сообщения в цитаты с указанными источниками и отвечает на вопросы с привязкой к первоисточникам
  • InTheWeights — сервис, проверяющий, знают ли LLM конкретного человека или компанию
 
 
Скилы
  • improve-codebase-architecture — прочесывает проект, находит, что в нем не так с архитектурой, показывает в виде наглядной HTML-странички
  • ai-bro — набор скиллов для работы с AI-агентами, который ведет тебя по задаче через четыре стадии: подумать (/bro-think-with-me), разобраться с багом (/bro-debug), собрать план (/bro-give-me-plan) и реализовать с ревью (/bro-do-it).
  • NVIDIA BioNeMo Agent Toolkit — скилы от NVIDIA, которые добавляют агентам готовые сценарии для решения биологических и медицинских задач: фолдинг белков (OpenFold, Boltz-2), молекулярный докинг (DiffDock), генеративную химию (GenMol, MolMIM), геномику (Evo2, MSA-Search) и дизайн белков (RFdiffusion → ProteinMPNN → OpenFold3).
 
Интересное
VibeJam — конкурс по vibe-coding игр, 90% кода должно быть написано AI
🎓 Бесплатный учебник
Hello-Agents — бесплатный учебник по агентам, где показывают, как собрать своего агента с нуля на Python, а не просто дергать готовые API.
  • Часть 1. Основы агентов и LLM — что такое нейросеть, трансформеры, промптинг и агенты
  • Часть 2. Собираем первого агента — парадигмы ReAct/Plan-and-Solve/Reflection с нуля, лоукод-платформы (Coze, Dify, n8n) и фреймворки AutoGen, AgentScope, LangGraph
  • Часть 3. Продвинутые техники — память и RAG, контекст-инжиниринг, протоколы MCP/A2A/ANP, Agentic-RL и оценка агентов
  • Часть 4. Кейсы из продакшна — тревел-ассистент на MCP, воспроизведение DeepResearch и симуляция социальной динамики в Cyber Town
  • Часть 5. Дипломный проект — сборка собственного мультиагентного приложения
🤖 Роботы и устройства
Энтузиаст собрал робота SARAS 2.0 на Raspberry Pi и дал Claude (через Claude Code + MCP) доступ к его сенсорам и двигателям. AI сам написал инструменты управления, отлаживал себя по описанию проблемы и принимал навигационные решения, меняя поведение правкой claude.md, а не кода. Код на Гитхабе.
Enoпервый агентный робот Genesis, в котором AI-агент и универсальное железо работают как единая система: рассуждает, планирует и действует в реальном мире.
robot_retargeter — открытый Python-пайплайн для перенацеливания движений с человека (SMPL-X) или исходного робота на целевых гуманоидов (Unitree G1/H2/T800, AgiBot X2 и др.) через обратную кинематику на mink + MuJoCo, с покадровым масштабированием скелета по длинам звеньев, геометрической реконструкцией колена и подавлением скольжения стоп в фазе опоры. Позволяет одной командой прогнать три стадии: извлечение ключевых точек → ретаргетинг → визуализация.
robot_retargeter — открытый Python-пайплайн для перенацеливания движений с человека (SMPL-X) или исходного робота на целевых гуманоидов (Unitree G1/H2/T800, AgiBot X2 и др.) через обратную кинематику на mink + MuJoCo, с покадровым масштабированием скелета по длинам звеньев, геометрической реконструкцией колена и подавлением скольжения стоп в фазе опоры. Позволяет одной командой прогнать три стадии: извлечение ключевых точек → ретаргетинг → визуализация.
Tecno Atom — концепт модульного телефона, показанный на MWC 2026. К корпусу на магнитах цепляются зум-объектив, дополнительные батареи и другие аксессуары.
 
🍰 Напоследок
Первый день вайбкодера:
Автор: Мирослав Кунгуров
 
Вы получили данное письмо, так как регистрировались на вебинар «Нужна ли математика
на собеседованиях?» на сайте proglib.academy
Чтобы отписаться, нажмите сюда
999999999999999
999999999999999