|
|
|
+ Unlimited OCR от Baidu, OCR 4 от Mistral, VibeThinker-3B как Gemini 3 Pro
|
|
|
|
|
|
1. Qwen выложила Qwen-AgentWorld-35B-A3B
|
Qwen-AgentWorld-35B-A3B — языковая модель мира на 35B (3B активных), обученная для симуляции окружений, в которых работают агенты. На основе действий и истории предсказывает следующее состояние окружения. Охватывает семь доменов в одной модели (MCP, Search, Terminal, SWE, Android, Web, OS). В AgentWorldBench обходит Qwen3.5-397B в Overall ( 56.39 vs 54.74).
|
|
|
|
2. LOGOS от Alibaba: модель для химии, биологии и материаловедения
|
LOGOS объединяет в одной архитектуре работу с белками, антителами, химическими реакциями и материалами вместо использования отдельных инструментов под каждую задачу. Доступна в 4 размерах (1B/3B/8B претрейн + 8B).
|
|
|
|
3. Sakana AI выпустила Fugu Ultra
|
Fugu Ultra — мультиагентный оркестратор, где координатор сам собирает пул LLM под задачу и выдает единый ответ без привязки к одному вендору. По бенчмаркам тягается с Opus 4.8 / GPT 5.5 / Gemini 3.1 Pro, а Fugu Ultra местами обгоняет их ( SWE-Bench Pro — 73.7, LiveCodeBench Pro — 90.8).
|
|
|
|
4. AWS анонсировала «Блоки»
|
Это конструктор бэкенда от AWS: берешь готовые блоки ( авторизация, файлы, AI и т. п.), пишешь логику на TypeScript, и она одинаково крутится у тебя на ноутбуке без AWS-аккаунта и в облаке AWS — фреймворк сам разруливает, где какой сервис использовать.
|
|
|
|
5. Unlimited OCR от Baidu
|
Unlimited OCR парсит десятки страниц документа за один проход без просадки скорости, потому что использует новый attention ( R-SWA) с константным KV cache. На бенчмарке OmniDocBench обходит DeepSeek OCR ( 93.23 vs 87.01) и берет SOTA среди фронтир моделей. Полезна, когда нужно прогнать книгу или длинный PDF целиком, а не склеивать результаты постранично.
|
|
|
|
6. Mistral AI представила OCR 4
|
OCR-модель с bounding boxes, классификацией блоков (заголовки, таблицы, уравнения, подписи) и confidence scores по страницам и словам, понимает 170 языков. На OlmOCRBench лидирует (85.20), в human-preference тестах аннотаторы в среднем в 72% случаев выбирают ее выдачу против конкурентов. Цена через API: $4 за 1000 страниц, через Batch API: $2 за 1000 страниц.
|
|
|
|
7. VibeThinker-3B на уровне GLM-5 и Kimi K2.5
|
VibeThinker-3B — ризонинг-модель, обученная на математике, коде и достигающая на бенчмарках (AIME, HMMT, IMO-AnswerBench, LiveCodeBench) уровня GLM-5, Kimi K2.5, Gemini 3 Pro и Qwen3.6 Plus. Подойдет для олимпиадных задач и контестов по программированию ( 96.1% принятых решений на свежих LeetCode), но не для вызова инструментов и автономных агентов — на этих сценариях разработчики ее использовать не рекомендуют.
|
|
|
|
8. Exa открыла доступ к агентному сервису для глубокого веб-поиска
|
Exa Agent дробит задачу на субагентов по доменам и комбинирует фронтиры с дешевыми моделями. Выполнение задач обходится вдвое дешевле по сравнению с GPT 5.5 и Claude Opus.
|
|
|
|
🚀 Освойте AI-агентов и получите ещё 2 курса бесплатно!
|
|
Выберите свой стек, чтобы быстрее расти в карьере, проходить собеседования и создавать ИИ-решения. Старт — в июле.
|
|
|
|
|
9. Alibaba выпустила векторную БД zvec
|
Zvec ставится через pip/npm/go/rust/dart, живет в одном локальном файле, без отдельного сервера. Работает в ноутбуках, серверах и на edge. Ищет миллиарды векторов за миллисекунды, поддерживает гибрид (вектор + полнотекст + фильтры).
Уже сделали MCP-мост для семантического поиска по коду с использованием Zvec и локальных эмбеддингов.Он индексирует файлы проекта и позволяет искать по смыслу, а не только по ключевым словам, что особенно удобно для больших кодовых баз и быстрого поиска по похожим реализациям.
|
|
|
|
|
- SDD-Pro — Spec-Driven Development для Claude Code, развернутый в полноценный фреймворк
- pi-web-search — веб-поиск для Pi: 5 API-Search провайдеров с фри тиром, которые переключаются когда кончаются лимиты
- Flue — TypeScript-харнесс дает агентам доступ к сессиям, инструментам, скилам, инструкциям, файлам и защищенным песочницам
- Архитектура DCD разбивает базу знаний на три уровня (домены, коллекции, документы) и маршрутизирует запрос сверху вниз через LLM, чтобы искать только в семантически однородном сегменте, а не по всей базе сразу
- shadcn/ui — UI-кит для генерации консистентных интерфейсов
- styles.refero.design — каталог из 2000+ дизайн-систем реальных продуктов, откуда можно извлечь цвета, типографику, отступы и компоненты любого сайта. Выдает DESIGN.md, который подсовываешь Cursor, Claude Code, Codex, v0 или Lovable, и агент сразу кодит в нужном стиле, а не выдумывает свой
- Design DNA — вставляешь URL любого сайта и за ~12 секунд получаешь готовую спецификацию DESIGN.md : цветовые токены, типографику, отступы и паттерны компонентов
- designmd.directory — еще один каталог дизайн-систем
- getdesign.md — каталог DESIGN.md из GitHub-коллекции awesome-design-md: готовые разборы дизайн-систем известных сайтов
- AgentStalker — проверяет LLM-агента целиком, а не саму модель: читает исходники, рисует граф, как данные ползут от пользовательского ввода и RAG до SQL-запросов и командной строки, потом подбирает под этот граф атаки и по желанию прогоняет их в изолированном Docker с eBPF-мониторингом, чтобы вынести вердикт с доказательствами. Поддерживает агентов на Python и Rust, OWASP Agentic Top 10, три режима по глубине (быстрый статический, стандартный, глубокий с песочницей) и сам не принимает решения «починить и перезапустить» — это решает LLM-оркестратор.
- serena — MCP инструменты для семантического поиска и редактирования кода
- Windows Copilot API — мост к Copilot, превращающий чат на copilot.microsoft.com в OpenAI-совместимый API
- Recall — плагин памяти для Claude Code, который ведет журнал сессий и сжимает его в краткое резюме «с чего начали и где остановились» через классический TF-IDF + TextRank. Экономит токены Claude при старте новой сессии и сохраняет историю работы в .recall/history.md + .recall/context.md под проектом
- Looper — превращает расплывчатую идею автоматизации в проверяемый loop со стадиями Goal → Plan → Review → Deliver → Judge → Stop: критикует цель, требует явной верификации и принудительно подключает ревьюера другой модели, после чего выдает loop.yaml + RUN_IN_SESSION.md для запуска. Полезен там, где встроенных /goal и /loop не хватает.
- auto-improving-kernel — агент в автономном режиме оптимизирует CUDA-ядро MatMul: ему разрешено править только kernel.cu. На видеокарте NVIDIA L4 агент сделал 34 эксперимента за вечер, 9 улучшений оставил и довел ядро с 1.29 TFLOPS до 9.51 TFLOPS — ускорение в 7.4 раза
|
 |
- lightassay — пишешь агенту «проверь, что мой пайплайн работает корректно», он сам собирает тесты, прогоняет твой код и пишет отчет в файлы
- ClipForge — локальный инструмент, который режет длинные YouTube-видео на вертикальные клипы 9:16 с транскрипцией через faster-whisper, вшитыми субтитрами
и кропом по центру или в сторону лиц. Запускается через Docker Compose или Python+Node локально, отдает готовые MP4 и SRT
- codex-lb — прокси и балансировщик для пула ChatGPT-аккаунтов. Раскидывает запросы по нескольким учеткам, считает токены/расход по 28 дням, раздает API-ключи с лимитами, все в веб-дашборде
|
 |
- AI в судебных спорах — практический разбор от от Романа Бузько, Кирилла Сереброва о том, где LLM реально усиливает позицию юриста (черновики, поиск противоречий, оценка перспектив через decision tree), а где оборачивается штрафами до $110 тыс. за выдуманные цитаты и потерей адвокатской привилегии (дело Heppner, 2026). Пригодится юристам, чтобы выстроить безопасный регламент работы с AI: какие задачи делегировать, что проверять вручную, как защитить тайну клиента и какие требования по раскрытию использования AI уже действуют в судах РФ, США, ЕС, Англии, Китая, Индии и ОАЭ.
|
- Metis — превращает документы и сообщения в цитаты с указанными источниками и отвечает на вопросы с привязкой к первоисточникам
- InTheWeights — сервис, проверяющий, знают ли LLM конкретного человека или компанию
|
- improve-codebase-architecture — прочесывает проект, находит, что в нем не так с архитектурой, показывает в виде наглядной HTML-странички
- ai-bro — набор скиллов для работы с AI-агентами, который ведет тебя по задаче через четыре стадии: подумать (/bro-think-with-me), разобраться с багом (/bro-debug), собрать план (/bro-give-me-plan) и реализовать с ревью (/bro-do-it).
- NVIDIA BioNeMo Agent Toolkit — скилы от NVIDIA, которые добавляют агентам готовые сценарии для решения биологических и медицинских задач: фолдинг белков (OpenFold, Boltz-2), молекулярный докинг (DiffDock), генеративную химию (GenMol, MolMIM), геномику (Evo2, MSA-Search) и дизайн белков (RFdiffusion → ProteinMPNN → OpenFold3).
|
VibeJam — конкурс по vibe-coding игр, 90% кода должно быть написано AI
|
Hello-Agents — бесплатный учебник по агентам, где показывают, как собрать своего агента с нуля на Python, а не просто дергать готовые API.
- Часть 1. Основы агентов и LLM — что такое нейросеть, трансформеры, промптинг и агенты
- Часть 2. Собираем первого агента — парадигмы ReAct/Plan-and-Solve/Reflection с нуля, лоукод-платформы (Coze, Dify, n8n) и фреймворки AutoGen, AgentScope, LangGraph
- Часть 3. Продвинутые техники — память и RAG, контекст-инжиниринг, протоколы MCP/A2A/ANP, Agentic-RL и оценка агентов
- Часть 4. Кейсы из продакшна — тревел-ассистент на MCP, воспроизведение DeepResearch и симуляция социальной динамики в Cyber Town
- Часть 5. Дипломный проект — сборка собственного мультиагентного приложения
|
Энтузиаст собрал робота SARAS 2.0 на Raspberry Pi и дал Claude (через Claude Code + MCP) доступ к его сенсорам и двигателям. AI сам написал инструменты управления, отлаживал себя по описанию проблемы и принимал навигационные решения, меняя поведение правкой claude.md, а не кода. Код на Гитхабе.
|
Eno — первый агентный робот Genesis, в котором AI-агент и универсальное железо работают как единая система: рассуждает, планирует и действует в реальном мире.
|
robot_retargeter — открытый Python-пайплайн для перенацеливания движений с человека (SMPL-X) или исходного робота на целевых гуманоидов (Unitree G1/H2/T800, AgiBot X2 и др.) через обратную кинематику на mink + MuJoCo, с покадровым масштабированием скелета по длинам звеньев, геометрической реконструкцией колена и подавлением скольжения стоп в фазе опоры. Позволяет одной командой прогнать три стадии: извлечение ключевых точек → ретаргетинг → визуализация.
|
robot_retargeter — открытый Python-пайплайн для перенацеливания движений с человека (SMPL-X) или исходного робота на целевых гуманоидов (Unitree G1/H2/T800, AgiBot X2 и др.) через обратную кинематику на mink + MuJoCo, с покадровым масштабированием скелета по длинам звеньев, геометрической реконструкцией колена и подавлением скольжения стоп в фазе опоры. Позволяет одной командой прогнать три стадии: извлечение ключевых точек → ретаргетинг → визуализация.
|
Tecno Atom — концепт модульного телефона, показанный на MWC 2026. К корпусу на магнитах цепляются зум-объектив, дополнительные батареи и другие аксессуары.
|
|
|
|
|
|
|
Вы получили данное письмо, так как регистрировались на вебинар «Нужна ли математика
на собеседованиях?» на сайте proglib.academy.
Чтобы отписаться, нажмите сюда
|
|
|
|