|
|
|
+ MiniMax обогнала Opus 4.7 на BrowseComp, Perplexity сократила расход токенов на 85%
|
|
|
|
|
|
1. MiniMax выпустила недорогую модель M3
|
Архитектура MSA поддерживает 1M токенов с гарантией минимум 512K. На BrowseComp выбила 83.5 против 79.3 у Opus 4.7. На PostTrainBench заняла третье место, обогнав всех, кроме Opus 4.7 и GPT-5.5.
|
|
|
|
2. Google опубликовала Gemma 4 12B
|
Мультимодальная модель, которая обрабатывает текст, изображения и аудио с меньшей задержкой, работает локально на 16 ГБ ОЗУ и выдает в бенчмарках результат на уровне 26B-моделей. Лицензия Apache 2.0.
|
|
|
3. RTX Spark: NVIDIA встроит 128 ГБ общей памяти и Blackwell в ноутбук
|
NVIDIA выпустила чип RTX Spark для Windows ПК: 1 петафлопс для задач AI, до 128 ГБ общей памяти, GPU Blackwell с 6144 ядрами CUDA плюс 20-ядерный CPU Grace (разработали совместно с MediaTek). С Microsoft сделали платформу под локальные агенты: новые security-примитивы Windows и runtime NVIDIA OpenShell, чтобы агенты крутились на устройстве.
Железо тянет 120B-модели, редактирование 12K-видео 4:2:2, рендер 3D-сцены объемом 90+ ГБ и AAA-игры в 1440p при 100+ fps. Adobe переписывает Photoshop и Premiere под Spark, обещают ×2 по AI и графике. Ноуты и мини-ПК обещают осенью от ASUS, Dell, HP, Lenovo, Surface и MSI. Покупаем ноут, гоняем локальные модели для Tier 0 задач и экономим на фронтире.
|
|
|
|
🎓 Хотите быть на волне AI-агентов?
|
|
30 июня стартует курс «Разработка AI-агентов»: 8 недель обучения, 12+ практических уроков.
О чем: Архитектура AI, AgentOps, мультиагентные паттерны, безопасность и контроль.
Промокод «FIRSTAGENT» на 10 000 руб. действует до 15 июня!
|
|
|
|
4. Search as Code: Perplexity превращает поиск в программируемый SDK для ИИ-агентов
|
Search as Code (SaC) — архитектура, где агенты собирают поисковые пайплайны из примитивов SDK через генерацию Python-кода вместо вызова монолитного API. Это дает контроль над каждым этапом поиска и снижает расход токенов до 85 % при росте точности на 12-20 процентных пунктов.
|
|
|
|
5. Codex получил функцию Computer use
|
|
|
|
6. OpenAI нанял разработчика Litter в команду Codex
|
Разработчик мобильного клиента Litter для удаленного доступа к Codex, Claude, Gemini и т. д. нанят в команду Codex.
|
|
|
7. Anthropic подала предварительную заявку на IPO
|
Подали конфиденциальный черновик заявления по форме S-1 в Комиссию по ценным бумагам. После рассмотрения заявки компания сможет провести IPO. Цену и число акций пока не определили.
|
|
|
8. Factory AI представила Router
|
Factory Router сам подбирает модель под задачу: простые запросы идут на дешевые модели, а сложные остаются на фронтирных. Если выбранная модель не тянет, сессия перекидывается на модель посильнее. При падении запроса роутер уходит на другую модель. Надежность 99.9%+. Правила роутинга задаются пользователем. Factory Router доступен в приватном превью в Factory CLI и Desktop App.
|
|
|
9. Семь моделей от Microsoft
|
Microsoft AI выпустила собственное семейство моделей:
Разработчики смогут тюнить веса под свои задачи через Microsoft Frontier Tuning — RL-среды, где модель обучается на реальных рабочих процессах организации.
|
|
|
|
|
11. Liquid AI резинули LFM2.5-8B-A1B
|
MoE-модель с 128K контекстом. На бенчмарке Non-Hallucination набрала 63.47% — лучший результат в классе, Gemma-4-26B-A4B (10.75%) отстает в 6 раз.
|
|
|
|
12. Обновление PaddleOCR-VL 1.6
|
SOTA 96.3% на OmniDocBench v1.6: улучшено распознавание таблиц, редких символов, печатей и графиков.
|
|
|
|
13. Модель Qwopus3.6-27B-v2-MTP-GGUF
|
Qwopus3.6-27B-v2-MTP — файнтюн Qwen3.6-27B с Multi-Token Prediction, ускоряющий генерацию в 1.66 раза при работе с кодом, DevOps, логикой и математикой. Сокращает общее время ответа на 56.5% и уменьшает объем выходных токенов на 27.7%, сохраняя качество пошагового рассуждения.
|
|
|
Déjà View (DVLT) — рекуррентный трансформер от NVIDIA, который по набору фотографий строит 3D-модель сцены с картами глубины.
|
|
|
|
|
- Crabbox берет ваш локальный проект, поднимает под него виртуальную машину, заливает туда код по SSH/rsync, запускает команды (тесты, билды, что угодно) и отдает результат обратно
- GoalBuddy — помогает агентам (Codex, Claude Code) не терять контекст при длинных задачах: создает локальную «доску» с планом, прогрессом и чек-листом, чтобы работа не начиналась заново после каждого прерывания
- composer-api — перенаправляет запросы от Cursor Composer к нужной модели через OpenAI API
- Claude-Opus-4.[6-8]-Censorship-Remover — убирает цензуру из Claude
- ai-agents — Docker-образы для Codex, Claude Code и OpenCode для запуска агентов в песочнице поверх любого проекта с пробросом учетных данных пользователя
- scientific-agents — каждый файл AGENTS.md задает агенту схему рассуждений старшего специалиста конкретной профессии: формулировка задач, выбор инструментов и данных, проверка утверждений, формат выдачи результатов
- UltraCode-Shim — прокси для запуска UltraCode-режима Claude Code на любой модели через /model. Позволяет раздельно выбирать модель для планировщика и исполнителя, а также автоматически направлять простые задачи на дешевые модели, сложные — на мощные
- LogicPipe — фреймворк для распределенного LLM-инференса на нескольких GPU/edge-устройствах
- Nullsec-S1 — PEFT/QLoRA-адаптер на Qwen2.5-Coder-7B-Instruct для аудита безопасности сгенерированного кода, возвращающий структурированный JSON-вердикт с уязвимостями, уровнем критичности и рекомендуемым исправлением
|
- Odysseus — self-hosted рабочее пространство, которое объединяет чат, агентов с инструментами, редактор документов, почту, календарь и менеджер задач. Работает с локальными моделями или внешними по API
- vibe-remote подключает Claude Code, OpenCode и Codex к Slack, Discord, Telegram, WeChat, Lark. Пишешь задачу в чат, агент ковыряет код у тебя на машине, ты смотришь результат. Все локально, каждый тред отдельная сессия
- kesha-voice-kit — распознает речь на 25 языках, озвучивает текст на 9 языках, определяет голосовую активность и распознает язык аудио. Написан на Rust, весит около 20 МБ. Без ffmpeg и Python
- nbd-vram — добавляет к общей памяти RAM память видеокарты
- ralphy — создает вирусные видео с помощью агентов
- openclaw-max-bridge — готовый мост между OpenClaw и мессенджером MAX :)))
- Databox — платформа бизнес-аналитики с AI: датасеты, кастомные метрики, дашборды и AI-инсайты без сложной настройки и долгого обучения. Дает командам быстрые ответы по данным без дорогих BI-решений
- Brief — единый источник правды для продуктовых команд: фиксирует решения и замысел продукта, отдает контекст людям и агентам через чат, Slack, CLI и MCP
- Fundraisly — агент для фандрайзинга, который анализирует базу из 300K+ инвесторов и миллионы сделок, находит тех, кто инвестирует в вашу нишу, и связывает вас с ними через общие знакомства или напрямую
- Elentaria — AI-оператор для B2B: анализирует бизнес, ранжирует 22 канала продаж, запускает подходящий план и оценивает, что реально принесло выручку, чтобы на следующую неделю работать точнее
|
 |
- Tokenwise — OpenAI-совместимый LLM-прокси показывает, где вы переплачиваете, и применяет оптимизацию в один клик с проверкой экономии в долларах.
|
- Stella — локальный поиск по файлам на Mac на естественном языке: опишите файл словами и он найдется, даже если имя нечитаемое. Результат можно перетащить в Gmail, открыть или запустить приложение
|
- Machine Learning Library — вручную отобранная библиотека из 923 ML-документов (~11 млн токенов): университетские курсы, статьи arXiv и канонические статьи, нормализованные в единый маркдаун с метаданными и полной атрибуцией
|
- thermo-nuclear-code-quality-review — запускает аудит качества кода. Ищет не мелкие баги, а структурные проблемы: раздувание файлов сверх 1000 строк, лишние абстракции и т. д. Каждое изменение проверяет по вопросу: нельзя ли выкинуть целый слой условий или оберток, переформулировав задачу. Не одобряет PR, который «работает», но засоряет кодовую базу
- NVIDIA выложила каталог скилов. Перед публикацией каждый скил гоняют через SkillSpector: сканер ищет уязвимости, утечки данных, промпт-инъекции и скрытые инструкции
- codex-dynamic-workflows — скил для оркестрации агентов превращает крупную задачу в управляемый workflow с планом, субагентами и верификацией результатов
- mathVideoMaker — скил для Cursor, генерирующий по запросу математический видеоролик (Manim → MP4) и интерактивную веб-страницу (HTML с KaTeX + canvas) с общей концепцией и оформлением
|
 |
Протестировал mimo-v2.5-pro, mimo-v2.5 — получше GLM 5.1 в задачах разработки на Python и React. На тарифе «Лайт» в Pi получилось 4.2 млрд кредитов = 173 млн токенов. Получается дорого.
|
Вышедшая на днях MiniMax M3 потребляет значительно меньше токенов по сравнению с Mimo/GLM и по качеству им не уступает. Это субъективный взгляд: оцениваю, как часто модель ошибается, правильно ли понимает задачу, насколько быстро справляется с задачей. MiniMax теперь новая рабочая лошадка. Claude и ChatGPT, конечно, для китайцев недостижимы.
|
|
|
|
|
zero2claude — учит работать в Claude Code людей, которые терминал никогда не открывали.
|
|
|
Davide Ciffa выложил PFlash: префилл 128K контекста на RTX 3090 ускорился в 10 раз. Маленькая модель Qwen3-0.6B оценивает важность токенов и оставляет 5% лучших, а тяжелая Qwen3.6-27B префиллит только их. 24.8 секунды вместо ~257 секунд у llama.cpp.
|
|
|
|
|
|
|
|
|
|
|
|
|
LeRobot RGB/RGB-D VLA Dataset Toolkit — инструмент для слияния, проверки качества, очистки и публикации LeRobot-датасетов с поддержкой RGB-D камер Orbbec. Проводит датасет через полный цикл: запись → объединение → аудит → удаление брака → загрузка на Hugging Face.
|
Anima — опенсорсная Agent OS, которая превращает устройства умного дома в агентов с LLM-мозгом, скилами и долговременной памятью. Устройства сами принимают решения с учетом контекста, привычек и взаимодействия друг с другом.
|
Исследователи добились равномерности ускорения центра масс во всех направлениях, отказавшись от традиционной геометрической симметрии конструкции. Подход проверен на тысяче симуляций и на 20-ногом роботе Argus. Робот двигается одинаково в любом направлении, сам стабилизируется и не теряет работоспособность при поломке ног.
|
|
|
|
|
|
|
Вы получили данное письмо, так как регистрировались на вебинар «Нужна ли математика
на собеседованиях?» на сайте proglib.academy.
Чтобы отписаться, нажмите сюда
|
|
|
|