|
|
|
Kimi открывает модели, Cursor уходит к SpaceX, чипы уходят под воду
|
|
|
|
|
|
1. OpenRouter запустил Fusion Router
|
Один API-вызов отправляет промпт ансамблю моделей, те отвечают параллельно, а модель-судья выявляет совпадения и расхождения, фиксирует пробелы. Внешняя модель пишет финальный ответ на основе разбора. По умолчанию в ансамбле три модели: anthropic/claude-opus-latest, openai/gpt-latest, google/gemini-pro-latest. Стоимость примерно в 4-5 раз выше одиночного вызова. Можно настроить свой ансамбль и выбрать судью, максимум 8 моделей. Рекурсия заблокирована: вложенные вызовы не могут снова запустить Fusion.
|
|
|
|
2. Anthropic отключила Fable 5 и Mythos 5
|
|
|
|
3. Anthropic сможет передавать данные полиции без решения суда
|
С 8 июля компания начнет требовать фото документов и селфи через Persona при подозрениях на злоупотребления. Anthropic сможет передавать логи правоохранителям по собственному усмотрению. Изменения затрагивают только личные тарифы, не Team/Enterprise и API.
|
|
|
|
🤯 Ты уже хороший разработчик, НО этого недостаточно…
|
|
Рынок быстро меняется: от разработчиков всё чаще ждут не просто умения писать код, а навыка внедрять AI в продукт.
На курсе по AI-агентам ты научишься собирать системы на базе LLM, API и RAG, которые решают реальные задачи бизнеса. Не теория ради галочки, а практический навык, который можно сразу добавить в своё резюме и рабочий стек.
|
|
|
|
4. DeepSeek привлекла $7.4 млрд при оценке свыше $50 млрд
|
Инвесторы вкладывают в партнерство под управлением основателя — без права голоса и с пятилетним запретом на продажу акций.
|
|
|
|
5. Xiaomi зарелизила MiMo Code
|
MiMo Code — модифицированный форк OpenCode, который сохраняет качество на длинных задачах. Отдельный writer-агент сохраняет состояние на чекпоинтах, а не ждет пока контекст переполнится; отдельная проверка не дает агенту соврать что работа завершена. Max Mode гоняет 5 кандидатов параллельно и жрет в 4-5 раз больше токенов. В итоге на задачах дольше 200 шагов MiMo Code с MiMo-V2.5-Pro обходит Claude Code c Claude Sonnet 4.6 в 65%+ случаев.
|
|
|
|
6. Xiaomi анонсировала MiMo UltraSpeed
|
|
|
|
7. Moonshot AI выпустила модель Kimi K2.7-Code
|
MoE-модель на 1 трлн параметров, 384 экспертов и 32B активных параметра, контекст 256K, режим thinking не отключить. На Kimi Code Bench v2 прыгнула с 50.9 до 62.0, обошла Opus 4.8 на MCP Mark Verified ( 81,1 против 76,4). Тратит на треть меньше reasoning-токенов, чем K2.6, — на длинных агентных прогонах это дает экономию. Веса открыты (модифицированная MIT, 595 ГБ). Все бенчмарки от самого Moonshot, независимых нет.
|
|
|
|
8. Z.ai представила GLM-5.2
|
Флагманская модель с рабочим контекстом 1 млн токенов, ориентированная под длительные агентные задачи. На FrontierSWE отстает от Opus 4.8 всего на 0.7%; на Terminal-Bench 2.1 набирает 81.0 против 85.0 у Opus 4.8. Веса доступны под MIT-лицензией.
|
|
|
|
9. Утечка финансов OpenAI за 2025 год
|
Чистый убыток составил 38.5 млрд долларов при выручке 13.07 млрд, из которых 17.2 млрд ушло Microsoft, а основная дыра — списание 41.55 млрд при преобразовании из некоммерческой организации в коммерческую. Инвесторы впервые видят настоящие цифры перед возможным IPO при оценке в 852 млрд и плане вложить 600 млрд в инфраструктуру до 2030 года.
|
|
|
|
10. SpaceX покупает Cursor за $60 млрд
|
Сделка усиливает позиции xAI на рынке AI-инструментов для кодинга, где Cursor соперничает с Anthropic и OpenAI. Разработчики получат AI-агент Grok Build и модели Grok, которые Cursor может помочь улучшить за счет доступа к данным о кодинге, а сама платформа — вычислительные мощности SpaceX, которых ей не хватало.
|
|
|
|
11. Let's Encrypt внесла санкционный запрет в соглашение на сертификаты
|
Let's Encrypt добавила в пользовательское соглашение ( pdf) пункт: сертификаты не выдаются лицам и организациям из стран/частей страны с полномасштабными санкциями США. Директор ISRG уточнил: частные лица и негосударственные компании из России и Ирана сертификаты получать продолжат, запрет коснется только госучреждений.
|
|
|
|
12. FastContext4: субагент для поиска по репо
|
FastContext от Microsoft — семейство субагентов ( 4B на Qwen3-Instruct и 30B-A3B на Qwen3-Coder, MoE), которые берут на себя поиск по репозиторию: делают параллельные READ/GLOB/GREP и возвращают компактный список цитат (файл + строки). Компактная FC-4B-RL на SWE-bench Pro обгоняет FC-30B-SFT ( 22.5 vs 20.0 с GLM-5.1) при меньшем расходе токенов. В целом FastContext снижает потребление токенов основным агентом на ~10-50% в зависимости от бенчмарка и варианта (например, GPT-5.4 на SWE-QA с FC-30B-SFT — ↓50.7%).
|
|
|
|
13. Open Knowledge Format: знания в маркдаун-файлах
|
Google выпустила спецификацию Open Knowledge Format (OKF): знания описываются каталогом markdown-файлов с YAML-frontmatter, где единственное обязательное поле — type. Файлы ссылаются друг на друга обычными markdown-ссылками, образуя граф.
|
|
|
|
|
- Ponytail — заставляет агентов писать на 80-94% меньше кода
- modelharness — плагин для Claude Code, добавляющий при старте сессии в системный промт 910 токенов: шесть практик Fable 5, три скила по запросу и агент-верификатор контекста. Снижает стоимость Opus 4.8 на 14% и увеличивает скорость на 16%
- CodexQB — плагин для Codex, который делает планирование проекта на основе репозитория: мастер-план, разбор текущего состояния, подпланы по фазам и аудит готовности, а потом выдает промпт для реализации, но сам ничего не реализует. Все сохраняется в папку Planner-docs
- bingo — набор пентест-инструментов, который скармливает URL любой из шести LLM (DeepSeek, Claude, GPT, GLM, Qwen, Ollama) и запускает 28-фазный пайплайн
- omnigent — оркестратор объединяет Claude Code, Codex, Cursor, Pi и кастомных агентов в одной сессии
- OpenLoop — универсальный фреймворк для конструирования циклов вокруг AI-агентов, реализующий play-test-fix-verify-improve циклы с логами, heartbeat'ами, бейзлайнами, ограничителями и аудитируемыми условиями остановки
- figma-ai-bridge — опенсорсный мост между Figma Desktop и агентами
- RL for Game — фреймворк обучения с подкреплением для автоматического управления в играх
|
 |
- IdeaScout — находит в чужих статьях идеи, которые можно перенести в твою задачу
- Proxy Checker — проверяет и фильтрует прокси: получает список бесплатных прокси, тестит HTTP/HTTPS/SOCKS4/5 на связку «твой сервер → прокси → цель», живые прокси записывает в TXT/JSON
- J.A.R.V.I.S — голосовой ассистент в стиле Iron Man поверх Hermes Agent: говорит с агентом через браузерный HUD с кольцом-реактором, агент реально выполняет действия (файлы, терминал, веб-поиск, 80+ скилов, память между сессиями), ответ возвращается речью за 3-5 секунд
- LogicCut — опенсорсный CLI для видеомонтажа: принимает видео или ссылку, режет 15-30-секундные тематические отрывки, переводит субтитры, озвучивает и сводит все в один ролик
|
- ccpocket — мобильный клиент для Codex и Claude
|
- Grimoire — это локальный поисковик по 20+ базам знаний для пентестеров с MCP
|
zero2claude — учит работать в Claude Code людей, которые терминал никогда не открывали.
|
 |
- knowledge-base — создание и обогащение базы знаний LLM
- ko-lesson — Codex-скилл для генерации курсов из учебных материалов Obsidian с обратной связью и экзаменационным циклом
- qiaomu-goal-meta-skill превращает размытые запросы в исполняемые /goal для Codex
- pixel2motion — делает из растровых логотипов анимированные HTML + SVG
- qiaomu-ai-prd — превращает идею продукта в структурированный PRD для людей и AI-ассистентов
- illo-skill — генерирует на основе статьи иллюстрации в газетном стиле с повторяющимся фирменным персонажем
- COMPASS — три скилла, чтобы агент не терял контекст между сессиями и не начинал вслепую:
• task-clarifier: задать 1-3 ключевых вопроса до того, как делать работу
• task-forest: держать в репо карту целей/подзадач/DAG с прогрессом и историей
• user-profile-keeper: помнить, как с тобой работать
- threejs-game-skills — 9 скиллов для Three.js-игр в браузере. Зовешь threejs-game-director, он сам подтягивает специалистов: геймплей, графика, UI, дебаг, QA, генерация 3D/картинок/аудио
- Harness Forge — скил для Claude Code, который запускает цикл автоматической оптимизации обвязки модели
|
|
Крон в 8 утра: claude -p "Hello" → просыпаешься в 10, работаешь до сброса лимитов в 13. Итого 3-6 продуктивных часов в день.
|
|
2. Ансамбли слабых моделей обогнали одиночные фронитры
|
На «Humanity's last exam» одиночные frontier-модели набрали ~20 баллов. Ансамбль из 2-5 моделей набрал ~50 баллов. Самый дешевый способ приблизиться к качеству Fable/Mythos сейчас: GPT 5.5 + Opus 4.8 + Gemini 3.1 Pro.
|
 |
Agentic Engineering Handbook — структурированная дорожная карта из 130 ресурсов по агентным системам. Покрывает OpenAI, Anthropic и Google, делит материалы на фазы с практическими заданиями и приоритетами P0/P1/P2.
- Фаза 0: Agent Loop From Scratch. Ядро любого агента: модель + инструменты + один цикл. Поняв ядро, проще разбираться во всем остальном: когда планировать, а когда действовать сразу; зачем явный список задач; как субагенты экономят контекст; что такое скилы, MCP, хуки и т. д.
- Фаза 1: Agent Foundations. Чем workflow отличается от одиночного агента, инструменты, передача задач, ограничители.
- Фаза 2: MCP & Tool Ecosystem. Model Context Protocol: сервер/клиент, удаленные vs локальные инструменты, загрузка инструментов и одобрение действий.
- Фаза 3: Context, Memory & Skills. Управление контекстным окном, кратковременной и долговременной памятью, скилами/плагинами, CLAUDE.md/AGENTS.md.
- Фаза 4: Harness & Long-Running Agents. Рантайм агента: поток событий, треды, состояние, песочница, подтверждение, восстановление после сбоев. Долгоиграющие задачи через PLANS.md и аналоги.
- Фаза 5: Coding & Workspace Agents. Сравнение Codex и Claude Code; изучение мультиагентного подхода, интеграция с IDE
- Фаза 6: Evals, Safety & Production. Построение цикла оценок до и после запуска, отслеживание каждого шага агнета, ограничения и разрешения агента, мониторинг регрессий.
|
|
|
Ponytail1. Qwen превращает роботов в «языковые инструменты»
|
Qwen представила Qwen-Robot Suite — три базовые модели ( RobotNav, RobotManip, RobotWorld), объединенные тем, что все они принимают и отдают команды на естественном языке. Это позволяет большой языковой модели-планировщику ( Qwen3.7-Plus) вызывать их как функции и собирать из них агентные системы для длинных физических задач без переобучения под конкретного робота.
|
2. AMD купила стартап Mext для экономии на памяти
|
Вместо того чтобы держать все данные в дорогой DRAM, стартап Mext перекидывает те данные, что нужны редко, на обычный flash-накопитель — он дешевле на порядки. А чтобы приложения не тормозили, AI-алгоритм предсказывает, какие данные скоро понадобятся, и заранее грузит их обратно в DRAM.
|
|
3. KAIST научились охлаждать чипы изнутри: рекордная эффективность на обычной воде
|
Инженеры Корейского института KAIST вырезали микроскопические каналы прямо внутри кремниевых чипов и пустили по ним обычную воду комнатной температуры. Коэффициент охлаждения (COP) — 106 000, что в 10 раз выше прежнего рекорда Nature в 2020 году.
|
HEARD — ESP32 + u-blox GPS + LoRa-радио в 3D-печатном корпусе с e-ink дисплеем образуют автономную mesh-сеть и позволяют гиду отслеживать местоположение всей группы на маршруте без интернета и сотовой связи.
|
Built Robotics поставляет автономную технику на стройки. Один оператор управляет целым парком машин, роботы работают круглосуточно, а система из 8 уровней безопасности держит технику в заданных зонах.
|
|
|
|
|
|
|
Вы получили данное письмо, так как регистрировались на вебинар «Нужна ли математика
на собеседованиях?» на сайте proglib.academy.
Чтобы отписаться, нажмите сюда
|
|
|
|