|
|
|
+ Microsoft отказывается от Claude, Сбер без денег, а шесть агентов строят Пантеон
|
|
|
|
|
Стартап Bexorg подключил 700 донорских мозгов к аппаратам и тестирует на них лекарства вместо экспериментов на животных.
|
|
|
Добавили динамические воркфлоу: запускает сотни параллельных агентов, потом проверяет результат. Гайд по промтингу 4.8.
|
|
|
Microsoft релизнули SkillOpt — оптимизатор скилов AI-агентов. Optimizer-модель генерирует улучшенные версии скилов, target-модель тестирует их на задачах, по результатам валидации выбирается лучший скил. Процесс повторяется.
|
|
|
Три модели 1.8B, 7B и 30B-A3B (MoE) поддерживают перевод на 33 языка и обгоняют DeepSeek-V4 и Kimi 2.6 в режиме быстрого мышления.
|
|
|
|
🎓 Хотите быть на волне AI-агентов?
|
|
30 июня стартует курс «Разработка AI-агентов»: 8 недель обучения, 12+ практических уроков.
О чем: Архитектура AI, AgentOps, мультиагентные паттерны, безопасность и контроль.
Промокод «EARLYBIRD» на 5 000 руб. действует до 31 мая!
|
|
|
|
|
5. Новый бенчмарк для оценки агентов
|
DeepSWE — новый бенчмарк для оценки агентов. Задачи написаны с нуля, требуют в 5.5× больше кода, благодаря чему модели, которые на других бенчмарках выглядят одинаково, здесь наконец показывают реальную разницу в качестве.
|
|
|
Питается от морских ветряков, охлаждается морской водой.
|
|
|
7. Китай заблокировал выезд AI-специалистам
|
Китай заблокировал выезд ключевым AI-специалистам из частных компаний, включая Alibaba и Deepseek, без одобрения властей.
|
|
|
8. SpaceX раскрыла финансы перед IPO
|
SpaceX раскрыла финансы перед IPO: выручка $18.7 млрд, убыток $4.9 млрд.
|
|
|
9. Figma выпустила агента для работы с макетами.
|
|
|
OpenAI добавила функцию Appshots в macOS-клиент Codex: скриншотит окно, вытаскивает текст и отправляет в чат.
|
|
|
|
11. Закрывают GPT-5.2 и 5.3-Codex
|
2 июня закрывают GPT-5.2 и 5.3-Codex Бесплатным планам оставят GPT-5.5 по умолчанию. На API старые модели останутся.
|
|
|
|
12. Pnpm переписали на Rust
|
|
|
Antigravity с Gemini 3.5 Flash оказался лучшим, а визуальный фидбек от человека сделал результат еще точнее.
|
|
|
14. Microsoft отзывает лицензии Claude Code
|
Microsoft отзывает корпоративные лицензии Claude Code и продвигает использование GitHub Copilot CLI, чтобы сократить расходы.
|
|
|
|
|
- codegraph — строит семантический граф знаний кода
- serena — MCP-сервер, дающий AI-агентам семантические инструменты работы с кодом (поиск, редактирование, отладка)
- ast-index — CLI-утилита на Rust для индексирования файловой базы (34 языка) и быстрого семантического поиска по нему
- acpbox — подключаешься к ACPBox по OpenAI-протоколу, а он отправляет запросы в Cursor, OpenCode или в другого агента
- codex-shim — подключает сторонние модели к Codex Desktop через локальный прокси
- ruflo — собирает агентов в рой с памятью и самообучением
- NadirClaw — заворачивает запросы к моделям через прокси: простые направляет на дешевые, сложные — на дорогие
- ygncode/pi-web — управляет Pi через браузер в локальной сети
- jmfederico/pi-web — запускаешь Pi на удаленном сервере, управляешь через браузер
- webchat2api — превращает веб-версии GPT и Grok в OpenAI-совместимый API
- codeindex — считает индекс зависимостей и blast-radius для файлов, чтобы AI-инструменты не сканировали весь репозиторий ради поиска одной функции
- agent-governance-toolkit — тулкит от Microsoft, который перехватывает вызовы агентов и рубит запрещенные действия на уровне кода, а не промптов.
|
- canirun.ai — проверяет, потянет ли ваше железо конкретную LLM
- Bumblebee — сканер, который находит уязвимые пакеты, расширения и AI-конфиги на машинах разработчиков
- pianke — автоматически группирует похожие снимки и помогает быстро выбрать лучшие через A/B-сравнение
- Peekaboo — macOS-инструмент, который позволяет агентам делать скриншоты приложений или всего экрана и задавать по ним вопросы
- AgentMesh — сканирует VSCode-расширения, MCP и скилы на зловредную активность
|
- Unabyss подключает твои приложения и автоматически обновляет контекст для любого AI через MCP.
|
- Rezonant — рабочее пространство для команд с AI-агентами: закидываешь контекст и идею, получаешь спеки и задачи, которые агенты сами выполнят.
|
- Yanshu находит повторяющиеся задачи в вашей работе и автоматизирует их.
|
- Avaturn Live создает AI-аватары, которые разговаривают как живые люди.
|
academic-research-skills — набор скилов для Claude Code для написания научных работ: поиск литературы, рецензирование, проверка ссылок и вылавливание выдуманных цитат на контрольных этапах пайплайна. plan-tree — скил для Codex, который заставляет агента вести структурированное дерево Markdown-файлов с планом проекта, чтобы контекст, решения и цели не терялись между сессиями. tweet.md превращает посты из X в чистый Markdown. Подставил tweet.md вместо x.com в URL, получил md-файл. Также доступен скил: npx skills add tweet-md/skill harness-starter-kit — переводит повторяющиеся ошибки агента в правило/тест/документ/автопроверку. make-pages-interactive — навешиваешь комментарии прямо на HTML-страницу, Claude читает и правит код.
|
|
|
Включите авто-режим в Claude — сессии идут параллельно без запросов подтверждения, классификатор вместо них отсекает опасные действия.
|
По умолчанию 95%. Протестировали 6 подходов к ответам на вопросы по длинным PDF-документам, чтобы выяснить, что лучше: Agentic RAG, Long-Context LLMs или Vision LLM. Использовали 30 реальных PDF-файлов с изображениями и таблицами, задав 171 вопрос Claude Sonnet 4.5. Выяснилось, что Long-Context LLMs чуть точнее (59.6%), но Agentic RAG почти не уступает (53.2%), при этом в 2-3 раза дешевле и без ошибок. Vision LLM — худший вариант для продакшена, т. к. самый дорогой и с 7% неисправимых сбоев.
|
|
LLM судит свой код мягче. Кросс-проверки между моделями поднимают качество.
Бессмысленно просить LLM оценить что-либо по числовой шкале. Никакого внутреннего эталона качества у моделей нет, шкала генерируется на ходу и скачет от запуска к запуску. Работает попарное сравнение: ставьте два объекта рядом и спрашивайте «какой лучше и почему».
|
|
|
|
|
|
|
DeepSeek V4 Pro — акционная скидка стала постоянной.
|
|
|
|
|
|
|
|
|
zero2claude — учит работать в Claude Code людей, которые терминал никогда не открывали.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В конце 1970-х General Motors (GM) теряла рынок из-за немецких и японских машин. Новый босс Смит решил, что роботы спасут заводы. GM влила $60 млрд в роботизацию: скупила компании, построила завод Хамтрамк с 260 роботами (беспрецедентный уровень роботизации по тем временам). Роботы вели себя непредсказуемо: били стекла, красили друг друга из-за чего несколько сотен автомобилей были настолько плохо окрашены, что GM пришлось отправлять их на соседний завод Cadillac для перекраски. В итоге выпускали 35 машин в час вместо 60. А параллельно Смит открыл NUMMI — совместный завод с Тойотой. Там минимум роботов, только сварка и покраска. Тойота принесла свою систему: мелкие улучшения каждый день, роботы помогают людям, а не заменяют. NUMMI стала лучшим заводом GM. Что-то это напоминает. https://youtu.be/l8OWJwnnXUg?si=Z5wakScmwTqPU7DM
|
|
|
Вы получили данное письмо, так как регистрировались на вебинар «Нужна ли математика
на собеседованиях?» на сайте proglib.academy.
Чтобы отписаться, нажмите сюда
|
|
|