|
|
|
Еще в выпуске: DeepSeek поднимет цены вдвое, Google выпустила Nano Banana 2 Lite и Gemini Omni Flash, а стоматологический робот сверлит зубы с точностью 0.2 мм
|
|
|
|
|
|
1. Anthropic представила Sonnet 5
|
Sonnet 5 не дотягивает до Opus 4.8 на агентных бенчмарках, но стоит в разы дешевле: 2$/10$ за миллион токенов вход/выход до 31 августа, потом 3$/15$. Токенайзер обновлен — тот же текст генерируется, потребляя в 1-1.35 больше токенов по сравнению с Sonnet 4.6.
|
|
|
|
2. Anthropic вернула Fable 5 через 18 дней после блокировки
|
США ввели экспортные ограничения 12 июня после джейлбрейка от Amazon: при обходе фильтров Fable 5 выявил ряд уязвимостей и в одном случае выдал демонстрацию их эксплуатации. Anthropic подтвердила, что менее способные модели ( Opus 4.8, GPT-5.5, Kimi K2.7 и др.) делают то же самое. Новый классификатор блокирует технику из отчёта в 99%+ случаев, но чаще ложно срабатывает на легитимные запросы при кодинге. Заблокированные запросы перенаправляются на Opus 4.8. Fable 5 вернулся 1 июля. До 7 июля он входит в лимиты подписки, далее — только за кредиты.
|
|
|
|
3. NVIDIA выкатила LocateAnything
|
Большинство моделей генерируют координаты бокса по цифрам, одна за другой. LocateAnything предсказывает готовый бокс целиком за один шаг. На одном H100 она выдает 12.7 BPS — в 10 раз быстрее Qwen3-VL и в 2.5 раза быстрее Rex-Omni. Обучена на 138M запросов и 785M боксов. По точности обходит бейзлайны на LVIS (50.7 F1), M6Doc (70.1), ScreenSpot-Pro (60.3). Есть гибридный режим: быстрый MTP по умолчанию с откатом на NTP. Веса уже на HuggingFace, код — в репозитории на GitHub.
|
|
|
|
4. Google анонсировала Nano Banana 2 Lite и Gemini Omni Flash
|
Nano Banana 2 Lite быстрее и дешевле Nano Banana 2 при минимальном падении качества.
|
|
|
|
5. Gemini Omni Flash делает видео из текста и картинок за 0.10$/сек
|
Gemini Omni Flash делает видео из текста и картинок за 0.10$/сек (как Veo 3.1 Fast), но пока ограничен 10-секундными роликами и не принимает аудио-референсы.
|
|
|
|
6. LongCat 2.0: модель на трлн параметров
|
LongCat 2.0 — опенсорс MoE от Meituan на 1.6 трлн параметров (33-56B активных) с контекстом в 1M,, обученная на 50 000 китайских чипов. На SWE-bench Pro (59.5) обходит GPT-5.5 (58.6) и Claшшшшude Opus 4.6 (57.3); на Terminal-Bench 2.1 набирает 70.8, на BrowseComp — 79.9.
|
|
|
|
7. Meta* выложила Brain2Qwerty v2*
|
Brain2Qwerty v2 — открытый пайплайн для декодирования текста из неинвазивных записей мозга ( MEG) в реальном времени, который обходит инвазивные методы по точности. Точность 61% слов (до 78% у лучшего участника) против 8% у других неинвазивных подходов, весь код и датасет выложены в открытый доступ.
* Продукт компании Meta, которая признана экстремистской и запрещена на территории РФ
|
|
|
|
8. Аудио-токенизатор KVAE-Audio от Сбера
|
KVAE-Audio — непрерывный полнодиапазонный аудио-токенизатор (4 8 кГц, 166 млн параметров, 64 канала в латенте), обошедший MMAudio, DACVAE MovieGen и SAME-L по метрикам text-to-audio генерации. Скачать: GitHub, Hugging Face.
|
|
|
|
9. Ollama 0.31 ускоряет генерацию Gemma 4 на macOS
|
Ollama 0.31 ускорила Gemma 4 почти на 90% благодаря multi-token prediction (MTP): маленькая черновая модель предлагает несколько токенов вперед, а основная модель проверяет их за один проход. Ollama сама подбирает оптимальную длину предсказания без потери качества. Ускорение доступно на компьютерах на macOS (тесты проводились на M5 Max); дополнительный прирост в 2-2.5 раза дает новое ядро для MLX, ускоряющий проверку батчей токенов.
|
|
|
|
10. DeepSeek поднимет цены на V4 вдвое в пиковые часы
|
DeepSeek V4 выходит из preview в середине июля, а цены в пиковые часы удвоятся.
|
|
|
|
11. OpenAI представила чип для инференса
|
Jalapeño — первый собственный чип OpenAI, разработанный совместно с Broadcom специально для инференса моделей. Ранние тесты показывают заметно лучшую производительность на ватт по сравнению с существующими решениями.
|
|
|
|
12. Ford нанял обратно 300 инженеров: AI не справился с контролем качества
|
Автоконцерн нанял обратно опытных инженеров после того, как AI-проверки на заводах не смогли заменить человеческую экспертизу. Опытные сотрудники теперь обучают алгоритмы и наставляют новичков, а сам Ford вернулся на первое место в индексе JD Power по качеству впервые с 2010 года.
|
|
|
|
13. Языковая сеть мозга оказалась шире, чем считали
|
Исследователи из MIT проанализировали фМРТ-данные 772 человек и нашли 17 участков мозга вне классических языковых зон, которые избирательно реагируют на речь: в мозжечке, гиппокампе, медиальной лобной извилине и миндалевидном теле и т. д. Эти новые зоны в сумме составляют около 5% объема взрослого мозга — примерно размером с крупную клубнику.
|
|
|
|
🚀 Освойте AI-агентов и получите ещё 2 курса бесплатно!
|
|
Выберите свой стек, чтобы быстрее расти в карьере, проходить собеседования и создавать ИИ-решения. Старт — в июле.
|
|
|
|
|
|
- sim-use — дает агентам доступ к экранам iOS Simulator и Android
- Ava — фреймворк для запуска популяций автономных агентов с памятью, убеждениями и социальной моделью, который фиксирует свойства цивилизации, возникающие из локальных взаимодействий. Позволяет исследовать, как роли, союзы и нормы формируются у тысяч агентов
- Codex-instruct-5.5 — Python-утилита, внедряющая в Codex CLI для GPT-5.5 восемь правил, отключая все фильтры отказа и ограничители
- Vision Bridge для OpenCode — мост из двух слоев, который дает агентам (одномодальным текстовым DeepSeek, GLM, Qwen) возможность работать с изображениями: плагин подменяет входящие картинки текстовым описанием, а MCP-сервер describe_image точечно считывает детали по запросу агента. Без второго слоя агент опирается на общее описание и додумывает детали; с мостом он вызывает vision-модель сам, когда нужна точность
- mutmut — система мутационного тестирования для Python, которая изменяет код и проверяет, ловят ли тесты эти изменения
- OKF — маленький vendor-neutral формат для баз знаний, которые живут в git, рендерятся где угодно и дают агентам структурный контекст
|
 |
- lightassay — пишешь агенту «проверь, что мой пайплайн работает корректно», он сам собирает тесты, прогоняет твой код и пишет отчет в файлы
- ClipForge — локальный инструмент, который режет длинные YouTube-видео на вертикальные клипы 9:16 с транскрипцией через faster-whisper, вшитыми субтитрами
и кропом по центру или в сторону лиц. Запускается через Docker Compose или Python+Node локально, отдает готовые MP4 и SRT
- codex-lb — прокси и балансировщик для пула ChatGPT-аккаунтов. Раскидывает запросы по нескольким учеткам, считает токены/расход по 28 дням, раздает API-ключи с лимитами, все в веб-дашборде
|
 |
- AI в судебных спорах — практический разбор от от Романа Бузько, Кирилла Сереброва о том, где LLM реально усиливает позицию юриста (черновики, поиск противоречий, оценка перспектив через decision tree), а где оборачивается штрафами до $110 тыс. за выдуманные цитаты и потерей адвокатской привилегии (дело Heppner, 2026). Пригодится юристам, чтобы выстроить безопасный регламент работы с AI: какие задачи делегировать, что проверять вручную, как защитить тайну клиента и какие требования по раскрытию использования AI уже действуют в судах РФ, США, ЕС, Англии, Китая, Индии и ОАЭ.
|
- Metis — превращает документы и сообщения в цитаты с указанными источниками и отвечает на вопросы с привязкой к первоисточникам
- InTheWeights — сервис, проверяющий, знают ли LLM конкретного человека или компанию
|
- improve-codebase-architecture — прочесывает проект, находит, что в нем не так с архитектурой, показывает в виде наглядной HTML-странички
- ai-bro — набор скиллов для работы с AI-агентами, который ведет тебя по задаче через четыре стадии: подумать (/bro-think-with-me), разобраться с багом (/bro-debug), собрать план (/bro-give-me-plan) и реализовать с ревью (/bro-do-it).
- NVIDIA BioNeMo Agent Toolkit — скилы от NVIDIA, которые добавляют агентам готовые сценарии для решения биологических и медицинских задач: фолдинг белков (OpenFold, Boltz-2), молекулярный докинг (DiffDock), генеративную химию (GenMol, MolMIM), геномику (Evo2, MSA-Search) и дизайн белков (RFdiffusion → ProteinMPNN → OpenFold3).
|
VibeJam — конкурс по vibe-coding игр, 90% кода должно быть написано AI
|
Hello-Agents — бесплатный учебник по агентам, где показывают, как собрать своего агента с нуля на Python, а не просто дергать готовые API.
- Часть 1. Основы агентов и LLM — что такое нейросеть, трансформеры, промптинг и агенты
- Часть 2. Собираем первого агента — парадигмы ReAct/Plan-and-Solve/Reflection с нуля, лоукод-платформы (Coze, Dify, n8n) и фреймворки AutoGen, AgentScope, LangGraph
- Часть 3. Продвинутые техники — память и RAG, контекст-инжиниринг, протоколы MCP/A2A/ANP, Agentic-RL и оценка агентов
- Часть 4. Кейсы из продакшна — тревел-ассистент на MCP, воспроизведение DeepResearch и симуляция социальной динамики в Cyber Town
- Часть 5. Дипломный проект — сборка собственного мультиагентного приложения
|
Энтузиаст собрал робота SARAS 2.0 на Raspberry Pi и дал Claude (через Claude Code + MCP) доступ к его сенсорам и двигателям. AI сам написал инструменты управления, отлаживал себя по описанию проблемы и принимал навигационные решения, меняя поведение правкой claude.md, а не кода. Код на Гитхабе.
|
Eno — первый агентный робот Genesis, в котором AI-агент и универсальное железо работают как единая система: рассуждает, планирует и действует в реальном мире.
|
robot_retargeter — открытый Python-пайплайн для перенацеливания движений с человека (SMPL-X) или исходного робота на целевых гуманоидов (Unitree G1/H2/T800, AgiBot X2 и др.) через обратную кинематику на mink + MuJoCo, с покадровым масштабированием скелета по длинам звеньев, геометрической реконструкцией колена и подавлением скольжения стоп в фазе опоры. Позволяет одной командой прогнать три стадии: извлечение ключевых точек → ретаргетинг → визуализация.
|
robot_retargeter — открытый Python-пайплайн для перенацеливания движений с человека (SMPL-X) или исходного робота на целевых гуманоидов (Unitree G1/H2/T800, AgiBot X2 и др.) через обратную кинематику на mink + MuJoCo, с покадровым масштабированием скелета по длинам звеньев, геометрической реконструкцией колена и подавлением скольжения стоп в фазе опоры. Позволяет одной командой прогнать три стадии: извлечение ключевых точек → ретаргетинг → визуализация.
|
Tecno Atom — концепт модульного телефона, показанный на MWC 2026. К корпусу на магнитах цепляются зум-объектив, дополнительные батареи и другие аксессуары.
|
|
|
|
|
|
|
Вы получили данное письмо, так как регистрировались на вебинар «Нужна ли математика
на собеседованиях?» на сайте proglib.academy.
Чтобы отписаться, нажмите сюда
|
|
|
|