Самые дешевые авиабилеты: LongCat обошла GPT-5.5, OpenAI показала свой чип, а MIT расширил языковую карту мозга

суббота, 4 июля 2026 г.

LongCat обошла GPT-5.5, OpenAI показала свой чип, а MIT расширил языковую карту мозга

DeepSeek поднимет цены вдвое, Google выпустила Nano Banana 2 Lite и Gemini Omni Flash, а стоматологический робот сверлит зубы с точностью 0.2 мм ͏‌͏͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌ ͏‌

⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌

Еще в выпуске: DeepSeek поднимет цены вдвое, Google выпустила Nano Banana 2 Lite и Gemini Omni Flash, а стоматологический робот сверлит зубы с точностью 0.2 мм

📰 Новости

1. Anthropic представила Sonnet 5

Sonnet 5 не дотягивает до Opus 4.8 на агентных бенчмарках, но стоит в разы дешевле: 2$/10$ за миллион токенов вход/выход до 31 августа, потом 3$/15$. Токенайзер обновлен — тот же текст генерируется, потребляя в 1-1.35 больше токенов по сравнению с Sonnet 4.6.

2. Anthropic вернула Fable 5 через 18 дней после блокировки

США ввели экспортные ограничения 12 июня после джейлбрейка от Amazon: при обходе фильтров Fable 5 выявил ряд уязвимостей и в одном случае выдал демонстрацию их эксплуатации. Anthropic подтвердила, что менее способные модели (Opus 4.8, GPT-5.5, Kimi K2.7 и др.) делают то же самое. Новый классификатор блокирует технику из отчёта в 99%+ случаев, но чаще ложно срабатывает на легитимные запросы при кодинге. Заблокированные запросы перенаправляются на Opus 4.8. Fable 5 вернулся 1 июля. До 7 июля он входит в лимиты подписки, далее — только за кредиты.

3. NVIDIA выкатила LocateAnything

Большинство моделей генерируют координаты бокса по цифрам, одна за другой. LocateAnything предсказывает готовый бокс целиком за один шаг. На одном H100 она выдает 12.7 BPS — в 10 раз быстрее Qwen3-VL и в 2.5 раза быстрее Rex-Omni. Обучена на 138M запросов и 785M боксов. По точности обходит бейзлайны на LVIS (50.7 F1), M6Doc (70.1), ScreenSpot-Pro (60.3). Есть гибридный режим: быстрый MTP по умолчанию с откатом на NTP. Веса уже на HuggingFace, код — в репозитории на GitHub.

4. Google анонсировала Nano Banana 2 Lite и Gemini Omni Flash

Nano Banana 2 Lite быстрее и дешевле Nano Banana 2 при минимальном падении качества.

5. Gemini Omni Flash делает видео из текста и картинок за 0.10$/сек

Gemini Omni Flash делает видео из текста и картинок за 0.10$/сек (как Veo 3.1 Fast), но пока ограничен 10-секундными роликами и не принимает аудио-референсы.

6. LongCat 2.0: модель на трлн параметров

LongCat 2.0 — опенсорс MoE от Meituan на 1.6 трлн параметров (33-56B активных) с контекстом в 1M,, обученная на 50 000 китайских чипов. На SWE-bench Pro (59.5) обходит GPT-5.5 (58.6) и Claшшшшude Opus 4.6 (57.3); на Terminal-Bench 2.1 набирает 70.8, на BrowseComp — 79.9.

7. Meta* выложила Brain2Qwerty v2*

Brain2Qwerty v2 — открытый пайплайн для декодирования текста из неинвазивных записей мозга (MEG) в реальном времени, который обходит инвазивные методы по точности. Точность 61% слов (до 78% у лучшего участника) против 8% у других неинвазивных подходов, весь код и датасет выложены в открытый доступ.
* Продукт компании Meta, которая признана экстремистской и запрещена на территории РФ

8. Аудио-токенизатор KVAE-Audio от Сбера

KVAE-Audio — непрерывный полнодиапазонный аудио-токенизатор (48 кГц, 166 млн параметров, 64 канала в латенте), обошедший MMAudio, DACVAE MovieGen и SAME-L по метрикам text-to-audio генерации. Скачать: GitHub, Hugging Face.

9. Ollama 0.31 ускоряет генерацию Gemma 4 на macOS

Ollama 0.31 ускорила Gemma 4 почти на 90% благодаря multi-token prediction (MTP): маленькая черновая модель предлагает несколько токенов вперед, а основная модель проверяет их за один проход. Ollama сама подбирает оптимальную длину предсказания без потери качества. Ускорение доступно на компьютерах на macOS (тесты проводились на M5 Max); дополнительный прирост в 2-2.5 раза дает новое ядро для MLX, ускоряющий проверку батчей токенов.

10. DeepSeek поднимет цены на V4 вдвое в пиковые часы

DeepSeek V4 выходит из preview в середине июля, а цены в пиковые часы удвоятся.

11. OpenAI представила чип для инференса

Jalapeño — первый собственный чип OpenAI, разработанный совместно с Broadcom специально для инференса моделей. Ранние тесты показывают заметно лучшую производительность на ватт по сравнению с существующими решениями.

12. Ford нанял обратно 300 инженеров: AI не справился с контролем качества

Автоконцерн нанял обратно опытных инженеров после того, как AI-проверки на заводах не смогли заменить человеческую экспертизу. Опытные сотрудники теперь обучают алгоритмы и наставляют новичков, а сам Ford вернулся на первое место в индексе JD Power по качеству впервые с 2010 года.

13. Языковая сеть мозга оказалась шире, чем считали

Исследователи из MIT проанализировали фМРТ-данные 772 человек и нашли 17 участков мозга вне классических языковых зон, которые избирательно реагируют на речь: в мозжечке, гиппокампе, медиальной лобной извилине и миндалевидном теле и т. д. Эти новые зоны в сумме составляют около 5% объема взрослого мозга — примерно размером с крупную клубнику.

🚀 Освойте AI-агентов и получите ещё 2 курса бесплатно!

Выберите свой стек, чтобы быстрее расти в карьере, проходить собеседования и создавать ИИ-решения. Старт — в июле.

Подробнее

🛠🤖 Инструменты для AI

sim-use — дает агентам доступ к экранам iOS Simulator и Android
Ava — фреймворк для запуска популяций автономных агентов с памятью, убеждениями и социальной моделью, который фиксирует свойства цивилизации, возникающие из локальных взаимодействий. Позволяет исследовать, как роли, союзы и нормы формируются у тысяч агентов
Codex-instruct-5.5 — Python-утилита, внедряющая в Codex CLI для GPT-5.5 восемь правил, отключая все фильтры отказа и ограничители
Vision Bridge для OpenCode — мост из двух слоев, который дает агентам (одномодальным текстовым DeepSeek, GLM, Qwen) возможность работать с изображениями: плагин подменяет входящие картинки текстовым описанием, а MCP-сервер describe_image точечно считывает детали по запросу агента. Без второго слоя агент опирается на общее описание и додумывает детали; с мостом он вызывает vision-модель сам, когда нужна точность
mutmut — система мутационного тестирования для Python, которая изменяет код и проверяет, ловят ли тесты эти изменения
OKF — маленький vendor-neutral формат для баз знаний, которые живут в git, рендерятся где угодно и дают агентам структурный контекст

🛠🧑 Инструменты для людей

lightassay — пишешь агенту «проверь, что мой пайплайн работает корректно», он сам собирает тесты, прогоняет твой код и пишет отчет в файлы
ClipForge — локальный инструмент, который режет длинные YouTube-видео на вертикальные клипы 9:16 с транскрипцией через faster-whisper, вшитыми субтитрами
и кропом по центру или в сторону лиц. Запускается через Docker Compose или Python+Node локально, отдает готовые MP4 и SRT
codex-lb — прокси и балансировщик для пула ChatGPT-аккаунтов. Раскидывает запросы по нескольким учеткам, считает токены/расход по 28 дням, раздает API-ключи с лимитами, все в веб-дашборде

AI в судебных спорах — практический разбор от от Романа Бузько, Кирилла Сереброва о том, где LLM реально усиливает позицию юриста (черновики, поиск противоречий, оценка перспектив через decision tree), а где оборачивается штрафами до $110 тыс. за выдуманные цитаты и потерей адвокатской привилегии (дело Heppner, 2026). Пригодится юристам, чтобы выстроить безопасный регламент работы с AI: какие задачи делегировать, что проверять вручную, как защитить тайну клиента и какие требования по раскрытию использования AI уже действуют в судах РФ, США, ЕС, Англии, Китая, Индии и ОАЭ.

Metis — превращает документы и сообщения в цитаты с указанными источниками и отвечает на вопросы с привязкой к первоисточникам
InTheWeights — сервис, проверяющий, знают ли LLM конкретного человека или компанию

Скилы

improve-codebase-architecture — прочесывает проект, находит, что в нем не так с архитектурой, показывает в виде наглядной HTML-странички
ai-bro — набор скиллов для работы с AI-агентами, который ведет тебя по задаче через четыре стадии: подумать (/bro-think-with-me), разобраться с багом (/bro-debug), собрать план (/bro-give-me-plan) и реализовать с ревью (/bro-do-it).
NVIDIA BioNeMo Agent Toolkit — скилы от NVIDIA, которые добавляют агентам готовые сценарии для решения биологических и медицинских задач: фолдинг белков (OpenFold, Boltz-2), молекулярный докинг (DiffDock), генеративную химию (GenMol, MolMIM), геномику (Evo2, MSA-Search) и дизайн белков (RFdiffusion → ProteinMPNN → OpenFold3).

Интересное

VibeJam — конкурс по vibe-coding игр, 90% кода должно быть написано AI

🎓 Бесплатный учебник

Hello-Agents — бесплатный учебник по агентам, где показывают, как собрать своего агента с нуля на Python, а не просто дергать готовые API.

Часть 1. Основы агентов и LLM — что такое нейросеть, трансформеры, промптинг и агенты
Часть 2. Собираем первого агента — парадигмы ReAct/Plan-and-Solve/Reflection с нуля, лоукод-платформы (Coze, Dify, n8n) и фреймворки AutoGen, AgentScope, LangGraph
Часть 3. Продвинутые техники — память и RAG, контекст-инжиниринг, протоколы MCP/A2A/ANP, Agentic-RL и оценка агентов
Часть 4. Кейсы из продакшна — тревел-ассистент на MCP, воспроизведение DeepResearch и симуляция социальной динамики в Cyber Town
Часть 5. Дипломный проект — сборка собственного мультиагентного приложения

🤖 Роботы и устройства

Энтузиаст собрал робота SARAS 2.0 на Raspberry Pi и дал Claude (через Claude Code + MCP) доступ к его сенсорам и двигателям. AI сам написал инструменты управления, отлаживал себя по описанию проблемы и принимал навигационные решения, меняя поведение правкой claude.md, а не кода. Код на Гитхабе.

Eno — первый агентный робот Genesis, в котором AI-агент и универсальное железо работают как единая система: рассуждает, планирует и действует в реальном мире.

robot_retargeter — открытый Python-пайплайн для перенацеливания движений с человека (SMPL-X) или исходного робота на целевых гуманоидов (Unitree G1/H2/T800, AgiBot X2 и др.) через обратную кинематику на mink + MuJoCo, с покадровым масштабированием скелета по длинам звеньев, геометрической реконструкцией колена и подавлением скольжения стоп в фазе опоры. Позволяет одной командой прогнать три стадии: извлечение ключевых точек → ретаргетинг → визуализация.

Tecno Atom — концепт модульного телефона, показанный на MWC 2026. К корпусу на магнитах цепляются зум-объектив, дополнительные батареи и другие аксессуары.

🍰 Напоследок

Первый день вайбкодера:

Автор: Мирослав Кунгуров

Вы получили данное письмо, так как регистрировались на вебинар «Нужна ли математика
на собеседованиях?» на сайте proglib.academy.
Чтобы отписаться, нажмите сюда

суббота, 4 июля 2026 г.

LongCat обошла GPT-5.5, OpenAI показала свой чип, а MIT расширил языковую карту мозга

суббота, 4 июля 2026 г.