Компания MultiOn представила прорывную технологию Agent Q для создания автономных веб-агентов, которые могут самостоятельно выполнять задачи в интернете. Она сочетает в себе поиск, самокритику и обучение с подкреплением, чтобы агенты могли лучше планировать свои действия и исправлять ошибки. В эксперименте по бронированию столиков через OpenTable агент на базе Llama-3* улучшил свою эффективность с 18,6% до 95,4% успешных бронирований после подключения технологии Agent Q. |
Meta* в сотрудничестве с исследователями Оксфордского университета разработала VFusion3D – продвинутую модель для генерации 3D-моделей по одному 2D-референсу. |
Новая версия генератора изображений Imagen 3, созданного Google DeepMind, генерирует потрясающие фото и иллюстрации, явно превосходящие нынешние возможности Midjourney и DALL-E. |
MIT опубликовал базу данных с информацией о более чем 700 потенциальных проблемах, которые могут возникнуть при использовании ИИ. Этот проект поможет: - Найти конкретные риски, отсортировав их по причине возникновения или сфере влияния.
- Понять, как различные факторы влияют на появление рисков ИИ.
|
У нашумевшего Devin появился сильный конкурент: стартап Cosine разработал автономного ИИ-инженера Genie, который работает на кастомной версии GPT-4o, недоступной для широкой публики, и превосходит Devin на 13,8%. | Cosine может самостоятельно работать над проектом |
Grok-2 теперь генерирует изображения (с помощью продвинутой модели FLUX.1 от Black Forest Labs), а поскольку серьезная цензура в чат-боте не предусмотрена – пользователи соревнуются в генерации непристойных, дискредитирующих и провокационных картинок. Что еще интереснее, Grok-2 удалось обойти самые мощные модели – Claude 3.5 Sonnet и GPT-4o – по нескольким бенчмаркам. |
Возможности Grok-2 теперь сопоставимы с лидерами |
🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста» |
Платные подписчики Gemini скоро смогут пользоваться чат-ботом в голосовом режиме. Функция работает аналогично голосовому режиму в ChatGPT. Apple разрабатывает новый большой продукт: монитор на гибкой роборуке, способной вращать экран во всех направлениях на 360°. Гаджет можно будет использовать в качестве пункта управления умным домом, инструмента для видеоконференций и системы мониторинга безопасности с удаленным доступом. Выпуск запланирован на 2026–2027 годы, цена ожидается в пределах $1000. Huawei готовится к запуску в массовое производство нового чипа Ascend 910C, способного составить конкуренцию NVIDIA H100 (и помочь китайской ИИ-индустрии обойти санкции США). ByteDance и Baidu уже тестируют чип и в перспективы готовы приобрести более 70 тысяч единиц. |
Приглашаем вас на вебинар «Как меняется математика в разных индустриях: от мобильных игр к фондовым рынкам», который состоится 22 августа в 20:00 по МСК. Там вы сможете: - Узнать, как математические методы влияют на мобильные игры и фондовые рынки.
- Понять различия в математических подходах в разных сферах бизнеса.
- Изучить реальные кейсы применения математики в GameDev и финансах.
- Оценить, какие математические знания необходимы для успешной карьеры в Data Science.
|
💸 ИИ неэффективен в управлении инвестициями |
Несмотря на то, что хедж-фонды, взявшие на вооружение ИИ, демонстрируют меньшую волатильность, их доходность ниже, чем у обычных фондов. Это показывает анализ индекса Eurekahedge AI Hedge Fund Index, который объединяет фонды, применяющие ИИ в торговле, с индексом S&P 500. Результаты показали, что за 15 лет индекс с ИИ принес 9,8% годовой доходности против 13,7% у S&P 500 – это противоречит распространенному мнению о том, что ИИ с накоплением опыта будет постоянно улучшать свои результаты. Авторы объясняют это явление математически обоснованным принципом, сформулированным лауреатом Нобелевской премии Уильямом Шарпом. Суть принципа заключается в том, что совокупный портфель всех активных управляющих (включая тех, кто использует ИИ) равен рынку в целом. Учитывая комиссии и другие расходы, доходность этого совокупного портфеля неизбежно будет ниже, чем у индексного фонда. Есть и дополнительные факторы, которые никогда не позволят ИИ-фондам обогнать рынок: - Технологии машинного обучения дороги в разработке и использовании, что увеличивает расходы фондов.
- Даже если отдельные ИИ-менеджеры могут превзойти рынок, их задача будет усложняться по мере того, как все большее количество конкурентов начнет использовать аналогичные технологии.
|
Прибыльность хедж-фондов, использующих ИИ, уступает S&P 500 |
⛓️ Цепочка размышлений – не панацея |
Промпты с цепочкой рассуждений (Chain-of-Thought prompting, или просто CoT) – это способ улучшить способность чат-ботов решать задачи. Вместо того, чтобы просто задать вопрос и ждать ответа, вы просите ИИ объяснить свои мысли шаг за шагом. Идея в том, что, показывая ИИ, как думать логически, мы учим его лучше решать проблемы. |
Цепочка рассуждений значительно улучшает качество ответов LLM, но есть нюансы |
Сначала казалось, что это работает отлично и может стать ключом к решению сложных задач в реальной жизни – ведь ИИ действительно стал лучше решать математические задачи и задачи на логику. Все были в восторге! Но оказалось, что не все так просто. Исследователи решили проверить (отчет в PDF), действительно ли ИИ стал умнее или просто научился повторять паттерны. Они дали ИИ задачи на планирование (например, сложить блоки в определенном порядке). Выяснилось, что: - ИИ хорошо справляется с простыми задачами, но быстро сдается, когда задачи становятся сложнее.
- ИИ скорее повторяет паттерны из примеров, чем действительно думает.
- Этот подход работает для узких задач, но не для всего сразу.
|
💬 Новый способ понять ход формирования ответов LLM |
Исследователи Google разработали эффективный и перспективный метод анализа и понимания внутренних механизмов работы больших языковых моделей – Patchscopes («Патчскопы»), который позволяет исследовать скрытые представления внутри нейронной сети, «перенося» их между разными слоями и промптами. Метод включает в себя: - Запуск исходного промпта через модель.
- Извлечение скрытого представления из определенного слоя.
- Вставку («патчинг») этого представления в другой промпт на определенном слое.
- Анализ того, как это влияет на генерацию ответа модели.
Patchscopes можно использовать для: - Изучения того, как модель обрабатывает информацию на разных слоях.
- Извлечения латентных атрибутов и знаний модели.
- Исправления ошибок рассуждения модели.
|
В отчете много интерактивных визуализаций, демонстрирующих работу метода |
Patchscopes предлагает более гибкий подход по сравнению с традиционными методами, такими как пробинг (probing), и не требует дополнительного обучения. И хотя еще требуются дальнейшие исследования для разработки общих рекомендаций по применению метода, уже очевидно, что он открывает широкие возможности для интерпретации и понимания работы LLM. |
🤖🎥 Все самое полезное про нейросети для генерации видео и дипфейки вы найдете на нашем телеграм-канале «Библиотека нейровидео» |
LearnGPT – персональный преподаватель для изучения чего угодно, от пиксельного арта до танцев. Face Swap – заменяет лица на фото. HIX AI – новый ИИ-поисковик. Предоставляет ссылки на источники информации и фото по теме. |
HIX AI хорошо работает с запросами на русском |
Dupe – находит бюджетные версии дорогих товаров. Vipro AI – генерирует продуктовые видео. |
Summarify – делает суммаризацию любого контента: от веб-страниц и аудиофайлов до YouTube-видео и PDF-документов. Manaflow – автоматизирует любую офисную работу, информацию о которой можно представить в виде таблиц. SoundRaw – генерирует треки, которые не приведут к проблемам с правообладателями: модель обучена на сэмплах, созданных штатными композиторами. |
SoundRaw пишет музыку во всех существующих жанрах |
🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале «Библиотека нейрозвука» |
Wondercraft AI – озвучивает и переводит подкасты, рекламу, аудиокниги и т. п. Похожий сервис – Lazybird. Neutone Morpho – создает звуковые эффекты для игр, фильмов и медиапроектов. Omni Engineer – консольный инструмент для интеграции ИИ в процесс разработки ПО и вспомогательные действия – от генерации и обработки изображений до работы с файловой системой и онлайн-поиска. Работает со всеми популярными LLM. Twitter-95 – ИИ-симуляция соцсети в стиле начала 90-х. Profound – SEO для ИИ-поисковиков. Tusk – автоматически вносит изменения в UI в соответствии с тикетами. *Meta и все ее продукты, включая Llama-3, признаны экстремистскими и запрещены на территории РФ. |
|
|
Понравилась ли вам эта рассылка? |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|