Самые дешевые авиабилеты: Как размышляют ИИ-модели

суббота, 17 августа 2024 г.

Как размышляют ИИ-модели

📰 Новости

Компания MultiOn представила прорывную технологию Agent Q для создания автономных веб-агентов, которые могут самостоятельно выполнять задачи в интернете. Она сочетает в себе поиск, самокритику и обучение с подкреплением, чтобы агенты могли лучше планировать свои действия и исправлять ошибки. В эксперименте по бронированию столиков через OpenTable агент на базе Llama-3* улучшил свою эффективность с 18,6% до 95,4% успешных бронирований после подключения технологии Agent Q.

Meta* в сотрудничестве с исследователями Оксфордского университета разработала VFusion3D – продвинутую модель для генерации 3D-моделей по одному 2D-референсу.

Новая версия генератора изображений Imagen 3, созданного Google DeepMind, генерирует потрясающие фото и иллюстрации, явно превосходящие нынешние возможности Midjourney и DALL-E.

🤖🎨 Все самое полезное про нейросети для генерации изображений вы найдете на нашем телеграм-канале «Библиотека нейрокартинок»

MIT опубликовал базу данных с информацией о более чем 700 потенциальных проблемах, которые могут возникнуть при использовании ИИ. Этот проект поможет:

Найти конкретные риски, отсортировав их по причине возникновения или сфере влияния.
Понять, как различные факторы влияют на появление рисков ИИ.

У нашумевшего Devin появился сильный конкурент: стартап Cosine разработал автономного ИИ-инженера Genie, который работает на кастомной версии GPT-4o, недоступной для широкой публики, и превосходит Devin на 13,8%.

Cosine может самостоятельно работать над проектом

Grok-2 теперь генерирует изображения (с помощью продвинутой модели FLUX.1 от Black Forest Labs), а поскольку серьезная цензура в чат-боте не предусмотрена – пользователи соревнуются в генерации непристойных, дискредитирующих и провокационных картинок. Что еще интереснее, Grok-2 удалось обойти самые мощные модели – Claude 3.5 Sonnet и GPT-4o – по нескольким бенчмаркам.

Возможности Grok-2 теперь сопоставимы с лидерами

🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста»

Платные подписчики Gemini скоро смогут пользоваться чат-ботом в голосовом режиме. Функция работает аналогично голосовому режиму в ChatGPT.

Apple разрабатывает новый большой продукт: монитор на гибкой роборуке, способной вращать экран во всех направлениях на 360°. Гаджет можно будет использовать в качестве пункта управления умным домом, инструмента для видеоконференций и системы мониторинга безопасности с удаленным доступом. Выпуск запланирован на 2026–2027 годы, цена ожидается в пределах $1000.

Huawei готовится к запуску в массовое производство нового чипа Ascend 910C, способного составить конкуренцию NVIDIA H100 (и помочь китайской ИИ-индустрии обойти санкции США). ByteDance и Baidu уже тестируют чип и в перспективы готовы приобрести более 70 тысяч единиц.

Приглашаем вас на вебинар «Как меняется математика в разных индустриях: от мобильных игр к фондовым рынкам», который состоится 22 августа в 20:00 по МСК. Там вы сможете:

Узнать, как математические методы влияют на мобильные игры и фондовые рынки.
Понять различия в математических подходах в разных сферах бизнеса.
Изучить реальные кейсы применения математики в GameDev и финансах.
Оценить, какие математические знания необходимы для успешной карьеры в Data Science.

Стать участником вебинара

💸 ИИ неэффективен в управлении инвестициями

Несмотря на то, что хедж-фонды, взявшие на вооружение ИИ, демонстрируют меньшую волатильность, их доходность ниже, чем у обычных фондов. Это показывает анализ индекса Eurekahedge AI Hedge Fund Index, который объединяет фонды, применяющие ИИ в торговле, с индексом S&P 500.

Результаты показали, что за 15 лет индекс с ИИ принес 9,8% годовой доходности против 13,7% у S&P 500 – это противоречит распространенному мнению о том, что ИИ с накоплением опыта будет постоянно улучшать свои результаты. Авторы объясняют это явление математически обоснованным принципом, сформулированным лауреатом Нобелевской премии Уильямом Шарпом. Суть принципа заключается в том, что совокупный портфель всех активных управляющих (включая тех, кто использует ИИ) равен рынку в целом. Учитывая комиссии и другие расходы, доходность этого совокупного портфеля неизбежно будет ниже, чем у индексного фонда.

Есть и дополнительные факторы, которые никогда не позволят ИИ-фондам обогнать рынок:

Технологии машинного обучения дороги в разработке и использовании, что увеличивает расходы фондов.
Даже если отдельные ИИ-менеджеры могут превзойти рынок, их задача будет усложняться по мере того, как все большее количество конкурентов начнет использовать аналогичные технологии.

Прибыльность хедж-фондов, использующих ИИ, уступает S&P 500

🤖🦾 Все самое полезное про роботов, беспилотники, автопилоты и интернет вещей вы найдете на нашем телеграм-канале

«Библиотека робототехники и беспилотников»

⛓️ Цепочка размышлений – не панацея

Промпты с цепочкой рассуждений (Chain-of-Thought prompting, или просто CoT) – это способ улучшить способность чат-ботов решать задачи. Вместо того, чтобы просто задать вопрос и ждать ответа, вы просите ИИ объяснить свои мысли шаг за шагом. Идея в том, что, показывая ИИ, как думать логически, мы учим его лучше решать проблемы.

Цепочка рассуждений значительно улучшает качество ответов LLM, но есть нюансы

Сначала казалось, что это работает отлично и может стать ключом к решению сложных задач в реальной жизни – ведь ИИ действительно стал лучше решать математические задачи и задачи на логику. Все были в восторге! Но оказалось, что не все так просто. Исследователи решили проверить (отчет в PDF), действительно ли ИИ стал умнее или просто научился повторять паттерны. Они дали ИИ задачи на планирование (например, сложить блоки в определенном порядке). Выяснилось, что:

ИИ хорошо справляется с простыми задачами, но быстро сдается, когда задачи становятся сложнее.
ИИ скорее повторяет паттерны из примеров, чем действительно думает.
Этот подход работает для узких задач, но не для всего сразу.

💬 Новый способ понять ход формирования ответов LLM

Исследователи Google разработали эффективный и перспективный метод анализа и понимания внутренних механизмов работы больших языковых моделей – Patchscopes («Патчскопы»), который позволяет исследовать скрытые представления внутри нейронной сети, «перенося» их между разными слоями и промптами. Метод включает в себя:

Запуск исходного промпта через модель.
Извлечение скрытого представления из определенного слоя.
Вставку («патчинг») этого представления в другой промпт на определенном слое.
Анализ того, как это влияет на генерацию ответа модели.

Patchscopes можно использовать для:

Изучения того, как модель обрабатывает информацию на разных слоях.
Извлечения латентных атрибутов и знаний модели.
Исправления ошибок рассуждения модели.

В отчете много интерактивных визуализаций, демонстрирующих работу метода

Patchscopes предлагает более гибкий подход по сравнению с традиционными методами, такими как пробинг (probing), и не требует дополнительного обучения. И хотя еще требуются дальнейшие исследования для разработки общих рекомендаций по применению метода, уже очевидно, что он открывает широкие возможности для интерпретации и понимания работы LLM.

🤖🎥 Все самое полезное про нейросети для генерации видео и дипфейки вы найдете на нашем телеграм-канале «Библиотека нейровидео»

🛠️ Инструменты

LearnGPT – персональный преподаватель для изучения чего угодно, от пиксельного арта до танцев.

Face Swap – заменяет лица на фото.

HIX AI – новый ИИ-поисковик. Предоставляет ссылки на источники информации и фото по теме.

HIX AI хорошо работает с запросами на русском

Dupe – находит бюджетные версии дорогих товаров.

Vipro AI – генерирует продуктовые видео.

Summarify – делает суммаризацию любого контента: от веб-страниц и аудиофайлов до YouTube-видео и PDF-документов.

Manaflow – автоматизирует любую офисную работу, информацию о которой можно представить в виде таблиц.

SoundRaw – генерирует треки, которые не приведут к проблемам с правообладателями: модель обучена на сэмплах, созданных штатными композиторами.

SoundRaw пишет музыку во всех существующих жанрах

🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале

«Библиотека нейрозвука»

Wondercraft AI – озвучивает и переводит подкасты, рекламу, аудиокниги и т. п. Похожий сервис – Lazybird.

Neutone Morpho – создает звуковые эффекты для игр, фильмов и медиапроектов.

Omni Engineer – консольный инструмент для интеграции ИИ в процесс разработки ПО и вспомогательные действия – от генерации и обработки изображений до работы с файловой системой и онлайн-поиска. Работает со всеми популярными LLM.

Twitter-95 – ИИ-симуляция соцсети в стиле начала 90-х.

Profound – SEO для ИИ-поисковиков.

Tusk – автоматически вносит изменения в UI в соответствии с тикетами.

*Meta и все ее продукты, включая Llama-3, признаны экстремистскими и запрещены на территории РФ.

Автор рассылки: Наталья Кайда

Понравилась ли вам эта рассылка?

Очень понравилась

Не понравилась