Самые дешевые авиабилеты: ИИ уже сравнился с человеческим IQ

суббота, 20 апреля 2024 г.

ИИ уже сравнился с человеческим IQ

📰 Новости

По данным отчета AI Index Report 2024, прошедший 2023 стал первым в новейшей истории годом, в котором ИИ успешно прошел сложные сертификационные экзамены, академический тест GRE и сравнился с человеческим IQ во многих областях, включая:

Понимание, объяснение и обсуждение текста, изображений и видео.
Решение математических задач олимпиадного уровня.

Прогресс ИИ и сравнение с человеческим IQ

Опрос о влиянии ИИ на рынок труда, проведенный авторами отчета, показал не самые оптимистичные ожидания респондентов на ближайшие 5 лет:

57% считают, что ИИ значительно изменит нынешние рабочие процессы;
36% думают, что ИИ лишит их работы.

Microsoft сделала весомый вклад в развитие технологии дипфейков: новая модель VASA-1 генерирует потрясающе реалистичные видео на основе одного фото и одной аудиозаписи. Основные возможности VASA-1:

Безупречная синхронизация движений губ с записью голоса. Пример – Мона Лиза читает рэп.
Естественная мимика и движения головы.
Реалистичное отражение эмоций на лице.
Высокое качество видео с частотой кадра 40 FPS.

Подробности o VASA-1 и множество примеров – на странице проекта

AI-отношения продолжают набирать популярность: некоторые пользователи уже тратят по $10000 в месяц на ИИ-подружек, а новые приложения для ИИ-дейтинга выходят каждую неделю.

Появился первый в мире конкурс красоты и успешности для ИИ-инфлюенсеров Мисс AI. Предполагается, что победа в «Мисс AI» будет равнозначна получению «Оскара» в киноиндустрии. Создатель ИИ-персонажа получит $5000 наличными и более $5000 PR-услугами на платформах организаторов конкурса.

Конкурс красоты для ИИ-инфлюенсеров появился 200 лет спустя первого конкурса для девушек

Компания Boston Dynamics распрощалась с гидравлической моделью робота Atlas, и представила новое поколение электрических андроидов. Новый Атлас отличается большей гибкостью, подвижностью, скоростью и улучшенной балансировкой.

Яндекс запустил ИИ-поисковик Нейро. Сервис доступен в Яндекс Браузере и Алисе. Нейро анализирует релевантные онлайн-материалы, соответствующие запросу пользователя, и генерирует ответ с помощью YandexGPT.

Microsoft инвестировала $1,5 млрд в эмиратскую ИИ-компанию G42. Компания будет использовать ИИ-инфраструктуру Azure, и обязуется отказаться от всех китайских технологий.

🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста»

🤖 Полная автоматизация разработки ПО

Microsoft уже удалось захватить нишу ИИ-ассистентов для разработчиков: число активных пользователей GitHub Copilot превысило 1,3 млн. Следующая цель компании – ИИ-платформа для полной автоматизации процесса разработки ПО. Первую версию этой платформы исследователи компании описали в публикации AutoDev: Automated AI-Driven Development. По набору фич AutoDev превосходит нашумевший Devon. Среди его основных возможностей:

Полностью автоматизированная разработка ПО

AutoDev позволяет пользователям определять сложные задачи, которые затем выполняются автономными ИИ-агентами.
ИИ-агенты могут выполнять разнообразные операции с кодовой базой, включая редактирование файлов, извлечение, сборку, выполнение, тестирование и операции с git.
Агенты имеют доступ к файлам, выводу компилятора, журналам сборки и тестирования, инструментам статического анализа и другой контекстной информации, необходимой для выполнения задач.

Безопасная среда разработки

AutoDev использует Docker-контейнеры для изолирования всех операций, обеспечивая безопасность и конфиденциальность.
Пользователи могут определять разрешенные или запрещенные команды и операции в рамках AutoDev.

Высокая эффективность

В тестах на наборе данных HumanEval AutoDev показал 91,5% и 87,8% успешности для генерации кода и генерации тестов соответственно.

Это функциональность обеспечивает более высокую производительность и безопасность по сравнению с генерацией фрагментов кода в чат-интерфейсе, и делает AutoDev первой комплексной платформой для автоматизации задач по разработке сложного ПО.

🤖🎨 Все самое полезное про нейросети для генерации изображений вы найдете на нашем телеграм-канале «Библиотека нейрокартинок»

🧠 ИИ помог ученым определить области мозга, связанные с психозом

С помощью ИИ ученые сделали значительный шаг в понимании причин галлюцинаций и бредовых идей, характерных для шизофрении и биполярного расстройства. Новое исследование, опубликованное в журнале Molecular Psychiatry, использовало методы машинного обучения и данные сканирования мозга, чтобы выявить две основные области мозга, участвующие в развитии психоза.

Теория, которую подтверждает это исследование, состоит в том, что при психозе нарушается работа мозговых сетей, отвечающих за направление внимания человека. Это вызывает появление галлюцинаций и бредовых идей. Психоз характерен для серьезных психических расстройств, таких как шизофрения, но его симптомы могут также встречаться вне рамок определенных психических заболеваний.

Ученые сфокусировались на людях в возрасте от 6 до 39 лет с редким генетическим синдромом 22q11.2, который повышает риск развития психоза, шизофрении и других проблем. Они использовали функциональную МРТ, чтобы отследить изменения в мозговом кровотоке, связанные с активностью мозговых клеток.

Анализ данных МРТ с помощью нового алгоритма машинного обучения выявил характерные «подписи» в мозге людей с психозом. Эти подписи были обнаружены в двух ключевых компонентах так называемой «сети значимости» мозга – передней островковой доле и вентральном стриатуме. Эта сеть отвечает за динамическое переключение нашего внимания между внутренними мыслями и внешними стимулами, направляя наше внимание на то, что важно и реально.

Ученые планируют использовать эти данные, чтобы применять существующие методы лечения, такие как стимуляция мозга, для предотвращения или задержки развития психоза у людей с высоким риском. Они также изучат, как антипсихотические лекарства влияют на эти области мозга, чтобы лучше понять механизм их действия.

⚽ Google DeepMind научила миниатюрных роботов играть в футбол

Процесс обучения происходил в два этапа:

На первом этапе в компьютерной симуляции роботы обучались двум основным навыкам с помощью обучения с подкреплением – вставать с земли после падения и бить по воротам.
На втором этапе роботов тренировали играть полноценный футбольный матч один на один, используя огромный массив видеоданных и другой информации.

После этого обученную виртуальную модель переместили на реальных роботов Robotis OP3 высотой 51 см. Эти роботы также могли продолжать обучение и улучшение своих навыков во время тестовых матчей на небольшом футбольном поле.

Наблюдая за игрой роботов, исследователи отметили, что многие их движения выполнялись более плавно и эффективно, чем у роботов, обученных с помощью стандартных методик. Например, роботы могли быстрее и элегантнее вставать после падения. Они также научились использовать тактические приемы, такие как обманные финты, чтобы обыгрывать соперника и выходить на ворота. Сравнение между изученным и запрограммированным поведением можно посмотреть здесь.

🤖🦾 Все самое полезное про роботов, беспилотники, автопилоты и интернет вещей вы найдете на нашем телеграм-канале

«Библиотека робототехники и беспилотников»

🚗 Первая VLAM для автономного вождения прошла тестирование в городских условиях

Wayve представила результаты испытаний LINGO-2 – закрытой системы, сочетающей в себе компьютерное зрение, обработку языка и управление (Vision-Language-Action Model, VLAM) для автономного вождения. Вот основные ее характеристики:

Входные данные. Модель получает на вход изображения с камер автомобиля, а также дополнительные данные – маршрут, текущую скорость и ограничение скорости.
Архитектура. LINGO-2 состоит из двух основных компонентов – модели компьютерного зрения и авторегрессионной языковой модели. Модель зрения обрабатывает изображения с камер в последовательность токенов, которые затем, вместе с дополнительными переменными, подаются на вход языковой модели.
Выходные данные. Языковая модель обучена предсказывать траекторию движения автомобиля и соответствующие текстовые комментарии в режиме реального времени. Затем контроллер автомобиля выполняет эту траекторию.

Основные возможности LINGO-2:

Адаптация поведения в соответствии с голосовыми командами. Модель может корректировать свое поведение в ответ на команды, например, «повернуть направо», «остановиться».
Интерактивность и объяснение решений. LINGO-2 может отвечать на вопросы о текущей ситуации на дороге и объяснять свои действия в режиме реального времени, в отличие от предыдущей модели LINGO-1, которая могла только комментировать ситуацию, но не была связана с принятием решений.
Захват комментариев вождения в режиме реального времени. Связывая зрение, язык и действия, LINGO-2 может использовать язык, чтобы объяснять, что она делает и почему, проливая свет на процесс принятия решений.

Это важный шаг вперед в разработке надежных автономных систем вождения, позволяющий лучше понять, как ИИ-системы принимают решения, и открывающий новые возможности для взаимодействия человека и автомобиля.

🛠️ Инструменты

Vidyard AI Avatars – генерирует видео с участием вашего ИИ-двойника.

EasyCaptions – многофункциональный ИИ-редактор для создания профессиональных видеоклипов.

Mango AI – генерирует рекламные видео для соцсетей, анимирует ИИ-ассистентов.

Flim – ИИ-поисковик для креативных людей.

Packify – ИИ-дизайнер упаковки.

Dora – генерирует сайты с 3D-анимацией. Похожие ИИ-сервисы для создания сайтов – WebWave и Limecube.

AutoWiki – автоматически создает вики-документацию для репозитория.

BestEver – генератор рекламных креативов.

EasyFolders – сохраняет диалоги с ChatGPT и Claude в удобных древовидных папках.

Spline AI 3D Generation – создает высококачественные 3D-модели по промптам и изображениям.

Deblank – генератор уникальных цветовых палитр.

🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале

«Библиотека нейрозвука»

✋ Сделай сам

Как использовать модель Claude 3 в собственных ИИ-приложениях

Anthropic Cookbook – обширная подборка «рецептов» от разработчиков Claude. Например, в этом блокноте содержится код приложения для генерации изображений с помощью Claude и Stable Diffusion, а здесь есть код, позволяющий чат-боту извлекать любую информацию из изображений, форм и графиков.

Evelyn – персональный ИИ-преподаватель

Evelyn не только отвечает на вопросы, но и создает разнообразные интерактивные учебные материалы – тесты, карточки, карты, – чтобы процесс изучения не был скучным. Возможности Evelyn можно оценить на сайте проекта.