По данным отчета AI Index Report 2024, прошедший 2023 стал первым в новейшей истории годом, в котором ИИ успешно прошел сложные сертификационные экзамены, академический тест GRE и сравнился с человеческим IQ во многих областях, включая: - Понимание, объяснение и обсуждение текста, изображений и видео.
- Решение математических задач олимпиадного уровня.
|
Прогресс ИИ и сравнение с человеческим IQ |
Опрос о влиянии ИИ на рынок труда, проведенный авторами отчета, показал не самые оптимистичные ожидания респондентов на ближайшие 5 лет: - 57% считают, что ИИ значительно изменит нынешние рабочие процессы;
- 36% думают, что ИИ лишит их работы.
Microsoft сделала весомый вклад в развитие технологии дипфейков: новая модель VASA-1 генерирует потрясающе реалистичные видео на основе одного фото и одной аудиозаписи. Основные возможности VASA-1: - Безупречная синхронизация движений губ с записью голоса. Пример – Мона Лиза читает рэп.
- Естественная мимика и движения головы.
- Реалистичное отражение эмоций на лице.
- Высокое качество видео с частотой кадра 40 FPS.
|
AI-отношения продолжают набирать популярность: некоторые пользователи уже тратят по $10000 в месяц на ИИ-подружек, а новые приложения для ИИ-дейтинга выходят каждую неделю. Появился первый в мире конкурс красоты и успешности для ИИ-инфлюенсеров Мисс AI. Предполагается, что победа в «Мисс AI» будет равнозначна получению «Оскара» в киноиндустрии. Создатель ИИ-персонажа получит $5000 наличными и более $5000 PR-услугами на платформах организаторов конкурса. |
Конкурс красоты для ИИ-инфлюенсеров появился 200 лет спустя первого конкурса для девушек |
Компания Boston Dynamics распрощалась с гидравлической моделью робота Atlas, и представила новое поколение электрических андроидов. Новый Атлас отличается большей гибкостью, подвижностью, скоростью и улучшенной балансировкой. |
Яндекс запустил ИИ-поисковик Нейро. Сервис доступен в Яндекс Браузере и Алисе. Нейро анализирует релевантные онлайн-материалы, соответствующие запросу пользователя, и генерирует ответ с помощью YandexGPT. Microsoft инвестировала $1,5 млрд в эмиратскую ИИ-компанию G42. Компания будет использовать ИИ-инфраструктуру Azure, и обязуется отказаться от всех китайских технологий. |
🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста» |
🤖 Полная автоматизация разработки ПО |
Microsoft уже удалось захватить нишу ИИ-ассистентов для разработчиков: число активных пользователей GitHub Copilot превысило 1,3 млн. Следующая цель компании – ИИ-платформа для полной автоматизации процесса разработки ПО. Первую версию этой платформы исследователи компании описали в публикации AutoDev: Automated AI-Driven Development. По набору фич AutoDev превосходит нашумевший Devon. Среди его основных возможностей: Полностью автоматизированная разработка ПО - AutoDev позволяет пользователям определять сложные задачи, которые затем выполняются автономными ИИ-агентами.
- ИИ-агенты могут выполнять разнообразные операции с кодовой базой, включая редактирование файлов, извлечение, сборку, выполнение, тестирование и операции с git.
- Агенты имеют доступ к файлам, выводу компилятора, журналам сборки и тестирования, инструментам статического анализа и другой контекстной информации, необходимой для выполнения задач.
Безопасная среда разработки - AutoDev использует Docker-контейнеры для изолирования всех операций, обеспечивая безопасность и конфиденциальность.
- Пользователи могут определять разрешенные или запрещенные команды и операции в рамках AutoDev.
Высокая эффективность В тестах на наборе данных HumanEval AutoDev показал 91,5% и 87,8% успешности для генерации кода и генерации тестов соответственно. Это функциональность обеспечивает более высокую производительность и безопасность по сравнению с генерацией фрагментов кода в чат-интерфейсе, и делает AutoDev первой комплексной платформой для автоматизации задач по разработке сложного ПО. |
🧠 ИИ помог ученым определить области мозга, связанные с психозом |
С помощью ИИ ученые сделали значительный шаг в понимании причин галлюцинаций и бредовых идей, характерных для шизофрении и биполярного расстройства. Новое исследование, опубликованное в журнале Molecular Psychiatry, использовало методы машинного обучения и данные сканирования мозга, чтобы выявить две основные области мозга, участвующие в развитии психоза. Теория, которую подтверждает это исследование, состоит в том, что при психозе нарушается работа мозговых сетей, отвечающих за направление внимания человека. Это вызывает появление галлюцинаций и бредовых идей. Психоз характерен для серьезных психических расстройств, таких как шизофрения, но его симптомы могут также встречаться вне рамок определенных психических заболеваний. Ученые сфокусировались на людях в возрасте от 6 до 39 лет с редким генетическим синдромом 22q11.2, который повышает риск развития психоза, шизофрении и других проблем. Они использовали функциональную МРТ, чтобы отследить изменения в мозговом кровотоке, связанные с активностью мозговых клеток. Анализ данных МРТ с помощью нового алгоритма машинного обучения выявил характерные «подписи» в мозге людей с психозом. Эти подписи были обнаружены в двух ключевых компонентах так называемой «сети значимости» мозга – передней островковой доле и вентральном стриатуме. Эта сеть отвечает за динамическое переключение нашего внимания между внутренними мыслями и внешними стимулами, направляя наше внимание на то, что важно и реально. Ученые планируют использовать эти данные, чтобы применять существующие методы лечения, такие как стимуляция мозга, для предотвращения или задержки развития психоза у людей с высоким риском. Они также изучат, как антипсихотические лекарства влияют на эти области мозга, чтобы лучше понять механизм их действия. |
⚽ Google DeepMind научила миниатюрных роботов играть в футбол |
Процесс обучения происходил в два этапа: - На первом этапе в компьютерной симуляции роботы обучались двум основным навыкам с помощью обучения с подкреплением – вставать с земли после падения и бить по воротам.
- На втором этапе роботов тренировали играть полноценный футбольный матч один на один, используя огромный массив видеоданных и другой информации.
После этого обученную виртуальную модель переместили на реальных роботов Robotis OP3 высотой 51 см. Эти роботы также могли продолжать обучение и улучшение своих навыков во время тестовых матчей на небольшом футбольном поле. Наблюдая за игрой роботов, исследователи отметили, что многие их движения выполнялись более плавно и эффективно, чем у роботов, обученных с помощью стандартных методик. Например, роботы могли быстрее и элегантнее вставать после падения. Они также научились использовать тактические приемы, такие как обманные финты, чтобы обыгрывать соперника и выходить на ворота. Сравнение между изученным и запрограммированным поведением можно посмотреть здесь. |
🚗 Первая VLAM для автономного вождения прошла тестирование в городских условиях |
Wayve представила результаты испытаний LINGO-2 – закрытой системы, сочетающей в себе компьютерное зрение, обработку языка и управление (Vision-Language-Action Model, VLAM) для автономного вождения. Вот основные ее характеристики: - Входные данные. Модель получает на вход изображения с камер автомобиля, а также дополнительные данные – маршрут, текущую скорость и ограничение скорости.
- Архитектура. LINGO-2 состоит из двух основных компонентов – модели компьютерного зрения и авторегрессионной языковой модели. Модель зрения обрабатывает изображения с камер в последовательность токенов, которые затем, вместе с дополнительными переменными, подаются на вход языковой модели.
- Выходные данные. Языковая модель обучена предсказывать траекторию движения автомобиля и соответствующие текстовые комментарии в режиме реального времени. Затем контроллер автомобиля выполняет эту траекторию.
Основные возможности LINGO-2: - Адаптация поведения в соответствии с голосовыми командами. Модель может корректировать свое поведение в ответ на команды, например, «повернуть направо», «остановиться».
- Интерактивность и объяснение решений. LINGO-2 может отвечать на вопросы о текущей ситуации на дороге и объяснять свои действия в режиме реального времени, в отличие от предыдущей модели LINGO-1, которая могла только комментировать ситуацию, но не была связана с принятием решений.
- Захват комментариев вождения в режиме реального времени. Связывая зрение, язык и действия, LINGO-2 может использовать язык, чтобы объяснять, что она делает и почему, проливая свет на процесс принятия решений.
Это важный шаг вперед в разработке надежных автономных систем вождения, позволяющий лучше понять, как ИИ-системы принимают решения, и открывающий новые возможности для взаимодействия человека и автомобиля. |
EasyCaptions – многофункциональный ИИ-редактор для создания профессиональных видеоклипов. Mango AI – генерирует рекламные видео для соцсетей, анимирует ИИ-ассистентов. |
Flim – ИИ-поисковик для креативных людей. Packify – ИИ-дизайнер упаковки. Dora – генерирует сайты с 3D-анимацией. Похожие ИИ-сервисы для создания сайтов – WebWave и Limecube. |
AutoWiki – автоматически создает вики-документацию для репозитория. BestEver – генератор рекламных креативов. EasyFolders – сохраняет диалоги с ChatGPT и Claude в удобных древовидных папках. Spline AI 3D Generation – создает высококачественные 3D-модели по промптам и изображениям. |
Deblank – генератор уникальных цветовых палитр. |
🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале «Библиотека нейрозвука» |
Как использовать модель Claude 3 в собственных ИИ-приложениях |
Anthropic Cookbook – обширная подборка «рецептов» от разработчиков Claude. Например, в этом блокноте содержится код приложения для генерации изображений с помощью Claude и Stable Diffusion, а здесь есть код, позволяющий чат-боту извлекать любую информацию из изображений, форм и графиков. |
Evelyn – персональный ИИ-преподаватель |
Evelyn не только отвечает на вопросы, но и создает разнообразные интерактивные учебные материалы – тесты, карточки, карты, – чтобы процесс изучения не был скучным. Возможности Evelyn можно оценить на сайте проекта. |
На этом все, увидимся через неделю! |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|