Самые дешевые авиабилеты: Что может Falcon 180B, чем заменить Midjourney и как определить интеллект AI

суббота, 9 сентября 2023 г.

Что может Falcon 180B, чем заменить Midjourney и как определить интеллект AI

📰 Новости

Институт технологических инноваций Абу-Даби выпустил самую большую на сегодняшний день открытую LLM в мире – Falcon 180B. Демо-версия доступна здесь. Спойлер: Python код для заполнения матрицы по спирали оказался нерабочим, а в список сериалов про программистов Falcon включил медицинскую драму.

Falcon не справился с задачей, которую правильно решают ChatGPT и Claude

В запросах, связанных с обработкой веб-данных, Falcon уступает Bard

Сгенерированную в апреле 2023 песню Heart on My Sleeve выдвинули на премию Grammy: Drake и Weeknd скоро останутся без работы.

Сотрудники Amazon не успевают удалять из магазина бессмысленные книги, сгенерированные ИИ. Скаммеры наживаются на всех жанрах – от сказок до путеводителей. На этот раз мошенники взялись за генерацию пособий для любителей собирать грибы. Специалисты предупреждают, что доверять советам в этих книжках нельзя.

Samsung собирается встраивать генеративный ИИ в бытовую технику. В следующем году уже можно будет приобрести ИИ-холодильник, прямо как в сериале «Кремниевая долина».

В МГУ заработал новый суперкомпьютер производительностью 400 AI петафлопс. Эта впечатляющая машина предназначена для научных исследований и разработок в области ИИ и больших данных.

В Дубае стартовал ИИ-кинофестиваль – к участию в конкурсе принимаются профессиональные и любительские короткометражки, при создании которых использовались AI-технологии. Победителей объявят 29 февраля 2024 года.

Пока большая часть Голливуда протестует против внедрения ИИ в киноиндустрию, некоторые звезды и знаменитые режиссеры с энтузиазмом выступили в поддержку новых технологий на Венецианском кинофестивале. Том Хэнкс, который сейчас занят продвижением нового фильма Роберта Земекиса «Здесь», снятого с помощью ИИ-технологии Metaphysic Live, рассказал, что вполне может представить себе, как его ИИ-образ будет играть в кино после смерти актера, а Джо Руссо считает, что в ближайшие годы зрители смогут сгенерировать себе кино на вечер с участием самих себя и Мэрилин Монро. А еще на Венецианском фестивале состоялась премьера экспериментального ИИ-боевика Aggro Dr1ft, созданного при помощи Stable Diffusion.

Aggro Dr1ft целиком состоит из «инфракрасных» кадров

Эксперты пришли к грустному заключению – к 2026 году 90% онлайн-контента будет ИИ-генерированным. Это может привести к полной деградации ИИ.

Компания Warner Music Central Europe подписала контракт с первым цифровым персонажем – виртуальной певицей Noonoouri и выпустила дебютный сингл Dominoes с участием диджея Alle Farben.

Исследователи разработали ИИ-систему, способную описывать запахи на основе анализа молекулярных структур соединений. Разработка уже определяет около 5000 различных запахов – от цветочных и травянистых до винных и рыбных. В будущем система поможет создавать новые синтетические ароматы и позволит понять, как человеческий мозг интерпретирует запахи.

Ангилья (британская заморская территория в Карибском море) в 2023 году заработает $30 млн (10% от всего ВВП), и все благодаря удачному домену – .ai.

С начала года стоимость акций NVIDIA выросла на 244%. Спрос на GPU продолжает расти, и ограничения экспорта, очевидно, никак не повлияют на продажи компании – чипы H100 уже используют в качестве залога для получения миллиардных кредитов.

Meta* создала новый тест для проверки ИИ-моделей компьютерного зрения на предвзятость: FACET* оценивает, насколько честно ИИ определяет и классифицирует объекты на изображениях и видео. Все подробности о работе FACET можно прочитать здесь. А еще Meta выложила в открытый доступ продвинутую модель компьютерного зрения DINOv2*.

❓Как это работает

Сотрудники популярной онлайн IDE Replit понятно рассказали в своем блоге, как происходит обучение больших языковых моделей, а журнал Forbes объяснил, как сотрудники «красных команд» в ИТ-гигантах тестируют модели на предвзятость в отношении афроамериканцев и мусульман.

Все, что нужно знать о странном мире LLM – что из себя представляют большие языковые модели, для чего их можно использовать, что можно на них построить, как их обучают и как можно решить многочисленные проблемы, связанных с их безопасным, эффективным и этичным использованием.

Что делает ChatGPT, и почему это работает – подробный и интересный материал, написанный понятным и живым языком, со множеством примеров и иллюстраций.

Статья «Большие языковые модели – не люди. Давайте не будем тестировать их, как людей» в журнале Technology Review (MIT) объясняет необходимость разработки специфических тестов для оценки способностей LLM, потому что большинство исследователей-энтузиастов до сих пор используют для этого человеческие экзамены и тесты IQ. Такой подход в корне неверен:

LLM хорошо справляются с аналоговыми рассуждениями, но испытывают трудности при решении задач, связанных с физическим миром и социальным взаимодействием. Это приводит к разногласиям по поводу интерпретации результатов и истинного интеллекта LLM.
GPT-4 и GPT-3 отлично справляются с некоторыми заданиями, но испытывают трудности с вариациями и сложными рассуждениями.
Обучающие данные для LLM поступают из интернета и могут включать ответы на экзаменационные вопросы – в этом случае модель занимается автодополнением, а не решением задачи.
Результаты работы таких моделей нестабильны и могут зависеть от небольших изменений в тестовых вопросах.

В общем и целом, существующие методы оценки недостаточны для понимания истинных возможностей LLM, а между тем сейчас очень важно иметь четкое представление о возможностях больших языковых моделей в связи с растущими надеждами и опасениями, которые они вызывают. Исследователи предлагают применять для тестирования языковых моделей методы, используемые для изучения животных и оценки когнитивных способностей младенцев.

⚒️ Инструменты

Pentest Copilot – AI-помощник этичного хакера.

Flavored Resume – перепишет резюме под любую вакансию.

Automorphic – поможет обучить модель на нужных данных за 10 простых шагов.

Audiosonic – прочитает текст по-человечески, со всеми нужными эмоциями.

Morise – ИИ-помощник ютубера: сгенерирует названия, описания и ключевые слова для роликов, поможет с новыми идеями, напишет посты.

Meiro – сделает тест, квиз или текстовую игру.

Checklist Generator AI – создает чек-листы для любой сферы деятельности – от составления бюджета до разработки ПО.

Vscoped – автоматически транскрибирует аудио и видео, создает субтитры.

Vispunk – генерирует и редактирует фотографии стокового качества.

Vispunk вполне может заменить Midjourney

Match AI – перенесет цветовую схему с одного изображения на другое.

🎓 Бесплатные курсы

Глубокое обучение – незаменимое руководство для всех, кто стремится разобраться в тонкостях глубокого обучения – от фундаментальных концепций до продвинутых приложений. Книга, написанная преподавателями MIT, охватывает широкий спектр тем, предлагает как теоретические, так и практические упражнения, подойдет для разработчиков с разным уровнем подготовки. Авторы не ограничиваются поверхностным рассмотрением глубокого обучения, а углубляются в математические основы нейронных сетей, алгоритмы оптимизации и методы регуляризации.

Сборник лекций Инженерной школы Стэнфордского университета – погружение в детали глубокого обучения с акцентом на изучении сквозных моделей, предназначенных, в частности, для классификации изображений. Лекции научат разрабатывать, обучать и отлаживать нейронные сети, а также предоставят исчерпывающее представление о самых важных исследованиях в области компьютерного зрения.

Полный курс машинного обучения (CS229 Стэнфордского университета) – отличается понятной подачей сложных математических концепций. Учебная программа составлена мастерски: сложность нарастает постепенно, и студенты плавно переходят от базовых понятий к решению продвинутых практических задач.

Подборка из 25 бесплатных курсов, связанных с использованием и разработкой ИИ: здесь есть интересные программы для любого уровня знаний и разных целей – от генерации изображений и видео до разработки ИИ-приложений и SEO-оптимизации.

🪛 Сделай сам

Обширная подборка открытых LLM, которые можно использовать в своих проектах – в том числе коммерческих.

AudioLDM2 – открытая модель для генерации музыки и речи на основе текста.

AgentSims – опенсорсная песочница для оценки LLM.

Интерфейс AgentSims

Open Interpreter – открытая вариация на тему Code Interpreter (OpenAI): позволяет запускать локально любой код, не имеет никаких ограничений и выходит в интернет.

GPT-author – напишет оригинальный фэнтези роман, используя GPT-4, Stable Diffusion и Anthropic API. Попробовать можно на Google Colab (со своими ключами).

MotionAgent – возьмет на себя весь процесс создания видео: напишет сценарий, сгенерирует изображения и превратит их в видео, напишет музыку. От вас потребуется только 36 Гб GPU и немного Питона.

DiffBIR – превратит размытые, искаженные и низкокачественные изображения в четкие профессиональные фото. Живая демонстрация – здесь.

Результаты работы DiffBIR

TextBase – фреймворк для быстрой разработки чат-ботов.

На этом все, напоследок – видеотуториал по созданию ультрареалистичных «кинокадров» в Midjourney. Увидимся через неделю!

* Организация Meta и ее продукты FACET и DINOv2, на которые мы ссылаемся, признаны экстремистскими и запрещены на территории РФ

Автор рассылки: Наталья Кайда

📖 Читать нас

🎓 Учиться у нас

Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.

суббота, 9 сентября 2023 г.

Что может Falcon 180B, чем заменить Midjourney и как определить интеллект AI

суббота, 9 сентября 2023 г.