Институт технологических инноваций Абу-Даби выпустил самую большую на сегодняшний день открытую LLM в мире – Falcon 180B. Демо-версия доступна здесь. Спойлер: Python код для заполнения матрицы по спирали оказался нерабочим, а в список сериалов про программистов Falcon включил медицинскую драму. |
Falcon не справился с задачей, которую правильно решают ChatGPT и Claude
|
В запросах, связанных с обработкой веб-данных, Falcon уступает Bard
|
Сгенерированную в апреле 2023 песню Heart on My Sleeve выдвинули на премию Grammy: Drake и Weeknd скоро останутся без работы. Сотрудники Amazon не успевают удалять из магазина бессмысленные книги, сгенерированные ИИ. Скаммеры наживаются на всех жанрах – от сказок до путеводителей. На этот раз мошенники взялись за генерацию пособий для любителей собирать грибы. Специалисты предупреждают, что доверять советам в этих книжках нельзя. Samsung собирается встраивать генеративный ИИ в бытовую технику. В следующем году уже можно будет приобрести ИИ-холодильник, прямо как в сериале «Кремниевая долина». В МГУ заработал новый суперкомпьютер производительностью 400 AI петафлопс. Эта впечатляющая машина предназначена для научных исследований и разработок в области ИИ и больших данных. В Дубае стартовал ИИ-кинофестиваль – к участию в конкурсе принимаются профессиональные и любительские короткометражки, при создании которых использовались AI-технологии. Победителей объявят 29 февраля 2024 года. Пока большая часть Голливуда протестует против внедрения ИИ в киноиндустрию, некоторые звезды и знаменитые режиссеры с энтузиазмом выступили в поддержку новых технологий на Венецианском кинофестивале. Том Хэнкс, который сейчас занят продвижением нового фильма Роберта Земекиса «Здесь», снятого с помощью ИИ-технологии Metaphysic Live, рассказал, что вполне может представить себе, как его ИИ-образ будет играть в кино после смерти актера, а Джо Руссо считает, что в ближайшие годы зрители смогут сгенерировать себе кино на вечер с участием самих себя и Мэрилин Монро. А еще на Венецианском фестивале состоялась премьера экспериментального ИИ-боевика Aggro Dr1ft, созданного при помощи Stable Diffusion. |
Aggro Dr1ft целиком состоит из «инфракрасных» кадров
|
Исследователи разработали ИИ-систему, способную описывать запахи на основе анализа молекулярных структур соединений. Разработка уже определяет около 5000 различных запахов – от цветочных и травянистых до винных и рыбных. В будущем система поможет создавать новые синтетические ароматы и позволит понять, как человеческий мозг интерпретирует запахи. Ангилья (британская заморская территория в Карибском море) в 2023 году заработает $30 млн (10% от всего ВВП), и все благодаря удачному домену – .ai. С начала года стоимость акций NVIDIA выросла на 244%. Спрос на GPU продолжает расти, и ограничения экспорта, очевидно, никак не повлияют на продажи компании – чипы H100 уже используют в качестве залога для получения миллиардных кредитов. Meta* создала новый тест для проверки ИИ-моделей компьютерного зрения на предвзятость: FACET* оценивает, насколько честно ИИ определяет и классифицирует объекты на изображениях и видео. Все подробности о работе FACET можно прочитать здесь. А еще Meta выложила в открытый доступ продвинутую модель компьютерного зрения DINOv2*. |
Сотрудники популярной онлайн IDE Replit понятно рассказали в своем блоге, как происходит обучение больших языковых моделей, а журнал Forbes объяснил, как сотрудники «красных команд» в ИТ-гигантах тестируют модели на предвзятость в отношении афроамериканцев и мусульман. Все, что нужно знать о странном мире LLM – что из себя представляют большие языковые модели, для чего их можно использовать, что можно на них построить, как их обучают и как можно решить многочисленные проблемы, связанных с их безопасным, эффективным и этичным использованием. Что делает ChatGPT, и почему это работает – подробный и интересный материал, написанный понятным и живым языком, со множеством примеров и иллюстраций. Статья «Большие языковые модели – не люди. Давайте не будем тестировать их, как людей» в журнале Technology Review (MIT) объясняет необходимость разработки специфических тестов для оценки способностей LLM, потому что большинство исследователей-энтузиастов до сих пор используют для этого человеческие экзамены и тесты IQ. Такой подход в корне неверен: - LLM хорошо справляются с аналоговыми рассуждениями, но испытывают трудности при решении задач, связанных с физическим миром и социальным взаимодействием. Это приводит к разногласиям по поводу интерпретации результатов и истинного интеллекта LLM.
- GPT-4 и GPT-3 отлично справляются с некоторыми заданиями, но испытывают трудности с вариациями и сложными рассуждениями.
- Обучающие данные для LLM поступают из интернета и могут включать ответы на экзаменационные вопросы – в этом случае модель занимается автодополнением, а не решением задачи.
- Результаты работы таких моделей нестабильны и могут зависеть от небольших изменений в тестовых вопросах.
В общем и целом, существующие методы оценки недостаточны для понимания истинных возможностей LLM, а между тем сейчас очень важно иметь четкое представление о возможностях больших языковых моделей в связи с растущими надеждами и опасениями, которые они вызывают. Исследователи предлагают применять для тестирования языковых моделей методы, используемые для изучения животных и оценки когнитивных способностей младенцев. |
Pentest Copilot – AI-помощник этичного хакера. Flavored Resume – перепишет резюме под любую вакансию. Automorphic – поможет обучить модель на нужных данных за 10 простых шагов. Audiosonic – прочитает текст по-человечески, со всеми нужными эмоциями. Morise – ИИ-помощник ютубера: сгенерирует названия, описания и ключевые слова для роликов, поможет с новыми идеями, напишет посты. Meiro – сделает тест, квиз или текстовую игру. Checklist Generator AI – создает чек-листы для любой сферы деятельности – от составления бюджета до разработки ПО. Vscoped – автоматически транскрибирует аудио и видео, создает субтитры. Vispunk – генерирует и редактирует фотографии стокового качества. |
Vispunk вполне может заменить Midjourney |
Match AI – перенесет цветовую схему с одного изображения на другое. |
Глубокое обучение – незаменимое руководство для всех, кто стремится разобраться в тонкостях глубокого обучения – от фундаментальных концепций до продвинутых приложений. Книга, написанная преподавателями MIT, охватывает широкий спектр тем, предлагает как теоретические, так и практические упражнения, подойдет для разработчиков с разным уровнем подготовки. Авторы не ограничиваются поверхностным рассмотрением глубокого обучения, а углубляются в математические основы нейронных сетей, алгоритмы оптимизации и методы регуляризации. Сборник лекций Инженерной школы Стэнфордского университета – погружение в детали глубокого обучения с акцентом на изучении сквозных моделей, предназначенных, в частности, для классификации изображений. Лекции научат разрабатывать, обучать и отлаживать нейронные сети, а также предоставят исчерпывающее представление о самых важных исследованиях в области компьютерного зрения. Полный курс машинного обучения (CS229 Стэнфордского университета) – отличается понятной подачей сложных математических концепций. Учебная программа составлена мастерски: сложность нарастает постепенно, и студенты плавно переходят от базовых понятий к решению продвинутых практических задач. Подборка из 25 бесплатных курсов, связанных с использованием и разработкой ИИ: здесь есть интересные программы для любого уровня знаний и разных целей – от генерации изображений и видео до разработки ИИ-приложений и SEO-оптимизации. |
Обширная подборка открытых LLM, которые можно использовать в своих проектах – в том числе коммерческих. AudioLDM2 – открытая модель для генерации музыки и речи на основе текста. AgentSims – опенсорсная песочница для оценки LLM. |
Open Interpreter – открытая вариация на тему Code Interpreter (OpenAI): позволяет запускать локально любой код, не имеет никаких ограничений и выходит в интернет. GPT-author – напишет оригинальный фэнтези роман, используя GPT-4, Stable Diffusion и Anthropic API. Попробовать можно на Google Colab (со своими ключами). MotionAgent – возьмет на себя весь процесс создания видео: напишет сценарий, сгенерирует изображения и превратит их в видео, напишет музыку. От вас потребуется только 36 Гб GPU и немного Питона. DiffBIR – превратит размытые, искаженные и низкокачественные изображения в четкие профессиональные фото. Живая демонстрация – здесь. |
Результаты работы DiffBIR |
TextBase – фреймворк для быстрой разработки чат-ботов. |
На этом все, напоследок – видеотуториал по созданию ультрареалистичных «кинокадров» в Midjourney. Увидимся через неделю! |
* Организация Meta и ее продукты FACET и DINOv2, на которые мы ссылаемся, признаны экстремистскими и запрещены на территории РФ |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|