Tencent выпустила опенсорсный генератор видео HunyuanVideo, который произвел небольшую сенсацию среди ИИ-энтузиастов: он генерирует потрясающе реалистичные клипы за считанные секунды и заметно превосходит проприетарных конкурентов Runway Gen-3 и Luma 1.6, особенно в качестве движения и последовательности сцен. Помимо генерации видео по тексту, модель может преобразовывать изображения в видео, создавать анимированные аватары и генерировать синхронизированные аудиотреки для видеоконтента. |
Google Deep Mind представила Genie 2 – модель для генерации интерактивных игровых миров. |
Похожий на Genie 2 генератор 3D-окружения на этой неделе выпустил стартап World Labs, основанный одной из самых авторитетных личностей в ИИ – Фей-Фей Ли. |
Компания Amazon представила семейство моделей Amazon Nova: - Micro – скоростная (больше 200 токенов в секунду) модель для генерации текста, перевода и дополнения кода.
- Lite – мультимодальная модель для быстрой обработки изображений, видео и текста.
- Pro – высокопроизводительная мультимодальная модель для работы с текстом, изображениями и видео. Подходит для сложных задач – суммаризации видео, Q&A, математических рассуждений, генерации кода.
- Canvas – генератор и редактор изображений.
- Nova Reel – управляемый генератор видео, создающий короткие рекламные клипы на основе текста и изображений.
|
OpenAI кардинально пересмотрела свое отношение к военному сотрудничеству. Изначально компания запрещала использование своих технологий в военных целях, однако в январе 2024 года убрала соответствующий пункт из пользовательского соглашения. В течение 2024 года OpenAI подписала контракты с Пентагоном по киберзащите и наняла нескольких бывших высокопоставленных сотрудников военных ведомств, включая Сашу Бейкер (бывшая чиновница министерства обороны) и Пола Накасоне (бывший глава АНБ). На этой неделе компания заключила соглашение с Anduril – американским оборонным стартапом, который производит ракеты, дроны и программное обеспечение для армии США. Цель партнерства – интеграция технологий OpenAI в системы Anduril для оценки и отслеживания беспилотных летательных аппаратов и противодействия атакам дронов. Стартап Humane, разработчик провальных ИИ-брошек AI Pin, пивотнулся в нишу ОС и начал продвижение CosmOS – операционной системы для умных гаджетов и ИИ-девайсов. |
Google DeepMind представила GenCast – ИИ-систему прогнозирования погоды, которая превзошла точность ведущей модели Европейского центра среднесрочных прогнозов погоды (ENS) по 97% оценочных показателей для 15-дневных прогнозов. GenCast обрабатывает прогнозы всего за 8 минут, используя один GPU, в то время как традиционные суперкомпьютеры тратят на это часы. Модель также точно предсказывает экстремальные погодные явления, включая тропические циклоны, волны тепла и ветровые волны. Система была обучена на 40 годах исторических погодных данных (1979–2018). DeepMind открылa полный исходный код для некоммерческих исследований. Стартап Exa готовится произвести революцию в поисковых технологиях с помощью ИИ-поисковика Websets. В отличие от традиционных поисковых систем, которые полагаются на ключевые слова для индексации страниц, Websets использует эмбеддинги, чтобы полностью понимать контекст и смысл каждой страницы. Это позволяет ему находить очень специфические данные, которые обычные поисковики не могут найти в принципе. Исследователи MIT разработали новый фотонный чип, способный выполнять все ключевые вычисления глубокой нейронной сети оптически. Задачу классификации чип выполнил менее чем за полнаносекунды, при этом достигнув больше 92% точности. Южная Корея стала первой в мире страной, заменившей больше 10% рабочей силы роботами. |
Magic Patterns – генерирует UI-код по скриншотам, редактирует готовые UI-элементы, применяет нужный стиль к дизайну. AutoDraw – превращает любые корявые эскизы в профессиональные иконки, диаграммы и иллюстрации. Agentic Tools Directory – обширный каталог инструментов на основе AI-агентов. Большая часть этих ИИ-приложений ориентирована на разработчиков. They See Your Photos – покажет, как много всего знает о вас Google AI благодаря вашим фото. | Google AI без труда определил социальный статус женщин (слева – актриса Аня Тейлор-Джой) |
Pollo AI – генерирует реалистичные видеоклипы на основе текстовых описаний, изображений и видеореференсов. |
Focu – помогает найти мотивацию для работы и стать более продуктивным. AI Santa – персонализированные видеопоздравления от Санта Клауса. Cloudy – генерирует и автоматически обновляет документацию так, чтобы она всегда соответствовала кодовой базе. Инструмент бесплатен для опенсорсных некоммерческих проектов. Voiser AI – выполняет транскрибацию, суммаризацию и перевод аудио и видео. Srcbook – создает любые приложения на TypeScript. |
ComicsMaker – генерирует комиксы по текстовым промптам, фото и эскизам. Поддерживает редактирование и обучение для создания кастомных персонажей. Pointer – ИИ-редактор, интегрированный в Google Docs. |
ACE Studio – генерирует вокал студийного качества на основе текста песни и MIDI. Kroto – переводит видео и документы на 60+ языков. DataFuel – скрапит весь контент сайта за один запрос и возвращает структурированные данные для LLM и RAG. Noiz – делает суммаризацию YouTube-роликов. EasyChef – предлагает подробные рецепты полезных (и диетических, если нужно) блюд из имеющихся в вашем холодильнике продуктов. Equals – электронные таблицы нового поколения для анализа и визуализации данных из любых источников от SQL-баз до бизнес-приложений. Создает отчеты и предлагает инсайты. Artflow Character Builder – генерирует фото и видео с участием определенных персонажей в любой нужной обстановке. | Plot – помощник для блогеров и SMM-специалистов: обеспечивает организованное хранение контента из соцсетей, генерацию новых идей и публикацию постов. GenYOU – бесплатный генератор реалистичных фотопортретов по селфи. Полностью сохраняет внешность персонажа, подходит для создания ИИ-инфлюенсеров. |
Superads – ассистент для маркетологов и SMM-специалистов. |
🎥 10+ лучших видео по разработке ИИ |
Разработку и обучение моделей можно освоить самостоятельно – по бесплатным роликам на YouTube (при условии, что вы уже хорошо знакомы с Python). Эти видео охватывают все ключевые аспекты создания и адаптации ИИ-моделей для решения различных задач: - 10-минутный обзор подхода к обучению модели с использованием Vertex AI. Показывает основы процесса машинного обучения с демонстрацией платформ Vertex AI, Amazon SageMaker и Azure Machine Learning. Подробности изложены в блоге автора.
|
- 17-минутное видео о структурировании данных – ключевом и самом сложном этапе подготовки модели. Раскрывает фундаментальные принципы организации обучающих данных.
|
- 5-минутное видео о файнтюнинге существующих моделей (например, Llama 3.2*) с помощью Ollama и Unsloth.
|
- Краткие видеообзоры основных возможностей самых популярных фреймворков машинного обучения – PyTorch, TensorFlow и CUDA.
- Углубленные туториалы по PyTorch (25 часов) и TensorFlow (14 часов).
- Продвинутые обучающие материалы для тех, кто хочет глубоко изучить внутреннюю механику нейронных сетей и современных языковых моделей:
|
Для вдохновения – подробное руководство по созданию мощного локального ИИ-сервера: - Установка Ollama (платформа для запуска локальных языковых моделей).
- Развертывание веб-интерфейса с расширенными функциями.
- Интеграция Stable Diffusion для генерации изображений.
- Настройка и кастомизация ИИ-моделей.
- Управление доступом пользователей.
- Возможность добавления ИИ-функций в любые приложения.
|
* Модели семейства Llama разрабатываются организацией Meta, деятельность которой признана экстремистской и запрещена на территории РФ. |
|
|
Понравилась ли вам эта рассылка? |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|