Самые дешевые авиабилеты: 10+ лучших видео по разработке ИИ

суббота, 7 декабря 2024 г.

10+ лучших видео по разработке ИИ

📰 Новости

Tencent выпустила опенсорсный генератор видео HunyuanVideo, который произвел небольшую сенсацию среди ИИ-энтузиастов: он генерирует потрясающе реалистичные клипы за считанные секунды и заметно превосходит проприетарных конкурентов Runway Gen-3 и Luma 1.6, особенно в качестве движения и последовательности сцен. Помимо генерации видео по тексту, модель может преобразовывать изображения в видео, создавать анимированные аватары и генерировать синхронизированные аудиотреки для видеоконтента.

Google Deep Mind представила Genie 2 – модель для генерации интерактивных игровых миров.

Похожий на Genie 2 генератор 3D-окружения на этой неделе выпустил стартап World Labs, основанный одной из самых авторитетных личностей в ИИ – Фей-Фей Ли.

Компания Amazon представила семейство моделей Amazon Nova:

Micro – скоростная (больше 200 токенов в секунду) модель для генерации текста, перевода и дополнения кода.
Lite – мультимодальная модель для быстрой обработки изображений, видео и текста.
Pro – высокопроизводительная мультимодальная модель для работы с текстом, изображениями и видео. Подходит для сложных задач – суммаризации видео, Q&A, математических рассуждений, генерации кода.
Canvas – генератор и редактор изображений.
Nova Reel – управляемый генератор видео, создающий короткие рекламные клипы на основе текста и изображений.

🤖🦾 Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека робототехники и беспилотников | Роботы, ИИ, интернет вещей»

OpenAI кардинально пересмотрела свое отношение к военному сотрудничеству. Изначально компания запрещала использование своих технологий в военных целях, однако в январе 2024 года убрала соответствующий пункт из пользовательского соглашения. В течение 2024 года OpenAI подписала контракты с Пентагоном по киберзащите и наняла нескольких бывших высокопоставленных сотрудников военных ведомств, включая Сашу Бейкер (бывшая чиновница министерства обороны) и Пола Накасоне (бывший глава АНБ). На этой неделе компания заключила соглашение с Anduril – американским оборонным стартапом, который производит ракеты, дроны и программное обеспечение для армии США. Цель партнерства – интеграция технологий OpenAI в системы Anduril для оценки и отслеживания беспилотных летательных аппаратов и противодействия атакам дронов.

Стартап Humane, разработчик провальных ИИ-брошек AI Pin, пивотнулся в нишу ОС и начал продвижение CosmOS – операционной системы для умных гаджетов и ИИ-девайсов.

Google DeepMind представила GenCast – ИИ-систему прогнозирования погоды, которая превзошла точность ведущей модели Европейского центра среднесрочных прогнозов погоды (ENS) по 97% оценочных показателей для 15-дневных прогнозов. GenCast обрабатывает прогнозы всего за 8 минут, используя один GPU, в то время как традиционные суперкомпьютеры тратят на это часы. Модель также точно предсказывает экстремальные погодные явления, включая тропические циклоны, волны тепла и ветровые волны. Система была обучена на 40 годах исторических погодных данных (1979–2018). DeepMind открылa полный исходный код для некоммерческих исследований.

Стартап Exa готовится произвести революцию в поисковых технологиях с помощью ИИ-поисковика Websets. В отличие от традиционных поисковых систем, которые полагаются на ключевые слова для индексации страниц, Websets использует эмбеддинги, чтобы полностью понимать контекст и смысл каждой страницы. Это позволяет ему находить очень специфические данные, которые обычные поисковики не могут найти в принципе.

Исследователи MIT разработали новый фотонный чип, способный выполнять все ключевые вычисления глубокой нейронной сети оптически. Задачу классификации чип выполнил менее чем за полнаносекунды, при этом достигнув больше 92% точности.

Южная Корея стала первой в мире страной, заменившей больше 10% рабочей силы роботами.

🤖🎨 Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека нейрокартинок | Midjourney, DALL-E, Stable Diffusion»

⛏️ Инструменты

Magic Patterns – генерирует UI-код по скриншотам, редактирует готовые UI-элементы, применяет нужный стиль к дизайну.

AutoDraw – превращает любые корявые эскизы в профессиональные иконки, диаграммы и иллюстрации.

Agentic Tools Directory – обширный каталог инструментов на основе AI-агентов. Большая часть этих ИИ-приложений ориентирована на разработчиков.

They See Your Photos – покажет, как много всего знает о вас Google AI благодаря вашим фото.

Google AI без труда определил социальный статус женщин
(слева – актриса Аня Тейлор-Джой)

Pollo AI – генерирует реалистичные видеоклипы на основе текстовых описаний, изображений и видеореференсов.

Focu – помогает найти мотивацию для работы и стать более продуктивным.

AI Santa – персонализированные видеопоздравления от Санта Клауса.

Cloudy – генерирует и автоматически обновляет документацию так, чтобы она всегда соответствовала кодовой базе. Инструмент бесплатен для опенсорсных некоммерческих проектов.

Voiser AI – выполняет транскрибацию, суммаризацию и перевод аудио и видео.

Srcbook – создает любые приложения на TypeScript.

🤖🔊 Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека нейрозвука | Транскрибация, синтез речи, ИИ-музыка»

ComicsMaker – генерирует комиксы по текстовым промптам, фото и эскизам. Поддерживает редактирование и обучение для создания кастомных персонажей.

Pointer – ИИ-редактор, интегрированный в Google Docs.

ACE Studio – генерирует вокал студийного качества на основе текста песни и MIDI.

Kroto – переводит видео и документы на 60+ языков.

DataFuel – скрапит весь контент сайта за один запрос и возвращает структурированные данные для LLM и RAG.

Noiz – делает суммаризацию YouTube-роликов.

EasyChef – предлагает подробные рецепты полезных (и диетических, если нужно) блюд из имеющихся в вашем холодильнике продуктов.

Equals – электронные таблицы нового поколения для анализа и визуализации данных из любых источников от SQL-баз до бизнес-приложений. Создает отчеты и предлагает инсайты.

Artflow Character Builder – генерирует фото и видео с участием определенных персонажей в любой нужной обстановке.

Animated Drawings – оживляет рисунки, превращая их в короткие видеоклипы.

Plot – помощник для блогеров и SMM-специалистов: обеспечивает организованное хранение контента из соцсетей, генерацию новых идей и публикацию постов.

GenYOU – бесплатный генератор реалистичных фотопортретов по селфи. Полностью сохраняет внешность персонажа, подходит для создания ИИ-инфлюенсеров.

Superads – ассистент для маркетологов и SMM-специалистов.

🤖✍️ Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека нейротекста | ChatGPT, Gemini, Bing»

🎥 10+ лучших видео по разработке ИИ

Разработку и обучение моделей можно освоить самостоятельно – по бесплатным роликам на YouTube (при условии, что вы уже хорошо знакомы с Python). Эти видео охватывают все ключевые аспекты создания и адаптации ИИ-моделей для решения различных задач:

10-минутный обзор подхода к обучению модели с использованием Vertex AI. Показывает основы процесса машинного обучения с демонстрацией платформ Vertex AI, Amazon SageMaker и Azure Machine Learning. Подробности изложены в блоге автора.

17-минутное видео о структурировании данных – ключевом и самом сложном этапе подготовки модели. Раскрывает фундаментальные принципы организации обучающих данных.

Двухчасовой видеоролик от Андрея Карпаты о создании GPT с нуля. Дополнительно – видео Софии Янг, которая адаптировала его код для собственной модели.

Полное руководство по запуску модели на локальном компьютере. Рекомендует LM Studio как самый простой инструмент (туториал по работе с LM Studio можно посмотреть здесь).

5-минутное видео о файнтюнинге существующих моделей (например, Llama 3.2*) с помощью Ollama и Unsloth.

Подробное объяснение RAG как альтернативы полного переобучения модели.

Краткие видеообзоры основных возможностей самых популярных фреймворков машинного обучения – PyTorch, TensorFlow и CUDA.
Углубленные туториалы по PyTorch (25 часов) и TensorFlow (14 часов).
Продвинутые обучающие материалы для тех, кто хочет глубоко изучить внутреннюю механику нейронных сетей и современных языковых моделей:
- Курс, посвященный разбору всех аспектов работы нейронных сетей и генеративных моделей (8 эпизодов по 8–27 мин).
- 10-серийный туториал Андрея Карпаты (эпизоды по 1–4 часа).