Microsoft переименовала Bing Chat в Copilot и запустила Copilot Studio – платформу, на которой можно создать кастомного бота, как это уже сделано на площадках Poe и OpenAI. А еще компания анонсировала запуск Windows AI Studio, которая значительно упростит интеграцию моделей и отладку ИИ-приложений. Amazon начал продажу бизнес-версии охранных роботов Astro. Хотя робот напоминает скорее Wall-E, чем Терминатора, он серьезно подготовлен к нештатным ситуациям – от обнаружения незнакомцев до реагирования на подозрительные звуки и пожар. | Охранный робот Astro – надежный защитник вашего бизнеса |
Команда исследователей из Оксфордского университета и Британского фонда по борьбе с заболеваниями сердца протестировала новый ИИ, определяющий риск сердечных заболеваний. Оказалось, что ИИ может предсказать инфаркт за 10 лет до приступа. Сэм Альтман подтвердил, что OpenAI работает над GPT-5, рассчитывает на дальнейшую финансовую поддержку от Microsoft, a настоящая цель компании – разработка безопасного сверхинтеллекта. Давно обещанную смарт-брошь Humane AI Pin наконец-то показали нескольким обозревателям вблизи, а на Ютубе начали появляться разочарованные отзывы: девайс окрестили «убийцей айфона» преждевременно, у этой «броши» даже нет экрана для просмотра ТикТока! Похоже, лучше купить Samsung Galaxy S24, у которого есть и собственный генеративный ИИ Gauss, и экран. |
Качество генерации реалистичных изображений достигло феноменального совершенства: сгенерированные изображения белых людей выглядят более убедительны, чем реальные фото. Ученые показали 124 участникам исследования набор из созданных ИИ изображений людей и реальных фотографий и попросили указать, какие портреты им кажутся настоящими, а какие – сгенерированными. 66% сгенерированных изображений были приняты за реальные фотографии, и в то же время лишь 51% реальных фото были признаны настоящими. Антропоморфный робот Mika, назначенная на пост генерального директора компании Dictador в сентябре, на днях получила звание почетного профессора варшавского Collegium Humanum. Мика – новейшая версия известной Софии. |
NVIDIA представила новый GPU H200 на базе архитектуры Hopper с объемом памяти HBM3e 141 ГБ и пропускной способностью 4.8 ТБ/с (почти в 2,5 раза больше, чем у A100). Производительность нового чипа при выполнении ИИ-задач – в 2-3 раза выше, чем у предыдущего флагмана А100. Китайские исследователи создали робота-химика, который может извлекать кислород из воды на Марсе. Робот синтезирует катализаторы без участия человека – по словам исследователей, без использования ИИ этот процесс для ученых занял бы не менее 2000 лет. В результате можно вырабатывать до 60 граммов кислорода в час из марсианских материалов – это снимает необходимость доставки кислорода с Земли. Разумеется, потенциал робота-химика с успехом можно использовать и для более приземленных целей. |
Рыночная оценка OpenAI приближается к невероятным $90 млрд, и в преддверии продаж акций компания переманивает ведущих ИИ-разработчиков Google соблазнительными предложениями – пакетами акций потенциальной стоимостью от $5 млн до $10 млн. |
Million AI – GitHub-бот для автоматического поиска и исправления неэффективных фрагментов кода в React-приложениях. |
Gmail with Klu – ИИ-поиск, суммаризация, инсайты и чат с вашими имейлами. Superhuman AI – делает краткое содержание всех входящих имейлов и пишет письма, имитируя ваш тон и манеру общения. PLAIDAY – бесплатный генератор изображений и видео, позволяющий вставить в изображение/видео чье угодно лицо. |
PLAIDAY удивит ваших подписчиков в соцсетях |
Krea – платформа для генерации изображений и видео, поддерживает редактирование в реальном времени. Работает с 2500+ моделями, позволяет обучать собственные модели, соответствующие вашим эстетическим предпочтениям. |
Туториал покажет, как латентное согласование может ускорить генерацию изображений в Stable Diffusion XL в 7-10 раз. В основе методики – дистилляция исходной модели в другую версию, которая требует меньше шагов (4-8 вместо первоначальных 25-50). Обычно этот подход требует огромных затрат ресурсов (и нескольких GPU), но автор разработал элегантное решение проблемы. Как сделать собственный GPT на платформе OpenAI – подробный туториал. В кастомный GPT можно загрузить любые собственные данные, поручить ему создание изображений в нужном стиле, предоставить доступ в интернет для сбора информации. Civitai – платформа для обмена опенсорсными моделями. В каталоге – огромный выбор впечатляющих моделей для генерации графики и видео во всевозможных стилях. EmotiVoice – генерирует речь с эмоциональной окраской, используя более 2000 голосов. MusicGen* – генератор музыкальных треков от разработчиков Facebook*, поддерживает аудиореференсы. Демо на Hugging Face. | MusicGen отлично имитирует стиль известных групп |
OpenChat – модель с 7 млрд параметров, сопоставимая с ChatGPT-3.5. Прекрасно работает с русским языком, по результатам тестов превосходит многие модели с десятикратным количеством параметров. Протестировать можно здесь. |
OpenChat делает все то же самое, что и ChatGPT, но без регистрации и VPN |
Story-to-Motion (pdf) – синтез бесконечной управляемой анимации персонажей по текстовому описанию. Авторы предлагают новую систему, основанную на LLM, для генерации реалистичных и управляемых движений и траекторий на основе входного текста. Система состоит из двух основных частей: планировщика движений, который извлекает серии позиций из исходного текста, и схемы поиска движений, которая создает движения, соответствующие тексту и ограничениям на траекторию и семантику. |
Music ControlNet (pdf) – диффузная модель для генерации музыки. Современные модели способны создавать высококачественные треки в любом стиле. Однако эти модели лучше всего подходят для определения общих характеристик музыки (жанр, настроение, темп), и не слишком эффективны с точки зрения контроля над более точными характеристиками (временные позиции музыкальных тактов или изменения динамики). Для решения этой проблемы авторы предлагают новую модель генерации музыки Music ControlNet, которая предлагает множество методов управления звуком. Примеры генерации – на сайте проекта. |
Instant3D (pdf) – новый фреймворк для молниеносной генерации 3D-моделей по текстовым промптам. Существующие модели используют ресурсоемкую парадигму оптимизации, из-за которой генерация занимает продолжительное время тогда как Instant3D может создать 3D-модель менее чем за секунду. Основная идея нового подхода заключается в поиске стратегий для эффективной инъекции текстовых условий в нейронную сеть. Кроме того, предлагается новый активационный функционал, названный скалированным сигмоидом, который заменяет обычный сигмоидный функционал и ускоряет процесс обучения в десятки раз. Примеры – на сайте проекта. |
И напоследок – исчерпывающий гайд, который поможет разобраться в ИИ с нуля. В гайде 6 разделов и огромное количество ссылок на полезные ресурсы. |
На этом все, увидимся через неделю! |
* Facebook, MusicGen принадлежат компании Metа, деятельность которой признана экстремистской и запрещена на территории РФ. |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|