Шведская финтех-компания Klarna опубликовала отчет об использовании чат-бота на базе GPT-4 (OpenAI) в поддержке клиентов: за первый месяц ИИ успешно разрешил 2,3 млн проблем пользователей сервиса, и этот объем работы эквивалентен объему задач, которые способны выполнить 700 сотрудников при полной занятости. При этом среднее время решения проблемы составило 2 минуты (вместо 11 минут, которые тратили реальные сотрудники). Klarna оценивает экономию в $40 млн в 2024, и больше не планирует нанимать сотрудников поддержки. Adobe представила демо модели Project Music GenAI Control для генерации и редактирования музыкальных треков. Модель создает трек в нужном стиле по текстовому описанию, после чего композицию можно редактировать как угодно, с помощью промптов. Project Music GenAI Control позволяет контролировать ноты так же, как Photoshop редактирует пиксели, поэтому разработчики называют модель «музыкальным Фотошопом». Разработка уже поддерживает: - увеличение продолжительности;
- закольцовку;
- использование аудиореференсов;
- изменение темпа, структуры;
- ремиксы и повторы фрагментов трека;
- снижение и повышение напряженности;
- и многое другое.
|
Результаты тестирования Sora |
Китайские исследователи доказали, что Sora действительно многократно превосходит возможности самых продвинутых генераторов видео – Pika и Gen2. Общепринятых метрик для количественной оценки сгенерированного видео на соответствие законам физики реального мира пока не существует, поэтому авторы предложили эталон, основанный на соблюдении физических принципов. Используя трехмерное восстановление, они оценили геометрическую точность, преобразуя сгенерированные Sora видео в 3D модели. Сравнение с базовыми значениями (Pika и Gen2) показало значительное преимущество Sora в геометрической согласованности. |
Революционная математическая модель Orca Math |
Команда исследователей Microsoft Research выяснила, что мини-модели тоже способны правильно решать математические задачи – если правильно подойти к их обучению. Ранее считалось, что для приемлемого уровня корректности математических решений размер модели не может быть менее 34 млрд параметров. Однако исследователи на примере создания и обучения Orca Math доказали, что модель с 7 млрд параметров может значительно превзойти возможности LLM – LLAMA-2-70B*, WizardMath-70B, Gemini-Pro и ChatGPT-3.5. |
В Т-Ж опубликовали подробную статью о генерации изображений в нейросети Шедеврум. Вокруг Шедеврума уже образовалось внушительное сообщество нейрохудожников. Некоторые авторы при составлении промптов используют неологизмы собственного изобретения, другие описывают детальные параметры фотосъемки, и это дает впечатляющие результаты. |
Выпуклоносвяз и страннопоген дают отличные результаты |
Другая публикация на Т-Ж, «8 неожиданных команд, с которыми ChatGPT работает лучше», рассказывает о сюррных промптах, которые пользователи составили опытным путем. Как оказалось, ответы ChatGPT можно улучшить с помощью: - угроз в отношении старушек;
- обещания дать $200 (или собачье лакомство);
- приказом дышать глубже и размышлять пошагово.
На DeepLearning появился бесплатный мини-курс по промпт-инжинирингу для моделей семейства Llama 2*. Курс научит: - Использовать коллекцию моделей Llama 2* для создания приложений и выполнения различных задач.
- Правильно писать промпты и выбирать модели для получения наилучших результатов.
- Применять продвинутые техники составления промптов (вопросы с примерами, специальные промпты для решения логических задач).
- Эффективно использовать Code Llama* в качестве помощника разработчика.
- Применять Llama Guard* для проверки пользовательских вопросов и ответов на наличие вредоносного контента.
|
LTX Studio – ИИ-платформа для генерации и редактирования видеоконтента. Audyo – озвучивает текст голосами знаменитостей разного калибра, от Арнольда Шварценеггера до Арианы Гранде. SkimAI – ИИ-ассистент для работы с имейлами. Auxuman – платформа для создания видеоигр по промптам. |
SuperWhisper – iOS-приложение для преобразования голоса в текст: можно диктовать заметки, имейлы, сообщения и статьи. Улучшает грамматику, пишет в любом нужном стиле, делает суммаризацию. Поддерживает 100+ языков, работает в офлайне. Fluently – поможет говорить по-английски на уровне носителя языка. PDFtoMP3 – конвертирует PDF-документы и книги в реалистичную речь. При необходимости делает суммаризацию и объясняет сложные тексты простым и понятным языком. PicNotes – преобразует в печатный текст самый неразборчивый почерк с фотографий документов. ButterReader – сделает аудиоверсии статей в вашем блоге. |
Anura – диагностирует состояние здоровья по селфи. Приложение работает на Android и iOS. |
SeamlessExpressive – переводит видео с сохранением исходного тона и эмоций. Эта разработка Meta* не настолько впечатляет, как потрясающий видеопереводчик HeyGen или инструменты ElevenLabs, зато доступ к ней можно получить бесплатно. Hello History – позволяет побеседовать с любой известной исторической личностью, от монархов и политиков до композиторов и художников. |
Discovery Daily – новый ИИ-сервис от Perplexity. Генерирует подкасты с кратким содержанием новостей на интересующую тему. Thinkbuddy – интегрирует все возможности выбранной модели (GPT-3.5/4, Gemini, Claude 2) в macOS. VirtuLook – представляет товары в лучшем виде: генерирует привлекательный фон, примеряет одежду на виртуальных моделях. | VirtuLook поможет сделать эффектный каталог товаров |
На этом все, до встречи через неделю! * Meta и все принадлежащие ей продукты, включая Code Llama, Llama 2, LLAMA-2-70B, Llama Guard и SeamlessExpressive, признаны экстремистскими и запрещены на территории РФ. |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|