Японская компания SoftBank Corp разработала ИИ-модель для обработки телефонных звонков в реальном времени – она превращает злобные голоса разгневанных клиентов в спокойные и дружелюбные, чтобы избавить сотрудников колл-центра от ненужного стресса. Stability AI выпустила новую версию своего генератора изображений – Stable Diffusion 3 Medium. Новая модель отлично умеет в фотореализм, понимает простые промпты и генерирует текст на английском без ошибок. При этом SD3M предъявляет умеренные требования к железу – запускать можно на любом более-менее современном ноутбуке. |
🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста» |
Беспрецедентная, многоуровневая и всеобъемлющая ИИ-функциональность, которую Apple щедро внедрила во всех гаджеты и приложения, по-настоящему впечатлила публику: акции компании моментально подскочили в цене, а капитализация превысила $3,33 трлн. Все новые фичи вызвали бурный восторг у поклонников бренда, но особая доля восхищения досталась этим приложениям: - Math Notes – помогает школьникам с заданиями по математике, а взрослым – с расчетом налогов.
- Image Wand Magic – генерирует потрясающие изображения по любым корявым наброскам.
- Genmoji – на лету создает кастомные эмодзи, если в коллекции нет подходящего.
- Новый калькулятор для iPad – решает сложные задачи по математике и физике.
|
Калькулятор решает задачки на лету |
Илон Маск неожиданно отозвал иск к OpenAI и поспешил заверить общественность, что забанит все девайсы Apple без промедления, если вдруг компания интегрировала ИИ от OpenAI в свою ОС на системном уровне. |
Илона не впечатлил новый калькулятор для iPad |
На этой неделе у двух самых мощных моделей для генерации видео – Sora и Veo – появились два потенциальных конкурента: - Китайская модель Kling – качество генераций на порядок выше, чем у Runway, но все же не такое высокое, как у Sora.
|
- Dream Machine от Luma AI – качество и возможности такие же, как у Sora, но длина клипов пока не превышает 5 секунд. Зато 30 клипов можно сгенерировать бесплатно.
|
CEO NVIDIA Дженсен Хуанг считает, что следующей волной развития ИИ станут роботы-гуманоиды и автономный транспорт. Судя по новым роботам и ассетам для них, представленным в еженедельной подборке IEEE Spectrum, он абсолютно прав: - Роботы норвежского стартапа 1X научились самостоятельно продумывать и выполнять сложные последовательности действий, которые необходимы для выполнения голосовых поручений, высказанных в свободной форме.
- Робот XBot-L прогуливается по Великой китайской стене и успешно преодолевает препятствия.
- Крылья для дрона, способные вращаться (как семена крылатки) и складываться/расправляться в полете (как птичьи крылья).
- Роботизированная кожа, способная двигаться, менять упругость, чувствительность и реагировать на внешнее воздействие.
- Автономный робот-тележка пользуется поездом для доставки обедов в офис.
- Робот-аватар DexNex точно имитирует все движения оператора. Визуально-тактильные данные, полученные в результате обмена между оператором и аватаром, будут использованы на следующем этапе – для обучения робота операциям, которые требуют человеческого уровня гибкости и координации движений.
|
🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале «Библиотека нейрозвука» |
Autodesigner 2.0 – может полностью заменить UI-дизайнера: генерирует все экраны/страницы для приложения, имитирует стиль со скриншотов. |
Kaiber AI – продвинутый генератор видеоклипов. Может анимировать отдельные области статических изображений. |
Amnesia – интерактивная образовательная AI-игра в стиле «Выбери себе приключение». Designs.ai – платформа для генерации всевозможной графики, лого, видео, текста и озвучки. CapCut – продвинутый, многофункциональный ИИ-редактор видео и графики. |
Jogg – генерирует промо-видео по URL. Summify – выполняет суммаризацию любых видео и аудио. GenType – сделает алфавит из чего угодно. Подробнее о работе с этим приложением – в блоге Google. |
GenType генерирует буквы на любой вкус |
MobileGPT – ИИ-помощник, работает в WhatsApp*: генерирует тексты, код и изображения, помогает в учебе и работе. Prog.AI – Chrome-расширение для ИТ-рекрутеров: собирает всю доступную информацию (скиллы, проекты, достижения) о разработчиках и предоставляет сводный рейтинг кандидатов. EducUp Study – создает персонализированные геймифицированные уроки из любых нужных материалов (видео, аудио, PDF, заметки, сайты и т. п.) |
MagicTime – необычный генератор видео: он предназначен для создания «метаморфических» клипов, – то есть роликов, показывающих процессы развития, изменений или трансформации объектов со временем, например, рост растений, приготовление пищи, строительство зданий и т.п. С помощью файнтюнинга можно добиться генерации видео в любом стиле – реалистичном, мультяшном, живописном и т.д. |
Модель отлично симулирует реальные метаморфозы. Больше примеров – на сайте проекта |
Как сделать ИИ-плагин для VS Code – туториал по разработке аналога GitHub Copilot, который будет работать на локальной ИИ-модели. Автор подробно рассматривает процесс создания плагина, разберется даже начинающий разработчик. Вот основные этапы работы: - Подготовка окружения и клонирование репозитория с шаблоном расширения.
- Установка и настройка локальной модели Llama.cpp, включая загрузку модели, запуск сервера и API.
- Добавление кнопок для запуска и остановки локальной модели Llama в расширение VS Code.
- Создание текстового поля ввода в webview для ввода запросов пользователем.
- Разделение webview на две части: одна для ввода, другая для отображения ответов модели.
- Реализация функционала отправки запросов с webview к локальной модели Llama и отображения ответов.
- Подготовка расширения к публикации и размещение его на VS Code Marketplace.
|
Разработчики Anthropic подробно рассказали о «красном» тестировании ИИ-моделей и о многочисленных сложностях, которые должны преодолевать сотрудники красных команд. Практика красного тестирования (red teaming) заключается во всесторонней проверке ИИ-системы ИИ с помощью имитации различных атак и вредоносных воздействий. Цель – выявить потенциальные уязвимости до того, как система будет развернута в реальных условиях. Основные направления тестирования и связанные с ними сложности выглядят так: - Тестирование экспертами в специфических областях. Для углубленного качественного тестирования вероятных рисков и угроз в самых важных социальных сферах (защита детей, предотвращение радикализации, обеспечение честных выборов и т.д.) приглашают специалистов в этих областях. Сложности связаны с привлечением достаточного количества квалифицированных экспертов и воспроизведением некоторых тестовых кейсов.
- Тестирование угроз нацбезопасности. На этом этапе для оценки соответствующих рисков нужно привлекать экспертов в области оружия массового поражения, кибербезопасности, автономных систем. Сложность – доступ к специализированным знаниям, моделирование реальных угроз.
- Многоязычное и межкультурное тестирование. Нужно найти локальных экспертов для выявления рисков, специфичных для разных языков и культур. Сложности – масштабирование на множество языков и культур и поиск подходящих специалистов.
- Использование языковых моделей для автоматизированного тестирования. Модели генерируют большое количество вредоносных примеров для тестирования устойчивости других моделей. Это итеративный процесс, в котором задействованы «красная» и «синяя» команды, поскольку одна модель генерирует атаки, а другая модель дообучается, чтобы противостоять этим атакам. Сложности этого этапа связаны с эффективностью и качеством автоматически сгенерированных тестов, а также с необходимостью человеческого надзора.
- Тестирование в новых модальностях. Мультимодальное тестирование с использованием изображений, аудио и т.д. проводят для выявления специфических рисков. Сложности возникают из-за очень большого пространства возможных входных данных, а также частой потребности в ручной разметке данных.
- Открытое общее тестирование. Широкую аудиторию привлекают для поиска общих рисков и уязвимостей. Сложностей здесь особенно много – стимулирование участия, контроль входных данных, неструктурированность результатов.
- Тестирование сообществом. Вовлечение сообщества (в ходе хакатонов, челленджей и т. п.) нужно для обнаружения общих ограничений ИИ-системы. Сложности связаны с созданием инфраструктуры и обработкой результатов.
Все эти этапы тестирования сопровождает основная мета-сложность – перевод качественного тестирования в количественные метрики: нужно превращать результаты ручного тестирования в воспроизводимые наборы данных и бенчмарки для автоматизированной оценки эффективности улучшений безопасности моделей. * WhatsApp принадлежит компании Meta, деятельность которой признана экстремистской и запрещена на территории РФ. |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|