Самые дешевые авиабилеты: Как обойти цензуру ИИ-модели

суббота, 22 июня 2024 г.

Как обойти цензуру ИИ-модели

📰 Новости

Американский режиссер Гэри Хаствит выпустил короткометражку, которая сама себя переписывает при каждом просмотре.

ИИ помог ученым доказать, что слоны зовут друг друга по именам. Это делает слонов первыми особями после людей, которые используют конкретные личные имена, а не более общий набор звуков для обращения к соплеменникам, как это делают некоторые другие животные и птицы.

Runway выпустила новую версию модели Gen-3 Alpha для генерации видео, сопоставимую по качеству с Sora.

🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста»

DeepMind представила модель V2A, которая генерирует звук для видео – диалоги, саундтрек и эффекты. Это революционная разработка – модель создает аудиодорожку синхронно с изображением, без промптов, учитывая контекст.

В Лондоне отменили премьеру фильма «Последний сценарист», созданного при помощи ChatGPT – из-за недовольства публики, не желающей смотреть ИИ-продукцию. В то же время британский предприниматель Стив Эндакотт продолжает предвыборную кампанию своего ИИ-аватара и надеется, что его альтер-эго пройдет в Палату общин.

Dell, Nvidia и Super Micro Computer объединили усилия в процессе создания грандиозного ИИ-суперкомпьютера для xAI Илона Маска. Система будет использовать около 100 000 чипов H100 от Nvidia, что сделает ее в 4 раза мощнее, чем любой другой существующий на данный момент ИИ-кластер. Ожидается, что суперкластер начнет работу осенью 2025 года.

Китайская опенсорсная модель DeepSeek Coder V2 уверенно превзошла GPT-4 Turbo, Claude 3 Opus и Gemini 1.5 Pro по качеству генерации кода и по способности решать математические задачи. Единственная модель, которую DeepSeek Coder V2 пока не удалось победить – GPT-4o.

DeepSeek Coder V2 удалось превзойти большинство популярных моделей

Инженеры Snapchat представили раннюю версию ИИ-модели, которая способна создавать яркий AR-опыт в реальном времени, работая прямо на смартфоне.

Илья Суцкевер, бывший главный научный сотрудник OpenAI, основал компанию Safe Superintelligence Inc, которая будет заниматься обеспечением безопасности искусственного суперинтеллекта. К Суцкеверу присоединились Дэниел Гросс (бывший ИИ-лид в Apple) и Дэниел Леви (экс-инженер OpenAI).

Появилась новая соцсеть Butterflies, где люди и ИИ-персонажи могут полноценно и естественно общаться – в комментариях и личных сообщениях.

Приложение работает на iOS и Android

Неуклонный рост спроса на ИИ-чипы сделал Nvidia самой богатой компанией в мире ($3,34 трлн). Руководитель Nvidia Дженсен Хуанг получил статус суперзвезды – и не только на своей родине в Тайване, но и в Кремниевой долине: недавно Марк Цукерберг назвал Хуанга аналогом Тейлор Свифт для ИТ-индустрии.

8 лет назад стоимость Nvidia не превышала 1% от нынешней

Илон Маск собирается использовать 1-2 тысячи роботов Optimus на своих фабриках в следующем году, и полагает, что именно андроиды – а не электромобили – в итоге станут главным продуктом Tesla. По оптимистичному мнению миллиардера, ежегодная емкость рынка роботов скоро достигнет 1 млрд экземпляров, и по крайней мере 10% от этого количества роботов будут изготовлены Tesla. Потенциальную капитализацию Optimus Маск оценивает в $20 трлн.

Себестоимость такого робота составит $10000, а розничная цена – $20000

🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале

«Библиотека нейрозвука»

🛠️ Инструменты

AutoKT – автоматически пишет и поддерживает подробную документацию для любого проекта.

AutoKT избавляет разработчиков от необходимости документировать код

CandyIcons – генерирует иконки для приложений.

CandyIcons поддерживает множество стилей

Т-Ж опубликовал подборку из 10 лучших нейронок для генерации аватарок в стиле аниме.

Обработка селфи в стиле аниме «Достучаться до тебя» и «Тетрадь смерти»

QuizSolver – автоматически отвечает на тесты.

QuizSolver доступен в виде плагина для Chrome

GenSpark – новый ИИ-поисковик, который недавно получил $60 млн от инвесторов под обещание обойти Perplexity и Google.

Sourcery – код-ревьюер, интегрируется с GitHub и GitLab, проверяет каждый запрос на вытягивание.

AI Illustration Generator – создает серии иллюстраций в едином стиле.

iAsk – еще один новый ИИ-поисковик. В платной версии также доступны генерация изображений, суммаризация и чат с документами.

VoiceCheap – переводит и дублирует видео на 30+ языках.

Coach – карьерный консультант от платформы CareerVillage.org.

Mojo – анимирует логотипы.

Remodel AI – оценивает интерьер вашей квартиры по фото и предлагает идеи по изменению дизайна.

CodeParrot превращает дизайны Figma и скриншоты в код для фронтенда.

🤖🎨 Все самое полезное про нейросети для генерации изображений вы найдете на нашем телеграм-канале «Библиотека нейрокартинок»

Quin – гадает на картах Таро :).

Veggie AI – превращает изображения в трехмерную анимацию. Поддерживает множество различных стилей.

Wegic – ИИ-разработчик и веб-дизайнер, сделает сайт за 90 секунд.

UImagine – превращает идеи и скриншоты в дизайн и код для фронтенда.

Diagram – ассистент дизайнера для максимальной автоматизации работы в Figma.

Reliv – автоматизирует QA-тестирование.

Pizi – превращает фото в детальную страницу продукта.

CodeWP – ИИ-ассистент для WordPress-разработчиков.

🤖🦾 Все самое полезное про роботов, беспилотники, автопилоты и интернет вещей вы найдете на нашем телеграм-канале

«Библиотека робототехники и беспилотников»

👾 Как «разцензурить» модель

Современные языковые модели обучены отказываться от выполнения потенциально вредных или неэтичных запросов. Хотя это важно для безопасности, это ограничивает гибкость моделей. Максим Лабонн представил технику под названием «аблитерация» (ablation + obliteration), которая позволяет «разцензурить» языковые модели без переобучения.

Аблитерация – это метод, который выявляет и удаляет «направление отказа» в остаточном потоке модели. Такой подход позволяет модели отвечать на все типы запросов без активации встроенного механизма отказа. Процесс аблитерации включает:
Сбор данных. Модель обрабатывает наборы вредных и безвредных инструкций, записывая активации остаточного потока.
Вычисление разницы. Рассчитывается средняя разница между активациями для вредных и безвредных инструкций.
Выбор. Выбирается лучшее «направление отказа» на основе этих расчетов.

Аблитерацию можно применять во время вывода, вычитая проекцию выхода на направление отказа. Другой вариант – изменить веса модели напрямую, чтобы она не могла представлять это направление (ортогонализация весов). Лебонн приводит практическую реализацию метода аблитерации – на примере модели Llama 3*, с использованием библиотек TransformerLens и Hugging Face. Результат – аблитерация успешно разцензуривает модель, но несколько снижает ее общую производительность. Для восстановления качества автор применяет дополнительное обучение с использованием метода DPO (Direct Preference Optimization).

Лебонн затрагивает вопрос хрупкости мер безопасности в ИИ и упоминает об этических последствиях разцензуривания моделей, однако подчеркивает тот факт, что аблитерацию можно рассматривать как форму тонкой настройки без переобучения, и применять ее для более благонадежных целей, нежели обход цензуры.

* Llama 3 разработана компанией Meta, деятельность которой признана экстремистской и запрещена на территории РФ.

***

Если хочешь попробовать себя в ML, приходи на наш новый курс «Базовые модели ML и приложения» – всему научим.

Автор рассылки: Наталья Кайда

Понравилась ли вам эта рассылка?

Очень понравилась

Не понравилась