Вернуть деньги: Microsoft заплатит до $15 000 за каждый баг в Bing AI

суббота, 21 октября 2023 г.

Microsoft заплатит до $15 000 за каждый баг в Bing AI

📰 Новости

Опубликован очередной отчет о состоянии дел в AI-индустрии. Самое главное:

GPT-4 пока что остается лидером по результатам всех тестов для ИИ и экзаменов для людей.
Все больше усилий направляется на создание компактных моделей, которые способны конкурировать с мощными проприетарными LLM за счет более качественных обучающих данных и поддержки объемного контекста. Этот тренд особенно актуален на фоне опасений о том, что через несколько лет созданной людьми информации уже будет недостаточно для масштабирования ИИ.
LLM и диффузионные модели продолжают помогать ученым совершать прорывные открытия, в частности – в области молекулярной биологии и в разработке новых лекарств.
Вычислительные мощности стали новой нефтью: NVIDIA демонстрирует рекордные доходы, а стартапы используют свои GPU в качестве конкурентного преимущества. США ужесточают торговые ограничения в отношении Китая и мобилизуют своих союзников в войне за чипы, а NVIDIA, Intel и AMD начали масштабные продажи GPU, не подлежащих экспортному контролю.
Генеративный ИИ спасает мир венчурных инвестиций: на фоне падения оценки обычных ИТ-проектов ИИ-стартапы, ориентированные на генеративные приложения (создающие изображения, видео, текст и программный код), привлекли более $18 млрд от венчурных и корпоративных инвесторов.
Проблема безопасности вышла на первый план, побудив правительства и регулирующие органы по всему миру начать разработку соответствующих мер. Однако за этой бурной деятельностью скрываются глубокие разногласия в ИИ-сообществе и отсутствие заметного прогресса, поскольку правительства разных стран придерживаются противоречивых подходов.
Другая серьезная проблема – отсутствие надежной системы оценки современных LLM: корректность результатов работы моделей оставляет желать лучшего, а интуитивную оценку нельзя назвать объективной.

Исследователи Швейцарской высшей технической школы Цюриха обнаружили, что LLM, подобные ChatGPT, могут точно угадывать множество личных деталей о человеке по совершенно невинной переписке с чат-ботом. Такие подробности ни в коем случае не должны попадать в руки злоумышленников (или таргетологов).

Платформа StackOverflow уволила 28% сотрудников – начинающие айтишники теперь предпочитают задавать вопросы вежливому ChatGPT. ИИ-апгрейд LinkedIn тоже повлек за собой увольнение персонала – там сократили 668 человек.

21-летний студент Люк Фарритор выиграл $40 000 за расшифровку римского свитка с помощью ИИ. До этого прочитать свиток не могли – он был обуглен во время извержения Везувия в октябре 79 г.н.э. Призеры, занявшие второе и третье места, получили по $10 000.

В конкурсе Vesuvius Challenge можно выиграть до $1 000 000

Известная писательница Маргарет Этвуд, книги которой незаконно использовали в обучении множества LLM, написала рецензию на рассказ и стихотворение, сгенерированные ChatGPT в подражание ее стилю. Спойлер: Этвуд согласна, что чат-бот пишет стишки не хуже условного дядюшки Роджера, но профессиональные авторы пока еще могут спать спокойно.

Microsoft заплатит от $2 000 до $15 000 за найденные в Bing AI баги. А вот за обнаружение ошибок в Bard AI вряд ли будут платить – багов там столько, что даже сотрудники Google сомневаются в полезности чат-бота.

Исследователи Северо-Западного университета представили революционное наноэлектронное устройство, которое позволяет в 100 раз повысить скорость работы ИИ при выполнении задач классификации в реальном времени. Устройство не нуждается в энергоемкой облачной инфраструктуре и способно молниеносно обрабатывать данные в носимых устройствах для медицинской диагностики. Ранее исследователи Лаборатории Линкольна (MIT) сообщили о разработке технологии обучения моделей, которая использует на 80% меньше электроэнергии, чем обычные методы.

🪛 Сделай сам

Создатель фреймворка LangChain, Харрисон Чейз, за 1 час научит, как сделать чат-бота на LangChain для работы с вашими собственными данными и документами.

Llemma – опенсорсная модель на базе Code Llama* для решения математических задач. Есть варианты на 7 млрд и на 34 млрд параметров. Статья о процессе обучения, результатах тестирования и сравнения Llemma с другими математическими моделями – здесь.

Simulatrex – фреймворк для симуляции социальных и рыночных сценариев:

Позволяет создавать симуляции с несколькими агентами, каждый из которых имеет свою личность, начальные условия и когнитивную модель.
Поддерживает как статические, так и динамические среды – это позволяет реализовать широкий спектр сценариев моделирования.
Имитационные модели Simulatrex – событийно-ориентированные, имеют встроенный механизм обработки событий и обновления среды.
Есть механизм оценки, позволяющий оценивать результаты работы агентов на основе заданных целей и метрик.
Предусмотрена интеграция с языковыми моделями – это позволяет агентам генерировать человекоподобные реакции.

Zephyr 7B Alpha – модель на базе Mistral-7B-v0.1, настроенная и дополнительно обученная для выполнения роли личного помощника. Генерирует ответы в стиле ChatGPT, отлично понимает русский язык, и превосходит показатели Llama-2 70B* по MT Benchmark.

⚙️ Как это работает

Исследователи обнаружили, что LLM линейно отделяют истинные утверждения от ложных – то есть во внутренней структуре модели существует некий «вектор истины», разделяющий истину и ложь. Исследователи протестировали открытие на разных типах данных и показали, что «зонды» (алгоритмы), обученные выделять «вектор истины», могут обобщать новые и совершенно неизвестные модели данные. Это говорит о том, что они выделяют именно общее понятие истины, а не просто коррелирующие с ней признаки, и этот факт открывает пути к созданию более надежных систем ИИ, менее склонных к галлюцинациям и генерации ложной информации.

Так LLM представляют истинные и ложные сведения

Статья «Большие языковые модели для чайников» интересно и понятно рассказывает о принципах работы и перспективах применения LLM:

LLM представляют слова в виде векторов чисел, называемых векторами слов. Каждое слово представлено уникальным вектором из многих чисел (например, 12288 чисел для GPT-3).
Слова группируются вместе в «пространстве слов» на основе семантической близости. Похожие слова находятся ближе друг к другу.
LLM обучаются на огромных текстовых данных (GPT-3 обучали на 500 миллиардах слов). Это позволяет им понимать контекст и связи между словами.
LLM используют архитектуру трансформеров – многослойную нейронную сеть. Каждый слой анализирует входные данные и передает результат дальше.
Первые слои анализируют синтаксис, последние – семантику и контекст всего текста. Большее количество слоев и размер векторов слов позволяют LLM лучше понимать сложные языковые конструкции и нюансы.
LLM могут решать задачи, которые вызывают затруднения у людей, например, вопросы, связанные с теорией разума – GPT-4 правильно отвечает на 95% таких заданий.
Приложения LLM все еще находятся на ранней стадии. Основные направления развития – вертикализация, автоматизация/ускорение человеческого труда и решение невозможных ранее задач.

Разработчики Parcha рассказали о процессе разработки ИИ-агентов для автоматизации бизнес-процессов. Такие агенты могут выполнять все рутинные задачи в области комплаенса и операционной деятельности. Основные компоненты агента:

Спецификации и директивы (роль, возможности, инструменты).
Блокнот для хранения промежуточных результатов.
Стандартные операционные процедуры (СОП), по которым агент действует.
Инструкции для финальной оценки и принятия решения.

Изначально компания использовала простой подход с агентами на базе Langchain и веб-сокетами для связи. Этот подход вызвал серьезные проблемы при масштабировании, и разработчики поделились усовершенствованиями, которые позволяют сделать агентов более надежными и производительными.

⚒️ Инструменты

Cosine – ИИ-ассистент разработчика: отвечает на любые вопросы по кодовой базе, дает советы, предлагает решения и генерирует идеи.

Cosine с успехом заменяет GitHub Copilot

Calligrapher – генерирует реалистичный рукописный текст. Русский язык пока не поддерживается.

SheetAI – ИИ на основе GPT-3, который работает прямо в Google Sheets и делает там все, что только можно ожидать от Excel-ассистента и модели, генерирующей текстовые данные. Другой похожий инструмент – AI in Sheets.

AI для Google Sheets – обрабатывает данные и пишет стишки

YTClass – совмещает образовательные ресурсы YouTube с мощью ИИ: ассистент поможет пройти любой курс и ответит на все вопросы.

ИИ выступает в качестве персонального наставника

Distillery – опенсорсный генератор изображений.

Еще не Midjourney, зато бесплатно

Humata – позволяет задавать вопросы по содержимому PDF-файлов, делает суммаризацию объемных документов.

Riffusion – пишет и исполняет песни по текстовым промптам, вот один из примеров.

Masterpiece X – генерирует 3D-модели по текстовому описанию. Отлично подходит для прототипирования в геймдеве.

Gemelo – клонирует голос и внешность для создания ИИ-двойника, который может, например, заниматься техподдержкой проекта и общаться с подписчиками.

Hotshot – генерирует GIFки по текстовым промптам.

Генератор GIFок работает на Stable Diffusion

Clio – бот для генерации изображений в Телеграме и WhatsApp*.

Тоже не Midjourney, зато в Телеграме

Напоследок – подборка из 10 незаурядных роботов, которые могут напугать своими способностями. Увидимся через неделю!

Если хочешь попробовать себя в ML, приходи на наш новый курс «Базовые модели ML и приложения» – всему научим.

На этом все, увидимся через неделю!

* Организация Meta и ее продукты Llama 2, Code Llama и WhatsApp признаны экстремистскими и запрещены на территории РФ.

Автор рассылки: Наталья Кайда

📖 Читать нас

🎓 Учиться у нас

Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.

суббота, 21 октября 2023 г.

Microsoft заплатит до $15 000 за каждый баг в Bing AI

суббота, 21 октября 2023 г.