Опубликован очередной отчет о состоянии дел в AI-индустрии. Самое главное: - GPT-4 пока что остается лидером по результатам всех тестов для ИИ и экзаменов для людей.
- Все больше усилий направляется на создание компактных моделей, которые способны конкурировать с мощными проприетарными LLM за счет более качественных обучающих данных и поддержки объемного контекста. Этот тренд особенно актуален на фоне опасений о том, что через несколько лет созданной людьми информации уже будет недостаточно для масштабирования ИИ.
- LLM и диффузионные модели продолжают помогать ученым совершать прорывные открытия, в частности – в области молекулярной биологии и в разработке новых лекарств.
- Вычислительные мощности стали новой нефтью: NVIDIA демонстрирует рекордные доходы, а стартапы используют свои GPU в качестве конкурентного преимущества. США ужесточают торговые ограничения в отношении Китая и мобилизуют своих союзников в войне за чипы, а NVIDIA, Intel и AMD начали масштабные продажи GPU, не подлежащих экспортному контролю.
- Генеративный ИИ спасает мир венчурных инвестиций: на фоне падения оценки обычных ИТ-проектов ИИ-стартапы, ориентированные на генеративные приложения (создающие изображения, видео, текст и программный код), привлекли более $18 млрд от венчурных и корпоративных инвесторов.
- Проблема безопасности вышла на первый план, побудив правительства и регулирующие органы по всему миру начать разработку соответствующих мер. Однако за этой бурной деятельностью скрываются глубокие разногласия в ИИ-сообществе и отсутствие заметного прогресса, поскольку правительства разных стран придерживаются противоречивых подходов.
- Другая серьезная проблема – отсутствие надежной системы оценки современных LLM: корректность результатов работы моделей оставляет желать лучшего, а интуитивную оценку нельзя назвать объективной.
|
Исследователи Швейцарской высшей технической школы Цюриха обнаружили, что LLM, подобные ChatGPT, могут точно угадывать множество личных деталей о человеке по совершенно невинной переписке с чат-ботом. Такие подробности ни в коем случае не должны попадать в руки злоумышленников (или таргетологов). Платформа StackOverflow уволила 28% сотрудников – начинающие айтишники теперь предпочитают задавать вопросы вежливому ChatGPT. ИИ-апгрейд LinkedIn тоже повлек за собой увольнение персонала – там сократили 668 человек. 21-летний студент Люк Фарритор выиграл $40 000 за расшифровку римского свитка с помощью ИИ. До этого прочитать свиток не могли – он был обуглен во время извержения Везувия в октябре 79 г.н.э. Призеры, занявшие второе и третье места, получили по $10 000. |
В конкурсе Vesuvius Challenge можно выиграть до $1 000 000 |
Известная писательница Маргарет Этвуд, книги которой незаконно использовали в обучении множества LLM, написала рецензию на рассказ и стихотворение, сгенерированные ChatGPT в подражание ее стилю. Спойлер: Этвуд согласна, что чат-бот пишет стишки не хуже условного дядюшки Роджера, но профессиональные авторы пока еще могут спать спокойно. Microsoft заплатит от $2 000 до $15 000 за найденные в Bing AI баги. А вот за обнаружение ошибок в Bard AI вряд ли будут платить – багов там столько, что даже сотрудники Google сомневаются в полезности чат-бота. Исследователи Северо-Западного университета представили революционное наноэлектронное устройство, которое позволяет в 100 раз повысить скорость работы ИИ при выполнении задач классификации в реальном времени. Устройство не нуждается в энергоемкой облачной инфраструктуре и способно молниеносно обрабатывать данные в носимых устройствах для медицинской диагностики. Ранее исследователи Лаборатории Линкольна (MIT) сообщили о разработке технологии обучения моделей, которая использует на 80% меньше электроэнергии, чем обычные методы. |
Создатель фреймворка LangChain, Харрисон Чейз, за 1 час научит, как сделать чат-бота на LangChain для работы с вашими собственными данными и документами. Llemma – опенсорсная модель на базе Code Llama* для решения математических задач. Есть варианты на 7 млрд и на 34 млрд параметров. Статья о процессе обучения, результатах тестирования и сравнения Llemma с другими математическими моделями – здесь. Simulatrex – фреймворк для симуляции социальных и рыночных сценариев: - Позволяет создавать симуляции с несколькими агентами, каждый из которых имеет свою личность, начальные условия и когнитивную модель.
- Поддерживает как статические, так и динамические среды – это позволяет реализовать широкий спектр сценариев моделирования.
- Имитационные модели Simulatrex – событийно-ориентированные, имеют встроенный механизм обработки событий и обновления среды.
- Есть механизм оценки, позволяющий оценивать результаты работы агентов на основе заданных целей и метрик.
- Предусмотрена интеграция с языковыми моделями – это позволяет агентам генерировать человекоподобные реакции.
Zephyr 7B Alpha – модель на базе Mistral-7B-v0.1, настроенная и дополнительно обученная для выполнения роли личного помощника. Генерирует ответы в стиле ChatGPT, отлично понимает русский язык, и превосходит показатели Llama-2 70B* по MT Benchmark. |
Исследователи обнаружили, что LLM линейно отделяют истинные утверждения от ложных – то есть во внутренней структуре модели существует некий «вектор истины», разделяющий истину и ложь. Исследователи протестировали открытие на разных типах данных и показали, что «зонды» (алгоритмы), обученные выделять «вектор истины», могут обобщать новые и совершенно неизвестные модели данные. Это говорит о том, что они выделяют именно общее понятие истины, а не просто коррелирующие с ней признаки, и этот факт открывает пути к созданию более надежных систем ИИ, менее склонных к галлюцинациям и генерации ложной информации. |
Так LLM представляют истинные и ложные сведения |
Статья «Большие языковые модели для чайников» интересно и понятно рассказывает о принципах работы и перспективах применения LLM: - LLM представляют слова в виде векторов чисел, называемых векторами слов. Каждое слово представлено уникальным вектором из многих чисел (например, 12288 чисел для GPT-3).
- Слова группируются вместе в «пространстве слов» на основе семантической близости. Похожие слова находятся ближе друг к другу.
- LLM обучаются на огромных текстовых данных (GPT-3 обучали на 500 миллиардах слов). Это позволяет им понимать контекст и связи между словами.
- LLM используют архитектуру трансформеров – многослойную нейронную сеть. Каждый слой анализирует входные данные и передает результат дальше.
- Первые слои анализируют синтаксис, последние – семантику и контекст всего текста. Большее количество слоев и размер векторов слов позволяют LLM лучше понимать сложные языковые конструкции и нюансы.
- LLM могут решать задачи, которые вызывают затруднения у людей, например, вопросы, связанные с теорией разума – GPT-4 правильно отвечает на 95% таких заданий.
- Приложения LLM все еще находятся на ранней стадии. Основные направления развития – вертикализация, автоматизация/ускорение человеческого труда и решение невозможных ранее задач.
|
Разработчики Parcha рассказали о процессе разработки ИИ-агентов для автоматизации бизнес-процессов. Такие агенты могут выполнять все рутинные задачи в области комплаенса и операционной деятельности. Основные компоненты агента: - Спецификации и директивы (роль, возможности, инструменты).
- Блокнот для хранения промежуточных результатов.
- Стандартные операционные процедуры (СОП), по которым агент действует.
- Инструкции для финальной оценки и принятия решения.
Изначально компания использовала простой подход с агентами на базе Langchain и веб-сокетами для связи. Этот подход вызвал серьезные проблемы при масштабировании, и разработчики поделились усовершенствованиями, которые позволяют сделать агентов более надежными и производительными. |
Cosine – ИИ-ассистент разработчика: отвечает на любые вопросы по кодовой базе, дает советы, предлагает решения и генерирует идеи. |
Cosine с успехом заменяет GitHub Copilot |
Calligrapher – генерирует реалистичный рукописный текст. Русский язык пока не поддерживается. SheetAI – ИИ на основе GPT-3, который работает прямо в Google Sheets и делает там все, что только можно ожидать от Excel-ассистента и модели, генерирующей текстовые данные. Другой похожий инструмент – AI in Sheets. |
AI для Google Sheets – обрабатывает данные и пишет стишки |
YTClass – совмещает образовательные ресурсы YouTube с мощью ИИ: ассистент поможет пройти любой курс и ответит на все вопросы. |
ИИ выступает в качестве персонального наставника |
Еще не Midjourney, зато бесплатно |
Humata – позволяет задавать вопросы по содержимому PDF-файлов, делает суммаризацию объемных документов. Riffusion – пишет и исполняет песни по текстовым промптам, вот один из примеров. Masterpiece X – генерирует 3D-модели по текстовому описанию. Отлично подходит для прототипирования в геймдеве. |
Gemelo – клонирует голос и внешность для создания ИИ-двойника, который может, например, заниматься техподдержкой проекта и общаться с подписчиками. Hotshot – генерирует GIFки по текстовым промптам. |
Генератор GIFок работает на Stable Diffusion |
Clio – бот для генерации изображений в Телеграме и WhatsApp*. |
Тоже не Midjourney, зато в Телеграме |
Напоследок – подборка из 10 незаурядных роботов, которые могут напугать своими способностями. Увидимся через неделю! |
На этом все, увидимся через неделю! |
* Организация Meta и ее продукты Llama 2, Code Llama и WhatsApp признаны экстремистскими и запрещены на территории РФ. |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|