Очередная ИИ-разработка Google шокировала пользователей и обозревателей: поисковая фича AI Overviews рекомендует есть небольшие камни, использовать нетоксичный клей для закрепления сыра на пицце, тренироваться 8 дней в неделю, и выкуривать 2-3 сигареты в день во время беременности. Факап вызвал даже больший резонанс, чем предыдущий ИИ-провал Google, связанный с неадекватным расовым разнообразием в генераторе изображений Gemini. Энтузиасты выяснили, что причиной нескольких бредовых ответов могут быть сатирические комментарии на Reddit и пранки из Onion, которые попали в обучающие данные. Но что именно заставляет AI Overviews давать правдоподобно выглядящие, и при этом лживые и опасные ответы во всех остальных случаях – остается загадкой. |
AI Overviews: Ешьте, люди, гравий, прячьте камни в мороженом и арахисовом масле |
🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста» |
Scale AI представила аналог мишленовского рейтинга для ИИ-моделей. В YouTube Music теперь можно найти песню, если напеть/просвистеть/наиграть нужный мотив. Исследователи MIT и MIT-IBM Watson AI Lab разработали метод, который позволяет научить модель обнаруживать определенные действия в длинных видео. OpenAI открыла доступ к кастомным чат-ботам в GPT Store для бесплатных аккаунтов – вероятно, в ответ на иск Илона Маска, который утверждает, что компания нарушила свое изначальное обещание работать на благо всего человечества. Кроме того, компания учредила новый комитет ИИ-безопасности и приступила к обучению новой версии GPT, которая приблизит момент создания AGI. Илон Маск поссорился с Яном Лекуном – руководителем ИИ-разработки в Meta*. Лекун (легендарная личность в ИИ-сфере, создатель концепции сверточных нейросетей) раскритиковал безответственный подход Маска к управлению ИИ-стартапом xAI, а тот поставил под сомнение последние научные достижения оппонента. |
Сооснователь Hugging Face поддержал Лекуна и подколол Маска |
Французский стартап Mistral (оцененный в $6 млрд и пользующийся поддержкой Microsoft) выпустил опенсорсную модель, предназначенную для генерации кода – Codestral с 22 млрд параметров. Модель обучили на 80+ языках программирования, включая самые востребованные – Python, Java, C++ и JavaScript, она может генерировать код, тесты и ответы по кодовой базе. |
Codestral значительно опережает аналогичные опенсорсные модели |
Евросоюз учредил AI Office, укомплектованный 140 экспертами из различных областей. Организация будет заниматься всесторонней работой по обеспечению безопасности ИИ и робототехники – в сотрудничестве со множеством ИИ-компаний, исследовательских учреждений и госструктур. Microsoft запустила чат-бот Copilot в Телеграме. Пока что бот работает только с текстовыми промптами, и не во всех регионах (которые определяются по номеру телефона). |
В отличие от Copilot в Bing, боту небезразличен регион номера |
Международная аудит-консалтинговая корпорация PwC стала крупнейшим пользователем ChatGPT Enterprise – более 267 000 сотрудников получили доступ к самым продвинутым функциям чат-бота – и первым реселлером OpenAI. По словам представителей корпорации, еще до заключения сделки сотрудники PwC успешно использовали кастомные GPTs для проверки налоговых деклараций, разработки ПО, мониторинга данных, подготовки отчетов и других повседневных задач. Хелен Тонер, бывший член совета директоров OpenAI, рассказала о настоящей причине непродолжительного увольнения Сэма Альтмана в прошлом году. По ее словам, Альтман склонен к манипуляциям, способствовал зарождению токсичной атмосферы в компании и скрывал детали разработки от совета директоров – о запуске ChatGPT они узнали из Твиттера. Почему же сотрудники требовали его возвращения? Потому что боялись – сначала того, что OpenAI без него не выжить, а потом того, что их уволят, если они не продемонстрируют поддержку. Ян Лейке, покинувший OpenAI вместе с Ильей Суцкевером, получил приглашение на работу от Anthropic и возглавил команду безопасности главного конкурента ChatGPT – Claude. Британское управление информационной безопасности расследует Recall, подозрительную новую фичу Microsoft, которая отслеживает все действия пользователя. |
🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале «Библиотека нейрозвука» |
Подборка из 10 лучших инструментов для суммаризации PDF – ChatwithPDF, AskYourPDF, Quillbot Summarizer, IntelliPPT, Scholarcy и так далее. Aragon – используя селфи любого качества, генерирует реалистичные профессиональные фотографии. | Softr – превращает таблицы и базы данных в десктопные и мобильные приложения для внутренней аналитики и клиентского сервиса. Blend AI – предоставляет доступ ко всем популярным ИИ-моделям и оптимизирует промпты для наилучшего результата. |
Blend AI дополнит промпт, нарисует по нему картинку и сделает видео |
PDF Flex – бесплатно делает суммаризацию файлов до 10 Мб. Pixu – генерирует профессиональные фото в любом стиле и в нужной локации. |
Flow Tunes – генератор фоновой музыки, которая не будет отвлекать от работы. К треку можно добавить всевозможные «звуки природы». Pyoneer – конвертирует данные и формулы Excel-таблиц в Python-скрипты. Doly – iOS приложение для 3D-сканирования реальных объектов и создания e-commerce видео. Visualizee – выполняет гиперреалистичный 3D-рендеринг в любом нужном стиле. |
Visualizee заменит 3D-визуализатора |
Viva – платформа для генерации и профессионального редактирования видео. Похожие сервисы – Atlabs и Pictory. |
Afforai – ассистент для проведения исследований: может извлекать нужные данные из тысяч документов. CrossQuery – Chrome расширение для поиска и суммаризации дискуссий на Reddit. AudioWaveAI – естественная озвучка текста, сопоставимая с качеством профессионально начитанной аудиокниги. |
Мультиагентное приложение для автоматического ведения блога |
Мультиагентный подход позволяет решать многокомпонентные задачи, требующие разнообразных знаний и навыков: агенты делятся информацией о ходе выполнения задачи и экспертными знаниями, что повышает общую эффективность системы. В этой статье шаг за шагом показан процесс создания мультиагентной системы для написания статей. Приложение использует CrewAI и Ollama: - Ollama – опенсорсный инструмент, который позволяет использовать LLM на компьютерах под управлением MacOS, Linux или Windows. Ollama предоставляет простой доступ к библиотеке предобученных LLM моделей, которые можно загрузить одной командой, и обеспечивает конфиденциальность, поскольку вся обработка данных происходит локально на вашем компьютере, без необходимости подключения к облачным сервисам. Кроме того, Ollama легко интегрируется с различными инструментами и библиотеками для создания ИИ-приложений.
- CrewAI – фреймворк для организации командной работы множества ИИ-агентов, каждый из которых выполняет определенную роль. Главные концепции CrewAI – агенты, задачи и команда:
- Агенты – отдельные ИИ-модули, способные выполнять задачи, принимать решения и взаимодействовать друг с другом. Они могут использовать различные инструменты, например, функции поиска или сложные API.
- Задачи – назначенные агентам цели и работа, которую они должны выполнить. В задачах может быть указано, какой агент должен ее выполнить и какие инструменты могут понадобиться.
- Команда – группа агентов с определенными ролями, которые совместно работают над достижением общей цели. Формирование команды включает в себя подбор агентов, распределение задач и установку последовательности их выполнения.
Автор подробно показывает: - Процесс настройки Ollama и подключения CrewAI к модели Llama 3* от Meta*.
- Создание и настройку трех агентов – для планирования контента, написания и редактирования блога. Определяются их роли, цели и контексты.
- Формирование команды, которой передаются задачи для выполнения в определенной последовательности.
- Получение результата работы команды агентов – готового пост для блога на заданную тему.
|
Новый способ создания графов знаний |
Разработчики LlamaIndex рассказали о новом способе представления данных – в виде графа свойств: - Узлы (вершины) графа могут иметь произвольные свойства в формате ключ-значение, а также метку (тип узла).
- Связи (ребра) между узлами также могут иметь метку (тип связи) и собственные свойства.
Такие графы свойств позволяют всесторонне описывать сущности, их свойства и связи между ними в рамках одной согласованной модели данных. Это делает их более гибкими и выразительными по сравнению с традиционными реляционными или триплетными представлениями. Основные преимущества графов свойств: Более выразительное представление сущностей - Позволяют присваивать метки (типы) узлам и связям в графе, а также дополнительные свойства/метаданные.
- Узлы могут представлять векторные эмбеддинги текста, а не только символьные сущности.
Гибридный поиск Можно одновременно использовать символьный поиск по ключевым словам, векторный поиск по близости эмбеддингов и поиск на основе структуры графа и связей между узлами.
Использование языка запросов графов Cypher Этот язык дает гибкие возможности для задания сложных шаблонов и навигации по графу при помощи декларативных запросов. Расширяемость - Предоставляются разные способы извлечения графа из данных – на основе схемы, неявный (подразумеваемые связи) и свободный.
- Можно комбинировать различные подходы для извлечения.
|
Визуализация графа свойств |
Как сделать GPT-модель с нуля за 10 часов |
Разработчица вдохновилась туториалом Андрея Карпаты, сделала собственную GPT-модель и пришла к выводу, что реализация такого захватывающего проекта – лучший способ провести выходные. |
И напоследок – база данных фильмов и сериалов, созданных с помощью ИИ. На этом все, вернемся через неделю! * Llama 3 принадлежит организации Meta, деятельность которой признана экстремистской и запрещена на территории РФ. |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|