В попытке опередить злоумышленников исследователи Корнелльского университета сами разработали первый вирус, заражающий ИИ-модели. Вирус получил имя Morris II – в честь Морриса, который стал первым сетевым вирусом в истории, поразившим интернет (в далеком 1988 году). Anthropic выпустила iOS-приложение для работы с Claude 3, и запустила новый тарифный план для команд – который уступает аналогичному плану OpenAI во всем, кроме щедрого объема контекста: Claude 3 может переварить 500 страниц данных, а ChatGPT – не более 50. Чат с Gemini в браузере Chrome теперь можно начать, если ввести в адресной строке @gemini и промпт после пробела. А еще Google адаптировала Gemini к работе на старых версиях Android. Бизнес-ассистент Amazon Q, созданный как альтернатива Microsoft Copilot, теперь доступен широкой публике. Есть плагины для VS Code и семейства IDEs от JetBrains. |
Исследователи Университета Огайо разработали модель CURE, способную точно предсказывать результаты клинических испытаний новых лекарств. По оценке разработчиков, возможности CURE на 7-8% превосходят способности любых других существующих ИИ-моделей. Семейство ИИ-моделей Google пополнилось медицинской линейкой – Med-Gemini-S 1.0, Med-Gemini-M 1.0, Med-Gemini-L 1.0 и Med-Gemini-M 1.5, которые, по утверждению разработчиков, значительно превосходят GPT-4 по медицинским тестам. |
Наконец-то Gemini удалось обогнать GPT-4 |
Meta* тоже выпустила медицинскую модель – Meditron,* которая, в свою очередь, превзошла все опенсорсные модели по тестам MedQA и MedMCQA. AI-аватары Synthesia теперь потрясающе реалистично имитируют любые эмоции и неотличимы от живых людей. |
ИИ-технологии окончательно стали новой нефтью: Саудовская Аравия запускает инвестиционный фонд объемом $100 млрд и планирует потратить еще $40 млрд на прямые инвестиции в перспективные ИИ-стартапы. Apple переманила множество ИИ-экспертов из Google и открыла в Цюрихе секретную лабораторию, исследования которой связаны с созданием продвинутых моделей, способных отвечать на текстовые и видеозапросы. Возможно, эти продвинутые модели нужны для тех самых домашних роботов, созданием которых недавно занялась компания. Midjourney теперь поддерживает выбор случайного стиля – для этого нужно добавить к промпту параметр --sref random. |
Профессионалы из различных областей – кино, анимация, реклама – протестировали Sora, Runway и Pika, после чего поделились результатами и мнениями. Общий вердикт: ни одна из моделей еще не может использоваться для создания контента без финального редактирования человеком. Лучшие результаты, наиболее применимые для создания реального видеоконтента, показала Sora, а Runway и Pika заняли второе и третье места. ByteDance выпустила опенсорсную модель Hyper SD на базе Stable Diffusion для генерации гиперреалистичных изображений. Демо-версия работает на Hugging Face. |
🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста» |
Ajelix – многофункциональный ассистент для работы с Excel и Google Docs: пишет формулы, макросы и VBA-скрипты, переводит контент, генерирует шаблоны и визуализирует данные. AI Comic Generator – генерирует комиксы и графические новеллы по вашим историям. |
Генератор комиксов поддерживает несколько различных стилей |
Braudit – личный карьерный консультант. GeoSpy – определяет место, где было сделано фото. BizPlanner.AI – пишет бизнес-планы для любых проектов. Watermelon – автоматизирует процесс создания кастомных GPT-ботов. HiTalk – личный преподаватель иностранного языка. Lex – альтернатива Word и Google Docs со множеством AI-инструментов для написания и редактирования текстов. Похожие инструменты – DeepL Write и WordTune. |
Creatify – генератор коротких рекламных клипов. |
Sana AI – многофункциональный личный ассистент: делает любые отчеты, презентации и заметки об обсуждениях на совещаниях, анализирует документы, автоматизирует рутинные задачи, выполняет нужные действия в интегрированных бизнес-приложениях. Рейтинг из 8 лучших ИИ-инструментов для работы с PDF. Призовые места в подборке достались Adobe Acrobat, Wondershare PDFelement и Unriddle. Последующие строчки рейтинга заняли Myreader, ZenoChat by TextCortex, UPDF, Perplexity AI и LightPDF. |
Все инструменты из рейтинга поддерживают чат с PDF-документами и суммаризацию |
🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале «Библиотека нейрозвука» |
Продвинутые методы извлечения в RAG |
RAG – это подход к созданию систем вопросно-ответного взаимодействия, который состоит из трех компонентов: - Извлечение – извлечение релевантных документов/фрагментов по запросу пользователя.
- Обогащение – создание контекста для языковой модели на базе извлеченных документов.
- Генерация – генерация точного, релевантного ответа на основе промпта и контекста, извлеченного из документов.
Эта статья подробно рассказывает о различных методах извлечения релевантных документов: Наивное извлечение Это простой базовый подход. Запрос пользователя преобразуется в векторное представление с помощью той же модели, что использовалась для создания векторной базы документов. Затем вычисляется близость (косинусная, евклидова и т. д.) между вектором запроса и векторами документов, и возвращаются K наиболее близких документов. Извлечение из родительских документов В этом методе большие документы разбиваются на мелкие дочерние фрагменты. В векторную базу записываются только дочерние фрагменты, а исходные родительские документы сохраняются в памяти. При поиске сначала извлекаются ближайшие к запросу дочерние фрагменты, а затем возвращаются родительские документы, которым эти фрагменты принадлежат. Это позволяет повысить точность, работая с мелкими фрагментами, но при этом сохранить контекст исходных документов. Извлечение из отфильтрованных данных Этот метод, вероятно, самый оптимальный на сегодняшний день: он фильтрует документы по метаданным (дата, рейтинг, категория и т. п.) перед тем, как искать близкие к запросу документы. Для определения, какие метаданные использовать при фильтрации, применяется языковая модель. Это позволяет значительно сократить объем вычислений. Извлечение с контекстным сжатием Сначала извлекается некоторое количество наиболее релевантных документов базовым методом (например, с помощью наивного способа). Затем с помощью кросс-энкодерной модели (более точной, но ресурсоемкой) пересчитывается релевантность этих документов и отбираются самые подходящие. Таким образом, совмещаются быстродействие би-энкодера и точность кросс-энкодера. |
Продвинутые схемы извлечения контекста |
4 основные ошибки при работе с векторными базами |
Векторная база данных – это специализированное решение для хранения, индексации и эффективного поиска векторов (высокоразмерных численных представлений данных – изображений, аудио, видео, текста и т. д). Векторный поиск позволяет извлекать информацию на основе семантической схожести, и поэтому векторные базы используются во всех видах ИИ – системах рекомендаций, генеративном ИИ, распознавании изображений и т. д. Часто ВБ используются неэффективно: автор этой статьи рассказал, в чем именно заключаются типичные ошибки разработчиков и к каким последствиям они могут привести: - Выбор неправильной стратегии индексирования приводит к снижению производительности поиска, увеличению задержек, повышению операционных расходов, проблемам с масштабируемостью, снижению точности поиска и релевантности результатов.
- Недооценка требований к масштабируемости приводит к ограничениям, снижению производительности, увеличению времени отклика запросов и сбоям системы.
- Игнорирование метаданных и операционных данных приводит к упущенным возможностям по оптимизации производительности запросов, выявлению проблем и сбоев.
- Неэффективное построение запросов значительно увеличивает время отклика и нагрузку на базу данных, а также приводит к нерелевантным результатам поиска.
Для каждой ошибки в статье очень подробно разъясняются ее причины и предлагаются детальные стратегии решения/избегания проблемы. На этом все, до встречи через неделю! * Meditron принадлежит компании Meta, деятельность которой признана экстремистской и запрещена на территории РФ. |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|