Unitree представила потрясающего робота-гуманоида G1. Он отличается поразительной подвижностью, компактностью, точностью движений, интеллектом и доступной – по сравнению с конкурентами – ценой $16000. | Stability AI столкнулась с серьезным финансовым кризисом и приступила к поискам покупателя. ИИ-поисковик You теперь можно использовать в Телеграме. Напряженная AI-гонка не позволила Microsoft выполнить план по снижению выбросов CO2: из-за упора на разработку ИИ-продуктов и радикального расширения дата-центров уровень выбросов компании увеличился на 30% по сравнению с 2020 годом, а уровень потребления электроэнергии превысил средние показатели небольших европейских стран. Этот факт подтверждает мнение Марка Цукерберга, высказанное на этой неделе: главным ступором прогресса в разработке ИИ станет ограничение/недостаток электроэнергии, а не дефицит GPU, который уже, по сути, преодолен. |
🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста» |
Google объявила о создании AI-детектора, способного определять мошеннические звонки на Android, но вместо всеобщего восхищения вызвала острые подозрения в намерении прослушивать все разговоры в собственных целях. Новая версия GPT-4o стала омнимодальной – работает с текстом, аудио, изображениями и видео. Распознание/генерация голоса происходят в ней нативно, налету, без промежуточной обработки текста. При этом модель работает в 2 раза быстрее, обходится на 50% дешевле и ленится меньше, чем GPT-4, к тому же скоро будет доступна для всеобщего бесплатного использования. На фоне этой новости Anthropic пригласила на работу Майка Кригера, сооснователя Instagram* и Artifact, для всестороннего продвижения Claude в широкие массы. |
Google значительно расширила возможности SynthID, инструмента для скрытой маркировки ИИ-контента: теперь с его помощью можно помечать любые сгенерированные материалы – текст, видео и аудио. Новая функциональность также была добавлена в Project IDX, браузерную IDE на базе Gemini. Аналитики Deloitte опросили 22800 миллениалов и зумеров в 44 странах и выяснили, кто использует AI-инструменты постоянно, а кто – редко. Постоянных пользователей GenAI среди респондентов – около 25%. 80% опрошенных в этой категории отметили, что ИИ помог им значительно снизить рабочую нагрузку и наконец-то наладить баланс между работой и личной жизнью. Но по мере повышения уровня ИИ-автоматизации у постоянных пользователей неуклонно возрастают опасения – уже 71% респондентов считает, что GenAI в итоге сможет заменить их полностью. Илья Суцкевер, сооснователь и ведущий научный сотрудник OpenAI, оставил AGI в надежных руках Сэма Альтмана и Миры Мурати, и покинул компанию после почти 10 лет работы – по его собственным словам, ради личного проекта, подробности о котором станут известны позже. |
🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале «Библиотека нейрозвука» |
Neptyne Sheet Bot – находит ошибки в формулах электронных таблиц, работает с загруженными файлами и с Google Sheets. Еще один отличный ИИ-ассистент для работы с таблицами – Luminal. Clipdrop – генератор и выдающийся редактор/улучшитель изображений на базе Stable Diffusion XL. |
VideoToPage – делает транскрипты и краткое содержание видео. Обрабатывает записи экрана, работает с файлами до 5 часов длиной. Короткие видеоклипы можно обрабатывать бесплатно. ElevenLabs Reader – iOS приложение, читает любые документы (и веб-страницы) реалистичными голосами с полным соблюдением интонации и эмоций. RightBlogger – автоматически пишет посты для блога. Unreal Speech – добавляет возможность генерации реалистичного голоса в любые приложения. CommenterAI – автоматически пишет комментарии на LinkedIn. Chatter – генератор интерактивных, персональных подкастов. Использует онлайн-поиск в реальном времени. Copyleaks – определяет плагиат и контент, сгенерированный ИИ. Аналогичный инструмент – Originality. Glato AI – генерирует рекламные видео с участием ИИ-аватаров. |
MaxAI – многофункциональный ассистент, делегирующий исполнение всевозможных задач популярным ИИ-моделям. Работает в качестве плагина для Chrome, базовые функции можно использовать бесплатно. Quizard AI – ИИ-приложение для студентов и школьников, помогает делать домашние задания, готовиться к экзаменам и тестам. Похожее приложение – ProfessorAI. Glitter AI – превращает ваш голос и клики мышью в иллюстрированные пошаговые гайды и туториалы. |
Voicenotes – конвертирует голосовые записи в заметки, посты для блога, списки дел и так далее. Помнит все ваши мысли – и может провести мозговой штурм для поиска новых идей. HIX AI – многофункциональный помощник для писателей, журналистов, копирайтеров и блогеров. |
Галлюцинации, ошибки и «мечты» |
ИИ-модели, как известно, иногда выдают ошибочные, странные или лживые ответы, которые совокупно называют галлюцинациями. Почему они это делают, и чем ошибки отличаются от галлюцинаций и «мечтаний» – рассказывает Колин Фрейзер. Автор проводит различие между классическими ошибками в машинном обучении, когда модель неправильно классифицирует уже существующий объект (например, распознает 7 как 9), и галлюцинациями языковых моделей, которые генерируют совершенно новый текст, не имеющий отношения к исходным данным. Он показывает, что весь выходной текст таких моделей является, по сути, галлюцинацией или «мечтой», а попытки количественно оценить частоту галлюцинаций с помощью общедоступных бенчмарков сомнительны: - Нет согласованного определения того, что считается галлюцинацией.
- Бенчмарки вынуждены использовать другие языковые модели для оценки выходных данных, что вносит систематическую ошибку.
- Тестовые наборы данных бенчмарков не отражают реальные запросы пользователей.
Вот что следует делать вместо использования бенчмарков: - Определить конкретную цель использования языковой модели (например, чат-бот для обслуживания клиентов).
- Составить репрезентативный набор данных – тексты, подобные реальным запросам.
- Вручную пометить, какие выходные данные приемлемы/неприемлемы для этой цели.
- На основе этого оценить вероятность генерации приемлемых/неприемлемых ответов.
Автор скептически относится к идее полного устранения галлюцинаций: выходной текст всегда будет в какой-то степени выдуманным, поскольку модель пытается сгенерировать нечто, чего не существовало в исходных данных. Возможно, следует принять галлюцинации как неизбежное свойство генеративного ИИ и просто сосредоточиться на тщательной оценке приемлемости генерируемого контента для конкретных применений. |
Phi-3 – семейство миниатюрных и при этом высокопроизводительных языковых моделей, которые могут работать локально на смартфоне. Как разработчикам удалось создать модели, сочетающие серьезные возможности с таким компактным размером – рассказано в этом лонгриде: - Ключевой фактор высокой производительности семейства моделей Phi-3 – использование качественных данных для обучения. Авторы применили образовательную парадигму для отбора веб-данных высокого качества.
- Была использована оптимальная смесь данных общих знаний и специализированных навыков для обучения каждой модели в соответствии с ее размером.
- После обучения применялись методы файн-тюнинга и прямой оптимизации предпочтений для улучшения производительности.
- Квантование весов модели до 4 бит позволило значительно уменьшить размер модели для работы на iPhone.
- Сочетание Phi-3 с поисковой системой может значительно расширить ее возможности по запоминанию и использованию обширных знаний.
|
Как использовать метаданные в качестве фильтров |
Один из способов повышения релевантности извлекаемой информации в RAG-приложениях – использование метаданных из пользовательских запросов. В этом туториале показаны преимущества применения метаданных для повышения релевантности, точности и эффективности извлечения контекстной информации, а также продемонстрирована практическая реализация метода: - Представлен пошаговый подход по созданию компонента QueryMetadataExtractor, использующего языковую модель для извлечения метаданных из пользовательского запроса в формате, пригодном для фильтрации.
- Показана интеграция QueryMetadataExtractor в пайплайн Haystack вместе с компонентом извлечения для практического применения фильтров.
|
Как сделать приложение для анализа и визуализации новостей | Уилсон Лин рассказал о пет-проекте Hackerverse, с помощью которого он проанализировал 40 млн постов и комментариев на Hacker News, популярном новостном сайте о технологиях и стартапах. Автор и сделал удобную визуальную карту для перехода по темам, а также реализовал поиск, который выдает куда более релевантные результаты, чем тот, что работает на сайте. Среди других дополнительных фич – виртуальные подсообщества по интересам, анализ популярности и настроений по темам и языкам программирования. Словом, это очень интересный проект для любого дата-сайентиста. Код и данные доступны на GitHub, а готовое приложение – здесь. |
Интерактивная карта Hackerverse позволяет масштабировать и изучать контент с помощью поиска по семантической близости |
На этом все, до встречи через неделю! * Instagram принадлежит Meta – организации, деятельность которой признана экстремистской и запрещена на территории РФ. |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|