Самые дешевые авиабилеты: О чем мечтает ИИ

суббота, 18 мая 2024 г.

О чем мечтает ИИ

📰 Новости

Unitree представила потрясающего робота-гуманоида G1. Он отличается поразительной подвижностью, компактностью, точностью движений, интеллектом и доступной – по сравнению с конкурентами – ценой $16000.

Stability AI столкнулась с серьезным финансовым кризисом и приступила к поискам покупателя.

ИИ-поисковик You теперь можно использовать в Телеграме.

Напряженная AI-гонка не позволила Microsoft выполнить план по снижению выбросов CO2: из-за упора на разработку ИИ-продуктов и радикального расширения дата-центров уровень выбросов компании увеличился на 30% по сравнению с 2020 годом, а уровень потребления электроэнергии превысил средние показатели небольших европейских стран. Этот факт подтверждает мнение Марка Цукерберга, высказанное на этой неделе: главным ступором прогресса в разработке ИИ станет ограничение/недостаток электроэнергии, а не дефицит GPU, который уже, по сути, преодолен.

🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста»

Google объявила о создании AI-детектора, способного определять мошеннические звонки на Android, но вместо всеобщего восхищения вызвала острые подозрения в намерении прослушивать все разговоры в собственных целях.

Новая версия GPT-4o стала омнимодальной – работает с текстом, аудио, изображениями и видео. Распознание/генерация голоса происходят в ней нативно, налету, без промежуточной обработки текста. При этом модель работает в 2 раза быстрее, обходится на 50% дешевле и ленится меньше, чем GPT-4, к тому же скоро будет доступна для всеобщего бесплатного использования. На фоне этой новости Anthropic пригласила на работу Майка Кригера, сооснователя Instagram* и Artifact, для всестороннего продвижения Claude в широкие массы.

Google значительно расширила возможности SynthID, инструмента для скрытой маркировки ИИ-контента: теперь с его помощью можно помечать любые сгенерированные материалы – текст, видео и аудио. Новая функциональность также была добавлена в Project IDX, браузерную IDE на базе Gemini.

Аналитики Deloitte опросили 22800 миллениалов и зумеров в 44 странах и выяснили, кто использует AI-инструменты постоянно, а кто – редко. Постоянных пользователей GenAI среди респондентов – около 25%. 80% опрошенных в этой категории отметили, что ИИ помог им значительно снизить рабочую нагрузку и наконец-то наладить баланс между работой и личной жизнью. Но по мере повышения уровня ИИ-автоматизации у постоянных пользователей неуклонно возрастают опасения – уже 71% респондентов считает, что GenAI в итоге сможет заменить их полностью.

Илья Суцкевер, сооснователь и ведущий научный сотрудник OpenAI, оставил AGI в надежных руках Сэма Альтмана и Миры Мурати, и покинул компанию после почти 10 лет работы – по его собственным словам, ради личного проекта, подробности о котором станут известны позже.

🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале

«Библиотека нейрозвука»

🛠️ Инструменты

Gamma – ИИ-приложение для создания продвинутых презентаций. Похожие инструменты – Beautiful и SlidesAI.

Slido – плагин для добавления опросов и голосований в презентации Google Slides. Аналогичные плагины – Poll Everywhere, Nearpod и Pear Deck. Вот пример презентации для студентов, сделанной с помощью Pear Deck.

Neptyne Sheet Bot – находит ошибки в формулах электронных таблиц, работает с загруженными файлами и с Google Sheets. Еще один отличный ИИ-ассистент для работы с таблицами – Luminal.

Clipdrop – генератор и выдающийся редактор/улучшитель изображений на базе Stable Diffusion XL.

VideoToPage – делает транскрипты и краткое содержание видео. Обрабатывает записи экрана, работает с файлами до 5 часов длиной. Короткие видеоклипы можно обрабатывать бесплатно.

ElevenLabs Reader – iOS приложение, читает любые документы (и веб-страницы) реалистичными голосами с полным соблюдением интонации и эмоций.

RightBlogger – автоматически пишет посты для блога.

Unreal Speech – добавляет возможность генерации реалистичного голоса в любые приложения.

CommenterAI – автоматически пишет комментарии на LinkedIn.

Chatter – генератор интерактивных, персональных подкастов. Использует онлайн-поиск в реальном времени.

Copyleaks – определяет плагиат и контент, сгенерированный ИИ. Аналогичный инструмент – Originality.

Glato AI – генерирует рекламные видео с участием ИИ-аватаров.

MaxAI – многофункциональный ассистент, делегирующий исполнение всевозможных задач популярным ИИ-моделям. Работает в качестве плагина для Chrome, базовые функции можно использовать бесплатно.

Quizard AI – ИИ-приложение для студентов и школьников, помогает делать домашние задания, готовиться к экзаменам и тестам. Похожее приложение – ProfessorAI.

Glitter AI – превращает ваш голос и клики мышью в иллюстрированные пошаговые гайды и туториалы.

Voicenotes – конвертирует голосовые записи в заметки, посты для блога, списки дел и так далее. Помнит все ваши мысли – и может провести мозговой штурм для поиска новых идей.

HIX AI – многофункциональный помощник для писателей, журналистов, копирайтеров и блогеров.

🤖🎨 Все самое полезное про нейросети для генерации изображений вы найдете на нашем телеграм-канале «Библиотека нейрокартинок»

❓Как это работает

Галлюцинации, ошибки и «мечты»

ИИ-модели, как известно, иногда выдают ошибочные, странные или лживые ответы, которые совокупно называют галлюцинациями. Почему они это делают, и чем ошибки отличаются от галлюцинаций и «мечтаний» – рассказывает Колин Фрейзер.

Автор проводит различие между классическими ошибками в машинном обучении, когда модель неправильно классифицирует уже существующий объект (например, распознает 7 как 9), и галлюцинациями языковых моделей, которые генерируют совершенно новый текст, не имеющий отношения к исходным данным. Он показывает, что весь выходной текст таких моделей является, по сути, галлюцинацией или «мечтой», а попытки количественно оценить частоту галлюцинаций с помощью общедоступных бенчмарков сомнительны:

Нет согласованного определения того, что считается галлюцинацией.
Бенчмарки вынуждены использовать другие языковые модели для оценки выходных данных, что вносит систематическую ошибку.
Тестовые наборы данных бенчмарков не отражают реальные запросы пользователей.

Вот что следует делать вместо использования бенчмарков:

Определить конкретную цель использования языковой модели (например, чат-бот для обслуживания клиентов).
Составить репрезентативный набор данных – тексты, подобные реальным запросам.
Вручную пометить, какие выходные данные приемлемы/неприемлемы для этой цели.
На основе этого оценить вероятность генерации приемлемых/неприемлемых ответов.

Автор скептически относится к идее полного устранения галлюцинаций: выходной текст всегда будет в какой-то степени выдуманным, поскольку модель пытается сгенерировать нечто, чего не существовало в исходных данных. Возможно, следует принять галлюцинации как неизбежное свойство генеративного ИИ и просто сосредоточиться на тщательной оценке приемлемости генерируемого контента для конкретных применений.

Случайный шум наводит ИИ на такие мечты

Секреты Phi-3

Phi-3 – семейство миниатюрных и при этом высокопроизводительных языковых моделей, которые могут работать локально на смартфоне. Как разработчикам удалось создать модели, сочетающие серьезные возможности с таким компактным размером – рассказано в этом лонгриде:

Ключевой фактор высокой производительности семейства моделей Phi-3 – использование качественных данных для обучения. Авторы применили образовательную парадигму для отбора веб-данных высокого качества.
Была использована оптимальная смесь данных общих знаний и специализированных навыков для обучения каждой модели в соответствии с ее размером.
После обучения применялись методы файн-тюнинга и прямой оптимизации предпочтений для улучшения производительности.
Квантование весов модели до 4 бит позволило значительно уменьшить размер модели для работы на iPhone.
Сочетание Phi-3 с поисковой системой может значительно расширить ее возможности по запоминанию и использованию обширных знаний.

🤖🦾 Все самое полезное про роботов, беспилотники, автопилоты и интернет вещей вы найдете на нашем телеграм-канале

«Библиотека робототехники и беспилотников»

🔧 Сделай сам

Как использовать метаданные в качестве фильтров

Один из способов повышения релевантности извлекаемой информации в RAG-приложениях – использование метаданных из пользовательских запросов. В этом туториале показаны преимущества применения метаданных для повышения релевантности, точности и эффективности извлечения контекстной информации, а также продемонстрирована практическая реализация метода:

Представлен пошаговый подход по созданию компонента QueryMetadataExtractor, использующего языковую модель для извлечения метаданных из пользовательского запроса в формате, пригодном для фильтрации.
Показана интеграция QueryMetadataExtractor в пайплайн Haystack вместе с компонентом извлечения для практического применения фильтров.

Как сделать приложение для анализа и визуализации новостей

Уилсон Лин рассказал о пет-проекте Hackerverse, с помощью которого он проанализировал 40 млн постов и комментариев на Hacker News, популярном новостном сайте о технологиях и стартапах. Автор и сделал удобную визуальную карту для перехода по темам, а также реализовал поиск, который выдает куда более релевантные результаты, чем тот, что работает на сайте. Среди других дополнительных фич – виртуальные подсообщества по интересам, анализ популярности и настроений по темам и языкам программирования. Словом, это очень интересный проект для любого дата-сайентиста. Код и данные доступны на GitHub, а готовое приложение – здесь.

Интерактивная карта Hackerverse позволяет масштабировать и изучать контент с помощью поиска по семантической близости

На этом все, до встречи через неделю!

* Instagram принадлежит Meta – организации, деятельность которой признана экстремистской и запрещена на территории РФ.

***

Если хочешь попробовать себя в ML, приходи на наш новый курс «Базовые модели ML и приложения» – всему научим.

Автор рассылки: Наталья Кайда

📖 Читать нас

🎓 Учиться у нас

Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.

суббота, 18 мая 2024 г.

О чем мечтает ИИ

суббота, 18 мая 2024 г.