Хотя последнее мощное обновление ChatGPT-4 Turbo оставило потенциальных конкурентов OpenAI позади в пыли, Amazon не теряет надежды: компания работает над созданием модели Olympus, которая в два раза превосходит ChatGPT-4 по числу параметров. Google, не полагаясь на собственные силы, продолжает инвестировать в Anthropic (разработчика Claude) внушительные суммы ($400 млн в ближайшее время и до $2 млрд в перспективе) и технологии – чипы TPU v5e (лучшая на сегодняшний день альтернатива GPU от NVIDIA). YouTube продолжает внедрять новые AI-инструменты: на платформе запустили чат-бота, который отвечает на вопросы по содержанию видеороликов и рекомендует контент. При обсуждении образовательных видео чат-бот может сгенерировать тест для проверки знаний. Ложка дегтя – бот пока что доступен лишь для: - выборочных видео;
- американских Premium-подписчиков старше 18;
- только на английском;
- на Android.
На прошлой неделе Илон Маск в очередной раз заявил, что ИИ – это одна из самых серьезных угроз для человечества, а затем, логично, анонсировал собственное ИИ-детище – Grok. Впрочем, как и в случае со многими другими анонсами Илона, обещанного придется ждать долго, к тому же Grok будет доступен только премиум-подписчикам. OpenAI объявила о новых планах по монетизации чат-ботов, созданных на платформе ChatGPT: пользователи смогут обучать ботов на каких угодно данных, и предоставлять платный доступ к ним. Идея явно заимствована у Quora, которая в октябре обнародовала идею монетизации пользовательских ботов на базе своего ИИ-агрегатора Poe. Исследователи продолжают работать над разработкой ИИ, который способен понимать язык животных. Ранее уже неоднократно сообщалось о прогрессе в расшифровке и генерации голосовых сигналов птиц, китов, собак и других представителей животного мира. Ученые в ходе этой работы сталкиваются с двумя проблемами: - Животные общаются не только голосом, но и с помощью мимики, телодвижений и всевозможных ритуалов. Неделю назад опубликовали исследование, которое обнаружило, что кошки при общении с друг другом используют 276 различных мимических выражений, а в общении с человеком задействуют другую мимику.
- Этические соображения – сгенерированные ИИ звуки не должны использоваться для общения с животными до тех пор, пока исследователи на 100% не будут уверены в их значении. Что еще важнее, ИИ для генерации голосов животных не должен попадать в руки браконьеров и других злоумышленников.
|
DALL-E генерирует отличные стикеры |
Автор туториала описал, как сделать и интегрировать в свой сайт чат-бота, который отвечает на вопросы по LinkedIn-профилю. В проекте используются OpenAI API, Chroma DB, HuggingFace Spaces и Gradio. VideoCrafter – предоставляет Open Diffusion модели для: - генерации видео по текстовым промптам;
- преобразования статического изображения в видео.
|
DeepSeek Coder – пишет код на самых популярных языках программирования, включая Python, PHP, JavaScript, C# и C++. По результатам тестов DeepSeek Coder превосходит большинство других моделей. |
Сравнение DeepSeek Code с другими моделями |
Realtime BakLLaVA расскажет, что изображено на картинке |
OpenGPTs – опенсорсный интерфейс для эффективного использования любой из 60+ LLM. |
Рональд Кнейсель, эксперт по глубокому обучению и автор несколько книг об ИИ, рассказал о своей новой книге «Как работает искусственный интеллект» и разоблачил несколько популярных заблуждений: - Многие до сих пор считают, будто ИИ – это некие сложные программы, созданные путем тщательного продумывания рабочей логики, и ответы на запросы они находят среди готовых ответов. Однако на самом деле современные нейросетевые модели типа GPT работают совсем иначе: они хранят свои знания в сжатом формате, который пока выходит за пределы нашего понимания, также, как и механизм хранения знаний в человеческом мозге.
- ИИ – это нечто совершенно новое и непостижимое для людей. Кнейсель утверждает, что принципы работы ИИ вполне понятны и основаны на простых алгоритмах и архитектурах, известных десятилетиями.
- Для создания ИИ нужны сложнейшие математические методы. Если вы без труда осилили первый семестр матанализа и статистики в университете – сможете разобраться в математических алгоритмах для ИИ.
- С ИИ можно взаимодействовать так же просто, как с компьютерными программами – в реальности взаимодействие с ИИ больше похоже на общение с личностью, которая обладает своей точкой зрения, предрассудками, и может давать ошибочные ответы.
В статье «PyTorch vs TensorFlow: сравнение фреймворков машинного обучения» разобрали особенности и сферы применения двух самых популярных инструментов, и упомянули перспективную альтернативу – Google JAX. |
Исследование «Парадокс генеративного ИИ: то, что он может создать, он может и не понимать» рассматривает интересное различие между ИИ и человеческими способностями в создании контента и в понимании его смысла: - Модели могут создавать контент, который по качеству превосходит работы людей-экспертов, и при этом обычно совершенно не понимают, что именно они создают. Это связано с тем, что модели обучают на огромных массивах готовых работ – текстов, изображений, музыки, и они попросту имитируют нужный результат.
- Люди, напротив, обучаются с самых основ – скрипач, к примеру, развивает базовые способности играть отдельные ноты, гаммы и т.д., прежде чем будет готов к концерту. Поскольку люди развивают способности к пониманию и созданию новых работ поэтапно, они прекрасно осознают, что делают, но их возможности по генерации нового креатива, в отличие от ИИ, ограничены.
Итак, парадокс заключается в том, что генеративные модели, по-видимому, быстрее и эффективнее приобретают способности к генерации, чем к пониманию, в отличие от человеческого интеллекта, которому понимание дается проще, а генерация – сложнее. Для проверки своей гипотезы авторы измерили эффективность модели, используя два типа оценок – выборочную и вопросительную. В первом случае модель должна дать ответ, выбрав правильный вариант из предоставленных, во втором – ответить на общий вопрос о содержании и значении сгенерированного результата. Проверка подтвердила, что хотя модели генерируют тексты и изображения, которые точно соответствуют запросу и сопоставимы с человеческими результатами (или даже превосходят их), они действительно с трудом отвечают на простые вопросы о только что созданном ими контенте. |
Модель не признала своего же горного козла |
📖 Новейшая бесплатная книга по математике для ML |
«Математическое введение в глубокое обучение: методы, реализация и теория» (pdf, на английском). Эта книга – введение в тему алгоритмов глубокого обучения. Здесь разобраны основные компоненты алгоритмов глубокого обучения с полной математической детализацией, включая различные архитектуры искусственных нейронных сетей (ИНС): - полносвязные сети прямого распространения;
- сверточные;
- рекуррентные;
- остаточные;
- с пакетной нормализацией.
Также рассмотрены: - Различные алгоритмы оптимизации – базовый метод стохастического градиентного спуска , ускоренные и адаптивные методы.
- Некоторые теоретические аспекты алгоритмов глубокого обучения – аппроксимационные возможности ИНС, теория оптимизации, ошибки обобщения.
- Отдельные методы глубокого обучения, в том числе физико-информированные сети и методы Галеркина.
Книга пригодится студентам и начинающим разработчикам, которым нужно вникнуть в математическую базу глубокого обучения. |
Dhibot – платформа для создания и обучения чат-ботов на ваших данных. Nexa AI – генерирует «стоковые» фотографии профессионального качества: реальные предметы можно помещать в любое окружение, а реальную одежду – надевать на виртуальных людей. |
Documind – создает чат с любыми документами. Piktochart – превращает данные из любых документов в эффектную инфографику, подробные отчеты и презентации. Papercup – переводит и дублирует видео и стримы. Chromox – генерирует впечатляющие видео на основе текста. Похожий генератор видео – ShortVideoGen. |
Openjourney можно установить на свой комп |
LimeLine – создает ИИ-агентов, которые возьмут на себя созвоны и переговоры. GPTGo – интеллектуальный поиск с помощью гибрида Google и GPT-бота. Lindy – платформа для создания ИИ-сотрудников, которые выполняют определенные типы задач. |
На этом все, увидимся через неделю! |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|