Венчурный фонд Microsoft и гендиректор GitHub Томас Домке вложили $7 млн в стартап Fastino, разрабатывающий ИИ-модели, которые не нуждаются в дорогих GPU и могут работать на обычных CPU потребительского класса. Популярный сервис ИИ-перевода DeepL теперь работает с аудио – переводит видео и разговоры в реальном времени, создает субтитры на 33 языках. Исследователи Университета Джона Хопкинса совершили прорыв в обучении хирургических роботов. Созданный ими робот осваивает сложные хирургические манипуляции, просматривая записи операций, проведенных реальными хирургами. |
Microsoft и французская IT-компания Iconem в сотрудничестве с Ватиканом создали ИИ-версию одного из самых значительных архитектурных памятников в мире – Собора Святого Петра. Ультраточная трехмерная модель включает 22 петабайта данных. Для ее разработки использовали 400 тысяч высококачественных фотографий, сделанных дронами, камерами и лазерами в течение 4 недель. Президент Microsoft Брэд Смит отказался назвать сумму инвестиций компании в проект, сказав лишь, что она была значительной и стала результатом инициативы папы Франциска по объединению ИТ-компаний для продвижения этичного использования ИИ. Он добавил, что Microsoft уже выполнила два аналогичных ИИ-проекта – в Мон-Сен-Мишель (Франция) и в Древней Олимпии (Греция). |
Сотрудники OpenAI, тестирующие новую модель «Орион», сообщили, что, несмотря на общее улучшение производительности по сравнению с предшествующими моделями, степень этого улучшения все же значительно ниже, чем в предыдущих обновлениях (в особенности при переходе от GPT-3 к GPT-4). Кроме того, новая модель не показывает очевидного превосходства в критически важных областях (программирование и сложные рассуждения). Это связано с нехваткой свежих высококачественных и разнообразных данных для обучения. Ограничения, вызванные дефицитом данных, вызывают опасения относительно будущего ИИ и способности моделей достигать своего максимального потенциала. Чтобы преодолеть это препятствие, OpenAI: - Планирует использовать синтетические данные.
- Собирается проводить обучение с подкреплением и тонкую настройку для выполнения специфических задач – чтобы устранить пробелы в производительности, которые невозможно заполнить с помощью реальных и синтетических данных.
Многие будут следить за тем, сработают ли подходы OpenAI с использованием синтетических данных и посттренинговых техник – проблема дефицита данных уже затронула всех лидеров отрасли, включая Anthropic и Google. Компания Google DeepMind открыла доступ к исходному коду и весам модели AlphaFold 3 для академического использования. AlphaFold 3 разработана Демисом Хассабисом и Джоном Джампером, получившим Нобелевскую премию по химии за 2024 год за свою работу по предсказанию структуры белков. AlphaFold 3 представляет собой огромный шаг вперед по сравнению со своими предшественниками: если AlphaFold 2 могла предсказывать структуру белков, то версия 3 способна моделировать сложные взаимодействия между белками, ДНК, РНК и малыми молекулами. Эта расширенная функциональность превращает модель из специализированного инструмента в комплексное решение для изучения молекулярной биологии и открывает новые пути для понимания клеточных процессов, начиная от регуляции генов и заканчивая метаболизмом лекарств, в ранее недоступных масштабах. Традиционные методы изучения этих взаимодействий часто требуют месяцев лабораторной работы и миллионов долларов на финансирование исследований – без гарантии успеха. Новая технология под названием PanoRadar, которая с помощью ИИ преобразует обычные радиоволны в сложные трехмерные изображения окружающих предметов, обеспечила роботов способностью видеть в дыму, тумане и даже сквозь стены. |
Google запустила экспериментальный ИИ-сервис Learn About, который помогает досконально изучить любую интересующую тему. |
«Библиотека программиста» ищет менеджеров контента |
Удаленка || Частичная занятость || Сдельная оплата Нужно: - Создавать контент для ТГ-каналов.
- Развивать комьюнити.
- Знать одну из тем: C#, DevOps, QA.
- Грамотно писать.
Почта для откликов: tatyana@proglib.io. |
PearAI – опенсорсный ИИ-редактор кода, альтернатива Cursor. |
SoBrief – краткое содержание 73,5+ тысяч книг всевозможных жанров, от классики до нон-фикшена. Можно прослушать аудиоверсию на 40 языках. Похожий сервис для беглого знакомства с понятно изложенным содержанием научных статей – Outread. Flair – ИИ-редактор/генератор для создания профессиональных продуктовых фото. |
PlayNote – создает профессиональные подкасты из любых текстовых файлов. Llama OCR – конвертирует изображения в структурированный Markdown-текст. |
Canva – превращает схематичные наброски в фотореалистичные изображения. Аналогичную функцию предоставляет генератор OpenArt. |
Генератор превращает примитивные эскизы в фотореалистичные изображения |
Spiritme – платформа для создания персонализированных видео с ИИ-аватаром. Vidu – продвинутый генератор видео: не просто создает клипы на основе текстовых описаний и оживляет изображения, а позволяет использовать конкретные референсы и управлять многими аспектами генерации. |
EzyGraph – превращает статьи в стильную инфографику. Hautech AI – надевает вашу одежду на виртуальных моделей, создавая профессиональные фотосессии. |
Hautech AI поможет обойтись и без фотографа, и без моделей |
☕ ИИ-хайп остывает: отчет Slack |
Сотрудники Slack обнаружили парадоксальную разницу в отношении к внедрению ИИ со стороны топ-менеджеров и рядовых офисных служащих: - Руководители компаний очень заинтересованы в ИИ. Почти все опрошенные (99%) планируют вложить деньги в развитие ИИ в этом году, а 97% чувствуют необходимость внедрить ИИ во все бизнес-процессы.
- Офисные работники, напротив, явно остывают к теме – за последние три месяца темпы внедрения ИИ замедлились во Франции и США, а уровень восторга от ИИ снизился на 6 процентных пунктов по всему миру.
Выяснились и препятствия, которые не позволяют офисным клеркам использовать ИИ на все 100%: - Почти половина сотрудников (48%) испытывают дискомфорт при мысли о том, чтобы признаться своему начальнику, что они используют ИИ для выполнения обычных рабочих задач. Основные причины этого дискомфорта:
- Чувство, что использование ИИ – это своего рода обман.
- Страх показаться менее компетентным.
- Нежелание выглядеть ленивым.
- Недостаток обучения продолжает тормозить внедрение ИИ – 61% офисных работников потратили меньше пяти часов на изучение того, как использовать ИИ-инструменты.
Но есть и хорошие новости – сотрудники готовы повышать свою квалификацию: 76% ощущают срочную потребность стать экспертами в ИИ. Главными причинами для этого являются тенденции в отрасли и личные цели (ожидания руководства стоят ниже в списке). |
OmniEdit – универсальный редактор, способный выполнять семь различных задач по редактированию изображений с любым соотношением сторон. OmniParser – комплексное решение для анализа UI-скриншотов и преобразования их в структурированные элементы, понятные ИИ-модели. Reaper – легкий и эффективный опенсорсный фреймворк для тестирования безопасности приложений. Ключевые возможности: - Собирает информацию о целевом приложении и его окружении.
- Помогает выявить уязвимости на ранних этапах.
- Позволяет перехватывать, анализировать и модифицировать HTTP/HTTPS-запросы.
- Позволяет модифицировать или повторно использовать существующие запросы.
- Выполняет разные типы атак на целевое приложение.
- Помогает выявить скрытые уязвимости.
- Позволяет нескольким экспертам работать над одним проектом одновременно.
- Автоматически создает подробные отчеты о проведенном тестировании.
|
ViewComfy – инструмент для быстрого создания веб-приложений на основе ИИ-моделей любого типа. Оснащён адаптивным UI, поддерживает вывод текста, изображений и видео. |
pgai – упрощает процесс создания поисковых систем, RAG и других ИИ-приложений на базе PostgreSQL. Основные возможности: - Автоматическое создание и синхронизация векторных представлений.
- Поиск данных с помощью векторного и семантического поиска.
- Возможность реализации RAG внутри одного SQL-запроса.
- Высокопроизводительный поиск ближайших соседей (ANN).
- Бесшовная интеграция с популярными расширениями для векторного поиска (pgvector и pgvectorscale).
| skrub – упрощает подготовку табличных данных к применению в машинном обучении. thepi.pe – извлекает структурированный текст из сложных документов. Основные возможности: - Поддерживает множество форматов файлов, включая PDF, Word, PowerPoint, видео, аудио и др.
- Работает с веб-страницами, GitHub-репозиториями и другими источниками.
- Поддерживает LLM и VLM, облачные и локальные.
- Позволяет извлекать структурированные данные в соответствии с заданной схемой.
- Успешно работает с плохо отсканированными PDF, сложными визуальными элементами и нетипично оформленными таблицами.
- Автоматически определяет тип файла и применяет соответствующую обработку.
Building AI Applications with Hugging Face – большая коллекция туториалов по разработке разных ИИ-приложений. Для каждого проекта предоставлены статья, код в Kaggle Notebook и YouTube-видео. |
* Соцсеть X/Twitter заблокирована на территории РФ. |
|
|
Понравилась ли вам эта рассылка? |
|
|
Вы получили это письмо, потому что подписались на нашу рассылку. Если вы больше не хотите получать наши письма, нажмите здесь.
|
|
|
|