Статьи

OpenAI обновляет ChatGPT: чат-бот с искусственным интеллектом теперь может «видеть, слышать и говорить»

OpenAI выпустила долгожданные обновления, которые позволят ее популярному чат-боту ChatGPT взаимодействовать с изображениями и голосами. Этот запуск представляет собой важный шаг на пути к концепции OpenAI об искусственном интеллекте общего назначения, который может воспринимать и обрабатывать информацию в нескольких режимах, а не только в текстовом виде.

«Мы начинаем внедрять в ChatGPT новые голосовые и графические возможности. Они предлагают новый, более интуитивно понятный тип интерфейса, позволяющий вам вести голосовой разговор или показывать ChatGPT, о чем вы говорите», — говорится в сообщении. официальный пост в блоге OpenAI.

OpenAI заявила, что новый ChatGPT-Plus будет включать голосовой чат, основанный на новой модели преобразования текста в речь, способной имитировать человеческие голоса, а также возможность обсуждать изображения посредством интеграции с моделями генерации изображений компании. Новые функции кажутся частью так называемого Видение GPT (или GPT-V, который часто путают с теоретическим GPT-5) и являются ключевыми компонентами улучшенной мультимодальной версии GPT-4, которая OpenAI представлен ранее в этом году

Это обновление происходит сразу после OpenAI представила DALL-E 3это самый продвинутый на сегодняшний день генератор текста в изображение. Первые тестеры называли DALL-E 3 «безумным» из-за его качества и точности. DALL-E 3 может создавать высококачественные изображения из текстовых подсказок, понимая сложный контекст и концепции, выраженные на естественном языке. Он будет встроен в ChatGPT Plus, сервис на основе подписки, предлагающий ChatGPT на основе GPT-4.

Интеграция DALLE3 и диалогового голосового чата означает стремление OpenAI создать помощников искусственного интеллекта, которые смогут воспринимать мир так же, как люди, — с помощью нескольких чувств. По словам компании: «Голос и изображение дают вам больше возможностей использовать ChatGPT в своей жизни. Сфотографируйте достопримечательность во время путешествия и поговорите в прямом эфире о том, что в ней интересного».

Microsoft поддерживает гонку искусственного интеллекта с помощью интеграции OpenAI

Крупнейший сторонник OpenAI, компания Microsoft, также активно внедряет передовые возможности генеративного искусственного интеллекта OpenAI в свои собственные потребительские продукты. На недавнем осеннем мероприятии Microsoft анонсировала обновления искусственного интеллекта для Windows 11, поиска в Office и Bing с использованием таких моделей, как DALLE3 (в программах настройки изображений, таких как обновленный Paint от Microsoft) и Copilot, помощника по программированию OpenAI.



Это соответствует Инвестиции Microsoft в OpenAI составили более $10 млрд.поскольку компания стремится возглавить гонку помощников ИИ. Дебют Copilot в Windows 11 26 сентября обещает сделать поддержку искусственного интеллекта доступной на всех платформах и устройствах Microsoft. Между тем Microsoft 365 Chat использует возможности естественного языка OpenAI для автоматизации сложных рабочих нагрузок.

Microsoft заявила, что «Microsoft 365 Chat обеспечивает всю вашу рабочую среду, включая электронную почту, собрания, чаты, документы и многое другое, а также Интернет».

Осторожные шаги на пути к ответственному ИИ

Однако OpenAI остро осознает потенциальные риски, связанные с более мощными мультимодальными системами искусственного интеллекта, включающими видение и генерацию голоса. Персонификация, предвзятость и зависимость от визуальной интерпретации являются ключевыми проблемами.

«Цель OpenAI — создать AGI, который будет безопасным и прибыльным», — написала компания в своем объявлении. «Мы верим в то, что наши инструменты будут предоставляться с течением времени, что позволит нам с течением времени вносить улучшения и снижать риски, одновременно подготавливая всех к использованию более мощных систем в будущем».

Более того, как сообщалось ранее, OpenAI собирает красную команду работать над способами предотвращения вредных последствий неправильного использования своих продуктов искусственного интеллекта. Генеральный директор Сэм Альтман также лоббирует по всему миру благоприятное законодательство.

В OpenAI заявили, что пользователи Plus и Enterprise получат доступ к этим новым функциям в течение следующих двух недель, после чего планируется расширить доступность для разработчиков. И с тех пор Google также объявляет о собственной революционной мультимодальной программе LLM. Близнецы, гонка за доминирование в индустрии искусственного интеллекта только началась


Подборка статей по криптовалютам и технологии блокчейн. Подпишитесь на нас в социальных сетях.

Информация для Вас была полезна?
0
0
0
0
0
0
0

Похожие статьи

Кнопка «Наверх»