OpenAI выпускает GPT | Шанхайская компания предварительно заполненных Vape Pod Co., Ltd.

OpenAI выпустила новую мощную модель искусственного интеллекта для распознавания изображений и текста, GPT-4, которую компания называет «последней вехой в своих усилиях по расширению глубокого обучения».

GPT-4 доступен уже сегодня платным пользователям OpenAI через ChatGPT Plus (с ограничением на использование), а разработчики могут записаться в список ожидания для доступа к API.

Цена составляет 0,03 доллара США за 1000 токенов «подсказки» (около 750 слов) и 0,06 доллара США за 1000 токенов «завершения» (опять же, около 750 слов). Токены представляют собой необработанный текст; например, слово «фантастический» будет разделено на лексемы «фан», «тас» и «тик». Токены подсказки — это части слов, передаваемые в GPT-4, а токены завершения — это контент, созданный GPT-4.

Как выяснилось, GPT-4 прятался на виду. Microsoft подтвердила сегодня, что Bing Chat, технология чат-ботов, разработанная совместно с OpenAI, работает на GPT-4.

Среди других первых пользователей — Stripe, который использует GPT-4 для сканирования бизнес-сайтов и предоставления сводки сотрудникам службы поддержки клиентов. Duolingo встроил GPT-4 в новый уровень подписки для изучения языков. Morgan Stanley создает систему на базе GPT-4, которая будет извлекать информацию из документов компании и предоставлять ее финансовым аналитикам. А Академия Хана использует GPT-4 для создания своего рода автоматизированного преподавателя.

Новые возможности GPT-4 позволяют создать «виртуального волонтера» для слабовидящих

GPT-4 может генерировать текст и принимать изображения и текстовые входные данные — улучшение по сравнению с GPT-3.5, его предшественником, который принимал только текст — и работает на «человеческом уровне» по различным профессиональным и академическим критериям. Например, GPT-4 сдает смоделированный экзамен на адвоката, набрав оценку около 10% лучших участников теста; напротив, показатель GPT-3.5 был примерно у нижних 10%.

По данным компании, OpenAI потратила шесть месяцев на «итеративную настройку» GPT-4, используя уроки внутренней программы состязательного тестирования, а также ChatGPT, что привело к «лучшим за всю историю результатам» по фактичности, управляемости и отказу выходить за пределы ограждений. Как и предыдущие модели GPT, GPT-4 обучался с использованием общедоступных данных, в том числе с общедоступных веб-страниц, а также данных, лицензированных OpenAI.

OpenAI совместно с Microsoft разработала «суперкомпьютер» с нуля в облаке Azure, который использовался для обучения GPT-4.

«В обычном разговоре различие между GPT-3.5 и GPT-4 может быть незаметным», — написал OpenAI в сообщении в блоге, анонсирующем GPT-4. «Разница проявляется, когда сложность задачи достигает достаточного порога — GPT-4 более надежен, креативен и способен обрабатывать гораздо более тонкие инструкции, чем GPT-3.5».

Без сомнения, одним из наиболее интересных аспектов GPT-4 является его способность понимать изображения так же, как и текст. GPT-4 может подписывать и даже интерпретировать относительно сложные изображения, например, идентифицировать адаптер кабеля Lightning по изображению подключенного iPhone.

Возможность распознавания изображений пока доступна не всем клиентам OpenAI — для начала OpenAI тестирует ее с единственным партнером, Be My Eyes. Новая функция виртуального волонтера Be My Eyes, основанная на GPT-4, может отвечать на вопросы об отправленных на нее изображениях. Компания объясняет, как это работает, в сообщении в блоге:

«Например, если пользователь отправит фотографию внутренней части своего холодильника, Виртуальный волонтер сможет не только правильно определить, что в нем находится, но также экстраполировать и проанализировать, что можно приготовить из этих ингредиентов. Инструмент также может предложить несколько рецептов этих ингредиентов и отправить пошаговое руководство по их приготовлению».

Более значимым улучшением GPT-4, возможно, является вышеупомянутый инструмент для обеспечения управляемости. В GPT-4 OpenAI представляет новую возможность API — «системные» сообщения, которые позволяют разработчикам задавать стиль и задачи, описывая конкретные направления. Системные сообщения, которые в будущем также появятся в ChatGPT, по сути, представляют собой инструкции, которые задают тон и устанавливают границы для следующих взаимодействий ИИ.

Например, системное сообщение может гласить: «Вы наставник, который всегда отвечает в сократовском стиле. Вы никогда не даете ученику ответа, но всегда стараетесь задать только правильный вопрос, чтобы помочь ему научиться думать самостоятельно. Вы всегда должны согласовывать свой вопрос с интересами и знаниями учащегося, разбивая проблему на более простые части, пока она не достигнет нужного им уровня».