API OpenAI работает на основе разнообразного набора моделей с различными возможностями и ценовыми категориями.
Модель | Описание |
---|---|
GPT-4 и GPT-4 Turbo | Набор моделей, которые улучшены по сравнению с GPT-3.5 и могут понимать, а также генерировать естественный язык или код |
GPT-3.5 | Набор моделей, которые улучшены по сравнению с GPT-3 и могут понимать, а также генерировать естественный язык или код |
DALL·E | Модель, которая может генерировать и редактировать изображения по запросу на естественном языке |
TTS | Набор моделей, которые могут преобразовывать текст в звучащий естественным образом голосовой аудио |
Whisper | Модель, которая может преобразовывать аудио в текст |
Embeddings | Набор моделей, которые могут преобразовывать текст в числовую форму |
GPT base | Набор моделей без выполнения инструкций, которые могут понимать, а также генерировать естественный язык или код |
Мы также опубликовали модели с открытым исходным кодом, включая Point-E, Whisper, Jukebox и CLIP.
gpt-3.5-turbo
, gpt-4
, и gpt-4-turbo-preview
указывают на последнюю версию модели. Вы можете проверить это, изучив объект ответа после отправки запроса.
В ответ будет включена конкретная используемая версия модели (например,
gpt-3.5-turbo-0613
).
Мы также предлагаем статические версии моделей, которыми разработчики могут продолжать пользоваться как минимум три месяца после введения обновленной модели. С новым ритмом обновлений моделей мы также даём людям возможность вносить свой вклад в оценки для помощи нам в улучшении модели для различных случаев использования. Если вас это интересует, проверьте репозиторий OpenAI Evals.
GPT-4 — это крупная мультимодальная модель (принимает входные данные в виде текста или изображений и выдаёт текст), которая может решать сложные задачи с более высокой точностью, чем любая из наших предыдущих моделей, благодаря своим широким общим знаниям и продвинутым способностям рассуждения. Как и gpt-3.5-turbo
, GPT-4 оптимизирован для чата, но также хорошо работает для традиционных задач завершения с использованием Chat Completions API. Узнайте, как использовать GPT-4, в нашем руководстве по GPT.
Модель | Описание | Окно контекста | Обучающие данные |
---|---|---|---|
gpt-4-0125-preview | GPT-4 Turbo | 128,000 токенов | До декабря 2023 |
gpt-4-turbo-preview | В настоящее время указывает на gpt-4-0125-preview. | 128,000 токенов | До декабря 2023 |
gpt-4-1106-preview | Модель GPT-4 Turbo с улучшенным выполнением инструкций, режимом JSON, воспроизводимыми результатами, параллельным вызовом функций и др. Возвращает максимум 4,096 выходных токенов. Это превью модель. | 128,000 токенов | До апреля 2023 |
gpt-4-vision-preview | GPT-4 с возможностью понимать изображения, в дополнение ко всем другим возможностям GPT-4 Turbo. В настоящее время указывает на gpt-4-1106-vision-preview. | 128,000 токенов | До апреля 2023 |
gpt-4-1106-vision-preview | GPT-4 с возможностью понимать изображения, в дополнение ко всем другим возможностям GPT-4 Turbo. Возвращает максимум 4,096 выходных токенов. Это версия превью модели. | 128,000 токенов | До апреля 2023 |
gpt-4 | В настоящее время указывает на gpt-4-0613. Смотрите постоянное обновление моделей. | 8,192 токена | До сентября 2021 |
gpt-4-32k | В настоящее время указывает на gpt-4-32k-0613. Смотрите постоянное обновление моделей. | 32,768 токенов | До сентября 2021 |
gpt-4-0613 | Снимок gpt-4 от 13 июня 2023 года с улучшенной поддержкой вызова функций. | 8,192 токена | До сентября 2021 |
gpt-4-32k-0613 | Снимок gpt-4-32k от 13 июня 2023 года с улучшенной поддержкой вызова функций. | 32,768 токенов | До сентября 2021 |
Для многих базовых задач разница между моделями GPT-4 и GPT-3.5 не значительна. Однако в более сложных ситуациях рассуждения модель GPT-4 гораздо более способна, чем любая из наших предыдущих моделей.
Модели GPT-3.5 могут понимать и генерировать естественный язык или код. Наша наиболее
способная и экономически выгодная модель в семействе GPT-3.5 - gpt-3.5-turbo
, которая
была оптимизирована для чата с использованием Chat Completions API, но также хорошо работает
и для традиционных задач автозавершения.
Модель | Описание | Окно контекста | Тренировочные данные |
---|---|---|---|
gpt-3.5-turbo-0125 | Обновленный GPT 3.5 Turbo | 16,385 токенов | До сентября 2021 |
gpt-3.5-turbo | В настоящее время указывает на gpt-3.5-turbo-0613. Псевдоним модели gpt-3.5-turbo будет автоматически обновлен с gpt-3.5-turbo-0613 на gpt-3.5-turbo-0125 16 февраля. | 4,096 токенов | До сентября 2021 |
gpt-3.5-turbo-1106 | Модель GPT-3.5 Turbo с улучшенным выполнением инструкций, режимом JSON, воспроизводимыми выходными данными, параллельным вызовом функций и многим другим. Возвращает максимум 4,096 токенов на выходе. | 16,385 токенов | До сентября 2021 |
gpt-3.5-turbo-instruct | Аналогичные возможности, как у моделей эпохи GPT-3. Совместим с устаревшим конечным точкам Completions и не с Chat Completions. | 4,096 токенов | До сентября 2021 |
DALL·E — это система ИИ, которая может создавать реалистичные изображения и искусство из описания на естественном языке. DALL·E 3 в настоящее время поддерживает возможность, получив запрос, создать новое изображение определенного размера. DALL·E 2 также поддерживает возможность редактировать существующее изображение или создавать вариации предоставленного пользователем изображения.
Модель | Описание |
---|---|
dall-e-3 | DALL·E 3 |
dall-e-2 | Предыдущая модель DALL·E, выпущенная в ноябре 2022 года. Вторая итерация DALL·E с более реалистичными, точными и в 4 раза более высоким разрешением изображений, чем у оригинальной модели. |
TTS — это модель ИИ, которая преобразует текст в естественно звучащий разговорный текст. Мы предлагаем две разные вариации модели, tts-1
оптимизирована для реального времени использования текста в речь и tts-1-hd
оптимизирована для качества. Эти модели могут использоваться с конечной точкой речи в Audio API.
Модель | Описание |
---|---|
tts-1 | Text-to-speech 1 |
tts-1-hd | Text-to-speech 1 HD |
Whisper – это универсальная модель распознавания речи. Она обучена на большом наборе разнообразных аудио и также является многозадачной моделью, которая может выполнять многоязычное распознавание речи, а также перевод речи и определение языка. Модель Whisper v2-large в настоящее время доступна через наш API с именем модели whisper-1
.
В настоящее время нет различий между открытой версией Whisper и версией, доступной через наш API. Однако через наш API мы предлагаем оптимизированный процесс вывода, который делает работу с Whisper через наш API гораздо быстрее, чем через другие средства. Для получения более технических деталей о Whisper можно прочитать статью.
Embeddings – это числовое представление текста, которое можно использовать для измерения схожести между двумя текстами. Наша вторая генерация модели встраивания, text-embedding-ada-002
, предназначена для замены предыдущих 16 моделей первого поколения с небольшой частью затрат. Embeddings полезны для поиска, кластеризации, рекомендаций, обнаружения аномалий и задач классификации.
Базовые модели GPT могут понимать и генерировать естественный язык или код, но не обучены следованию инструкциям. Эти модели созданы в качестве замены нашим оригинальным базовым моделям GPT-3 и используют устаревший API Completions. Большинство клиентов должны использовать GPT-3.5 или GPT-4.
Модель | Описание | Максимум токенов | Обучающие данные |
---|---|---|---|
babbage-002 | Замена базовым моделям GPT-3 ada и babbage. | 16,384 токена | До сентября 2021 |
davinci-002 | Замена базовым моделям GPT-3 curie и davinci. | 16,384 токена | До сентября 2021 |
Ваши данные принадлежат вам.
Для выявления злоупотреблений, данные API могут храниться до 30 дней, после чего они будут удалены (если иное не требуется по закону). Для доверенных клиентов с чувствительными приложениями может быть доступно хранение данных равное нулю. При нулевом хранении данных запросы и ответы не сохраняются ни в каких журналах логирования и существуют только в памяти для обработки запроса.
Конечная точка | Данные используемые для обучения | Хранение по умолчанию | Возможность нулевого хранения |
---|---|---|---|
/v1/chat/completions* | Нет | 30 дней | Да, за исключением входных изображений* |
/v1/files | Нет | До удаления клиентом | Нет |
/v1/assistants | Нет | До удаления клиентом | Нет |
/v1/threads | Нет | 60 дней * | Нет |
/v1/threads/messages | Нет | 60 дней * | Нет |
/v1/threads/runs | Нет | 60 дней * | Нет |
/v1/threads/runs/steps | Нет | 60 дней * | Нет |
/v1/images/generations | Нет | 30 дней | Нет |
/v1/images/edits | Нет | 30 дней | Нет |
/v1/images/variations | Нет | 30 дней | Нет |
/v1/embeddings | Нет | 30 дней | Да |
/v1/audio/transcriptions | Нет | Нулевое хранение данных | - |
/v1/audio/translations | Нет | Нулевое хранение данных | - |
/v1/audio/speech | Нет | 30 дней | Нет |
/v1/fine_tuning/jobs | Нет | До удаления клиентом | Нет |
/v1/moderations | Нет | Нулевое хранение данных | - |
/v1/completions | Нет | 30 дней | Да |
-
Входы изображений через модель
gpt-4-vision-preview
не подлежат нулевому удержанию. -
Для API помощников мы все еще оцениваем стандартный период удержания во время Беты. Мы ожидаем, что стандартный период удержания стабилизируется после окончания Беты.
Конечная точка | Последние модели |
---|---|
/v1/assistants | Поддерживаются все модели, кроме gpt-3.5-turbo-0301. Инструмент retrieval требует gpt-4-1106-preview или gpt-3.5-turbo-1106. |
/v1/audio/transcriptions | whisper-1 |
/v1/audio/translations | whisper-1 |
/v1/audio/speech | tts-1, tts-1-hd |
/v1/chat/completions | gpt-4 и датированные выпуски моделей, gpt-4-1106-preview, gpt-4-vision-preview, gpt-4-32k и датированные выпуски моделей, gpt-3.5-turbo и датированные выпуски моделей, gpt-3.5-turbo-16k и датированные выпуски моделей, адаптированные версии gpt-3.5-turbo |
/v1/completions (Legacy) | gpt-3.5-turbo-instruct, babbage-002, davinci-002 |
/v1/embeddings | text-embedding-ada-002 |
/v1/fine_tuning/jobs | gpt-3.5-turbo, babbage-002, davinci-002 |
/v1/moderations | text-moderation-stable, text-moderation-latest |
/v1/images/generations | dall-e-2, dall-e-3 |