API OpenAI работает на основе разнообразного набора моделей с различными возможностями и ценовыми категориями.

МодельОписание
GPT-4 и GPT-4 Turbo

Набор моделей, которые улучшены по сравнению с GPT-3.5 и могут понимать, а также генерировать естественный язык или код

GPT-3.5

Набор моделей, которые улучшены по сравнению с GPT-3 и могут понимать, а также генерировать естественный язык или код

DALL·E

Модель, которая может генерировать и редактировать изображения по запросу на естественном языке

TTS

Набор моделей, которые могут преобразовывать текст в звучащий естественным образом голосовой аудио

WhisperМодель, которая может преобразовывать аудио в текст
EmbeddingsНабор моделей, которые могут преобразовывать текст в числовую форму
GPT base

Набор моделей без выполнения инструкций, которые могут понимать, а также генерировать естественный язык или код

Мы также опубликовали модели с открытым исходным кодом, включая Point-E, Whisper, Jukebox и CLIP.

gpt-3.5-turbo, gpt-4, и gpt-4-turbo-preview указывают на последнюю версию модели. Вы можете проверить это, изучив объект ответа после отправки запроса. В ответ будет включена конкретная используемая версия модели (например, gpt-3.5-turbo-0613).

Мы также предлагаем статические версии моделей, которыми разработчики могут продолжать пользоваться как минимум три месяца после введения обновленной модели. С новым ритмом обновлений моделей мы также даём людям возможность вносить свой вклад в оценки для помощи нам в улучшении модели для различных случаев использования. Если вас это интересует, проверьте репозиторий OpenAI Evals.

GPT-4 — это крупная мультимодальная модель (принимает входные данные в виде текста или изображений и выдаёт текст), которая может решать сложные задачи с более высокой точностью, чем любая из наших предыдущих моделей, благодаря своим широким общим знаниям и продвинутым способностям рассуждения. Как и gpt-3.5-turbo, GPT-4 оптимизирован для чата, но также хорошо работает для традиционных задач завершения с использованием Chat Completions API. Узнайте, как использовать GPT-4, в нашем руководстве по GPT.

МодельОписаниеОкно контекстаОбучающие данные
gpt-4-0125-preview

GPT-4 Turbo
Последняя модель GPT-4, направленная на снижение случаев «лени», когда модель не выполняет задачу. Возвращает максимум 4,096 выходных токенов.

128,000 токеновДо декабря 2023
gpt-4-turbo-preview

В настоящее время указывает на gpt-4-0125-preview.

128,000 токеновДо декабря 2023
gpt-4-1106-preview

Модель GPT-4 Turbo с улучшенным выполнением инструкций, режимом JSON, воспроизводимыми результатами, параллельным вызовом функций и др. Возвращает максимум 4,096 выходных токенов. Это превью модель.

128,000 токеновДо апреля 2023
gpt-4-vision-preview

GPT-4 с возможностью понимать изображения, в дополнение ко всем другим возможностям GPT-4 Turbo. В настоящее время указывает на gpt-4-1106-vision-preview.

128,000 токеновДо апреля 2023
gpt-4-1106-vision-preview

GPT-4 с возможностью понимать изображения, в дополнение ко всем другим возможностям GPT-4 Turbo. Возвращает максимум 4,096 выходных токенов. Это версия превью модели.

128,000 токеновДо апреля 2023
gpt-4

В настоящее время указывает на gpt-4-0613. Смотрите постоянное обновление моделей.

8,192 токенаДо сентября 2021
gpt-4-32k

В настоящее время указывает на gpt-4-32k-0613. Смотрите постоянное обновление моделей.

32,768 токеновДо сентября 2021
gpt-4-0613

Снимок gpt-4 от 13 июня 2023 года с улучшенной поддержкой вызова функций.

8,192 токенаДо сентября 2021
gpt-4-32k-0613

Снимок gpt-4-32k от 13 июня 2023 года с улучшенной поддержкой вызова функций.

32,768 токеновДо сентября 2021

Для многих базовых задач разница между моделями GPT-4 и GPT-3.5 не значительна. Однако в более сложных ситуациях рассуждения модель GPT-4 гораздо более способна, чем любая из наших предыдущих моделей.

Модели GPT-3.5 могут понимать и генерировать естественный язык или код. Наша наиболее способная и экономически выгодная модель в семействе GPT-3.5 - gpt-3.5-turbo, которая была оптимизирована для чата с использованием Chat Completions API, но также хорошо работает и для традиционных задач автозавершения.

МодельОписаниеОкно контекстаТренировочные данные
gpt-3.5-turbo-0125

Обновленный GPT 3.5 Turbo
Последняя модель GPT-3.5 Turbo с более высокой точностью ответов в запрашиваемых форматах и исправлением ошибки, которая вызывала проблемы с кодировкой текста для функций на неанглийском языке. Возвращает максимум 4,096 токенов на выходе.

16,385 токеновДо сентября 2021
gpt-3.5-turbo

В настоящее время указывает на gpt-3.5-turbo-0613. Псевдоним модели gpt-3.5-turbo будет автоматически обновлен с gpt-3.5-turbo-0613 на gpt-3.5-turbo-0125 16 февраля.

4,096 токеновДо сентября 2021
gpt-3.5-turbo-1106

Модель GPT-3.5 Turbo с улучшенным выполнением инструкций, режимом JSON, воспроизводимыми выходными данными, параллельным вызовом функций и многим другим. Возвращает максимум 4,096 токенов на выходе.

16,385 токеновДо сентября 2021
gpt-3.5-turbo-instruct

Аналогичные возможности, как у моделей эпохи GPT-3. Совместим с устаревшим конечным точкам Completions и не с Chat Completions.

4,096 токеновДо сентября 2021

DALL·E — это система ИИ, которая может создавать реалистичные изображения и искусство из описания на естественном языке. DALL·E 3 в настоящее время поддерживает возможность, получив запрос, создать новое изображение определенного размера. DALL·E 2 также поддерживает возможность редактировать существующее изображение или создавать вариации предоставленного пользователем изображения.

МодельОписание
dall-e-3

DALL·E 3
Последняя модель DALL·E, выпущенная в ноябре 2023 года.

dall-e-2

Предыдущая модель DALL·E, выпущенная в ноябре 2022 года. Вторая итерация DALL·E с более реалистичными, точными и в 4 раза более высоким разрешением изображений, чем у оригинальной модели.

TTS — это модель ИИ, которая преобразует текст в естественно звучащий разговорный текст. Мы предлагаем две разные вариации модели, tts-1 оптимизирована для реального времени использования текста в речь и tts-1-hd оптимизирована для качества. Эти модели могут использоваться с конечной точкой речи в Audio API.

МодельОписание
tts-1

Text-to-speech 1
Последняя модель преобразования текста в речь, оптимизированная для скорости.

tts-1-hd

Text-to-speech 1 HD
Последняя модель преобразования текста в речь, оптимизированная для качества.

Whisper – это универсальная модель распознавания речи. Она обучена на большом наборе разнообразных аудио и также является многозадачной моделью, которая может выполнять многоязычное распознавание речи, а также перевод речи и определение языка. Модель Whisper v2-large в настоящее время доступна через наш API с именем модели whisper-1.

В настоящее время нет различий между открытой версией Whisper и версией, доступной через наш API. Однако через наш API мы предлагаем оптимизированный процесс вывода, который делает работу с Whisper через наш API гораздо быстрее, чем через другие средства. Для получения более технических деталей о Whisper можно прочитать статью.

Embeddings – это числовое представление текста, которое можно использовать для измерения схожести между двумя текстами. Наша вторая генерация модели встраивания, text-embedding-ada-002, предназначена для замены предыдущих 16 моделей первого поколения с небольшой частью затрат. Embeddings полезны для поиска, кластеризации, рекомендаций, обнаружения аномалий и задач классификации.

Базовые модели GPT могут понимать и генерировать естественный язык или код, но не обучены следованию инструкциям. Эти модели созданы в качестве замены нашим оригинальным базовым моделям GPT-3 и используют устаревший API Completions. Большинство клиентов должны использовать GPT-3.5 или GPT-4.

МодельОписаниеМаксимум токеновОбучающие данные
babbage-002

Замена базовым моделям GPT-3 ada и babbage.

16,384 токенаДо сентября 2021
davinci-002

Замена базовым моделям GPT-3 curie и davinci.

16,384 токенаДо сентября 2021

Ваши данные принадлежат вам.

Для выявления злоупотреблений, данные API могут храниться до 30 дней, после чего они будут удалены (если иное не требуется по закону). Для доверенных клиентов с чувствительными приложениями может быть доступно хранение данных равное нулю. При нулевом хранении данных запросы и ответы не сохраняются ни в каких журналах логирования и существуют только в памяти для обработки запроса.

Конечная точкаДанные используемые для обученияХранение по умолчаниюВозможность нулевого хранения

/v1/chat/completions*

Нет30 днейДа, за исключением входных изображений*
/v1/filesНетДо удаления клиентомНет
/v1/assistantsНетДо удаления клиентомНет
/v1/threadsНет60 дней *Нет
/v1/threads/messagesНет60 дней *Нет
/v1/threads/runsНет60 дней *Нет
/v1/threads/runs/stepsНет60 дней *Нет
/v1/images/generationsНет30 днейНет
/v1/images/editsНет30 днейНет
/v1/images/variationsНет30 днейНет
/v1/embeddingsНет30 днейДа
/v1/audio/transcriptionsНетНулевое хранение данных-
/v1/audio/translationsНетНулевое хранение данных-
/v1/audio/speechНет30 днейНет
/v1/fine_tuning/jobsНетДо удаления клиентомНет
/v1/moderationsНетНулевое хранение данных-
/v1/completionsНет30 днейДа
  • Входы изображений через модель gpt-4-vision-preview не подлежат нулевому удержанию.

  • Для API помощников мы все еще оцениваем стандартный период удержания во время Беты. Мы ожидаем, что стандартный период удержания стабилизируется после окончания Беты.

Конечная точка

Последние модели

/v1/assistants

Поддерживаются все модели, кроме gpt-3.5-turbo-0301. Инструмент retrieval требует gpt-4-1106-preview или gpt-3.5-turbo-1106.

/v1/audio/transcriptions

whisper-1

/v1/audio/translations

whisper-1

/v1/audio/speech

tts-1, tts-1-hd

/v1/chat/completions

gpt-4 и датированные выпуски моделей, gpt-4-1106-preview, gpt-4-vision-preview, gpt-4-32k и датированные выпуски моделей, gpt-3.5-turbo и датированные выпуски моделей, gpt-3.5-turbo-16k и датированные выпуски моделей, адаптированные версии gpt-3.5-turbo

/v1/completions (Legacy)

gpt-3.5-turbo-instruct, babbage-002, davinci-002

/v1/embeddings

text-embedding-ada-002

/v1/fine_tuning/jobs

gpt-3.5-turbo, babbage-002, davinci-002

/v1/moderations

text-moderation-stable, text-moderation-latest

/v1/images/generations

dall-e-2, dall-e-3