Модели

Обзор

API OpenAI работает на основе разнообразного набора моделей с различными возможностями и ценовыми категориями.

Модель	Описание
GPT-4 и GPT-4 Turbo	Набор моделей, которые улучшены по сравнению с GPT-3.5 и могут понимать, а также генерировать естественный язык или код
GPT-3.5	Набор моделей, которые улучшены по сравнению с GPT-3 и могут понимать, а также генерировать естественный язык или код
DALL·E	Модель, которая может генерировать и редактировать изображения по запросу на естественном языке
TTS	Набор моделей, которые могут преобразовывать текст в звучащий естественным образом голосовой аудио
Whisper	Модель, которая может преобразовывать аудио в текст
Embeddings	Набор моделей, которые могут преобразовывать текст в числовую форму
GPT base	Набор моделей без выполнения инструкций, которые могут понимать, а также генерировать естественный язык или код

Мы также опубликовали модели с открытым исходным кодом, включая Point-E, Whisper, Jukebox и CLIP.

Постоянное обновление моделей

gpt-3.5-turbo, gpt-4, и gpt-4-turbo-preview указывают на последнюю версию модели. Вы можете проверить это, изучив объект ответа после отправки запроса. В ответ будет включена конкретная используемая версия модели (например, gpt-3.5-turbo-0613).

Мы также предлагаем статические версии моделей, которыми разработчики могут продолжать пользоваться как минимум три месяца после введения обновленной модели. С новым ритмом обновлений моделей мы также даём людям возможность вносить свой вклад в оценки для помощи нам в улучшении модели для различных случаев использования. Если вас это интересует, проверьте репозиторий OpenAI Evals.

GPT-4 и GPT-4 Turbo

GPT-4 — это крупная мультимодальная модель (принимает входные данные в виде текста или изображений и выдаёт текст), которая может решать сложные задачи с более высокой точностью, чем любая из наших предыдущих моделей, благодаря своим широким общим знаниям и продвинутым способностям рассуждения. Как и gpt-3.5-turbo, GPT-4 оптимизирован для чата, но также хорошо работает для традиционных задач завершения с использованием Chat Completions API. Узнайте, как использовать GPT-4, в нашем руководстве по GPT.

Модель	Описание	Окно контекста	Обучающие данные
gpt-4-0125-preview	GPT-4 Turbo Последняя модель GPT-4, направленная на снижение случаев «лени», когда модель не выполняет задачу. Возвращает максимум 4,096 выходных токенов.	128,000 токенов	До декабря 2023
gpt-4-turbo-preview	В настоящее время указывает на gpt-4-0125-preview.	128,000 токенов	До декабря 2023
gpt-4-1106-preview	Модель GPT-4 Turbo с улучшенным выполнением инструкций, режимом JSON, воспроизводимыми результатами, параллельным вызовом функций и др. Возвращает максимум 4,096 выходных токенов. Это превью модель.	128,000 токенов	До апреля 2023
gpt-4-vision-preview	GPT-4 с возможностью понимать изображения, в дополнение ко всем другим возможностям GPT-4 Turbo. В настоящее время указывает на gpt-4-1106-vision-preview.	128,000 токенов	До апреля 2023
gpt-4-1106-vision-preview	GPT-4 с возможностью понимать изображения, в дополнение ко всем другим возможностям GPT-4 Turbo. Возвращает максимум 4,096 выходных токенов. Это версия превью модели.	128,000 токенов	До апреля 2023
gpt-4	В настоящее время указывает на gpt-4-0613. Смотрите постоянное обновление моделей.	8,192 токена	До сентября 2021
gpt-4-32k	В настоящее время указывает на gpt-4-32k-0613. Смотрите постоянное обновление моделей.	32,768 токенов	До сентября 2021
gpt-4-0613	Снимок gpt-4 от 13 июня 2023 года с улучшенной поддержкой вызова функций.	8,192 токена	До сентября 2021
gpt-4-32k-0613	Снимок gpt-4-32k от 13 июня 2023 года с улучшенной поддержкой вызова функций.	32,768 токенов	До сентября 2021

Для многих базовых задач разница между моделями GPT-4 и GPT-3.5 не значительна. Однако в более сложных ситуациях рассуждения модель GPT-4 гораздо более способна, чем любая из наших предыдущих моделей.

GPT-3.5

Модели GPT-3.5 могут понимать и генерировать естественный язык или код. Наша наиболее способная и экономически выгодная модель в семействе GPT-3.5 - gpt-3.5-turbo, которая была оптимизирована для чата с использованием Chat Completions API, но также хорошо работает и для традиционных задач автозавершения.

Модель	Описание	Окно контекста	Тренировочные данные
gpt-3.5-turbo-0125	Обновленный GPT 3.5 Turbo Последняя модель GPT-3.5 Turbo с более высокой точностью ответов в запрашиваемых форматах и исправлением ошибки, которая вызывала проблемы с кодировкой текста для функций на неанглийском языке. Возвращает максимум 4,096 токенов на выходе.	16,385 токенов	До сентября 2021
gpt-3.5-turbo	В настоящее время указывает на gpt-3.5-turbo-0613. Псевдоним модели gpt-3.5-turbo будет автоматически обновлен с gpt-3.5-turbo-0613 на gpt-3.5-turbo-0125 16 февраля.	4,096 токенов	До сентября 2021
gpt-3.5-turbo-1106	Модель GPT-3.5 Turbo с улучшенным выполнением инструкций, режимом JSON, воспроизводимыми выходными данными, параллельным вызовом функций и многим другим. Возвращает максимум 4,096 токенов на выходе.	16,385 токенов	До сентября 2021
gpt-3.5-turbo-instruct	Аналогичные возможности, как у моделей эпохи GPT-3. Совместим с устаревшим конечным точкам Completions и не с Chat Completions.	4,096 токенов	До сентября 2021

DALL·E

DALL·E — это система ИИ, которая может создавать реалистичные изображения и искусство из описания на естественном языке. DALL·E 3 в настоящее время поддерживает возможность, получив запрос, создать новое изображение определенного размера. DALL·E 2 также поддерживает возможность редактировать существующее изображение или создавать вариации предоставленного пользователем изображения.

Модель	Описание
dall-e-3	DALL·E 3 Последняя модель DALL·E, выпущенная в ноябре 2023 года.
dall-e-2	Предыдущая модель DALL·E, выпущенная в ноябре 2022 года. Вторая итерация DALL·E с более реалистичными, точными и в 4 раза более высоким разрешением изображений, чем у оригинальной модели.

TTS

TTS — это модель ИИ, которая преобразует текст в естественно звучащий разговорный текст. Мы предлагаем две разные вариации модели, tts-1 оптимизирована для реального времени использования текста в речь и tts-1-hd оптимизирована для качества. Эти модели могут использоваться с конечной точкой речи в Audio API.

Модель	Описание
tts-1	Text-to-speech 1 Последняя модель преобразования текста в речь, оптимизированная для скорости.
tts-1-hd	Text-to-speech 1 HD Последняя модель преобразования текста в речь, оптимизированная для качества.

Whisper

Whisper – это универсальная модель распознавания речи. Она обучена на большом наборе разнообразных аудио и также является многозадачной моделью, которая может выполнять многоязычное распознавание речи, а также перевод речи и определение языка. Модель Whisper v2-large в настоящее время доступна через наш API с именем модели whisper-1.

В настоящее время нет различий между открытой версией Whisper и версией, доступной через наш API. Однако через наш API мы предлагаем оптимизированный процесс вывода, который делает работу с Whisper через наш API гораздо быстрее, чем через другие средства. Для получения более технических деталей о Whisper можно прочитать статью.

Embeddings

Embeddings – это числовое представление текста, которое можно использовать для измерения схожести между двумя текстами. Наша вторая генерация модели встраивания, text-embedding-ada-002, предназначена для замены предыдущих 16 моделей первого поколения с небольшой частью затрат. Embeddings полезны для поиска, кластеризации, рекомендаций, обнаружения аномалий и задач классификации.

GPT base

Базовые модели GPT могут понимать и генерировать естественный язык или код, но не обучены следованию инструкциям. Эти модели созданы в качестве замены нашим оригинальным базовым моделям GPT-3 и используют устаревший API Completions. Большинство клиентов должны использовать GPT-3.5 или GPT-4.

Модель	Описание	Максимум токенов	Обучающие данные
babbage-002	Замена базовым моделям GPT-3 ada и babbage.	16,384 токена	До сентября 2021
davinci-002	Замена базовым моделям GPT-3 curie и davinci.	16,384 токена	До сентября 2021

Как мы используем ваши данные

Ваши данные принадлежат вам.

Для выявления злоупотреблений, данные API могут храниться до 30 дней, после чего они будут удалены (если иное не требуется по закону). Для доверенных клиентов с чувствительными приложениями может быть доступно хранение данных равное нулю. При нулевом хранении данных запросы и ответы не сохраняются ни в каких журналах логирования и существуют только в памяти для обработки запроса.

Политики использования по умолчанию для конечных точек

Конечная точка	Данные используемые для обучения	Хранение по умолчанию	Возможность нулевого хранения
/v1/chat/completions*	Нет	30 дней	Да, за исключением входных изображений*
/v1/files	Нет	До удаления клиентом	Нет
/v1/assistants	Нет	До удаления клиентом	Нет
/v1/threads	Нет	60 дней *	Нет
/v1/threads/messages	Нет	60 дней *	Нет
/v1/threads/runs	Нет	60 дней *	Нет
/v1/threads/runs/steps	Нет	60 дней *	Нет
/v1/images/generations	Нет	30 дней	Нет
/v1/images/edits	Нет	30 дней	Нет
/v1/images/variations	Нет	30 дней	Нет
/v1/embeddings	Нет	30 дней	Да
/v1/audio/transcriptions	Нет	Нулевое хранение данных	-
/v1/audio/translations	Нет	Нулевое хранение данных	-
/v1/audio/speech	Нет	30 дней	Нет
/v1/fine_tuning/jobs	Нет	До удаления клиентом	Нет
/v1/moderations	Нет	Нулевое хранение данных	-
/v1/completions	Нет	30 дней	Да

Входы изображений через модель gpt-4-vision-preview не подлежат нулевому удержанию.
Для API помощников мы все еще оцениваем стандартный период удержания во время Беты. Мы ожидаем, что стандартный период удержания стабилизируется после окончания Беты.

Совместимость конечных точек модели

Конечная точка	Последние модели
/v1/assistants	Поддерживаются все модели, кроме gpt-3.5-turbo-0301. Инструмент retrieval требует gpt-4-1106-preview или gpt-3.5-turbo-1106.
/v1/audio/transcriptions	whisper-1
/v1/audio/translations	whisper-1
/v1/audio/speech	tts-1, tts-1-hd
/v1/chat/completions	gpt-4 и датированные выпуски моделей, gpt-4-1106-preview, gpt-4-vision-preview, gpt-4-32k и датированные выпуски моделей, gpt-3.5-turbo и датированные выпуски моделей, gpt-3.5-turbo-16k и датированные выпуски моделей, адаптированные версии gpt-3.5-turbo
/v1/completions (Legacy)	gpt-3.5-turbo-instruct, babbage-002, davinci-002
/v1/embeddings	text-embedding-ada-002
/v1/fine_tuning/jobs	gpt-3.5-turbo, babbage-002, davinci-002
/v1/moderations	text-moderation-stable, text-moderation-latest
/v1/images/generations	dall-e-2, dall-e-3