OpenAI выпускает новое поколение аудиомоделей: улучшенное распознавание и настройка стиля речи ИИОбновление включает улучшенное распознавание речи и возможность управлять стилем речи ИИ с помощью простых текстовых команд.
Наиболее примечательной особенностью является новая модель gpt-4o-mini-tts преобразования текста в речь. Система реагирует на такие инструкции по стилю, как «говорите как пират» или «расскажите это как сказку на ночь», что позволяет разработчикам точно настраивать звучание голоса ИИ. Эти возможности основаны на архитектурах GPT-4o и GPT-4o-mini от OpenAI, которые обрабатывают несколько типов входных и выходных данных.
источник -
здесь