நேரடி குரல் இடைமுகங்களில் OpenAI இன்னும் முன்னேறுகிறது
OpenAI தனது API-யில் குரல் நுண்ணறிவு அம்சங்களின் புதிய தொகுப்பைச் சேர்த்துள்ளது; இதன் மூலம் மென்பொருள் தயாரிப்புகளில் நேரடி ஆடியோவுடன் டெவலப்பர்கள் மேலும் பலவற்றை செய்ய முடிகிறது. புதிய கருவிகள் பயன்பாடுகள் பயனர்களுடன் பேசவும், பேச்சை உரையாக்கவும், உரையாடல்கள் நடைபெறும் போதே அவற்றை மொழிபெயர்க்கவும் உதவும் வகையில் வடிவமைக்கப்பட்டுள்ளன என்று நிறுவனம் கூறுகிறது.
இந்த வெளியீட்டில் மூன்று முக்கிய திறன்கள் உள்ளன: GPT-Realtime-2, GPT-Realtime-Translate மற்றும் GPT-Realtime-Whisper. இவை இணைந்து, சாதாரண குரல் உள்ளீடு மற்றும் வெளியீட்டைத் தாண்டி, ஒரு நேரடி உரையாடலின் ஓட்டத்திலேயே கேட்கவும், தர்க்கிக்கவும், மொழிபெயர்க்கவும், பதிலளிக்கவும் கூடிய அமைப்புகளுக்கான விரிவான முயற்சியை உருவாக்குகின்றன.
என்ன புதியது
முதல் மாடல் GPT-Realtime-2, இயற்கைத் தன்மை கொண்ட குரல் தொடர்புக்காக மேம்படுத்தப்பட்ட ஒரு குரல் மாடலாக அறிமுகப்படுத்தப்படுகிறது. இது முந்தைய GPT-Realtime-1.5-இல் இருந்து வேறுபடுகிறது என்று OpenAI கூறுகிறது, ஏனெனில் இது GPT-5 நிலை reasoning-ஐ அடிப்படையாகக் கொண்டு, மேலும் சிக்கலான பயனர் கோரிக்கைகளை கையாளும் வகையில் உருவாக்கப்பட்டுள்ளது. இதனால், ஒரு உரையாடல் என்பது குறுகிய prompts-களின் தொடர் மட்டுமல்லாமல், கூடுதல் சூழல் மற்றும் முடிவு எடுக்கும் திறன் தேவைப்படும் சூழல்களிலும் குரல் அமைப்புகளை மேலும் திறன் வாய்ந்ததாக மாற்ற நிறுவனம் முயல்கிறது என்பது தெரிகிறது.
இரண்டாவது வெளியீடு, GPT-Realtime-Translate, நேரடி மொழிபெயர்ப்புக்காக உருவாக்கப்பட்டுள்ளது. உரையாடல் சூழலில் பேசுபவரின் வேகத்துடன் ஒத்திசைந்து செயல்படும் real-time translation-ஐ இது வழங்க முடியும் என்று OpenAI கூறுகிறது. வழங்கப்பட்ட மூல உரைப்படி, இது 70-க்கும் அதிகமான input languages மற்றும் 13 output languages-ஐ ஆதரிக்கிறது.
மூன்றாவது கருவி, GPT-Realtime-Whisper, நேரடி speech-to-text transcription-ஐ மையமாகக் கொண்டது. பேசப்படும் உரையாடல்கள் நிகழும் போதே அவற்றைப் பிடித்து, தங்கள் பயன்பாடுகளில் உடனடி transcription-ஐச் சேர்க்க டெவலப்பர்களுக்கு வழி வழங்குகிறது என்று OpenAI கூறுகிறது.



