एक अधिक सक्षम मॉडल, लेकिन पुरानी समस्या के साथ

OpenAI का GPT-5.5 उस तरह की सुर्खी के साथ आया है जो आमतौर पर किसी बड़े मॉडल रिलीज़ को परिभाषित करती है: यह अब Artificial Analysis Intelligence Index में शीर्ष पर है, और स्रोत पाठ के अनुसार Anthropic और Google के प्रमुख प्रतिस्पर्धियों से आगे निकल गया है। प्रदर्शन के लिहाज़ से, लॉन्च को संक्षेप में बताना आसान है। मुश्किल हिस्सा यह है कि वही रिपोर्ट एक स्थायी और गंभीर कमजोरी का भी वर्णन करती है: hallucination.

The Decoder के विवरण में GPT-5.5 को ऐसे मॉडल के रूप में प्रस्तुत किया गया है जो बड़े भाषा मॉडलों की सबसे जिद्दी व्यवहारगत खामियों में से एक को हल किए बिना frontier price-performance तस्वीर को बेहतर बनाता है। उन्नत AI प्रणालियों का मूल्यांकन करते समय यह संयोजन लगातार अधिक केंद्रीय होता जा रहा है। बेहतर स्कोर और बेहतर दक्षता मायने रखते हैं। उतना ही यह भी मायने रखता है कि मॉडल जानता है या नहीं कि उसे कब नहीं पता।

क्या बेहतर हुआ

स्रोत के अनुसार GPT-5.5 Artificial Analysis Intelligence Index पर 60 अंक हासिल करता है, जिससे यह Claude Opus 4.7 और Gemini 3.1 Pro Preview से तीन अंक आगे है, जो 57 पर बराबरी पर थे। यह भी कहा गया है कि मॉडल GPT-5.4 की तुलना में लगभग 40 प्रतिशत कम टोकन उपयोग करता है। यह टोकन कमी महत्वपूर्ण है क्योंकि यह रिलीज़ की economics बदल देती है।

नाममात्र रूप से, GPT-5.5 की API कीमत बढ़कर प्रति मिलियन input tokens $5 और प्रति मिलियन output tokens $30 हो गई, जबकि GPT-5.4 में यह कम थी। लेकिन कम टोकन खपत व्यवहार में इस बढ़ोतरी को नरम कर देती है। स्रोत अनुमान लगाता है कि दक्षता लाभों को ध्यान में रखने पर प्रभावी लागत वृद्धि लगभग 20 प्रतिशत है। बेंचमार्क के संदर्भ में, यह भी तर्क दिया गया है कि GPT-5.5 Anthropic के मॉडल की maximum settings की तुलना में बहुत कम लागत पर medium compute पर Claude Opus 4.7-स्तरीय स्कोर हासिल कर सकता है।

यह वही तरह का tradeoff है जिसे developers वास्तव में नोटिस करते हैं। frontier model race अब सिर्फ leaderboard पर सबसे ऊपर पहुँचने के बारे में नहीं है। यह इस बारे में है कि क्या performance gains उचित token usage, manageable latency और production deployment को सही ठहराने लायक विश्वसनीयता के साथ आते हैं। इन मानदंडों पर, GPT-5.5 OpenAI की स्थिति को मजबूत करता दिखता है।