चीनमधील सर्वात मोठ्या AI नावांपैकी एकाचे बारकाईने पाहिलेले पुनरागमन
DeepSeek चा V4 preview release हा कंपनीच्या R1 reasoning system ने 2025 च्या सुरुवातीला efficient frontier AI भोवतीची जागतिक चर्चा बदलल्यानंतरचा सर्वात महत्त्वाचा model launch आहे. MIT Technology Review नुसार, नवीन flagship मागील generation पेक्षा खूपच लांब prompts process करू शकतो, आणि ही रचना मोठ्या प्रमाणातील text अधिक कार्यक्षमतेने हाताळण्यासाठी बनवली आहे. तितकेच महत्त्वाचे म्हणजे तो अजूनही open source आहे, ज्यामुळे advanced model weights व्यापकपणे उपलब्ध करून देण्याची, आणि त्यांना पूर्णपणे proprietary service मागे बंद न ठेवण्याची कंपनीची strategy कायम राहते.
हे संयोजन महत्त्वाचे आहे, कारण ते सध्याच्या AI market मधील दोन मोठ्या मर्यादांना लक्ष्य करते: cost आणि control. Longer-context handling आता अधिक महत्त्वाचे होत आहे, कारण developers coding tools, agent systems, आणि enterprise workflows तयार करत आहेत ज्यांना dense documents, लांब conversations, किंवा multi-step instructions ingest कराव्या लागतात. दुसरीकडे, open access कंपन्यांना मोजक्या US-based model providers वर पूर्णपणे अवलंबून न राहता, किंवा वाढत्या usage costs स्वीकारल्याशिवाय advanced capabilities वापरण्याचा मार्ग देते.
V4 का महत्त्वाचा आहे, जरी तो R1 सारखा बाजार हादरवत नसला तरी
MIT Technology Review स्पष्ट सांगते की V4 मुळे R1 ने जसा क्षेत्रात गोंधळ निर्माण केला तसा होण्याची शक्यता कमी आहे. पण त्याचा अर्थ release किरकोळ आहे असा नाही. DeepSeek आता हे सिद्ध करण्याचा प्रयत्न करत आहे की त्याचा आधीचा breakthrough केवळ अनुकूल क्षणी घडलेली एकदाच झालेली घटना नव्हती. दुसरा मोठा release कंपनीला एका एकमेव आश्चर्यापेक्षा सातत्याने काम करणारा frontier actor म्हणून प्रस्थापित करण्यास मदत करतो.
हा launch कठीण काळानंतर आला आहे. source text मध्ये महिन्यांच्या scrutiny, मोठ्या personnel departures, आधीच्या releases मधील विलंब, आणि US तसेच Chinese authorities कडून वाढलेल्या लक्षाचा उल्लेख आहे. या संदर्भात V4 हा केवळ technical update नाही, तर institutional resilience चेही विधान आहे. DeepSeek नवीन model घेऊनच परत आलेली नाही, तर तिला प्रथम प्रभावी बनवणाऱ्या open-model approach प्रति अजूनही कटिबद्ध राहून परत आली आहे.
दोन versions, एक strategy
कंपनी V4 दोन रूपांत रिलीज करत आहे: V4-Pro, coding आणि complex agent tasks साठी, आणि V4-Flash, जो जलद आणि स्वस्त चालवण्यासाठी डिझाइन केला आहे. दोन्ही versions मध्ये reasoning modes देखील आहेत, जे prompt हाताळताना model चे step-by-step processing दाखवतात. ही विभागणी व्यापक market pattern दर्शवते. Developers आता एकाच flagship पेक्षा model family पसंत करत आहेत: एक कठीण, उच्च-मूल्याच्या tasks साठी ट्यून केलेला, आणि दुसरा कमी latency व cost-sensitive वापरांसाठी optimize केलेला.
MIT Technology Review च्या सारांशानुसार, DeepSeek चे pricing claims हे कंपनीचा मोठा संदेश पुढे नेतात की high-end performance साठी premium-provider economics अपरिहार्य असतातच असे नाही. स्वतंत्र benchmarks शेवटी या दाव्यांची पूर्ण पुष्टी करतील का, हा वेगळा प्रश्न आहे. तातडीने महत्त्वाचे म्हणजे DeepSeek पुन्हा एकदा केवळ capability नव्हे तर affordability भोवतीही अपेक्षा ठरवत आहे. त्यामुळे proprietary labs आणि rival open-weight developers या दोघांवरही दबाव राहतो.
व्यापक महत्त्व
V4 हे AI मधील एक geopolitical reality देखील अधोरेखित करते. चीनचे model ecosystem स्थिर नाही, आणि open-weight releases जगभरातील developers आणि enterprises साठी त्याच्या सर्वात रणनीतिक exports पैकी एक बनत आहेत. DeepSeek च्या आधीच्या यशाने इतर Chinese firms कडून open-weight model launches च्या मोठ्या लाटेला चालना दिली. हा release सांगतो की ती गती अजूनही कायम आहे.
- V4 context handling वाढवतो आणि DeepSeek चे open-source distribution model अबाधित ठेवतो.
- हा launch महत्त्वाचा आहे कारण तो scrutiny, delays, आणि staff departures नंतर आला आहे.
- त्याचे Pro आणि Flash variants premium agentic workloads आणि कमी खर्चाच्या high-volume वापरात बाजार कसा विभागला जात आहे ते दाखवतात.
सर्वात महत्त्वाचा निष्कर्ष हा नाही की V4 लगेचच उद्योगातील सर्वोत्तम model बनेल. महत्त्वाचे हे आहे की DeepSeek अजूनही स्पर्धेच्या अटी ठरवत आहे. concentration ने परिभाषित झालेल्या market मध्ये, frontier ambitions असलेला कोणताही गंभीर open release benchmark arguments सुरू होण्याआधीच power balance बदलतो.
हा लेख MIT Technology Review च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.
Originally published on technologyreview.com




