முழுமையான agent workflows-ஐ நோக்கி Qwen-ஐ Alibaba நகர்த்துகிறது

Alibaba-வின் Qwen குழு Qwen3.7-Plus-ஐ வெளியிட்டுள்ளது. இது visual understanding-ஐ coding மற்றும் tool use போன்ற பாரம்பரிய agent திறன்களுடன் இணைக்கும் ஒரு புதிய multimodal model. நிறுவனம் இதை ஒரு multimodal interactive hybrid agent என்று விவரிக்கிறது; அதன் நிலைப்பாடு குறிப்பிடத்தக்கது: image input கொண்ட chatbot என அல்ல, interfaces-ஐ உணர்ந்து அவற்றுக்குள் செயல்பட வேண்டிய system என இது முன்வைக்கப்படுகிறது.

வழங்கப்பட்ட source text-இன் படி, Qwen3.7-Plus நிஜ உலகக் காட்சிகளை அடையாளம் காண, screen content-ஐ படிக்க, graphical user interfaces-ஐ இயக்க, visual templates-இல் இருந்து code எழுத, மற்றும் mobile apps-ஐ end to end navigate செய்ய வடிவமைக்கப்பட்டுள்ளது. இயங்கும் முறை முக்கியமானது. UI clicks மற்றும் command-line instructions ஒரே agent loop-இல் இயங்குகின்றன; இது perception, planning, execution ஆகியவற்றுக்காக தனித்தனி models-ஐ விட, automation-ன் மேலும் ஒருங்கிணைந்த வடிவத்தை Alibaba நோக்குகிறதென காட்டுகிறது.

நீண்டகால tasks இந்த pitch-ன் மையம்

Alibaba-வின் showcase examples நீண்ட workflows-இல் autonomy-க்கு கவனம் செலுத்துகின்றன. ஒரு demonstration-இல், ஒரு hybrid agent system 11 மணி நேரத்துக்கும் மேலாக ஒரு English vocabulary learning app-ஐ உருவாக்கியது. source-ன் கூற்றுப்படி, அந்த run 1,000-க்கும் அதிகமான agent calls-இல் 10,000-க்கும் அதிகமான code lines-ஐ உருவாக்கியது.

அறிக்கையிடப்பட்ட செயல்முறையில் requirements documentation, automated code generation, dependency installation, test-case creation, GUI-based testing, parallel test scenarios, மற்றும் version management ஆகியவை இடம்பெற்றன. இந்த விவரங்கள் முக்கியமானவை; ஏனெனில் இவை கதையை ஒரே முறை செய்யும் coding demo-வைக் கடந்ததாக மாற்றுகின்றன. பல கட்டங்களைக் கொண்ட software project-ஐ model தொடர்ந்து கையாள முடியும், மேலும் மனித உதவி மீண்டும் மீண்டும் இன்றி tools மற்றும் interfaces முழுவதும் இயங்கத் தொடர முடியும் என்பதையே Alibaba வலியுறுத்துகிறது.

இரண்டாவது demonstration software generation-இலிருந்து software imitation-க்கு நகர்ந்தது. interface-ஐ parse செய்து, SwiftUI code உருவாக்கி, வெளிப்புற real-time stock data API-ஐ இணைத்து, முடிவை compile செய்து, அதன் சொந்தமாக பத்து functional tests ஓட்டி, Apple-ன் native macOS Stocks app-ஐ agent மீள உருவாக்கியதாக Alibaba கூறுகிறது. அந்த செயல்திறன் பரவலாக பொருந்தினால், model-ன் மதிப்பு prompts-க்கு பதில் அளிப்பதைவிட, செயல்படும் interface-ஐ பார்த்து அதை code-ஆக மீண்டும் உருவாக்குவதற்கிடையிலான நேரத்தை குறைப்பதில் அதிகமாக இருக்கலாம்.

Browser மற்றும் cloud operations பரப்பை விரிவாக்குகின்றன

மூன்றாவது use case model-ஐ browser-based operations-க்கு விரிவாக்குகிறது. Qwen for Chrome என்ற sidebar extension வழியாக, system user permission-ுடன் agent mode-க்கு மாறி cloud console tasks-ஐ செய்ய முடியும். source text-இல் ஒரு எடுத்துக்காட்டாக, image, storage, மற்றும் security-group options-ஐ அமைப்பதுடன், கிடைக்கும் மிகக் குறைந்த விலை virtual server instance-ஐ model வாங்கியதாக குறிப்பிடப்படுகிறது.

Alibaba மேலும் model follow-up scaling மற்றும் maintenance tasks-ஐ கையாண்டதாக கூறுகிறது. இது முக்கியம்; ஏனெனில் pitch-ஐ தனித்த tasks முடிப்பதிலிருந்து lifecycle management-க்கு மாற்றுகிறது. ஒரு சேவையை உருவாக்கவும், test செய்யவும், configure செய்யவும், பின்னர் பராமரிக்கவும் கூடிய model, சாதாரணமாக engineers, scripts, மற்றும் workflow tools இணைப்புக்காக நிறுவனங்கள் ஒதுக்கியிருந்த பகுதிக்குள் நுழைகிறது.

வலுவான GUI performance, ஆனால் pure reasoning-இல் பலவீனம்

வழங்கப்பட்ட material-இல் benchmark நிலை கலவையாக உள்ளது. Alibaba-வின் வெளியிடப்பட்ட முடிவுகள், Qwen3.7-Plus graphical interface tasks-இல் குறிப்பாக சிறப்பாக செயல்படுவதாக reportedly காட்டுகின்றன. AndroidWorld மற்றும் ScreenSpot Pro-வில், model GPT-5.4 (xhigh)-ஐ விட தெளிவாக முன்னிலையில் இருப்பதாக விவரிக்கப்படுகிறது. இது crowded market-இல் Alibaba-க்கு ஒரு தெளிவான கோணத்தை அளிக்கிறது: interface manipulation AI-யின் முக்கிய போர் களமாக மாறினால், Qwen உரையாடலிலேயே அல்ல, execution-இலும் போட்டியிட விரும்புகிறது.

அதே நேரத்தில், source text system pure logic benchmarks-இல் பின்தங்குவதாக கூறுகிறது. இந்த caveat முக்கியமானது. சூழல் தானாக structure, visual anchors, மற்றும் action affordances-ஐ வழங்கும் போது Qwen3.7-Plus மிகவும் பயனுள்ளதாக இருக்கலாம்; ஆனால் அந்த context இல்லாமல் abstract reasoning tasks-ஐ தீர்க்க வேண்டியபோது அது குறைவாக இருக்கலாம் என்பதைக் இது சுட்டிக்காட்டுகிறது.

நடைமுறையில், software-ஐ பார்ப்பதிலும் அதற்குள் செயல்படுவதிலும் model-ன் வலிமைகள் rooted ஆக உள்ளன போல தெரிகிறது. இது intelligence-ன் ஒரு குறுகிய, ஆனால் வணிக ரீதியாக முக்கியமான வரையறை; குறிப்பாக enterprise automation, testing, customer operations, மற்றும் software prototyping-க்கு.

இந்த வெளியீடு ஏன் முக்கியம்

Qwen3.7-Plus, Alibaba Cloud வழியாக proprietary ஆனால் ஒப்பீட்டளவில் மலிவான option-ஆகவும் நிலைநிறுத்தப்பட்டுள்ளது. விலை மற்றும் deployment path முக்கியமானவை; ஏனெனில் agentic systems நீண்ட sessions இயக்கும்போது, பல calls execute செய்யும்போது, மற்றும் வெளிப்புற tools-உடன் தொடர்பு கொள்ளும்போது செலவு விரைவாக உயரலாம். Alibaba operating costs-ஐ குறைவாக வைத்துக்கொண்டு வலுவான interface performance-ஐ வழங்கினால், frontier-model pricing இன்றி automation வேண்டுமென்பவர்களான developers மற்றும் businesses மத்தியில் அது வரவேற்பைப் பெறலாம்.

பெரிய பொருள் என்னவென்றால், AI vendors progress-ஐ எவ்வாறு வரையறுக்கிறார்கள் என்பதில் Qwen3.7-Plus ஒரு மாற்றத்தை பிரதிபலிக்கிறது. benchmark scores அல்லது chat quality-இல் மட்டுமே கவனம் செலுத்தாமல், ஒரு model interface-ஐ கவனிக்க, முடிவெடுக்க, tools-ஐ அழைக்க, code எழுத, மற்றும் மணி நேரங்களாக task-இல் நிலைத்திருக்க முடியுமா என்பதையே Alibaba வலியுறுத்துகிறது. இது reliability, oversight, மற்றும் failure handling தொடர்பான கடினமான கேள்விகளைத் தீர்க்கவில்லை. ஆனால் போட்டி எந்த திசையில் செல்கிறது என்பதை இது காட்டுகிறது: AI systems-ஐ அவை என்ன சொல்கின்றன என்பதனால் அல்ல, அவை என்ன முடிக்கின்றன என்பதனால் மதிப்பிடும் திசை.

இந்தக் கட்டுரை The Decoder-ன் செய்தியறிக்கையை அடிப்படையாகக் கொண்டது. அசல் கட்டுரையைப் படிக்கவும்.

Originally published on the-decoder.com