Cursor Composer 2.5 குறைந்த செலவில் முன்னணி AI coding models-ஐ குறிவைக்கிறது

கோடிங் மாடல் சந்தையில் விலைச் சவால் வருகிறது

Cursor Composer 2.5 என்ற புதிய in-house AI coding model-ஐ வெளியிட்டுள்ளது; அந்த model முன்னணி frontier systems-இன் benchmark performance-க்கு இணையாக செயல்பட முடியும் என்றும், ஆனால் செலவின் ஒரு சிறிய பகுதியிலேயே இயங்கும் என்றும் நிறுவனம் கூறுகிறது. இந்தக் கூற்று உண்மையான developer workflows-இல் நிலைத்தால், generative AI-யின் மிகவும் வணிக ரீதியாக செயல்படும் பிரிவுகளில் ஒன்றில் போட்டி இன்னும் தீவிரமாகலாம்.

The Decoder வெளியிட்ட செய்தியின் படி, Composer 2.5 Moonshot-ன் open-source Kimi K2.5 checkpoint-ஐ அடிப்படையாகக் கொண்டு உருவாக்கப்பட்டுள்ளது, மேலும் Cursor-ன் முந்தைய Composer 2 model-ஐ விட 25 மடங்கு அதிக synthetic tasks-இல் பயிற்சி பெற்றுள்ளது. கூடுதல் training மற்றும் reinforcement learning-க்கு compute budget-இன் 85 சதவீதம் செலவிடப்பட்டதாக Cursor கூறுகிறது; இதனால் இந்த release-ஐ அவர்கள் ஒரு சிறிய finetune-ஆக மட்டும் கருதவில்லை என்பது தெரிகிறது.

முக்கியக் கூற்று performance parity பற்றியது. Composer 2.5 SWE-Bench Multilingual-இல் 79.8 சதவீதமும் CursorBench v3.1-இல் 63.2 சதவீதமும் பெற்றதாக Cursor தெரிவிக்கிறது; அந்த tests-இல் model Opus 4.7 மற்றும் GPT-5.5-க்கு இணையாக உள்ளது என்று அது கூறுகிறது. coding-model சந்தையில் benchmark parity முக்கியமானது, ஏனெனில் இப்போது பல வாடிக்கையாளர்கள் broad language fluency-ஐ விட software-specific tasks, כגון bug fixing, repository navigation, மற்றும் நம்பகமான code generation ஆகியவற்றின் அடிப்படையில் தயாரிப்புகளை ஒப்பிடுகின்றனர்.

செலவு குறித்த கூற்று மதிப்பெண்களை விட அதிக முக்கியத்துவம் பெறலாம்

Benchmarks கவனத்தை ஈர்க்கும்; ஆனால் வணிக ரீதியான வலுவான வாதம் pricing-இல் இருக்கலாம். Composer 2.5-ன் விலை input tokens-க்கு प्रति மில்லியன் $0.50, output tokens-க்கு प्रति மில்லியன் $2.50 என்று Cursor கூறுகிறது. அதே reported performance-உடன் உள்ள faster variant input tokens-க்கு प्रति மில்லியன் $3.00, output tokens-க்கு प्रति மில்லியன் $15.00 என விலை நிர்ணயம் செய்யப்பட்டுள்ளது. இதனால் வழக்கமான task costs Anthropic மற்றும் OpenAI-யின் போட்டி high-end systems-ஐ விட குறிப்பிடத்தக்க அளவில் குறைவாக இருக்கும் என்று நிறுவனம் கூறுகிறது.

இது முக்கியமானது, ஏனெனில் coding assistants inference cost-க்கு மிகுந்த உணர்திறன் கொண்டவை. அவை பெரும்பாலும் நீண்ட context, repeated edits, agentic loops, மற்றும் multi-file operations-இல் வேலை செய்கின்றன; இதனால் task-க்கு செலவு விரைவாக அதிகரிக்கலாம். சந்தையின் உச்ச மட்டத்துக்கு நெருக்கமான performance-ஐ வழங்கி, marginal cost-ஐ கணிசமாக குறைக்கும் model end users-க்கும், scale-இல் பொருளாதார ரீதியாகச் சாத்தியமான அமைப்பை நாடும் platform builders-க்கும் ஈர்க்கக்கூடியதாகிறது.

எனவே இந்த release AI infrastructure-இல் உருவாகி வரும் ஒரு பெரிய pattern-இல் பொருந்துகிறது: போட்டி இனி சிறந்த model யாரிடம் உள்ளது என்பதில் மட்டும் இல்லை. frontier-level performance-ஐ மிகச் சிறந்த operating cost-இல் யார் வழங்க முடியும் என்பதும் அதே அளவு முக்கியம். coding-இல், பயனர்கள் product-இன் உள்ளே நேரடியாக output-ஐ ஒப்பிட முடிவதால், இந்த tradeoff மிகவும் தெளிவாகப் பார்க்கப்படுகிறது.

Create, edit and star in videos with two Google Vids updates

Google Vids-இல் Gemini Omni மற்றும் தனிப்பட்ட அவதாரங்கள் சேர்க்கப்பட்டன

Google Workspace-இல் AI வீடியோ உருவாக்கத்தை Google விரிவுபடுத்துகிறது; இதில் prompt-அடிப்படையிலான கிளிப் உருவாக்கம், திருத்தம், மேலும் selfie மற்றும் குரல் பதிவில் இருந்து உருவாக்கப்படும் தனிப்பயன் அவதாரங்களும் உள்ளன.

Read article

Synthetic training மற்றும் product integration

Composer 2.5, specialized AI firms open checkpoints-ஐ அடிப்படையாகக் கொண்டு training data, reinforcement learning, மற்றும் product integration மூலம் எவ்வாறு வேறுபாடு உருவாக்குகின்றன என்பதையும் காட்டுகிறது. Cursor-ன் 25 மடங்கு அதிக synthetic tasks என்ற விளக்கம், generated அல்லது programmatically constructed workloads coding-model behavior-ஐ மேம்படுத்துவதில் இன்னும் மையமாக உள்ளன என்பதைக் காட்டுகிறது. Proprietary base-model development-ஐ முழுமையாக நம்பாமல் வேகமாக முன்னேற விரும்பும் குழுக்களுக்கு synthetic training முக்கிய lever ஆக மாறியுள்ளது.

இந்த model ஏற்கனவே Cursor-இல் live-ஆக உள்ளது, எனவே இது ஒரு research announcement-ஆக மட்டும் இல்லாமல் உடனடி distribution-ஐப் பெறுகிறது. இது முக்கியமான வேறுபாடு. பல model claims முதலில் papers அல்லது benchmark tables-இல் சுழல்கின்றன, பின்னர் production use-க்கு வந்து சேர்கின்றன. Composer 2.5 நேரடியாக coding environment-இன் உள்ளே வருகிறது; அங்கு பயனர்கள் benchmark gains நடைமுறை உதவியாக மாறுகிறதா என்பதை சோதிக்க முடியும்.

அப்படியிருந்தும் benchmark comparisons-ஐ கவனமாகப் படிக்க வேண்டும். கொடுக்கப்பட்ட source text Cursor-ன் கணக்குகளையும் named rival systems-க்கு இணையான performance என்ற கூற்றையும் தெரிவிக்கிறது; ஆனால் உண்மையான மதிப்பீடு model நீண்ட sessions, தெளிவில்லாத அறிவுறுத்தல்கள், repository-specific reasoning, மற்றும் production conditions-இல் error recovery ஆகியவற்றை எவ்வாறு கையாளுகிறது என்பதையே சார்ந்திருக்கும். Coding assistants-ஐ one-shot correctness-ஐ விட, முழு development loop முழுவதும் அவை எவ்வளவு பயனுள்ளதாக இருக்கின்றன என்பதில்தான் பெரும்பாலும் மதிப்பிடுகின்றனர்.

வெளியீட்டின் பின்னால் இருக்கும் பெரிய நோக்கம்

இந்த launch ஒரு பெரிய strategic முயற்சியின் பகுதியாகவும் விவரிக்கப்படுகிறது. அதே report-ன்படி, Cursor SpaceX மற்றும் xAI உடன் scratch-இல் இருந்து இன்னும் பெரிய successor model-ஐ பயிற்சி செய்து வருகிறது; Colossus-2 cluster-இல் பத்து மடங்கு compute மற்றும் ஒரு million H100 equivalents பயன்படுத்தப்படுகிறது. இந்தத் திட்டம் எதிர்காலத்தை நோக்கியதாயினும், Composer 2.5-ஐ ஒரு பெரிய கதையின் பகுதியாக அமைக்கிறது: Cursor வெறும் editor-இல் வெளிப்புற models-ஐ integrate செய்வதில்லை, தன்னுடைய training agenda கொண்ட model builder-ஆக தன்னை நிறுவ முயல்கிறது.

பெரிய AI market-க்கு இது முக்கியமானது, ஏனெனில் application companies model stack-இன் கீழ்த்தரங்களுக்கு எவ்வாறு இறங்குகின்றன என்பதை இது காட்டுகிறது. ஒரு product company open foundations, heavy synthetic training, மற்றும் aggressive pricing-ஐப் பயன்படுத்தி போட்டியிடக்கூடிய specialist model-ஐ உருவாக்க முடிந்தால், அது பெரிய model vendors மீது இரு திசைகளிலிருந்தும் அழுத்தம் கொடுக்கும்: performance expectations உயர்ந்தபடியே இருக்கும், அதே நேரத்தில் premium prices-ஐ ஏற்கும் விருப்பம் குறையலாம்.

Composer 2.5 எனவே ஒரு வழக்கமான model refresh-ஐ விட அதிகமானதாகத் தெரிகிறது. focused training மற்றும் product-native deployment flagship systems-உடன் உள்ள இடைவெளியை எவ்வாறு குறைக்கலாம், மேலும் AI coding-இன் economics-ஐ எவ்வாறு மறுஎழுதலாம் என்பதற்கான ஒரு சோதனை இது. developers model-ஐ விளம்பரப்படுத்தப்பட்டபடி செயல்படுவதாகக் கண்டால், மிக முக்கியமான benchmark leaderboard score அல்லாமல், மற்ற சந்தையை பதிலளிக்க வைக்கும் அந்த price point ஆக இருக்கலாம்.

இந்தக் கட்டுரை The Decoder-ன் செய்தி அடிப்படையில் உருவாக்கப்பட்டது. மூலக் கட்டுரையைப் படிக்கவும்.

Originally published on the-decoder.com

Cursor AI கோடிங்கில் குறைந்த செலவு கொண்ட போட்டியாளராக Composer 2.5-ஐ அறிமுகப்படுத்துகிறது

கோடிங் மாடல் சந்தையில் விலைச் சவால் வருகிறது

செலவு குறித்த கூற்று மதிப்பெண்களை விட அதிக முக்கியத்துவம் பெறலாம்

Google Vids-இல் Gemini Omni மற்றும் தனிப்பட்ட அவதாரங்கள் சேர்க்கப்பட்டன

Synthetic training மற்றும் product integration

வெளியீட்டின் பின்னால் இருக்கும் பெரிய நோக்கம்

Comments (0)

Keep Reading