Kimi K2.6 విడుదల: open-weight model మరియు 300-agent swarm సామర్థ్యం

Kimi K2.6 ఓపెన్-వెయిట్ ప్రతిపాదనతో frontier పోటీలోకి ప్రవేశిస్తోంది

Moonshot AI Kimi K2.6ను విడుదల చేసింది. ఇది కోడింగ్ మరియు ఏజెంట్ బెంచ్‌మార్క్‌లలో GPT-5.4, Claude Opus 4.6, మరియు Gemini 3.1 Proతో పోటీపడగలదని కంపెనీ చెబుతున్న ఓపెన్-వెయిట్ మోడల్. ఈ విడుదల బెంచ్‌మార్క్ దావాల వల్ల మాత్రమే కాదు, Moonshot వాటితో అసాధారణంగా దూకుడైన product directionను జత చేయడం వల్ల కూడా ప్రత్యేకంగా కనిపిస్తోంది: పెద్ద స్థాయి multi-agent execution.

అందించిన source text ప్రకారం, K2.6 Tools‌తో HLEలో 54.0, SWE-Bench Proలో 58.6, మరియు BrowseCompలో 83.2 సాధించింది. Rust, Go, మరియు Python వంటి భాషల్లో 4,000కు పైగా tool calls‌ను chain చేయగలదని, 12 గంటలకు పైగా నిరంతరంగా నడవగలదని Moonshot చెబుతోంది. OpenAI, Anthropic, మరియు Googleలకు చెందిన top systems‌తో coding మరియు agent tasks‌లో సమానంగా ఉండగలదని, కానీ pure reasoning మరియు visionలో వెనుకబడుతుందని ఈ మోడల్‌ను వివరిస్తున్నారు.

ఈ బలాలు మరియు బలహీనతల కలయిక సూచనాత్మకంగా ఉంది. K2.6 ఒకేసారి అన్నీ కావాలని ప్రయత్నించడం లేదు. ఇక్కడ దృష్టి operational performanceపై ఉంది: ఒక మోడల్ పనిని ఎంత బాగా విడగొడుతుంది, tools‌ను ఎలా పిలుస్తుంది, task‌పై ఎలా నిలబడుతుంది, మరియు దీర్ఘకాలిక software లేదా research workflows‌ను ఎలా పూర్తి చేస్తుంది. ప్రత్యేకించి enterprise కొనుగోలుదారులు మరియు developers benchmark theater కన్నా, ఒక మోడల్ నిజంగా పని ముగించగలదా అనే అంశంపై ఎక్కువ దృష్టి పెడుతున్న తరుణంలో frontier market మరింతగా ఇదే దిశగా సాగుతోంది.

ప్రధాన లక్షణం intelligence కాదు, scale

Moonshot యొక్క అతిపెద్ద దావా Agent Swarm. ఇది parallel‌గా 300 వరకు sub-agents‌ను నడపగల system, ప్రతి agent 4,000 steps వరకు తీసుకోగలదు. ఈ system పనులను స్వయంచాలకంగా subtasks‌గా విభజించి, వాటిని ప్రత్యేకీకరించిన agents‌కు అప్పగిస్తుందని కంపెనీ చెబుతోంది. ఈ agents web research, document analysis, మరియు writing‌ను కలిపి, websites, documents, slide decks, మరియు spreadsheets వంటి పూర్తయిన outputs‌ను ఒకే run‌లో ఉత్పత్తి చేయడమే లక్ష్యంగా పని చేస్తాయని వివరిస్తున్నారు.

ఈ సామర్థ్యాలు వాస్తవంలో నిలబడితే, దాని ప్రాముఖ్యత గణనీయంగా ఉంటుంది. AI agents చుట్టూ మార్కెట్ సంభాషణ చాలా కాలంగా ఒక మోడల్ స్వతంత్రంగా పనిచేయగలదా అనే ప్రశ్నపై కేంద్రీకృతమైంది. Kimi K2.6 ఆ ప్రశ్నను తిరిగి రూపకల్పన చేస్తోంది. ఒకే agent అన్నీ నిర్వహించాలనే బదులు, Moonshot model-scale orchestration వైపు నెట్టుతోంది, అక్కడ అనేక agents parallel‌గా పనిచేస్తాయి మరియు ఒక coordinating system వైఫల్యాలు, handoffs, specializationలను నిర్వహిస్తుంది.

source text‌లో "claw groups" అనే preview featureను కూడా ప్రస్తావించారు. ఇది మనుషులు మరియు అనేక agents ఒక teamలా కలిసి పనిచేయడానికి అనుమతిస్తుంది, ఇందులో K2.6 coordination‌ను నిర్వహించి, ఒక agent విఫలమైతే లేదా చిక్కుకుపోతే జోక్యం చేసుకుంటుంది. ఈ design choice ముఖ్యమైనది, ఎందుకంటే ఇది deployment‌కు మరింత వాస్తవికమైన model‌ను సూచిస్తోంది: పూర్తి autonomy కాదు, కానీ software agents మరియు మనుషులు కలిసి పని చేసే supervised swarms.

Google ప్రచురణకర్తలకు AI search opt-out ఇస్తోంది, కానీ నియంత్రణను తన చేతిలోనే ఉంచుకుంది

Google Search Consoleలో AI search controls మరియు reporting‌ను చేర్చుతోంది, అదే సమయంలో regulators AI-generated results‌పై ప్రచురణకర్తలకు మరింత హక్కు ఇవ్వాలని సంస్థపై ఒత్తిడి చేస్తున్నారు.

Read article

మూసివున్న model incumbents‌కు మరింత నేరుగా సవాలు

Moonshot దీన్ని open-weight model‌గా అందుబాటులోకి తీసుకువస్తున్నందున Kimi K2.6 మరింత గమనించదగ్గది. అత్యంత శక్తివంతమైన systems ఎక్కువగా కఠినంగా నియంత్రిత APIs మరియు subscription products ద్వారా అందించబడుతున్న మార్కెట్‌లో, open-weight విడుదల వేరే రకం ఒత్తిడిని సృష్టిస్తుంది. ఇది developers‌కు models‌ను inspect చేయడానికి, adapt చేయడానికి, host చేయడానికి, మరియు తమ stacks‌లో integrate చేయడానికి మరింత అవకాశం ఇస్తుంది, licenses‌లో కొన్ని షరతులు ఉన్నప్పటికీ.

ఈ సందర్భంలో, model modified MIT license కింద వస్తుంది. source text ప్రకారం, నెలకు 100 million కంటే ఎక్కువ active users లేదా నెలకు $20 million కంటే ఎక్కువ revenue ఉన్న commercial deployments, user interface‌లో స్పష్టంగా "Kimi K2.6"కి credit ఇవ్వాలి. ఇది పూర్తిగా షరతుల్లేని విడుదల కాదు, కానీ పూర్తిగా closed frontier systems‌తో పోలిస్తే విస్తృత access వైపు ఒక గణనీయమైన అడుగు.

Availability కూడా reach‌ను గరిష్ఠంగా చేయడానికి రూపొందించినట్టుగా కనిపిస్తోంది. Moonshot, K2.6ను kimi.comలో chat మరియు agent modeలో, Kimi Code ద్వారా coding tool‌గా, API ద్వారా, అలాగే Hugging Faceలో open-source download‌గా అందిస్తోంది. ఈ వ్యాప్తి, experiment చేయడం నుంచి production వరకు ఉన్న మొత్తం developer funnel‌లో పోటీ చేయాలనే కంపెనీ ఆకాంక్షను సూచిస్తోంది.

ఈ launch AI తదుపరి దశ గురించి ఏమి చెబుతోంది

ఈ విడుదలలో అత్యంత ముఖ్యమైన విషయం model progress అంటే ఏమిటి అనే దృష్టిలో మార్పు కావచ్చు. Moonshot K2.6ను ప్రధానంగా మెరుగైన chatbot‌గా ప్రదర్శించడం లేదు. దాన్ని extended execution కోసం ఒక system‌గా ప్రదర్శిస్తోంది. దీర్ఘ runs, భారీ tool usage, multi-agent delegation, మరియు పూర్తయిన artifacts ఈ pitch కేంద్రంలో ఉన్నాయి.

అది K2.6ను agentic software development‌లో ఎదుగుతున్న పోటీలో నేరుగా నిలబెడుతుంది. source text ప్రకారం, ఈ model text prompts నుండి animations మరియు database connectionsతో కూడిన పూర్తి websites‌ను రూపొందించగలదు, అలాగే user sign-ups, database operations, session management వంటి ప్రాథమిక full-stack పనులను కూడా నిర్వహించగలదు. ఆ outputs production‌కు సరిపడా నమ్మదగినవా అనే ప్రశ్న వేరే, కానీ దిశ స్పష్టంగా ఉంది: model vendors ఇప్పుడు prompt నుండి working system‌కు వెళ్లే మార్గాన్ని తమ ఆధీనంలోకి తీసుకోవాలనుకుంటున్నారు.

పోటీ framing కూడా ముఖ్యం. GPT-5.4 మరియు Claude Opus 4.6లను peers‌గా పేరు పెట్టడం ద్వారా, open-weight models ఇక కేవలం చౌకైన, బలహీనమైన ప్రత్యామ్నాయాలుగా చూడాల్సిన అవసరం లేదని Moonshot ప్రకటిస్తోంది. బదులుగా, కనీసం కొన్ని పని వర్గాల్లో, వాటిని అదే performance tier‌లో ఉన్న విశ్వసనీయ పోటీదారులుగా చూపించవచ్చు.

అయితే, ఇచ్చిన text‌లో ఒక ముఖ్యమైన caveat ఉంది: K2.6 pure reasoning మరియు visionలో top systems‌ కంటే వెనుకబడి ఉంది. అంటే model యొక్క promise raw all-purpose capability కంటే workflow design మరియు tool integration‌పై ఎక్కువగా ఆధారపడవచ్చు. కానీ బహుశా అదే అసలు పాయింట్ కావచ్చు. నిజ జీవిత deployments‌లో, కాలక్రమంలో అనేక సంకుచిత చర్యలను సమన్వయం చేయగలగడం generalized intelligence comparison‌ను గెలవడం కంటే ఎక్కువ ముఖ్యం కావచ్చు.

అందువల్ల Kimi K2.6 conventional model launch కంటే AI product design తదుపరి ఎటు వెళ్తుందో చెప్పే ప్రకటనలా కనిపిస్తోంది: parallel agents, long-horizon execution, మరియు చిన్న సంభాషణలో ఎంత impressive‌గా వినిపిస్తుందనే దానికన్నా, ఎంత పని పూర్తిచేయగలదనే ఆధారంగా models‌ను తీర్చిదిద్దే దిశగా.

ఈ వ్యాసం The Decoder నివేదిక ఆధారంగా ఉంది. మూల వ్యాసాన్ని చదవండి.

Google Deepmind's Gemma 4 12B squeezes multimodal AI onto a laptop with just 16 GB of RAM

Gemma 4 12B మల్టీమోడల్ AIని 16GB ల్యాప్‌టాప్‌లకు తీసుకొస్తోంది

Google DeepMind యొక్క Gemma 4 12B, native text, image, మరియు audio processing‌ను consumer laptops‌కు అందిస్తోంది; దీని వల్ల local మరియు cloud AI workflows మధ్య తేడా తగ్గుతోంది.

Read article

Originally published on the-decoder.com

ఓపెన్-వెయిట్ Kimi K2.6 భారీ మల్టీ-ఏజెంట్ వర్క్‌ఫ్లోల వైపు AI పోటీని ముందుకు నెడుతోంది