Claude Mythos ఒక ముఖ్యమైన Erdős సమస్యను పరిష్కరించిందని నివేదించబడింది

మరో AI గణిత పురోగతి అని చెప్పబడినది వేగంగా వచ్చింది

ఫ్రంట్ియర్ AI గణితంలో పోటీ చక్రం వేగంగా ముందుకు సాగుతోంది. OpenAI, Erdős unit-distance conjecture ని ఖండించిందని చెప్పబడిన వెంటనే, Anthropic ఉద్యోగులు ఇప్పుడు Claude Mythos కూడా అదే సమస్యను పరిష్కరించగలదని చెబుతున్నారు, The Decoder ప్రకారం.

ఈ విషయం ఇప్పటికీ అదే ఒక చెప్పబడిన ఫలితం మాత్రమే: Anthropic సిబ్బంది వివరించి, X లో బహిరంగంగా చర్చించిన ఒక నివేదిక. ఇది ముఖ్యమైనది, ఎందుకంటే ఇది ఈ కథను అధునాతన AI పరిశోధనలో మరింత సాధారణంగా మారుతున్న వర్గంలో ఉంచుతుంది: ఒక పూర్తి సంస్థాగత పత్రం లేదా విస్తృత స్వతంత్ర ధృవీకరణ ప్రశ్నను తేల్చే ముందు, అర్థవంతమైన సాంకేతిక పురోగతి మొదట ల్యాబ్‌లు, ఇంజినీర్లు, మరియు పనిచేస్తున్న గణితవేత్తల మధ్య ప్రചരిస్తుంది.

ఆ హెచ్చరిక ఉన్నప్పటికీ, ఈ అభివృద్ధి ప్రాధాన్యం కలిగినదే. Erdős unit-distance conjecture 1946 నుంచి తెరవే ఉంది. అనేక frontier systems ఇప్పుడు దీర్ఘకాలంగా పరిష్కారంలేని combinatorial-geometry సమస్యకు ఉపయోగపడే పరిష్కార మార్గాలను కనుగొనగలిగితే, సంబంధిత కథ ఇకపై ఒకే శీర్షికను ఆకర్షించే నిరూపణ గురించి కాదు. అది, అధునాతన మోడళ్లు కఠినమైన పరిశోధనా సమస్యలపై పునరావృతంగా విలువ చూపించడం ప్రారంభించాయేమో అన్న అవకాశమే.

Anthropic ఏమి చేసిందని చెప్పబడుతోంది

మూల పాఠ్యం ప్రకారం, AI మరో Erdős సమస్యను పరిష్కరించిన తర్వాత Anthropic ఒక test setup ని నిర్మించింది. ఆ వ్యవస్థలో Mythos access కలిగిన isolated Claude Code instances ఉండేవి; వాటికి సమస్య ఇచ్చారు, solution paths అన్వేషించారు, ఆపై సంగ్రహించిన కనుగొన్న విషయాలను స్వతంత్రంగా పని చేస్తున్న ఇతర instances కు పంపించారు. ఆ వివరము ముఖ్యమైనది, ఎందుకంటే అది చర్చను ఒకే prompt నుంచి agentic workflow వైపుకు తీసుకెళ్తుంది.

ఇతర మాటల్లో చెప్పాలంటే, ఈ reported achievement ని pure one-shot language-model answer గా frame చేయడం లేదు. అది coordinated research harness కు మరింత సమీపంగా ఉంది: అనేక model instances, problem decomposition, summarization, మరియు approaches ని పునరావృతంగా పోల్చడం. దీని వల్ల ఫలితం ఒక neat demo కంటే, AI-సహాయిత గణిత పని వాస్తవంలో ఎలా సాగవచ్చో చూపే ఒక ముందస్తు చూపు గా మారుతుంది.

Mythos, OpenAI యొక్క model కన్నా వేరే మార్గాన్ని తరచుగా తీసుకున్నదని కూడా source చెబుతోంది. అది నిజమైతే, ఇది duplication కంటే ఇంకా ఆసక్తికరమైనదాన్ని సూచిస్తుంది. Independent solution strategies, కేవలం ఇప్పటికే తెలిసిన reasoning line ని పునరుత్పత్తి చేయడంకన్నా, నిజమైన పరిశోధన విలువకు దగ్గరగా ఉంటాయి.

A Gatik autonomous truck at a PepsiCo distribution center.

Gatik PepsiCo నెట్‌వర్క్‌లో autonomous freight పాత్రను లోతుగా పెంచుతోంది

PepsiCo, Gatikతో తన పనిని multi-year deal ద్వారా విస్తరించింది; ఇది North American food and beverage logisticsలో autonomous middle-mile freightను మరింత లోతుగా తీసుకెళ్తోంది.

Read article

ఈ పోలిక ఎందుకు ముఖ్యము

గణితవేత్త Daniel Litt, Anthropic యొక్క ఫలితాన్ని OpenAI దానికంటే “కొంచెం బలహీనమైనది” అని పిలిచినట్లు, అదే సమయంలో Mythos OpenAI యొక్క పరిష్కారాన్ని కూడా కనుగొన్నదని చెప్పినట్లు ఈ వ్యాసం పేర్కొంటుంది. ఇది అన్ని నిరూపణలు సమానమవు అనే విషయాన్ని గుర్తు చేస్తుంది. గణితంలో, correctness తో పాటు elegance, సంక్షిప్తత, మరియు భావనాత్మక కొత్తదనం కూడా ముఖ్యం.

అయితే, వ్యూహాత్మకంగా తీసుకోవాల్సిన విషయం ఒక ల్యాబ్ నిరూపణ మరొకటి కంటే అందంగా ఉందని కాదు. అనేక ల్యాబ్‌లు ఇప్పుడు తమ వ్యవస్థలు గత తరాల కంటే చాలా ఉన్నత స్థాయిలో open mathematical problems తో పని చేయగలవని నమ్ముతున్నట్లు కనిపిస్తోంది. అది పునరావృతంగా సాధ్యమయ్యే క్షణంలో, ప్రశ్న “AI ఇది చేయగలదా?” నుంచి “ఎంత తరచుగా, ఎంత స్వతంత్రంగా, మరియు ఎంత మానవ పర్యవేక్షణతో?” అన్నదానికి మారుతుంది.

The Decoder, Google DeepMind ఇటీవల ఒక AI-సహాయిత వ్యవస్థ Lean అనే formal proof language ను ఉపయోగించి తొమ్మిది Erdős సమస్యలను పరిష్కరించినట్లు ప్రకటించిందని కూడా పేర్కొంటుంది. ఆ పోలిక ప్రస్తుత AI గణిత పనిలో ఒక ముఖ్యమైన తేడాను స్పష్టంగా చూపిస్తుంది. కొన్ని వ్యవస్థలు formal-verification environments పై ఎక్కువగా ఆధారపడతాయి; మరికొన్నింటిని natural-language reasoning మరియు agentic exploration ఆధారంగా ఎక్కువగా అంచనా వేస్తున్నారు. కచ్చిత సామర్థ్యం గురించి ఏ శైలి మరింత వెల్లడిస్తుందో అనే విషయంలో ఈ రంగం ఇంకా తేల్చుకోలేదు.

పెద్ద మార్పు

ఈ కథను నిలకడగా ఉంచేది కేవలం ఆ ప్రత్యేక conjecture మాత్రమే కాదు. అనుసరించే దావాల వేగమే. గణితంలోని open problems ఒకప్పుడు మానవ మరియు యంత్ర reasoning మధ్య సరిహద్దుకు స్పష్టమైన సూచికలుగా ఉండేవి. ఇప్పుడు ఆ సరిహద్దు మరింత రంధ్రాలుగా కనిపిస్తోంది, ముఖ్యంగా labs frontier models ను orchestration tools తో కలిపి, అవి branch చేయడానికి, compare చేయడానికి, summarize చేయడానికి, మరియు మళ్లీ ప్రయత్నించడానికి అవకాశం ఇస్తున్నప్పుడు.

ఒక reported lab success మరియు స్థిరంగా, విస్తృతంగా నమ్మదగిన research system మధ్య ఇంకా పెద్ద తేడా ఉంది. Verification, peer review, మరియు reproducibility అవసరంగానే ఉన్నాయి. కానీ pattern ను నిర్లక్ష్యం చేయడం కష్టం: AI labs ఇక benchmark gains లేదా polished consumer assistants మాత్రమే చూపించడం లేదు. అవి increasingly తమ systems ను advanced knowledge work కి contributors గా చూపిస్తున్నాయి.

ఈ దావాలు కొనసాగి నిలబడితే, AI math headlines అరుదైన అపవాదులుగా ఉండటం మానుకుని, స్వతంత్రంగా ఒక కొత్త research category గా కనిపించడం ప్రారంభిస్తాయి.

Anthropic సిబ్బంది Claude Mythos, Erdős unit-distance conjecture ను పరిష్కరించిందని అంటున్నారు.
reported setup లో ఒక simple one-shot prompt బదులుగా అనేక సమన్వయపూర్వక Claude Code instances ఉపయోగించారు.
పెద్ద మార్పు isolated benchmark విజయాల నుంచి research-style math exploration లో AI systems ను ఉపయోగించే దిశగా మారడం.

ఈ వ్యాసం The Decoder యొక్క రిపోర్టింగ్ ఆధారంగా ఉంది. మూల వ్యాసాన్ని చదవండి.

Google మరియు OpenAI చైనాతో సంబంధం ఉన్న వేర్వేరు AI దుర్వినియోగ కార్యకలాపాలను బయటపెట్టాయి

Google ఒక AI-సক্ষম మోసపు నెట్‌వర్క్‌పై దావా వేసింది, అదే సమయంలో US చర్చలు మరియు మౌలిక సదుపాయాల కథనాలను లక్ష్యంగా చేసుకున్న చైనాతో సంబంధం ఉన్న రెండు ప్రభావ క్లస్టర్లను అడ్డుకున్నామని OpenAI తెలిపింది.

Read article

Originally published on the-decoder.com

Anthropic యొక్క Claude Mythos ఒక ప్రముఖ Erdős సమస్యను ఎదుర్కొన్న తాజా AI అని నివేదించబడుతోంది