మరో AI గణిత పురోగతి అని చెప్పబడినది వేగంగా వచ్చింది

ఫ్రంట్ియర్ AI గణితంలో పోటీ చక్రం వేగంగా ముందుకు సాగుతోంది. OpenAI, Erdős unit-distance conjecture ని ఖండించిందని చెప్పబడిన వెంటనే, Anthropic ఉద్యోగులు ఇప్పుడు Claude Mythos కూడా అదే సమస్యను పరిష్కరించగలదని చెబుతున్నారు, The Decoder ప్రకారం.

ఈ విషయం ఇప్పటికీ అదే ఒక చెప్పబడిన ఫలితం మాత్రమే: Anthropic సిబ్బంది వివరించి, X లో బహిరంగంగా చర్చించిన ఒక నివేదిక. ఇది ముఖ్యమైనది, ఎందుకంటే ఇది ఈ కథను అధునాతన AI పరిశోధనలో మరింత సాధారణంగా మారుతున్న వర్గంలో ఉంచుతుంది: ఒక పూర్తి సంస్థాగత పత్రం లేదా విస్తృత స్వతంత్ర ధృవీకరణ ప్రశ్నను తేల్చే ముందు, అర్థవంతమైన సాంకేతిక పురోగతి మొదట ల్యాబ్‌లు, ఇంజినీర్లు, మరియు పనిచేస్తున్న గణితవేత్తల మధ్య ప్రചരిస్తుంది.

ఆ హెచ్చరిక ఉన్నప్పటికీ, ఈ అభివృద్ధి ప్రాధాన్యం కలిగినదే. Erdős unit-distance conjecture 1946 నుంచి తెరవే ఉంది. అనేక frontier systems ఇప్పుడు దీర్ఘకాలంగా పరిష్కారంలేని combinatorial-geometry సమస్యకు ఉపయోగపడే పరిష్కార మార్గాలను కనుగొనగలిగితే, సంబంధిత కథ ఇకపై ఒకే శీర్షికను ఆకర్షించే నిరూపణ గురించి కాదు. అది, అధునాతన మోడళ్లు కఠినమైన పరిశోధనా సమస్యలపై పునరావృతంగా విలువ చూపించడం ప్రారంభించాయేమో అన్న అవకాశమే.

Anthropic ఏమి చేసిందని చెప్పబడుతోంది

మూల పాఠ్యం ప్రకారం, AI మరో Erdős సమస్యను పరిష్కరించిన తర్వాత Anthropic ఒక test setup ని నిర్మించింది. ఆ వ్యవస్థలో Mythos access కలిగిన isolated Claude Code instances ఉండేవి; వాటికి సమస్య ఇచ్చారు, solution paths అన్వేషించారు, ఆపై సంగ్రహించిన కనుగొన్న విషయాలను స్వతంత్రంగా పని చేస్తున్న ఇతర instances కు పంపించారు. ఆ వివరము ముఖ్యమైనది, ఎందుకంటే అది చర్చను ఒకే prompt నుంచి agentic workflow వైపుకు తీసుకెళ్తుంది.

ఇతర మాటల్లో చెప్పాలంటే, ఈ reported achievement ని pure one-shot language-model answer గా frame చేయడం లేదు. అది coordinated research harness కు మరింత సమీపంగా ఉంది: అనేక model instances, problem decomposition, summarization, మరియు approaches ని పునరావృతంగా పోల్చడం. దీని వల్ల ఫలితం ఒక neat demo కంటే, AI-సహాయిత గణిత పని వాస్తవంలో ఎలా సాగవచ్చో చూపే ఒక ముందస్తు చూపు గా మారుతుంది.

Mythos, OpenAI యొక్క model కన్నా వేరే మార్గాన్ని తరచుగా తీసుకున్నదని కూడా source చెబుతోంది. అది నిజమైతే, ఇది duplication కంటే ఇంకా ఆసక్తికరమైనదాన్ని సూచిస్తుంది. Independent solution strategies, కేవలం ఇప్పటికే తెలిసిన reasoning line ని పునరుత్పత్తి చేయడంకన్నా, నిజమైన పరిశోధన విలువకు దగ్గరగా ఉంటాయి.

ఈ పోలిక ఎందుకు ముఖ్యము

గణితవేత్త Daniel Litt, Anthropic యొక్క ఫలితాన్ని OpenAI దానికంటే “కొంచెం బలహీనమైనది” అని పిలిచినట్లు, అదే సమయంలో Mythos OpenAI యొక్క పరిష్కారాన్ని కూడా కనుగొన్నదని చెప్పినట్లు ఈ వ్యాసం పేర్కొంటుంది. ఇది అన్ని నిరూపణలు సమానమవు అనే విషయాన్ని గుర్తు చేస్తుంది. గణితంలో, correctness తో పాటు elegance, సంక్షిప్తత, మరియు భావనాత్మక కొత్తదనం కూడా ముఖ్యం.

అయితే, వ్యూహాత్మకంగా తీసుకోవాల్సిన విషయం ఒక ల్యాబ్ నిరూపణ మరొకటి కంటే అందంగా ఉందని కాదు. అనేక ల్యాబ్‌లు ఇప్పుడు తమ వ్యవస్థలు గత తరాల కంటే చాలా ఉన్నత స్థాయిలో open mathematical problems తో పని చేయగలవని నమ్ముతున్నట్లు కనిపిస్తోంది. అది పునరావృతంగా సాధ్యమయ్యే క్షణంలో, ప్రశ్న “AI ఇది చేయగలదా?” నుంచి “ఎంత తరచుగా, ఎంత స్వతంత్రంగా, మరియు ఎంత మానవ పర్యవేక్షణతో?” అన్నదానికి మారుతుంది.

The Decoder, Google DeepMind ఇటీవల ఒక AI-సహాయిత వ్యవస్థ Lean అనే formal proof language ను ఉపయోగించి తొమ్మిది Erdős సమస్యలను పరిష్కరించినట్లు ప్రకటించిందని కూడా పేర్కొంటుంది. ఆ పోలిక ప్రస్తుత AI గణిత పనిలో ఒక ముఖ్యమైన తేడాను స్పష్టంగా చూపిస్తుంది. కొన్ని వ్యవస్థలు formal-verification environments పై ఎక్కువగా ఆధారపడతాయి; మరికొన్నింటిని natural-language reasoning మరియు agentic exploration ఆధారంగా ఎక్కువగా అంచనా వేస్తున్నారు. కచ్చిత సామర్థ్యం గురించి ఏ శైలి మరింత వెల్లడిస్తుందో అనే విషయంలో ఈ రంగం ఇంకా తేల్చుకోలేదు.

పెద్ద మార్పు

ఈ కథను నిలకడగా ఉంచేది కేవలం ఆ ప్రత్యేక conjecture మాత్రమే కాదు. అనుసరించే దావాల వేగమే. గణితంలోని open problems ఒకప్పుడు మానవ మరియు యంత్ర reasoning మధ్య సరిహద్దుకు స్పష్టమైన సూచికలుగా ఉండేవి. ఇప్పుడు ఆ సరిహద్దు మరింత రంధ్రాలుగా కనిపిస్తోంది, ముఖ్యంగా labs frontier models ను orchestration tools తో కలిపి, అవి branch చేయడానికి, compare చేయడానికి, summarize చేయడానికి, మరియు మళ్లీ ప్రయత్నించడానికి అవకాశం ఇస్తున్నప్పుడు.

ఒక reported lab success మరియు స్థిరంగా, విస్తృతంగా నమ్మదగిన research system మధ్య ఇంకా పెద్ద తేడా ఉంది. Verification, peer review, మరియు reproducibility అవసరంగానే ఉన్నాయి. కానీ pattern ను నిర్లక్ష్యం చేయడం కష్టం: AI labs ఇక benchmark gains లేదా polished consumer assistants మాత్రమే చూపించడం లేదు. అవి increasingly తమ systems ను advanced knowledge work కి contributors గా చూపిస్తున్నాయి.

ఈ దావాలు కొనసాగి నిలబడితే, AI math headlines అరుదైన అపవాదులుగా ఉండటం మానుకుని, స్వతంత్రంగా ఒక కొత్త research category గా కనిపించడం ప్రారంభిస్తాయి.

  • Anthropic సిబ్బంది Claude Mythos, Erdős unit-distance conjecture ను పరిష్కరించిందని అంటున్నారు.
  • reported setup లో ఒక simple one-shot prompt బదులుగా అనేక సమన్వయపూర్వక Claude Code instances ఉపయోగించారు.
  • పెద్ద మార్పు isolated benchmark విజయాల నుంచి research-style math exploration లో AI systems ను ఉపయోగించే దిశగా మారడం.

ఈ వ్యాసం The Decoder యొక్క రిపోర్టింగ్ ఆధారంగా ఉంది. మూల వ్యాసాన్ని చదవండి.

Originally published on the-decoder.com