மற்றொரு AI கணித முன்னேற்றம் எனக் கூறப்படும் செய்தி விரைவாக வருகிறது

முன்நிலை AI கணிதத்தில் போட்டி சுழற்சி வேகமடைந்து வருகிறது. OpenAI, Erdős unit-distance conjecture-ஐ மறுத்ததாகக் கூறப்பட்ட சில நிமிடங்களுக்குப் பிறகு, Anthropic ஊழியர்கள் இப்போது Claude Mythos கூட அதே சிக்கலைத் தீர்க்க முடியும் எனக் கூறுகிறார்கள், என்று The Decoder தெரிவிக்கிறது.

இங்கே உள்ள கூற்று அதுவே: Anthropic பணியாளர்கள் விவரித்தும் X-ல் பொது வெளியில் விவாதிக்கப்பட்டும் இருக்கும் ஒரு reported result. இது முக்கியம், ஏனெனில் இது இந்தக் கதையை முன்னேற்ற AI ஆராய்ச்சியில் அதிகமாக காணப்படும் ஒரு வகையில் வைக்கிறது: முழுமையான நிறுவனப் பத்திரிகை அல்லது பரந்த சுயாதீன சரிபார்ப்பு கேள்வியைத் தீர்மானிக்கும் முன், அர்த்தமுள்ள தொழில்நுட்ப முன்னேற்றம் முதலில் ஆய்வகங்கள், பொறியாளர்கள், மற்றும் நடைமுறை கணிதவியலாளர்கள் இடையே பரவுகிறது.

இந்த எச்சரிக்கையினையும் பொருட்படுத்தினால், அறிக்கையிடப்பட்ட முன்னேற்றம் முக்கியமானது. Erdős unit-distance conjecture 1946 முதல் திறந்த நிலையில் உள்ளது. பல முன்னணி அமைப்புகள் இப்போது நீண்டகாலமாக நிலுவையில் உள்ள combinatorial-geometry சிக்கலுக்கு பயனுள்ள தீர்வு பாதைகளை கண்டுபிடிக்க முடிந்தால், தொடர்புடைய கதை இனி ஒரே ஒரு தலைப்பு-பிடிக்கும் நிரூபணம் மட்டும் அல்ல. அது, மேம்பட்ட மாதிரிகள் கடினமான ஆராய்ச்சி பிரச்சினைகளில் மீண்டும் மீண்டும் பயன்படும் மதிப்பை காட்டத் தொடங்கியிருக்கலாம் என்பதற்கான சாத்தியமே.

Anthropic என்ன செய்ததாகக் கூறப்படுகிறது

மூல உரையின்படி, AI மற்றொரு Erdős பிரச்சினையைத் தீர்த்த பிறகு Anthropic ஒரு சோதனை அமைப்பை உருவாக்கியது. இந்த அமைப்பில் Mythos அணுகலுடன் தனிமைப்படுத்தப்பட்ட Claude Code instances இருந்தன; அவற்றிற்கு பிரச்சினை வழங்கப்பட்டது, தீர்வு பாதைகளை ஆராய்ந்தன, பின்னர் சுருக்கப்பட்ட கண்டறிதல்களை தனித்தனியாக வேலை செய்துகொண்டிருந்த பிற instances-க்கு அனுப்பின. அந்த விவரம் முக்கியமானது, ஏனெனில் அது உரையாடலை ஒரு single prompt-இலிருந்து agentic workflow நோக்குத் திருப்புகிறது.

மற்ற வார்த்தைகளில், அறிக்கையிடப்பட்ட சாதனை ஒரு pure one-shot language-model பதிலாக கட்டமைக்கப்படவில்லை. அது ஒருங்கிணைந்த ஆராய்ச்சி harness-க்கு நெருக்கமானது: பல model instances, பிரச்சினை பிரித்தல், சுருக்கம், மற்றும் அணுகுமுறைகளை மீண்டும் மீண்டும் ஒப்பிடுதல். இது முடிவை சுத்தமான demo-வாக அல்லாமல், AI உதவியுடன் கணிதப் பணி நடைமுறையில் எப்படிச் செல்லலாம் என்பதற்கான ஒரு முன்னோட்டமாக மாற்றுகிறது.

Mythos, OpenAI-யின் model-ஐ விட அடிக்கடி வேறுபட்ட பாதையை எடுத்ததாகவும் மூலத்திலிருந்து கூறப்படுகிறது. அது துல்லியமானதாக இருந்தால், அது வெறும் நகலெடுப்பை விட அதிக சுவாரஸ்யமான ஒன்றைக் குறிப்பதாகும். சுயாதீன தீர்வு உத்திகள், ஏற்கனவே அறியப்பட்ட reasoning line-ஐ மீட்டமைப்பதை விட, உண்மையான ஆராய்ச்சி மதிப்புக்கு அருகாமையில் உள்ளன.

இந்த ஒப்பீடு ஏன் முக்கியம்

கணிதவியலாளர் Daniel Litt, Anthropic-இன் முடிவு OpenAI-யின் முடிவை விட “சற்றுக் குறைவானது” என்று கூறியதாகவும், அதே நேரத்தில் Mythos OpenAI-யின் தீர்வையும் கண்டுபிடித்ததாகவும் கட்டுரை குறிப்பிடுகிறது. இது எல்லா நிரூபணங்களும் சமமல்ல என்பதை நினைவூட்டுகிறது. கணிதத்தில், correctness உடன் சேர்ந்து elegance, சுருக்கம், மற்றும் கருத்தியல் புதுமை ஆகியவையும் முக்கியம்.

இருப்பினும், மூலோபாயப் பாடம் ஒரு ஆய்வகத்தின் நிரூபணம் மற்றொன்றை விட அழகாக இருந்ததல்ல. பல ஆய்வகங்கள் இப்போது தங்களுடைய அமைப்புகள் முன் தலைமுறைகளைக் காட்டிலும் மிக உயர்ந்த நிலையில் திறந்த கணிதப் பிரச்சினைகளுடன் ஈடுபட முடியும் என நம்புகின்றன என்பதே. அது மீண்டும் மீண்டும் செய்யக்கூடியதாகி விட்டால், எல்லை “AI இதைச் செய்ய முடியுமா?” என்பதிலிருந்து “எவ்வளவு அடிக்கடி, எவ்வளவு சுயமாக, மற்றும் எவ்வளவு மனித மேற்பார்வையுடன்?” என்பதற்குத் தாவுகிறது.

Google DeepMind சமீபத்தில் Lean எனப்படும் formal proof language-ஐப் பயன்படுத்தி AI-உதவியுள்ள ஒரு அமைப்பு ஒன்பது Erdős பிரச்சினைகளைத் தீர்த்ததாக அறிவித்ததையும் The Decoder குறிப்பிடுகிறது. அந்த ஒப்பீடு தற்போதைய AI கணிதப் பணியில் ஒரு முக்கிய வேறுபாட்டைத் தெளிவாக்குகிறது. சில அமைப்புகள் formal-verification environments மீது பெரிதும் சார்ந்துள்ளன; மற்றவை natural-language reasoning மற்றும் agentic exploration அடிப்படையில் அதிகமாக மதிப்பிடப்படுகின்றன. கச்சா திறனைப் பற்றிய வெளிப்பாட்டில் எந்த முறை அதிகம் பேசுகிறது என்பதை இந்தத் துறை இன்னும் முடிவு செய்யவில்லை.

பெரிய மாற்றம்

இந்தக் கதையை நிலைத்ததாக மாற்றுவது குறிப்பிட்ட conjecture மட்டும் அல்ல. அடுத்தடுத்து வரும் கூற்றுகளின் வேகம்தான். கணிதத்தில் open problems ஒருகாலத்தில் மனித மற்றும் இயந்திர reasoning-க்கு இடையிலான எல்லையின் தெளிவான அடையாளங்களாக இருந்தன. இப்போது அந்த எல்லை அதிகமாக ஊடுருவக்கூடியதாகத் தெரிகிறது, குறிப்பாக labs frontier models-ஐ orchestration tools-உடன் இணைத்து, அவற்றை branch செய்ய, compare செய்ய, summarize செய்ய, மற்றும் மீண்டும் முயற்சிக்கச் செய்யும் போது.

ஒரு reported lab success-க்கும், நிலையான மற்றும் பரவலாக நம்பத்தகுந்த research system-க்கும் இடையில் இன்னும் பெரிய வித்தியாசம் உள்ளது. சரிபார்ப்பு, peer review, மற்றும் reproducibility அத்தியாவசியமாகவே உள்ளன. ஆனால் pattern-ஐ புறக்கணிக்க முடியாது: AI labs இனி benchmark gains அல்லது polished consumer assistants-ஐ மட்டும் காட்டவில்லை. அவை increasingly தங்கள் systems-ஐ advanced knowledge work-இல் பங்களிப்பாளர்களாகக் காட்டுகின்றன.

இந்தக் கூற்றுகள் தொடர்ந்து நிலைத்தால், AI math headlines அரிதான விலக்குகளாக இருப்பதை நிறுத்தி, தங்களுக்கே உரிய புதிய research category ஆகத் தோன்றத் தொடங்கும்.

  • Anthropic ஊழியர்கள் Claude Mythos, Erdős unit-distance conjecture-ஐத் தீர்த்ததாகக் கூறுகிறார்கள்.
  • அறிக்கையிடப்பட்ட அமைப்பில் ஒரு simple one-shot prompt-இற்கு பதிலாக பல ஒருங்கிணைந்த Claude Code instances பயன்படுத்தப்பட்டன.
  • முக்கிய மாற்றம், தனிப்பட்ட benchmark வெற்றிகளிலிருந்து நீண்டகாலமாக திறந்துள்ள கணிதப் பிரச்சினைகளில் research-style AI exploration-க்கு மாறுவதாகும்.

இந்தக் கட்டுரை The Decoder-இன் செய்தி அடிப்படையில் உருவாக்கப்பட்டுள்ளது. மூலக் கட்டுரையைப் படிக்கவும்.

Originally published on the-decoder.com