கணிதவியலாளர்கள் பணியாற்றும் விதத்தில் உள்ள பிரச்சினை
கணித ஆராய்ச்சி என்பது மனித செயல்களில் மிகவும் கடினமான அறிவாற்றல் முயற்சிகளில் ஒன்று — மேலும் பல விதங்களில், மிகக் குறைவாக தானியக்கமாக்கப்பட்ட ஒன்றும் ஆகும். AI systems coding, writing, மற்றும் data analysis ஆகியவற்றை மாற்றியுள்ளன, ஆனால் higher mathematics-இன் formal structures பெரும்பாலும் அவற்றின் எட்டாக்கட்டாகவே உள்ளன. Proofs-ஐ கடுமையான logic மூலம் சரிபார்க்க வேண்டும்; abstract structures-இல் உள்ள patterns, text-க்கு பெரிய மொழி மாதிரிகளை பயனுள்ளதாக 만드는 statistical pattern-matching-க்கு பணியமர்வதில்லை. Axiom Math என்ற startup, இதை மாற்ற ஒரு வழி கண்டுபிடித்ததாக நம்புகிறது, மேலும் இந்த வாரம் அது mathematicians-க்கு ஒரு free tool-ஐ வெளியிட்டுள்ளது; அது ஒரு single laptop-இல் குறிப்பிடத்தக்க pattern-discovery திறனை வழங்குகிறது.
Axplorer எனப்படும் இந்த tool, PatternBoost-இன் ஒரு democratized version ஆகும் — இது Francois Charton உருவாக்கிய algorithm; அவர் தற்போது Axiom-இல் research scientist, முன்னர் Meta-வில் பணியாற்றியவர். 2024-இல், Charton PatternBoost-ஐ thousands of supercomputer nodes-இல் மூன்று வாரங்கள் இயக்கி, graph theory-யின் century-old problem ஆன Turan four-cycles problem-ஐ தீர்த்தார். Axplorer அந்த முடிவை Mac Pro-வில் இரண்டரை மணி நேரத்தில் அளிக்க முடியும்.
Axplorer என்ன செய்கிறது
Axplorer-இன் பின்னுள்ள algorithm, classical search மற்றும் neural network learning ஆகியவற்றின் iterative cycle மூலம் செயல்படுகிறது. இது ஒரு mathematical problem-க்கான large number of random candidate solutions-ஐ உருவாக்குவதில் தொடங்கி, சிறப்பாக செயல்படும் தீர்வுகளை வைத்துக் கொள்கிறது. பின்னர், ஒரு transformer neural network அந்த வெற்றிகரமான உதாரணங்களின் மீது train செய்யப்படுகிறது, ஒரு நல்ல solution-ஐ வகைப்படுத்தும் பண்புகள் என்ன என்பதை அது கற்றுக்கொள்ள. அடுத்த சுற்றில், trained network மேம்படுத்தப்பட்ட candidate-களை உருவாக்குகிறது; அவை மற்றொரு classical search phase-க்கு seeds ஆக செயல்படுகின்றன. இந்த இரண்டு phase-களும் மாறிமாறி நடைபெறுகின்றன, ஒவ்வொரு சுற்றிலும் progressively better solutions உருவாகின்றன.
முக்கிய insight என்னவென்றால், neural network-க்கு mathematics-ஐ எந்த ஆழமான அர்த்தத்திலும் புரிந்துகொள்ள வேண்டியதில்லை. இதுவரை கிடைத்த solutions-இல் உள்ள structural patterns-ஐ அடையாளம் காண்பதும், அந்த patterns-ஐ பயன்படுத்தி better candidates உருவாக்குவதும்தான் அதன் வேலை. பல iterations-களில், இதன் மூலம் classical search மட்டும் கொண்டு கண்டுபிடிக்க கடினமான solutions கிடைக்கின்றன — குறிப்பாக search space மிகப் பெரியதாக இருக்கும் பிரச்சினைகளில், அங்கு random exploration computationally intractable ஆகிவிடும்.



