गणितज्ञ कैसे काम करते हैं, इसमें समस्या क्या है

गणितीय शोध मानव गतिविधि के सबसे चुनौतीपूर्ण बौद्धिक कार्यों में से एक है — और कई मायनों में सबसे कम स्वचालित भी। AI प्रणालियों ने कोडिंग, लेखन और डेटा विश्लेषण को बदल दिया है, लेकिन उच्च गणित की औपचारिक संरचनाएँ अब तक काफी हद तक उनकी पहुंच से बाहर रही हैं। प्रमाणों की जांच कठोर तर्क से करनी होती है; अमूर्त संरचनाओं में पैटर्न, टेक्स्ट के लिए बड़े भाषा मॉडल को उपयोगी बनाने वाली सांख्यिकीय पैटर्न-मैचिंग के आगे आसानी से नहीं झुकते। Axiom Math नाम का एक स्टार्टअप मानता है कि उसने इसे बदलने का तरीका ढूंढ लिया है, और इस हफ्ते उसने गणितज्ञों के लिए एक मुफ्त टूल जारी किया है, जो एक अकेले लैपटॉप पर उल्लेखनीय पैटर्न-खोज क्षमता देता है।

Axplorer नाम का यह टूल PatternBoost का एक लोकतांत्रिक संस्करण है — यह एक एल्गोरिद्म है जिसे Francois Charton ने विकसित किया था, जो अब Axiom में एक शोध वैज्ञानिक हैं और इससे पहले Meta में काम कर चुके थे। 2024 में Charton ने PatternBoost को हजारों सुपरकंप्यूटर नोड्स पर तीन हफ्तों तक चलाकर ग्राफ थ्योरी की एक सदी पुरानी समस्या, Turan four-cycles problem, को हल किया था। Axplorer वही परिणाम Mac Pro पर ढाई घंटे में दे सकता है।

Axplorer क्या करता है

Axplorer के पीछे का एल्गोरिद्म शास्त्रीय खोज और न्यूरल नेटवर्क सीखने के एक पुनरावृत्त चक्र के माध्यम से काम करता है। यह किसी गणितीय समस्या के लिए बड़ी संख्या में यादृच्छिक संभावित समाधानों को बनाकर शुरू करता है और सबसे अच्छे प्रदर्शन करने वालों को बनाए रखता है। इसके बाद एक transformer neural network को उन सफल उदाहरणों पर प्रशिक्षित किया जाता है, ताकि वह सीख सके कि एक अच्छे समाधान की विशेषताएँ क्या होती हैं। अगले दौर में, प्रशिक्षित नेटवर्क बेहतर संभावित समाधान बनाता है, जो शास्त्रीय खोज के एक और चरण के लिए बीज का काम करते हैं। दोनों चरण बारी-बारी से चलते हैं, और हर दौर में समाधान क्रमशः बेहतर होते जाते हैं।

मुख्य अंतर्दृष्टि यह है कि न्यूरल नेटवर्क को गणित को किसी गहरे अर्थ में समझने की जरूरत नहीं होती। उसे केवल अब तक मिले समाधानों में संरचनात्मक पैटर्न पहचानने होते हैं और उन्हीं पैटर्न का उपयोग बेहतर संभावित समाधान बनाने में करना होता है। कई पुनरावृत्तियों के बाद, इससे ऐसे समाधान मिलते हैं जिन्हें केवल शास्त्रीय खोज से ढूंढना असंभव-सा होता — खासकर उन समस्याओं में जिनका search space बहुत विशाल हो, जहां यादृच्छिक खोज computationally intractable हो जाती है।