गोंधळलेले ऑर्डर्स संरचित व्यवहारांमध्ये रूपांतरित करणे

अन्न आणि पेय वितरकांना सेवा देणारा Choco, अजूनही हाताने केल्या जाणाऱ्या कामाच्या ओझ्याने ग्रस्त असलेल्या क्षेत्राच्या ऑर्डर पाइपलाइनमध्ये AI एजंट्स खोलवर समाविष्ट केल्याचे सांगतो. 27 एप्रिल रोजी प्रकाशित एका ग्राहक केस स्टडीत कंपनीने सांगितले की OpenAI APIs आता तिला वर्षाला 88 लाखांहून अधिक ऑर्डर्स प्रक्रिया करण्यास मदत करत आहेत, तसेच हाताने ऑर्डर नोंदणी 50% कमी झाली आहे आणि कर्मचारी वाढविल्याशिवाय विक्री संघाची उत्पादकता दुप्पट झाली आहे.

Choco ने सोडवण्याचा प्रयत्न केलेला प्रश्न वितरण क्षेत्रात परिचित आहे, पण फारसा आकर्षक नाही. ऑर्डर्स नेहमी स्वच्छ डिजिटल स्वरूपात येत नाहीत. त्या ईमेल, मजकूर संदेश, व्हॉइसमेल, प्रतिमा, दस्तऐवज आणि अगदी हस्तलिखित नोंदींद्वारे येतात. त्यानंतर मानवी कर्मचारी त्या तुकड्यांचे रूपांतर संरचित एंटरप्राइझ रिसोर्स प्लॅनिंग नोंदींमध्ये करतात. हे काम श्रमखाऊ, पुनरावृत्तीपूर्ण आणि अनुभवी ऑर्डर डेस्क कर्मचाऱ्यांच्या मनात असलेल्या संदर्भ-जाणिवेवर अवलंबून असते.

आधुनिक भाषा मॉडेल्स आता फक्त मदत करण्यापलीकडे जाऊन कार्यान्वयनासाठी पुरेसे सक्षम झाले आहेत, असा Choco चा युक्तिवाद आहे. कंपनीच्या मते, तिची AI प्रणाली बहु-माध्यम संवादांचे ERP-तयार ऑर्डर्समध्ये रूपांतर करू शकते आणि ते ग्राहक-विशिष्ट संदर्भाचा वापर करून.

खरा कठीण भाग नेमका कुठे होता

ही केस स्टडी महत्त्वाची आहे, कारण ती आव्हानाला साध्या मजकूर-उत्खननाच्या समस्या म्हणून मांडत नाही. Choco च्या अभियांत्रिकी नेतृत्वानुसार, कठीण समस्या होती अंतर्भूत संदर्भ: ग्राहक-विशिष्ट SKU, युनिट पसंती, डिलिव्हरी नमुने, आणि ऐतिहासिक ऑर्डरिंग वर्तन यांचे मॅपिंग. दुसऱ्या शब्दांत, अडथळा फक्त संदेश वाचणे नव्हता. तो अनुभवी मानवी ऑपरेटरप्रमाणे अस्पष्टता सोडवणे होता.

एंटरप्राइझ AI मध्ये हा फरक महत्त्वाचा आहे. अनेक कामकाजांचे प्रवाह स्वयंचलित वाटतात, जोपर्यंत edge cases दिसत नाहीत. एखाद्या वितरकाला अपूर्ण मजकूर संदेश किंवा धूसर प्रतिमा मिळू शकते, ज्याचा अर्थ केवळ मागील ग्राहक वर्तन आणि कॅटलॉग परंपरांच्या आधारे लावला जाऊ शकतो. Choco म्हणते की त्याने dynamic in-context learning infrastructure तयार केली आहे, ज्यामुळे प्रणाली ग्राहकाच्या इतिहास आणि उत्पादन डेटाच्या आधारे इनपुटमधील संदिग्धता दूर करू शकते.

मोठ्या प्रमाणावर हे खरे असेल, तर ती सामान्य दस्तऐवज पार्सिंगपेक्षा अधिक अर्थपूर्ण क्षमता आहे. हे AI एजंट्ससाठी असा मॉडेल सूचित करते जे उपयुक्त आहेत कारण ते कार्यप्रणालीच्या संदर्भात अंतर्भूत आहेत, केवळ असंरचित मजकूर वाचू शकतात म्हणून नाही.

OrderAgent पासून VoiceAgent पर्यंत

बहु-माध्यम इनपुट प्रक्रिया करण्यासाठी Choco ने OrderAgent सादर केला, आणि नंतर OpenAI च्या Realtime API द्वारे समर्थित VoiceAgent नावाच्या प्रणालीसह आवाजामध्ये विस्तार केला, असे कंपनी म्हणते. त्यामुळे ग्राहकांना व्यवसायिक वेळेनंतरही, उप-सेकंद विलंबासह, फोनवर नैसर्गिकपणे ऑर्डर देता येतात.

व्यवसायिक तर्क सरळ आहे. अन्न-वितरण सतत, वेळ-संवेदनशील ऑर्डरिंगवर चालते, आणि अनेक पुरवठादार अजूनही खंडित आणि अनौपचारिक संवाद चॅनेल्सद्वारे काम करतात. सतत उपलब्ध, व्हॉइस ऑर्डर्स स्वीकारणारी आणि त्यांना संरचित नोंदींमध्ये रूपांतरित करणारी प्रणाली स्टाफिंग विंडो आणि हाताने ट्रान्सक्रिप्शनवरील अवलंबित्व कमी करते.

हे एंटरप्राइझ AI कसे तैनात केले जात आहे यातील व्यापक बदलाकडेही निर्देश करते. वापरकर्त्यांना नवीन इंटरफेसमध्ये ढकलण्याऐवजी कंपन्या लोक आधीपासून वापरत असलेल्या चॅनेल्सवर मॉडेल लागू करत आहेत. ईमेल, SMS, फोन कॉल, प्रतिमा ग्राहक बाजूला संपूर्ण कामकाजाचा प्रवाह पुन्हा डिझाइन न करता मशीन-वाचनीय इनपुट बनतात.

हे फक्त एका कंपनीपलीकडे का महत्त्वाचे आहे

AI स्वीकाराच्या कथा अनेकदा मोठ्या कार्यालयीन वातावरणातील कोडिंग, मार्केटिंग किंवा ज्ञान-कामावर केंद्रित असतात. Choco चे प्रकरण अधिक ऑपरेशनल आहे. ते भौतिक अर्थव्यवस्थेत आहे, जिथे रेस्टॉरंट्स, वितरक, पुरवठादार आणि ग्राहक व्यवस्थापक सर्व वेळेवर ऑर्डर कॅप्चरवर अवलंबून असतात. त्यामुळे काही ग्राहकाभिमुख AI दृश्यांपेक्षा agentic systems कुठे आधी मूल्य निर्माण करू शकतात याचे हे उपयुक्त उदाहरण ठरते.

कंपनीचे म्हणणे आहे की ती संयुक्त राज्ये, युनायटेड किंग्डम, युरोप आणि गल्फ प्रदेशातील 21,000 हून अधिक वितरक आणि 1,00,000 खरेदीदारांना सेवा देते. त्या प्रमाणावर, हाताने ऑर्डर नोंदणी कमी होणे हे केवळ श्रम-बचत करणारे आकडे नाही. ते throughput, error rates, service coverage, आणि प्रमाणानुसार back-office कर्मचारी न वाढवता व्यवसाय किती वेगाने वाढू शकतो यावर परिणाम करू शकते.

OpenAI ची केस स्टडी देखील स्पष्ट करते की Choco ने त्याचे APIs का निवडले: model performance, multimodal capability, structured outputs, आणि मोठ्या प्रमाणावर production reliability. हे गुण महत्त्वाचे ठरतात जेव्हा मॉडेल डेमो वातावरणाऐवजी transaction pipeline चा भाग असते. उद्योगांना फक्त धारदार वाटणारे मॉडेल नको असते. त्यांना सातत्याने वापरता येतील अशी आउटपुट देणारे मॉडेल हवे असते.

वर्कफ्लो सॉफ्टवेअरमधून कामाच्या निष्पादनाकडे

केस स्टडीतला सर्वात रंजक दावा संकल्पनात्मक आहे. Choco या बदलाचे वर्णन वर्कफ्लो सॉफ्टवेअरमधून थेट कामे पार पाडू शकणाऱ्या AI प्रणालींकडे होणाऱ्या संक्रमण म्हणून करते. हे पारंपरिक अर्थाने ऑटोमेशनपेक्षा अधिक मजबूत विधान आहे. याचा अर्थ असा की सॉफ्टवेअर आता पूर्वी मानवी निर्णय आणि संदर्भ-स्मरणशक्तीने हाताळली जाणारी कामे स्वीकारत आहे, केवळ एखादा फॉर्म डिजिटल रूपात आणण्यापुरते मर्यादित नाही.

एखाद्या कंपनीने प्रकाशित केलेल्या यशकथेतून काय अनुमान काढता येईल याला अजूनही मर्यादा आहेत. स्रोत मजकूर स्वतंत्र benchmarking, error rates, किंवा failure cases देत नाही. पण वास्तविक उद्योगात AI एजंट्स कसे मांडले जात आहेत याचा ठोस दृष्टिकोन तो देतो: अमूर्त copilots म्हणून नाही, तर गोंधळलेला मानवी संवाद स्वीकारून व्यवसाय-तयार व्यवहार निर्माण करणाऱ्या कार्यप्रणाली म्हणून.

जर हे मॉडेल पसरले, तर काही सुरुवातीचे आणि टिकाऊ AI फायदे दीर्घकाळ डिजिटलदृष्ट्या खंडित राहिलेल्या उद्योगांतून येऊ शकतात. अन्न-वितरण त्यापैकी एक आहे, आणि Choco स्वतःला याचा पुरावा म्हणून सादर करत आहे की हा क्षेत्र आता production-scale agentic AI आत्मसात करू शकतो.

हा लेख OpenAI च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.