বিশৃঙ্খল অর্ডারকে কাঠামোবদ্ধ লেনদেনে রূপান্তর

খাদ্য ও পানীয় পরিবেশকদের সেবা দেওয়া Choco বলছে, এটি এমন একটি খাতের অর্ডার পাইপলাইনে AI এজেন্ট গভীরভাবে যুক্ত করেছে, যা এখনও ম্যানুয়াল কাজের বোঝা বহন করছে। ২৭ এপ্রিল প্রকাশিত একটি গ্রাহক কেস স্টাডিতে কোম্পানিটি জানায়, OpenAI APIs এখন বছরে 88 লক্ষের বেশি অর্ডার প্রক্রিয়াকরণে সাহায্য করছে, একই সঙ্গে হাতে-কলমে অর্ডার এন্ট্রি 50% কমিয়েছে এবং কর্মী না বাড়িয়েই বিক্রয় দলের উৎপাদনশীলতা দ্বিগুণ করেছে।

Choco যে সমস্যার সমাধান করতে চেয়েছে, তা বিতরণ খাতে পরিচিত, কিন্তু খুব কমই আকর্ষণীয়। অর্ডার সব সময় পরিষ্কার ডিজিটাল ফরম্যাটে আসে না। সেগুলো আসে ইমেল, টেক্সট মেসেজ, ভয়েসমেল, ছবি, নথি, এমনকি হাতে-লেখা নোটের মাধ্যমেও। পরে মানব কর্মীরা সেই অংশগুলোকে কাঠামোবদ্ধ এন্টারপ্রাইজ রিসোর্স প্ল্যানিং এন্ট্রিতে রূপান্তর করেন। এই কাজ শ্রমসাপেক্ষ, পুনরাবৃত্তিমূলক, এবং এমন প্রাসঙ্গিক জ্ঞানের ওপর নির্ভরশীল যা প্রায়ই অভিজ্ঞ অর্ডার ডেস্ক কর্মীদের মাথায় থাকে।

Choco-র যুক্তি হলো, আধুনিক ভাষা মডেল এখন কেবল সহায়তা ছাড়িয়ে সরাসরি কার্যসম্পাদনের জন্য যথেষ্ট উন্নত। কোম্পানির মতে, তার AI সিস্টেমগুলো বহুমাধ্যমিক যোগাযোগকে ERP-প্রস্তুত অর্ডারে রূপান্তর করতে পারে এবং তা গ্রাহক-নির্দিষ্ট প্রেক্ষাপট ব্যবহার করেই।

আসল কঠিন অংশ কোথায় ছিল

এই কেস স্টাডিটি গুরুত্বপূর্ণ, কারণ এটি চ্যালেঞ্জটিকে সহজ টেক্সট এক্সট্রাকশন হিসেবে দেখায় না। Choco-র ইঞ্জিনিয়ারিং নেতৃত্ব বলছে, কঠিন সমস্যা ছিল অন্তর্নিহিত প্রেক্ষাপট: গ্রাহক-নির্দিষ্ট SKU, ইউনিট পছন্দ, ডেলিভারি ধারা, এবং ঐতিহাসিক অর্ডারিং আচরণ মানচিত্র করা। অন্য কথায়, বাধা ছিল শুধু বার্তা পড়া নয়। অভিজ্ঞ মানব অপারেটরের মতো অস্পষ্টতা দূর করা।

এন্টারপ্রাইজ AI-তে এই পার্থক্য গুরুত্বপূর্ণ। অনেক কর্মপ্রবাহ স্বয়ংক্রিয় করা যায় বলে মনে হয়, যতক্ষণ না edge case সামনে আসে। একজন পরিবেশক অসম্পূর্ণ টেক্সট বার্তা বা ঝাপসা ছবি পেতে পারে, যার অর্থ কেবল আগের গ্রাহক আচরণ এবং ক্যাটালগ নিয়মের সঙ্গে মিলিয়ে ব্যাখ্যা করলে বোঝা যায়। Choco বলছে, তারা dynamic in-context learning infrastructure তৈরি করেছে, যাতে সিস্টেম গ্রাহকের ইতিহাস ও পণ্যের ডেটার সঙ্গে তুলনা করে ইনপুটের অস্পষ্টতা দূর করতে পারে।

এটি যদি বড় পরিসরে সঠিক হয়, তাহলে তা সাধারণ ডকুমেন্ট পার্সিংয়ের চেয়ে বেশি অর্থবহ সক্ষমতা। এটি এমন এক AI এজেন্ট মডেলের ইঙ্গিত দেয় যা উপকারী, কারণ তারা অপারেশনাল প্রেক্ষাপটে বসানো, কেবল তাই নয় যে তারা অসংগঠিত টেক্সট পড়তে পারে।

OrderAgent থেকে VoiceAgent

Choco বলছে, তারা বহুমাধ্যমিক ইনপুট প্রক্রিয়াকরণের জন্য OrderAgent চালু করেছিল, তারপর OpenAI-র Realtime API দ্বারা চালিত VoiceAgent নামের একটি সিস্টেমের মাধ্যমে ভয়েসে প্রসারিত হয়েছে। এর ফলে গ্রাহকরা অফিস সময়ের বাইরেও, উপ-সেকেন্ড লেটেন্সিতে, স্বাভাবিকভাবে ফোনে অর্ডার দিতে পারেন।

ব্যবসায়িক যুক্তি সরল। খাদ্য বিতরণ নিরন্তর, সময়-সংবেদনশীল অর্ডারিংয়ের ওপর চলে, এবং বহু সরবরাহকারী এখনও খণ্ডিত ও অনানুষ্ঠানিক যোগাযোগ চ্যানেলের মাধ্যমে কাজ করে। এমন একটি সিস্টেম যা 24/7 উপলব্ধ থাকতে পারে, ভয়েস অর্ডার গ্রহণ করতে পারে, এবং সেগুলোকে কাঠামোবদ্ধ রেকর্ডে রূপান্তর করতে পারে, স্টাফিং উইন্ডো ও হাতে ট্রান্সক্রিপশনের ওপর নির্ভরতা কমায়।

এটি আরও দেখায় যে এন্টারপ্রাইজ AI কীভাবে মোতায়েন হচ্ছে। ব্যবহারকারীদের নতুন ইন্টারফেসে ঠেলে দেওয়ার বদলে, কোম্পানিগুলো মানুষ যে চ্যানেল ইতিমধ্যেই ব্যবহার করে, সেগুলোর ওপর মডেল প্রয়োগ করছে। ইমেল, SMS, ফোন কল, ছবি, গ্রাহক পক্ষের পূর্ণ কর্মপ্রবাহ পুনর্নির্মাণ ছাড়াই মেশিন-পাঠযোগ্য ইনপুটে পরিণত হয়।

কেন এটি শুধু একটি কোম্পানির চেয়ে বেশি গুরুত্বপূর্ণ

AI গ্রহণের গল্পগুলো প্রায়ই বড় অফিস পরিবেশে কোডিং, মার্কেটিং বা জ্ঞানভিত্তিক কাজের ওপর কেন্দ্রীভূত হয়। Choco-র কেসটি আরও কার্যকরী। এটি বাস্তব অর্থনীতির ভেতরে, যেখানে রেস্তোরাঁ, পরিবেশক, সরবরাহকারী এবং গ্রাহক ব্যবস্থাপক সবাই সময়মতো অর্ডার ক্যাপচারের ওপর নির্ভর করে। এটি দেখায় যে agentic systems কিছু ভোক্তা-মুখী AI কল্পনার চেয়ে আগে কোথায় মূল্য তৈরি করতে পারে তার একটি কার্যকর উদাহরণ।

কোম্পানিটি বলছে, যুক্তরাষ্ট্র, যুক্তরাজ্য, ইউরোপ এবং গালফ অঞ্চল জুড়ে এটি 21,000-এর বেশি পরিবেশক এবং 1,00,000 ক্রেতাকে সেবা দেয়। সেই স্কেলে, হাতে-কলমে অর্ডার এন্ট্রি কমে যাওয়া শুধু শ্রম-সাশ্রয়ের পরিসংখ্যান নয়। এটি throughput, error rate, service coverage, এবং আনুপাতিক হারে ব্যাক-অফিস কর্মী না বাড়িয়েই একটি ব্যবসা কত দ্রুত বড় হতে পারে, তা প্রভাবিত করতে পারে।

OpenAI-র কেস স্টাডি এটিও জোর দেয় কেন Choco তার APIs বেছে নিয়েছে: model performance, multimodal capability, structured outputs, এবং production reliability at scale। যখন মডেল ডেমো পরিবেশের বদলে লেনদেন পাইপলাইনের অংশ, তখন এ ধরনের বৈশিষ্ট্যই গুরুত্বপূর্ণ। প্রতিষ্ঠানগুলো শুধু সাবলীল শোনায় এমন মডেল চায় না। তাদের দরকার এমন মডেল, যা ধারাবাহিকভাবে ব্যবহারযোগ্য আউটপুট দিতে পারে।

কর্মপ্রবাহ সফটওয়্যার থেকে কাজ সম্পাদন

কেস স্টাডির সবচেয়ে আকর্ষণীয় দাবি ধারণাগত। Choco এটিকে কর্মপ্রবাহ সফটওয়্যার থেকে এমন AI সিস্টেমে রূপান্তর হিসেবে বর্ণনা করে, যা সরাসরি কাজ সম্পাদন করতে পারে। এটি ক্লাসিক অর্থে অটোমেশনের চেয়ে শক্তিশালী বক্তব্য। এর মানে সফটওয়্যার এমন কাজও গ্রহণ করছে, যা আগে মানব-বিবেচনা এবং প্রাসঙ্গিক স্মরণশক্তির মাধ্যমে সম্পন্ন হতো, শুধু একটি ফর্ম ডিজিটাইজ করা নয়।

একটি কোম্পানি-প্রকাশিত সাফল্যের গল্প থেকে কী অনুমান করা যায়, তার সীমাবদ্ধতা অবশ্যই আছে। উৎস পাঠ্যে স্বাধীন benchmarking, error rate বা failure case নেই। তবে এটি বাস্তব শিল্পে AI এজেন্টদের কীভাবে অবস্থান করানো হচ্ছে তার একটি স্পষ্ট চিত্র দেয়: বিমূর্ত copilots হিসেবে নয়, বরং অপারেশনাল সিস্টেম হিসেবে, যা বিশৃঙ্খল মানব যোগাযোগ গ্রহণ করে ব্যবসায়-প্রস্তুত লেনদেন তৈরি করে।

যদি এই মডেল ছড়িয়ে পড়ে, তবে কিছু প্রাথমিক ও স্থায়ী AI লাভ দীর্ঘদিন ধরে ডিজিটালি খণ্ডিত থাকা শিল্পগুলো থেকে আসতে পারে। খাদ্য বিতরণ তাদের একটি, এবং Choco নিজেকে প্রমাণ হিসেবে তুলে ধরছে যে খাতটি এখন production-scale agentic AI গ্রহণ করতে পারে।

এই নিবন্ধটি OpenAI-এর প্রতিবেদনের ওপর ভিত্তি করে। মূল নিবন্ধ পড়ুন.