Google chatbot থেকে Gemini-কে operating-system assistant-এ প্রসারিত করছে

Google তার Gemini প্রচেষ্টাকে Android-এর দৈনন্দিন কার্যপ্রণালীর আরও গভীরে নিয়ে যাচ্ছে, standalone AI assistant থেকে এমন software-এর দিকে সরে যাচ্ছে যা ব্যবহারকারীদের অ্যাপ ও সেবার মধ্যে কাজ সম্পন্ন করতে সাহায্য করতে পারে। Google I/O-এর আগে, কোম্পানি Gemini Intelligence ব্যানারে নতুন ফিচারের একটি সেট তুলে ধরেছে, যা বহু-ধাপের কাজ স্বয়ংক্রিয় করা, autofill উন্নত করা, ওয়েব কনটেন্ট সারসংক্ষেপ করা, এবং এলোমেলো কথ্য ইনপুটকে পরিপাটি লিখিত টেক্সটে রূপান্তর করার জন্য তৈরি।

কোম্পানির ঘোষণায় বলা হয়েছে, প্রাথমিক rollout এই গ্রীষ্মে Samsung Galaxy S26 এবং Google Pixel 10-এ শুরু হবে। Google আরও বলেছে, বছরের পরের দিকে smartwatch, cars, headsets, এবং laptops-সহ আরও বিস্তৃত device support পরিকল্পনা করা হয়েছে। এই সময়সূচি গুরুত্বপূর্ণ, কারণ এটি দেখায় Google এই ফিচারগুলোকে কোনো niche experiment হিসেবে দেখছে না। বরং, Gemini-কে Android ecosystem জুড়ে বসে যেতে পারে এমন একটি layer হিসেবে এবং মানুষ কীভাবে device ও service ব্যবহার করে তার অংশ হিসেবে স্থাপন করছে।

উত্তর থেকে কাজের দিকে

সবচেয়ে গুরুত্বপূর্ণ পরিবর্তন হলো Gemini-কে এখন response তৈরি করার ব্যবস্থা হিসেবে কম এবং task সম্পন্ন করার ব্যবস্থা হিসেবে বেশি উপস্থাপন করা হচ্ছে। Google বলছে, assistant ভ্রমণ বুক করা বা notes app থেকে shopping cart-এ shopping list সরানোর মতো কাজ সামলাতে পারবে। এই উদাহরণগুলো এমন consumer AI মডেলের দিকে ইঙ্গিত করে, যা শুধু conversation-এর ওপর নয়, orchestration-এর ওপর নির্ভর করে। মূল্য প্রস্তাবনা শুধু এই নয় যে AI একটি prompt বুঝতে পারে, বরং সেটি intent-কে বহু interface জুড়ে একাধিক ধাপে রূপান্তর করতে পারে।

এই পরিবর্তন AI-তে সবচেয়ে গুরুত্বপূর্ণ প্রতিযোগিতার ক্ষেত্রগুলোর একটি হয়ে উঠেছে। Chatbots প্রশ্নের উত্তর দিতে, text সারসংক্ষেপ করতে, এবং message draft করতে পারে, কিন্তু ব্যবহারকারীদের এখনও page-এ click করতে, তথ্য copy করতে, এবং শেষ পর্যন্ত কাজ নিজেরাই সম্পন্ন করতে হয়। Android-এ আরও বেশি agent-like behavior সরাসরি বসিয়ে Google সেই gap কমাতে এবং যেখানে digital friction সবচেয়ে বেশি সেখানে assistant-টিকে উপযোগী করতে চাইছে।

Chrome এবং Gboard পরীক্ষার ক্ষেত্র

দুটি সবচেয়ে স্পষ্ট উদাহরণ Chrome এবং Gboard-এর মধ্যে দেখা যাচ্ছে। Chrome-এ Gemini web content সারসংক্ষেপ করবে এবং জটিল ফর্ম পূরণে সাহায্য করবে। Google বলছে form-filling behavior কেবল তখনই সক্রিয় হবে যখন ব্যবহারকারীরা স্পষ্টভাবে তা enable করবেন, যা privacy, control, এবং error risk নিয়ে কোম্পানির scrutiny প্রত্যাশা করার ইঙ্গিত দেয়। ফর্ম AI automation-এর স্বাভাবিক লক্ষ্য, কারণ সেগুলো পুনরাবৃত্তিমূলক এবং সময়সাপেক্ষ, কিন্তু সেগুলোতে personal data থাকে এবং ভুলের জন্য সহনশীলতা কম। ফিচারটিকে opt-in রেখে Google সুবিধা এবং এই আশ্বাসের মধ্যে ভারসাম্য রাখছে যে automation নীরবে সংবেদনশীল কাজ দখল করে নেবে না।

Gboard-এ Rambler নামের একটি ফিচার আসছে, যা কথ্য, অপরিপাটি চিন্তাকে আরও পরিষ্কার text message-এ রূপান্তর করে। সূত্র অনুযায়ী, ফিচারটি একাধিক ভাষা একসঙ্গে সমর্থন করতে পারে। এটি বহুভাষিক অঞ্চল বা এমন পরিবারে বিশেষভাবে উপকারী হতে পারে যেখানে মানুষ স্বাভাবিকভাবেই এক বাক্যের মধ্যে ভাষা বদলায়। এটি AI interface-এর একটি বৃহত্তর প্রবণতাও তুলে ধরে: ব্যবহারকারীদের কঠোর format-এ বলতে বা টাইপ করতে না দিয়ে, messy human input-কে উপস্থাপনযোগ্য কিছুতে রূপান্তর করতে প্রয়োজনীয় পরিশ্রম কমানোর দিকে systemগুলো এগোচ্ছে।

Customization-কে prompt হিসেবে দেখা

Create My Widget নামের আরেকটি ফিচার interface customization-এর জন্য। ব্যবহারকারীরা recipe suggestion বা নির্দিষ্ট weather information-কেন্দ্রিক widget চাইতে পারেন, আর system সেটি তৈরি করবে। উপরে থেকে দেখলে এটি AI task automation-এর তুলনায় ছোট ঘোষণা মনে হতে পারে। কিন্তু এটি দেখায় Google natural language-কে software creation-এর জন্য একটি নতুন control layer হিসেবে কীভাবে দেখছে। menu বা layout tool ঘাঁটার বদলে, ব্যবহারকারীরা একটি interface element বর্ণনা করেন এবং system সেটি তৈরি করে।

যদি এই পদ্ধতি নির্ভরযোগ্যভাবে কাজ করে, তাহলে device personalizing-এর বাধা কমিয়ে Android-কে আরেকটি আলাদা পরিচয় দিতে পারে। বছরের পর বছর Android আংশিকভাবে flexibility-র ওপর প্রতিদ্বন্দ্বিতা করেছে। বর্ণনার মাধ্যমে কার্যকর interface element তৈরি করতে দেওয়া সেই identity-কে AI যুগে এগিয়ে নিয়ে যায়।

Google I/O-এর আগে একটি প্রতিযোগিতামূলক পদক্ষেপ

সময়টাও উল্লেখযোগ্য। সূত্র Gemini Intelligence push-কে AI agent market-এ OpenAI এবং Anthropic-এর সঙ্গে gap কমানোর Google-এর প্রচেষ্টার সঙ্গে যুক্ত করছে। ওই market এখন text তৈরি করা ছাড়িয়ে কাজ করা system দ্বারা সংজ্ঞায়িত হচ্ছে। কোম্পানিগুলো এমন assistant বানাতে দৌড়াচ্ছে, যা software navigate করতে, তথ্য retrieve করতে, এবং কম user intervention-এ অর্থপূর্ণ action নিতে পারে।

মে মাসের শুরুতে Google তার experimental browser agent Project Mariner বন্ধ করে তার প্রযুক্তি নতুন Gemini Agent-এ মিশিয়ে দেওয়ার সিদ্ধান্ত অভ্যন্তরীণ consolidation-এর ইঙ্গিত দেয়, যাতে একটি আরও unified strategy গড়ে ওঠে। experimental agent capability আলাদা রাখার বদলে, Google সেগুলোকে তার flagship consumer AI stack-এ একীভূত করছে বলে মনে হচ্ছে। model quality-এর মতোই এই consolidation-ও গুরুত্বপূর্ণ হতে পারে, কারণ ব্যবহারকারীরা সাধারণত সেসব ফিচারই গ্রহণ করেন যেগুলো আগে থেকেই তারা কাজ করেন এমন জায়গায় দেখা যায়, যেমন keyboard, browser, এবং operating system।

এই rollout কেন গুরুত্বপূর্ণ

এই ঘোষণাগুলো প্রমাণ করে না যে AI agents-এর সমস্যা সমাধান হয়ে গেছে। বাস্তব জগতের automation এখনও দুর্বল interface, অস্পষ্ট user intent, এবং ভুল কাজের ঝুঁকির সঙ্গে লড়াই করছে। কিন্তু Google-এর update দেখায় যে শিল্প আরও operational phase-এ প্রবেশ করছে। এখন focus model demo-তে প্রভাব ফেলতে পারে কি না, সেটি থেকে সরে গিয়ে মানুষ যেসব routine প্রতিদিন repeat করে সেগুলোর মধ্যে কীভাবে এগুলো বসানো যায়, সেখানে বেশি যাচ্ছে।

rollout যদি মসৃণভাবে হয়, Android ব্যবহারকারীরা AI-কে destination না ভেবে background infrastructure হিসেবে দেখতে শুরু করতে পারেন: browser-এ summarizer, keyboard-এ cleaner, commerce flow-এ helper, এবং custom interface component তৈরি করার tool। এটা consumer AI adoption-এর একটি বাস্তব পদক্ষেপ হবে, কারণ এতে intelligence-কে novelty-র বদলে utility-এর সঙ্গে যুক্ত করা হয়।

  • Google বলছে Gemini Intelligence এই গ্রীষ্মে প্রথমে Galaxy S26 এবং Pixel 10-এ চালু হবে।
  • নতুন ফিচারগুলো automation, summarization, message drafting, এবং widget creation-কে লক্ষ্য করছে।
  • এই পদক্ষেপ Gemini-কে chatbot-only ব্যবহারের বাইরে agent-style সহায়তার দিকে ঠেলে দেয়।

এই নিবন্ধটি The Decoder-এর প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধ পড়ুন.

Originally published on the-decoder.com