Apple Adds AI Accessibility Features Including Eye-Controlled Wheelchair Support

অ্যাপল সিস্টেম-স্তরের AI ফিচারের মধ্যে অ্যাক্সেসিবিলিটিকে আরও গভীরভাবে আনছে

অ্যাপল নতুন অ্যাক্সেসিবিলিটি আপডেটের একটি সেট ঘোষণা করেছে, যা Apple Intelligence ব্যবহার করে মূল সহায়ক টুলগুলোর মধ্যে ছবি বর্ণনা, নথি ব্যাখ্যা, ক্যাপশন তৈরি এবং ইন্টারফেস নেভিগেশন বিস্তৃত করবে। আপডেটে একটি উল্লেখযোগ্য mobility feature-ও রয়েছে: Vision Pro ব্যবহারকারীরা তাদের চোখ দিয়ে সামঞ্জস্যপূর্ণ হুইলচেয়ার নিয়ন্ত্রণ করতে পারবেন।

এই প্যাকেজ দেখায় যে অ্যাপল অ্যাক্সেসিবিলিটিকে আর একটি সংকীর্ণ add-on হিসেবে নয়, বরং system-wide AI application হিসেবে দেখছে। একটি standalone ফিচার চালু করার বদলে কোম্পানি image understanding, natural-language control এবং caption generation-কে iPhone, iPad, Mac, Apple TV এবং Vision Pro-সহ বিভিন্ন পণ্যের মধ্যে বুনে দিচ্ছে।

VoiceOver আরও সমৃদ্ধ image understanding পাচ্ছে

সবচেয়ে স্পষ্ট আপগ্রেডগুলোর একটি VoiceOver-এ। অ্যাপল বলেছে, এর image-recognition ক্ষমতা visual content আরও ভালোভাবে বুঝবে এবং আরও বিস্তারিত বর্ণনা তৈরি করবে। কোম্পানির দেওয়া উদাহরণে, ফিচারটি একটি bill দেখে amount এবং due date-এর মতো তথ্য পড়তে পারে, পাশাপাশি ফটোগ্রাফ এবং personal records কীভাবে বর্ণনা করে তা আরও উন্নত করতে পারে।

এটি গুরুত্বপূর্ণ, কারণ অনেক accessibility tools ঐতিহাসিকভাবে স্পষ্ট interface elements-এ শক্তিশালী হলেও unstructured visual content-এ দুর্বল। একটি বেশি স্মার্ট image layer, নথি পড়া, receipts পরীক্ষা করা বা ব্যক্তিগত ছবি বোঝার মতো দৈনন্দিন কাজকে sighted assistance-এর ওপর কম নির্ভরশীল করতে পারে।

এই উন্নতিটিও সেই বিস্তৃত শিল্পগত পরিবর্তনের সঙ্গে সামঞ্জস্যপূর্ণ, যেখানে multimodal AI system-গুলো শুধু consumer novelty-এর জন্য নয়, সহায়ক context-এ সরাসরি task support-এর জন্যও ব্যবহৃত হচ্ছে।

Anthropic US আদেশের পর Fable 5 ও Mythos 5 স্থগিত করল

জাতীয় নিরাপত্তা-সংক্রান্ত উদ্বেগ এবং একটি রিপোর্ট করা jailbreak ঝুঁকির সঙ্গে যুক্ত মার্কিন সরকারি আদেশের পর Anthropic তার নতুন Fable 5 এবং Mythos 5 মডেলের গ্রাহক অ্যাক্সেস বন্ধ করে দিয়েছে।

Read article

Live Recognition এবং Magnifier আরও কথোপকথনমূলক হচ্ছে

অ্যাপল আরও দিচ্ছে যে ব্যবহারকারীরা iPhone camera view থেকে Live Recognition সক্রিয় করে, ফ্রেমে কী আছে সে সম্পর্কে follow-up questions করতে পারবেন। এতে recognition আরও interactive প্রক্রিয়ায় পরিণত হয়। একবারের label-এর বদলে, ব্যবহারকারীরা scene সম্পর্কে অতিরিক্ত বিশদ জানতে পারবেন।

low vision ব্যবহারকারীদের জন্য, অ্যাপল বলেছে Magnifier-কে Action button-এ নির্ধারণ করা যাবে এবং high-contrast interface-এ দেখানো যাবে। “zoom in” বা “turn on flashlight”-এর মতো voice commands-ও ফিচারগুলোতে প্রবেশের পথ দেবে। এই পরিবর্তনগুলো আলাদা settings হিসেবে নয়, friction কমানোর উপায় হিসেবে বেশি গুরুত্বপূর্ণ। সহায়ক টুলগুলো যদি লুকোনো বা ঝামেলাপূর্ণ হয়, তবে সেগুলো primary workflow না হয়ে fallback feature হয়ে যায়।

অ্যাপল Magnifier-এর বাইরেও natural-language screen control প্রসারিত করছে। কোম্পানি বলেছে, ব্যবহারকারীরা স্ক্রিনে যা দেখছেন তার ভিত্তিতে কাজ বর্ণনা করতে পারবেন, যেমন Maps-এ “tap the guide about best restaurants” এবং Files-এ “tap the purple folder”। এটি ইঙ্গিত দেয় যে অ্যাপল language understanding-কে screen context-এর সঙ্গে যুক্ত করে ব্যবহারকারীদের fixed command-এর বদলে interface meaning-এর মাধ্যমে উল্লেখ করার দিকে এগোচ্ছে।

Reader এবং captions বাস্তব-জগতের কনটেন্টকে লক্ষ্য করছে

আরেকটি গুরুত্বপূর্ণ আপডেট Reader-এর জন্য, যা অ্যাপলের মতে scientific paper-এর মতো multi-column, images এবং tables থাকা জটিল নথি আরও ভালোভাবে সামলাতে পারবে। কোম্পানি আরও বলেছে, ব্যবহারকারীরা AI-generated summaries পেতে পারবেন বা custom fonts এবং colors রেখে native language-এ লেখা পড়তে পারবেন।

অ্যাক্সেসিবিলিটির ক্ষেত্রে, নথি সামলানোই প্রায়ই সেই জায়গা যেখানে polished demo কঠিন বাস্তবতার সঙ্গে ধাক্কা খায়। Multi-column layout, embedded graphics এবং tables সহজ reading system-কে প্রায়ই ভেঙে দেয়। অ্যাপলের implementation যদি বর্ণনা অনুযায়ী কাজ করে, তাহলে এটি ঘন academic এবং professional material-কে dyslexia, low vision এবং অন্যান্য reading-related চ্যালেঞ্জ থাকা মানুষের জন্য আরও সহজলভ্য করতে পারে।

অ্যাপল এমন videos-এর জন্যও AI-generated subtitles যোগ করছে যেগুলোতে আগে থেকেই captions নেই। ফিচারটি iPhone-এ রেকর্ড করা video এবং বন্ধু বা পরিবারের কাছ থেকে পাওয়া clips-এ প্রযোজ্য হবে, এবং একাধিক Apple platform-এ কাজ করবে। ব্যবহারকারীরা তৈরি হওয়া subtitles-এর চেহারাও নিয়ন্ত্রণ করতে পারবেন।

এতে অ্যাক্সেসিবিলিটি আনুষ্ঠানিক media catalog ছাড়িয়ে দৈনন্দিন personal video-তে প্রসারিত হচ্ছে, যেখানে captioning প্রায়ই অনুপস্থিত। এটি generative AI-এর একটি বাস্তবসম্মত ব্যবহারও দেখায়: authored media বদলানো নয়, বরং missing accessibility metadata বড় আকারে পূরণ করা।

Congress lets decades-old spying law lapse amid Trump

বর্ধিত মেয়াদ পাস করতে কংগ্রেস ব্যর্থ হওয়ায় সেকশন 702 মেয়াদোত্তীর্ণ হতে চলেছে

২০০৮ সালের পর প্রথমবার, ফরেন ইন্টেলিজেন্স সারভেইলেন্স অ্যাক্টের সেকশন 702 মেয়াদোত্তীর্ণ হতে যাচ্ছে, কারণ কংগ্রেস এমনকি স্বল্পমেয়াদি বর্ধিত মেয়াদও অনুমোদন করতে ব্যর্থ হয়েছে।

Read article

Vision Pro এবং হুইলচেয়ার নিয়ন্ত্রণ

সবচেয়ে স্বতন্ত্র ঘোষণা হলো Vision Pro-এর জন্য একটি নতুন project, যা ব্যবহারকারীদের চোখ দিয়ে সামঞ্জস্যপূর্ণ হুইলচেয়ার নিয়ন্ত্রণ করতে দেয়। অ্যাপল বলেছে, ভিন্ন lighting condition-এও recalibration ছাড়াই এই ফিচার কাজ করে। এটি যুক্তরাষ্ট্রে Tolt এবং LUCI alternative drive system-এর সঙ্গে চালু হবে, এবং Bluetooth ও wired accessory উভয়েরই সমর্থন থাকবে।

এই ফিচারটি আলাদা করে চোখে পড়ে, কারণ এটি অ্যাক্সেসিবিলিটিকে software navigation থেকে physical mobility-তে নিয়ে যায়। Eye tracking ইতিমধ্যেই Vision Pro interaction-এর কেন্দ্রে ছিল, কিন্তু এটিকে wheelchair control-এর সঙ্গে যুক্ত করা stakes বদলে দেয়। সময়ের সঙ্গে সবচেয়ে বড় প্রশ্ন হবে বাস্তব ব্যবহারে এর reliability, বিশেষ করে movement, lighting change এবং safety constraint থাকা পরিবেশে। অ্যাপলের ঘোষণা এখনো deployment ফলাফল দেয়নি, কিন্তু integration-এর পরিধি উল্লেখযোগ্য।

ভাষা কভারেজ এবং platform বিস্তার

অ্যাপল আরও বলেছে, শ্রবণ-প্রতিবন্ধী ব্যবহারকারীদের জন্য কারও নাম বলা হলে জানাতে তৈরি Name Recognition ফিচার এখন ৫০টি ভাষা সমর্থন করে। Large text support tvOS-এও আসছে।

এই সংযোজনগুলো Vision Pro ঘোষণার মতো বড় নয়, কিন্তু একই ধারা অনুসরণ করে: অ্যাক্সেসিবিলিটিকে একটিমাত্র product line-এ সীমাবদ্ধ না রেখে পুরো platform stack জুড়ে ছড়িয়ে দেওয়া। এই টুলগুলো যদি ধারাবাহিকভাবে কাজ করে, তা অ্যাপলের একটি বড় প্রতিযোগিতামূলক সুবিধা হতে পারে। ফোন থেকে ট্যাবলেট, হেডসেট, টেলিভিশন পর্যন্ত ব্যবহারকারীর সঙ্গে চলা একটি ফিচার এক-ডিভাইস পরীক্ষার চেয়ে আলাদা অভিজ্ঞতা তৈরি করে।

PeopleSoft 0-day affecting hundreds of organizations steals gigabytes of data

Oracle-এর প্যাচ আসার আগেই PeopleSoft-এর zero-day ভাঙচুর ছড়িয়ে পড়ে

CVE-2026-35273 হিসেবে চিহ্নিত একটি গুরুতর PeopleSoft SSRF ত্রুটি Oracle তা প্রকাশ করার দুই সপ্তাহেরও বেশি আগে থেকেই কাজে লাগানো হচ্ছিল, আর গবেষকেরা এই হামলাগুলোকে ShinyHunters ও extortion কার্যকলাপের সঙ্গে যুক্ত করেছেন.

Read article

বড় তাৎপর্য

অ্যাপলের ঘোষণা এমন সময়ে এসেছে যখন প্রযুক্তি কোম্পানিগুলো AI-কে productivity এবং consumer assistance-এর মাধ্যমে increasingly frame করছে। অ্যাক্সেসিবিলিটি এ থেকে সরাসরি লাভবান হতে পারে, কারণ image understanding, natural-language control এবং automatic summarization এমন ক্ষমতা যা সহায়ক ব্যবহারের সঙ্গে স্বাভাবিকভাবে মেলে। এই রিলিজে অ্যাপল সেই সংযোগগুলো স্পষ্টভাবে দেখাচ্ছে।

এই ঘোষণা “AI for accessibility” নিয়ে শিল্পের অনেক দাবির চেয়ে আরও বাস্তবসম্মত দৃষ্টিও দেখায়। কোম্পানি নির্দিষ্ট workflow বলেছে: bill পড়া, photographs বর্ণনা করা, জটিল documents অনুসরণ করা, personal videos-এর জন্য captions তৈরি করা, screen element-কে description-এর মাধ্যমে নিয়ন্ত্রণ করা, এবং চোখের gaze দিয়ে সামঞ্জস্যপূর্ণ হুইলচেয়ার চালানো। এগুলো বিমূর্ত প্রতিশ্রুতি নয়, বরং বাস্তব কাজ।

বাকি প্রশ্ন হলো, এই ফিচারগুলো ঘোষণাপত্র ও demo-এর বাইরে কতটা ভালো কাজ করে। accuracy, latency এবং trust অ্যাক্সেসিবিলিটিতে অনেক mainstream AI application-এর চেয়ে বেশি গুরুত্বপূর্ণ, কারণ ভুল শুধুই অসুবিধা নয়, access-ও আটকে দিতে পারে। কিন্তু অ্যাপল যা প্রকাশ করেছে তার ভিত্তিতে, এটি একটি বড় অ্যাক্সেসিবিলিটি সম্প্রসারণ, এবং সহায়ক নকশাকে secondary feature list নয়, বরং first-order AI product category হিসেবে বিবেচনা করে।

এই নিবন্ধটি TechCrunch-এর প্রতিবেদনের ওপর ভিত্তি করে। মূল নিবন্ধটি পড়ুন.

Originally published on techcrunch.com

অ্যাপল অন-ডিভাইস AI, উন্নত ক্যাপশন এবং চোখ-নিয়ন্ত্রিত হুইলচেয়ার সমর্থনসহ অ্যাক্সেসিবিলিটি টুলস বাড়াচ্ছে

অ্যাপল সিস্টেম-স্তরের AI ফিচারের মধ্যে অ্যাক্সেসিবিলিটিকে আরও গভীরভাবে আনছে

VoiceOver আরও সমৃদ্ধ image understanding পাচ্ছে

Anthropic US আদেশের পর Fable 5 ও Mythos 5 স্থগিত করল

Live Recognition এবং Magnifier আরও কথোপকথনমূলক হচ্ছে

Reader এবং captions বাস্তব-জগতের কনটেন্টকে লক্ষ্য করছে

বর্ধিত মেয়াদ পাস করতে কংগ্রেস ব্যর্থ হওয়ায় সেকশন 702 মেয়াদোত্তীর্ণ হতে চলেছে

Vision Pro এবং হুইলচেয়ার নিয়ন্ত্রণ

ভাষা কভারেজ এবং platform বিস্তার

Oracle-এর প্যাচ আসার আগেই PeopleSoft-এর zero-day ভাঙচুর ছড়িয়ে পড়ে

বড় তাৎপর্য

Comments (0)

Related Articles

Apple-এর foundation-model বিভাজন একটি হাইব্রিড AI কৌশলের ইঙ্গিত দেয়

রেকর্ড IPO-এর পর SpaceX-এ লেনদেন শুরু

প্রোমিথিউস ইঞ্জিনিয়ারিং ডিজাইনের জন্য AI টুলসকে লক্ষ্য করছে

বিশেষজ্ঞদের সতর্কবার্তা: এআই এজেন্টদের জন্য আরও কঠোর এন্টারপ্রাইজ গার্ডরেল দরকার

Keep Reading