Enterprise AI agents இணையத்தின் பழமையான trust பிரச்சினையையே தங்களுடன் கொண்டு வரக்கூடும்
Google ஆராய்ச்சியாளர்கள், தீய நோக்குள்ள பொதுத் தளப் பக்கங்கள் indirect prompt injection வழியாக enterprise AI agents-ஐ தீவிரமாக பாதிக்கின்றன என்று எச்சரிக்கின்றனர்; இது வழங்கப்பட்ட candidate metadata மற்றும் excerpt-ல் கூறப்பட்டுள்ளது. இந்த எச்சரிக்கை agentic AI குறித்து மாதங்களாக நிலவி வந்த கவலையை மேலும் கூர்மையாக்குகிறது: அமைப்புகளுக்கு வெளிப்புற மூலங்களைப் படிக்க, சுருக்க, மற்றும் அவற்றின் மீது செயல்பட அதிக autonomy கொடுக்கப்படும் போது, அவை திறந்த இணையத்தின் எதிர்மறை தன்மையையும் மரபாகப் பெறுகின்றன.
இங்கு கூறப்படும் அச்சுறுத்தல் வழக்கமான software exploit என்ற குறுகிய அர்த்தத்தில் அல்ல. இது model behavior-ஐ மாற்றும் முயற்சி. ஒரு hostile page, AI agent அதைப் பார்வையிடும், index செய்யும் அல்லது summarize செய்யும் போது அதை பாதிக்கக்கூடிய instructions அல்லது content-ஐ உட்பொதிக்கலாம். அந்த agent enterprise tools அல்லது workflows-க்கு இணைக்கப்பட்டிருந்தால், ஆபத்து தவறான output-இல் மட்டும் முடிவதில்லை. அது decisions, retrieval chains, மற்றும் downstream operational actions வரை பரவலாம்.
Indirect prompt injection-ஐ அமைப்பு ரீதியாகத் தீர்ப்பது ஏன் கடினம்
இந்த எச்சரிக்கை பல தற்போதைய AI products-ஐ அடித்தளமாக வைத்துள்ள ஒரு design assumption-ஐ குறிவைக்கிறது: developer-கள் model-ஐச் சுற்றி போதுமான guardrails வைத்தால், agents பரந்த அளவிலான documents-ல் பாதுகாப்பாக இயங்கலாம் என்பதையே. Indirect prompt injection attacks input layer-ஐயே மாசுபடுத்துவதால் அந்த assumption-ஐ சவாலுக்கு உட்படுத்துகின்றன. பிரச்சினை user model-க்கு என்ன கேட்கிறார் என்பதில் மட்டும் இல்லை. user அறியாமலே சுற்றுப்புற சூழல் model-க்கு என்ன கேட்கிறது என்பதிலும் உள்ளது.
வழங்கப்பட்ட excerpt-ல் Common Crawl repository-ஐ scan செய்த security teams இந்த ஆபத்துடன் தொடர்புடைய ஆதாரங்களைக் கண்டறிந்ததாக கூறப்படுகிறது. இது முக்கியமான விவரம், ஏனெனில் Common Crawl மிகப் பெரியது மற்றும் web-scale data work-ல் பரவலாகப் பயன்படுத்தப்படுகிறது. prompt-injection patterns ஏற்கனவே அங்கு தெரிந்தால், பிரச்சினை கோட்பாடானது மட்டும் அல்ல. AI systems retrieval, summarization, அல்லது browsing க்காக அதிகம் நம்பும் அதே பொதுத் தகவல் சூழலிலேயே hostile content seed செய்ய முடியும் என்பதைக் காட்டுகிறது.
Agents ஆபத்தை ஏன் அதிகரிக்கின்றன
Chatbots தவறாக யூகிக்கலாம் அல்லது instructions-ஐ தவறாகப் படிக்கலாம்; ஆனால் agents அதிகப் பரிமாணமுள்ள surface area-ஐ உருவாக்குகின்றன, ஏனெனில் அவை செயல்களை செய்ய வடிவமைக்கப்பட்டுள்ளன. அவை pages fetch செய்கின்றன, systems-ஐ connect செய்கின்றன, actions-ஐ draft செய்கின்றன, சில சமயங்களில் workflows-ஐ trigger செய்கின்றன. அதனால் ஒரு poisoned page-க்கு பாரம்பரிய அர்த்தத்தில் software-ஐ “hack” செய்ய வேண்டிய அவசியமில்லை. அடுத்து என்ன நடக்கிறது என்பதை மாற்றுவதற்கு model-ன் reasoning-ஐ மாற்றினால் போதும்.
Enterprise-களுக்கு இது புதிய security boundary கேள்வியை உருவாக்குகிறது. இணையத்தில் எப்போதும் spam, scams, malicious scripts, deceptive content ஆகியவை இருந்தே வந்துள்ளன. மனித ஊழியர்கள் training, browser defenses, institutional controls போன்றவற்றின் கலவையுடன் அந்த சூழலை சமாளிக்கிறார்கள். AI agents-க்கு இன்னும் அதே அளவிலான judgment இல்லை, மேலும் அவை hostile content-ஐ machine speed மற்றும் machine scale-ல் செயலாக்க முடியும். அந்த சமநிலையின்மை, பழைய internet பிரச்சினையையே AI யுகத்திற்குரிய ஒன்றாக மாற்றுகிறது.
AI deployment-க்கு உள்ள பெரிய பாடம்
Google எச்சரிக்கையை வெறும் research footnote ஆக அல்ல, product architecture issue ஆகப் பார்க்க வேண்டும். AI agent-ஐ public pages browse செய்ய அல்லது ingest செய்ய அனுமதிக்கும் எந்த system-மும், அந்தப் பக்கங்களில் adversarial instructions இருக்கலாம் என்று கருத வேண்டும். பாதுகாப்பான default trust அல்ல. பாதுகாப்பான default suspicion, isolation, மேலும் agent-ன் output sensitive systems-ஐ பாதிக்க அனுமதிக்கும் முன் layered validation ஆகும்.
வழங்கப்பட்ட material-ல் Google-ன் முழு mitigation guidance இல்லை; ஆகவே இங்கே உள்ள ஆதாரம் திசை காட்டுவதற்கானது, முழுமையானது அல்ல. ஆனால் திசை தெளிவாக உள்ளது. Enterprise AI agents, language models text-ஐ interpret செய்கின்றன, மற்றும் இணையத்தில் attackers எழுதிய text-ஐ அவை சந்திக்கின்றன என்ற உண்மையுடன் மோதுகின்றன. மேலும் பல நிறுவனங்கள் agents-ஐ operationalize செய்யும் வேகத்தில், மிக முக்கியமான security question இப்போது model என்ன செய்ய முடியும் என்பதல்ல; model-ஐ என்ன செய்ய வைக்க முடியும் என்பதே ஆகலாம்.
இந்த கட்டுரை AI News-இன் செய்திப்படுத்தலை அடிப்படையாகக் கொண்டது. மூல கட்டுரையைப் படிக்கவும்.
Originally published on artificialintelligence-news.com