ஒரு வித்தியாசமான வழிமுறை, அதில் ஒரு தீவிரமான செய்தி
இந்த வாரம் OpenAI-இன் coding tooling-இல் மிகவும் பேசப்பட்ட வரிகளில் ஒன்று software quality, security, அல்லது latency பற்றியது இல்லை. அது goblins பற்றியது. Wired-ன் அறிக்கையின்படி, Codex CLI-இல் உள்ள வழிமுறைகள் model-க்கு தெளிவாகச் சொல்கின்றன: பயனரின் கோரிக்கையுடன் தெளிவாக தொடர்புடையதாக இல்லாவிட்டால் goblins, gremlins, raccoons, trolls, ogres, pigeons, அல்லது பிற உயிர்களைப் பற்றி பேச வேண்டாம்.
முதற்கண், இது production-க்கு தப்பிச் சென்ற ஒரு உள்ளக நகைச்சுவை போலப் படிக்கிறது. ஆனால் நடைமுறையில், இது இன்னும் முக்கியமான ஒன்றைக் காட்டுகிறது: model behavior இப்போது training மற்றும் architecture மட்டும் அல்ல, பயனர்கள் நிஜ உலகில் தொடர்ந்து சந்திக்கும் recurring patterns-ஐ அடக்குவதற்காக வடிவமைக்கப்பட்ட மிகக் குறிப்பிட்ட operational guardrails மூலமும் நிர்ணயிக்கப்படுகிறது.
AI assistants-இன் விசித்திரமான edge cases இனி research demos-க்கு மட்டும் கட்டுப்படவில்லை என்பதால் இது முக்கியம். Coding agents இப்போது serious productivity tools ஆக நிலைநிறுத்தப்படுகின்றன. Vendors அவற்றை command-line environments, desktop automation flows, அல்லது applications முழுவதும் செயல்படக்கூடிய agentic systems-இல் தள்ளும்போது, சிறிய recurring quirks கூட product-level பிரச்சினைகளாக மாறலாம்.
Model-இன் வித்தியாசத்திலிருந்து product requirement-க்கு
Wired-ன் அறிக்கையின்படி, X-இல் உள்ள பயனர்கள் OpenAI models சில சமயங்களில் goblins மற்றும் அதற்கு ஒத்த உயிர்களின் மீது சிக்கிக் கொண்டன என்று கூறினார்கள், குறிப்பாக OpenClaw உடன் சேர்க்கப்பட்டபோது, இது AI-யை computer மற்றும் apps-ஐ கட்டுப்படுத்தி task-களை முடிக்க அனுமதிக்கும் ஒரு tool. சில பயனர்கள் அந்த நடத்தை நகைச்சுவையாகக் கருதினர். மற்றவர்கள் அதை ஒரு அறியக்கூடிய failure mode ஆகக் கண்டனர். எப்படியிருந்தாலும், OpenAI-இன் பதில் நேரடியானதாகத் தெரிகிறது: தடை விதியை நேரடியாக instructions-இல் எழுதிவிடுவது.
இதன் விளைவு, நவீன AI products உண்மையில் எவ்வாறு tune செய்யப்படுகின்றன என்பதற்கான பயனுள்ள snapshot. model capability பற்றிய சுத்தமான public narrative பெரும்பாலும் benchmarks, reasoning, மற்றும் real-world task success-ஐ முன்வைக்கிறது. அந்த அடுக்கின் கீழே இன்னொரு அடுக்கு உள்ளது: தொழில்நுட்ப ரீதியாக பாதிப்பில்லாததாயினும் நடைமுறையில் இடையூறு தரக்கூடிய நடத்தை தோன்றாமல் இருக்க instruction engineering. ஒரு model code எழுதும் போது தேவையற்ற metaphors அல்லது whimsical மொழிக்கு மீண்டும் மீண்டும் சாய்ந்தால், அது underlying technical output சரியாக இருந்தாலும் trust-ஐ குறைத்து, பயனர்களைத் திசைதிருப்பி, system-ஐ நிலையற்றதாக உணரச் செய்யலாம்.
வேறு வார்த்தைகளில், “goblins-ஐ குறிப்பிடாதே” என்பது உண்மையில் goblins பற்றி அல்ல. அது reliability பற்றி. பயனர்கள் code assistant ஒன்று task-இல் நிலைத்து, professional tone-ஐ காக்க, மற்றும் நேரத்தைச் சேமிக்க வேண்டிய workflows-இல் சீரற்ற theme obsession-களைச் சேர்க்காமல் இருக்க வேண்டும் என்பதே அவர்களின் எதிர்பார்ப்பு.
Agentic systems இதை ஏன் கடினமாக்குகின்றன
Wired குறிப்பிடுவது போல, பெரிய language models அடுத்ததாக என்ன வரும் என்பதை கணிக்க பயிற்றுவிக்கப்பட்ட probabilistic systems; அதில் கூடுதல் instructions மற்றும் context சேர்க்கும் ஒரு “agentic harness” உள்ளபோது அசாதாரண நடத்தை அதிகமாக இருக்கலாம். இந்த framing முக்கியமானது. base model-ஐ சுற்றி எத்தனை அடுக்குகள் சேர்க்கப்படுகிறதோ, அவ்வளவு அதிகமாக அசாதாரண நடத்தை தோன்றுவதற்கான interaction surfaces உருவாகும்.
எளிய prompt-and-response loop-இல் பயன்படுத்தப்படும் coding assistant ஒரு விஷயம். நீண்ட instructions-ஐ படித்து, memory-ஐ நினைவுகூர்ந்து, tools-ஐ கையாள்ந்து, software-ஐ இயக்கி, persona-வைப் பேணும் system இன்னொரு விஷயம். இத்தகைய செறிந்த சூழல்கள் local prompt patterns, stylistic bleed-through, அல்லது recurring motifs தோன்றுவதற்கான கூடுதல் வாய்ப்புகளை உருவாக்கலாம். தனித்தனியாகப் பார்த்தால் அபத்தமாகத் தோன்றும் ஒன்று, முழு stack-இன் சிக்கலின் அறிகுறியாக இருக்கலாம்.
இந்தக் கட்டுரை அந்த பிரச்சினையை போட்டித் தருணத்திலும் வைக்கிறது. OpenAI-இன் புதிய model release coding performance-ஐ முக்கியமாக முன்வைத்தது, அதே சமயம் vendors AI-assisted software development-ஐ core market ஆக வரையறுக்கப் போட்டியிட்டுக் கொண்டிருந்தனர். அது behavioral polish-ஐ குறைவாக அல்ல, அதிகமாகவே முக்கியமாக்குகிறது. Coding agents ஒரு flagship product class ஆக மாறினால், முன்பு quirky எனத் தோன்றிய rough edges brand liabilities ஆக மாறலாம்.
Meme-உம் சந்தையும்
இந்த கண்டுபிடிப்பு உடனடியாக meme ஆக மாறியது; பயனர்கள் jokes, images, மற்றும் playful “goblin mode” extensions-களை உருவாக்கினர். AI-இல் இந்த கலாச்சார எதிர்வினை பரிச்சயமானது. Product oddities பெரும்பாலும் நிறுவனங்கள் விளக்குவதற்கு முன்பே internet artifacts ஆகிவிடுகின்றன. ஆனால் meme cycle-இன் வேகம் industrial significance-ஐ மறைக்கக் கூடாது. AI products-க்கு திறன்கள் மட்டும் போதாது என்பதை நிறுவனங்கள் உணர்ந்து வருகின்றன. அவற்றுக்கு behavioral containment கூட தேவை.
அதில் tone, persona discipline, மற்றும் மீண்டும் மீண்டும் தோன்றும் உதவாத patterns-ஐ அடக்குதல் அடங்கும்; அவற்றைத் தடுக்க explicit intervention தேவைப்படுகிறது. ஒரு vendor instructions-இல் creatures பட்டியலை hard-code செய்வது, இந்த செயல்முறை எவ்வளவு hands-on ஆகிவிட்டது என்பதை காட்டுகிறது. Frontier models-ஐ அன்றாட tools-இல் பயன்படுத்தக்கூடியதாக மாற்றுவதற்குப் பின்னால் உள்ள, பெரிதாக பேசப்படாத உழைப்பின் மிகத் தெளிவான உதாரணங்களில் இதுவும் ஒன்று.
பொதுவாக மக்கள் AI systems-ஐ monolithic intelligence-களாகப் பார்க்கிறார்கள்; ஆனால் உண்மையில் deployed products என்பது patches, filters, hidden instructions, மற்றும் behavioral guardrails நிறைந்த layered constructions. இந்த mechanism-கள் model-ஐ வெறும் refine செய்வதில்லை. அவை user experience-ஐ வரையறுக்கின்றன.
OpenAI-இன் anti-goblin rule விசித்திரமாக இருப்பதால் நகைச்சுவையாகத் தோன்றுகிறது. அதே காரணத்தால்தான் அது முக்கியமானதும் கூட. ஒரு product team mythical creatures-ஐ explicit-ஆக suppress செய்ய வேண்டும் என்று முடிவு செய்தால், emergent model behavior மற்றும் software quality control-இன் இடையிலான கோடு மிகவும் மெல்லியதாகிவிட்டது என்பதைக் காட்டுகிறது. Coding agents உருவாக்கும் நிறுவனங்களுக்கு உண்மையான கதை இதுவாக இருக்கலாம்.
இந்தக் கட்டுரை Wired-ன் செய்தி அறிக்கையை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.
Originally published on wired.com




