OpenAI-இன் ‘No Goblins’ Rule ஒரு உண்மையான AI product சவாலை வெளிப்படுத்துகிறது

ஒரு வித்தியாசமான வழிமுறை, அதில் ஒரு தீவிரமான செய்தி

இந்த வாரம் OpenAI-இன் coding tooling-இல் மிகவும் பேசப்பட்ட வரிகளில் ஒன்று software quality, security, அல்லது latency பற்றியது இல்லை. அது goblins பற்றியது. Wired-ன் அறிக்கையின்படி, Codex CLI-இல் உள்ள வழிமுறைகள் model-க்கு தெளிவாகச் சொல்கின்றன: பயனரின் கோரிக்கையுடன் தெளிவாக தொடர்புடையதாக இல்லாவிட்டால் goblins, gremlins, raccoons, trolls, ogres, pigeons, அல்லது பிற உயிர்களைப் பற்றி பேச வேண்டாம்.

முதற்கண், இது production-க்கு தப்பிச் சென்ற ஒரு உள்ளக நகைச்சுவை போலப் படிக்கிறது. ஆனால் நடைமுறையில், இது இன்னும் முக்கியமான ஒன்றைக் காட்டுகிறது: model behavior இப்போது training மற்றும் architecture மட்டும் அல்ல, பயனர்கள் நிஜ உலகில் தொடர்ந்து சந்திக்கும் recurring patterns-ஐ அடக்குவதற்காக வடிவமைக்கப்பட்ட மிகக் குறிப்பிட்ட operational guardrails மூலமும் நிர்ணயிக்கப்படுகிறது.

AI assistants-இன் விசித்திரமான edge cases இனி research demos-க்கு மட்டும் கட்டுப்படவில்லை என்பதால் இது முக்கியம். Coding agents இப்போது serious productivity tools ஆக நிலைநிறுத்தப்படுகின்றன. Vendors அவற்றை command-line environments, desktop automation flows, அல்லது applications முழுவதும் செயல்படக்கூடிய agentic systems-இல் தள்ளும்போது, சிறிய recurring quirks கூட product-level பிரச்சினைகளாக மாறலாம்.

Model-இன் வித்தியாசத்திலிருந்து product requirement-க்கு

Wired-ன் அறிக்கையின்படி, X-இல் உள்ள பயனர்கள் OpenAI models சில சமயங்களில் goblins மற்றும் அதற்கு ஒத்த உயிர்களின் மீது சிக்கிக் கொண்டன என்று கூறினார்கள், குறிப்பாக OpenClaw உடன் சேர்க்கப்பட்டபோது, இது AI-யை computer மற்றும் apps-ஐ கட்டுப்படுத்தி task-களை முடிக்க அனுமதிக்கும் ஒரு tool. சில பயனர்கள் அந்த நடத்தை நகைச்சுவையாகக் கருதினர். மற்றவர்கள் அதை ஒரு அறியக்கூடிய failure mode ஆகக் கண்டனர். எப்படியிருந்தாலும், OpenAI-இன் பதில் நேரடியானதாகத் தெரிகிறது: தடை விதியை நேரடியாக instructions-இல் எழுதிவிடுவது.

இதன் விளைவு, நவீன AI products உண்மையில் எவ்வாறு tune செய்யப்படுகின்றன என்பதற்கான பயனுள்ள snapshot. model capability பற்றிய சுத்தமான public narrative பெரும்பாலும் benchmarks, reasoning, மற்றும் real-world task success-ஐ முன்வைக்கிறது. அந்த அடுக்கின் கீழே இன்னொரு அடுக்கு உள்ளது: தொழில்நுட்ப ரீதியாக பாதிப்பில்லாததாயினும் நடைமுறையில் இடையூறு தரக்கூடிய நடத்தை தோன்றாமல் இருக்க instruction engineering. ஒரு model code எழுதும் போது தேவையற்ற metaphors அல்லது whimsical மொழிக்கு மீண்டும் மீண்டும் சாய்ந்தால், அது underlying technical output சரியாக இருந்தாலும் trust-ஐ குறைத்து, பயனர்களைத் திசைதிருப்பி, system-ஐ நிலையற்றதாக உணரச் செய்யலாம்.

வேறு வார்த்தைகளில், “goblins-ஐ குறிப்பிடாதே” என்பது உண்மையில் goblins பற்றி அல்ல. அது reliability பற்றி. பயனர்கள் code assistant ஒன்று task-இல் நிலைத்து, professional tone-ஐ காக்க, மற்றும் நேரத்தைச் சேமிக்க வேண்டிய workflows-இல் சீரற்ற theme obsession-களைச் சேர்க்காமல் இருக்க வேண்டும் என்பதே அவர்களின் எதிர்பார்ப்பு.

Musk’s xAI fired engineer for raising concerns about Grok chatbot, lawsuit claims

Grok பாதுகாப்பு கவலைகளை முன்வைத்ததால் xAI பொறியாளர் பணிநீக்கம் செய்யப்பட்டார் என வழக்கு குற்றஞ்சாட்டுகிறது

Grok-க்கான வலுவான பாதுகாப்பு செயல்முறைகளை அமல்படுத்தும்படி அழுத்தம் கொடுத்ததற்குப் பிறகு, ஒரு முன்னாள் xAI பொறியாளர் தன்னை சட்டவிரோதமாக பணிநீக்கம் செய்ததாக குற்றஞ்சாட்டுகிறார்; இது AI பாதுகாப்பு தடுப்புகள் மற்றும் நிறுவன பொறுப்பியல் மீதான கவனத்தை அதிகரிக்கிறது.

Read article

Agentic systems இதை ஏன் கடினமாக்குகின்றன

Wired குறிப்பிடுவது போல, பெரிய language models அடுத்ததாக என்ன வரும் என்பதை கணிக்க பயிற்றுவிக்கப்பட்ட probabilistic systems; அதில் கூடுதல் instructions மற்றும் context சேர்க்கும் ஒரு “agentic harness” உள்ளபோது அசாதாரண நடத்தை அதிகமாக இருக்கலாம். இந்த framing முக்கியமானது. base model-ஐ சுற்றி எத்தனை அடுக்குகள் சேர்க்கப்படுகிறதோ, அவ்வளவு அதிகமாக அசாதாரண நடத்தை தோன்றுவதற்கான interaction surfaces உருவாகும்.

எளிய prompt-and-response loop-இல் பயன்படுத்தப்படும் coding assistant ஒரு விஷயம். நீண்ட instructions-ஐ படித்து, memory-ஐ நினைவுகூர்ந்து, tools-ஐ கையாள்ந்து, software-ஐ இயக்கி, persona-வைப் பேணும் system இன்னொரு விஷயம். இத்தகைய செறிந்த சூழல்கள் local prompt patterns, stylistic bleed-through, அல்லது recurring motifs தோன்றுவதற்கான கூடுதல் வாய்ப்புகளை உருவாக்கலாம். தனித்தனியாகப் பார்த்தால் அபத்தமாகத் தோன்றும் ஒன்று, முழு stack-இன் சிக்கலின் அறிகுறியாக இருக்கலாம்.

இந்தக் கட்டுரை அந்த பிரச்சினையை போட்டித் தருணத்திலும் வைக்கிறது. OpenAI-இன் புதிய model release coding performance-ஐ முக்கியமாக முன்வைத்தது, அதே சமயம் vendors AI-assisted software development-ஐ core market ஆக வரையறுக்கப் போட்டியிட்டுக் கொண்டிருந்தனர். அது behavioral polish-ஐ குறைவாக அல்ல, அதிகமாகவே முக்கியமாக்குகிறது. Coding agents ஒரு flagship product class ஆக மாறினால், முன்பு quirky எனத் தோன்றிய rough edges brand liabilities ஆக மாறலாம்.

Meme-உம் சந்தையும்

இந்த கண்டுபிடிப்பு உடனடியாக meme ஆக மாறியது; பயனர்கள் jokes, images, மற்றும் playful “goblin mode” extensions-களை உருவாக்கினர். AI-இல் இந்த கலாச்சார எதிர்வினை பரிச்சயமானது. Product oddities பெரும்பாலும் நிறுவனங்கள் விளக்குவதற்கு முன்பே internet artifacts ஆகிவிடுகின்றன. ஆனால் meme cycle-இன் வேகம் industrial significance-ஐ மறைக்கக் கூடாது. AI products-க்கு திறன்கள் மட்டும் போதாது என்பதை நிறுவனங்கள் உணர்ந்து வருகின்றன. அவற்றுக்கு behavioral containment கூட தேவை.

அதில் tone, persona discipline, மற்றும் மீண்டும் மீண்டும் தோன்றும் உதவாத patterns-ஐ அடக்குதல் அடங்கும்; அவற்றைத் தடுக்க explicit intervention தேவைப்படுகிறது. ஒரு vendor instructions-இல் creatures பட்டியலை hard-code செய்வது, இந்த செயல்முறை எவ்வளவு hands-on ஆகிவிட்டது என்பதை காட்டுகிறது. Frontier models-ஐ அன்றாட tools-இல் பயன்படுத்தக்கூடியதாக மாற்றுவதற்குப் பின்னால் உள்ள, பெரிதாக பேசப்படாத உழைப்பின் மிகத் தெளிவான உதாரணங்களில் இதுவும் ஒன்று.

பொதுவாக மக்கள் AI systems-ஐ monolithic intelligence-களாகப் பார்க்கிறார்கள்; ஆனால் உண்மையில் deployed products என்பது patches, filters, hidden instructions, மற்றும் behavioral guardrails நிறைந்த layered constructions. இந்த mechanism-கள் model-ஐ வெறும் refine செய்வதில்லை. அவை user experience-ஐ வரையறுக்கின்றன.

OpenAI-இன் anti-goblin rule விசித்திரமாக இருப்பதால் நகைச்சுவையாகத் தோன்றுகிறது. அதே காரணத்தால்தான் அது முக்கியமானதும் கூட. ஒரு product team mythical creatures-ஐ explicit-ஆக suppress செய்ய வேண்டும் என்று முடிவு செய்தால், emergent model behavior மற்றும் software quality control-இன் இடையிலான கோடு மிகவும் மெல்லியதாகிவிட்டது என்பதைக் காட்டுகிறது. Coding agents உருவாக்கும் நிறுவனங்களுக்கு உண்மையான கதை இதுவாக இருக்கலாம்.

இந்தக் கட்டுரை Wired-ன் செய்தி அறிக்கையை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.

‘You Will Not Speak on Flock Tonight’: County Commissioner Refuses to Let Residents Opposing Flock Speak at Meeting

வட கரோலினா குடிமக்கள் Flock கேமராக்களுக்கு எதிராக பேசத் தடுக்கப்பட்டனர்

வட கரோலினாவில் உள்ள ஒரு கவுண்டி ஆணையர், Flock உரிமம் தகடு வாசிப்பிகளுக்கு எதிரான பொதுக் கருத்துக்களை ஒரே ஒரு பேச்சாளருக்கே கட்டுப்படுத்தினார்; இதனால் உள்ளூர் கண்காணிப்பு விவாதம், பொதுக் கூட்டங்களில் யாருக்கு குரல் கிடைக்கிறது என்ற ஒரு பெரிய மோதலாக மாறியது.

Read article

Originally published on wired.com

OpenAI-இன் anti-goblin விதி அசாதாரண AI நடத்தை ஒரு உண்மையான product பிரச்சினையாக மாறிவருவதை காட்டுகிறது

ஒரு வித்தியாசமான வழிமுறை, அதில் ஒரு தீவிரமான செய்தி

Model-இன் வித்தியாசத்திலிருந்து product requirement-க்கு

Grok பாதுகாப்பு கவலைகளை முன்வைத்ததால் xAI பொறியாளர் பணிநீக்கம் செய்யப்பட்டார் என வழக்கு குற்றஞ்சாட்டுகிறது

Agentic systems இதை ஏன் கடினமாக்குகின்றன

Meme-உம் சந்தையும்

வட கரோலினா குடிமக்கள் Flock கேமராக்களுக்கு எதிராக பேசத் தடுக்கப்பட்டனர்

Comments (0)

Related Articles

அண்டார்டிக் பனிக்கட்டிகள் புதிய கடலடி வாழிடங்களை உருவாக்குகின்றன

AI அடிப்படையிலான விலை நிர்ணயத்துக்காக Washington Post மீது வழக்கு

Keep Reading