வலுவான மாதிரிகள் சிறப்பாக செயல்பட்டன, ஆனால் பயனாளர்கள் அதை கவனிக்கவில்லை

Anthropic நடத்திய ஒரு உள்நாட்டு சோதனை, AI சமத்துவமின்மையின் நுணுக்கமான ஆனால் முக்கியமான ஒரு வடிவம் ஏற்கனவே உருவாகி இருக்கலாம் என்பதைச் சுட்டுகிறது: வலுவான மாதிரிகள் பிரதிநிதித்துவப்படுத்தும் أشخاص, அருகில் இருக்கும் யாரும் அந்த இடைவெளியை உணராத வகையில், சிறந்த முடிவுகளைப் பெற முடியும். வழங்கப்பட்ட மூல உரையின்படி, Anthropic 2025 டிசம்பரில் ஒரு வாரம் நீண்ட உள்நாட்டு சந்தை “Project Deal” நடத்தி, அதில் 69 பணியாளர்கள் Slack வழியாக Claude-அடிப்படையிலான AI முகவர்களைப் பயன்படுத்தி உண்மையான பொருட்களை வாங்கவும் விற்கவும் செய்தனர்.

ஒவ்வொரு பங்கேற்பாளருக்கும் 100 டாலர் பட்ஜெட் வழங்கப்பட்டது. சந்தை திறக்குமுன், Claude தன்னார்வலர்களிடம் அவர்கள் என்ன வாங்க அல்லது விற்க விரும்புகிறார்கள், அவர்களின் விலை விருப்பங்கள் என்ன, மற்றும் தங்கள் முகவர் எந்த விதமான பேச்சுவார்த்தை முறையை பயன்படுத்த வேண்டும் என்று கேட்டறிந்தது. அந்த தகவல்களை வைத்து Anthropic தனிப்பட்ட system prompts உருவாக்கியது. அதன் பிறகு, AI முகவர்கள் பட்டியல்கள் எழுதுதல், எதிர்ப்பக்கங்களைத் தேடுதல், ஆஃபர்கள் இடுதல், பேரம் பேசுதல், மற்றும் ஒப்பந்தங்களை முடித்தல் ஆகிய அனைத்தையும் முடிவுவரை கையாள்ந்தனர். மனிதர்கள் இறுதியில் பொருட்களை பரிமாறுவதற்காக மட்டுமே மீண்டும் சேர்ந்தனர்.

சோதனையின் முக்கிய திருப்பம் பங்கேற்பாளர்களுக்குத் தெரியாமல் வைத்துக் கொள்ளப்பட்டது. Anthropic சந்தையின் இணை பதிப்புகளை நடத்தியது. சிலவற்றில் ஒவ்வொரு பங்கேற்பாளரும் Claude Opus 4.5 மூலம் பிரதிநிதித்துவப்படுத்தப்பட்டனர்; மூல உரையில் அது அந்த நேரத்தில் Anthropic-இன் frontier model என விவரிக்கப்பட்டுள்ளது. மற்றவற்றில், பங்கேற்பாளர்கள் 50% வாய்ப்பில் Claude Haiku 4.5 மூலம் பிரதிநிதித்துவப்படுத்தப்பட்டனர்; இது நிறுவனத்தின் சிறிய மாதிரி.

முடிவு தொழில்நுட்பமானதுமட்டுமல்ல. சமூகமானதும் கூட.

மூலத்தின் படி, அதிக திறன் கொண்ட Opus மாதிரி சராசரியாக Haiku-வை விட தொடர்ந்து சிறந்த விலைகளைப் பெற்றது மற்றும் அதிக ஒப்பந்தங்களை முடித்தது. அதே சமயம், அதிக தீவிரமான பேச்சுவார்த்தை அறிவுறுத்தல்கள் முடிவுகளில் புள்ளியியல் ரீதியாக குறிப்பிடத்தக்க வேறுபாட்டை உருவாக்கவில்லை. வேறு வார்த்தைகளில், வெறும் கடுமையாக பேரம் பேசச் சொல்வது அல்ல; மாதிரி திறனே முக்கியமானது.

இந்த முடிவு, நிறுவன AI ஏற்றுமுதலில் பொதுவாக காணப்படும் ஒரு உள்ளுணர்வுக்கு எதிராக செல்கிறது; அங்கு அமைப்புகள் சில சமயம் prompt style அல்லது வெளிப்புற நடத்தைதான் பெரும்பாலான மதிப்பை நிர்ணயிக்கும் என கருதுகின்றன. Anthropic-இன் கண்டுபிடிப்புகள், அடிப்படை மாதிரியின் வலிமை tone-ஐ விட முக்கியமாக இருக்கலாம் என்பதைக் காட்டுகின்றன. இந்த முறை பரவலாகச் செயல்பட்டால், முகவரின் தரமே டிஜிட்டல் பரிவர்த்தனைகளில் யார் நல்ல நிபந்தனைகளைப் பெறுகிறார்கள் என்பதை அமைதியாக தீர்மானிக்க முடியும்.

மிக வியப்பூட்டும் கண்டுபிடிப்பு பொருளாதாரத்தை விட உணர்வுப்பூர்வமானதாக இருக்கலாம். பலவீனமான Haiku முகவர்களைப் பெற்ற பயனாளர்கள் பொருளளவில் மோசமான முடிவுகளைப் பெற்றிருந்தாலும், தங்கள் பரிவர்த்தனைகளை Opus மூலம் பிரதிநிதித்துவப்படுத்தப்பட்ட பயனாளர்களைப் போலவே நியாயமானதாக மதிப்பிட்டதாக Anthropic கூறுகிறது. இதுதான் நிறுவனம் AI உதவியுடனான முடிவெடுத்தலில் “தெரியாத சமத்துவமின்மை” என்று குறிப்பிடும் நிலை.

இது முக்கியமான கருத்து. பாரம்பரிய சமத்துவமின்மைகள் பெரும்பாலும் விலை, அணுகல், அல்லது சேவைத் தரத்தில் தெளிவாகத் தெரியும். Anthropic சுட்டும் விஷயம் அதிகம் கண்டறிய கடினமானது: இரண்டு பேர் சமமாக திருப்தியாக உணரலாம்; ஆனால் அவர்களின் சார்பில் செயல்பட்ட இயந்திரம் ஒருவருக்கு முறையாகக் குறைந்த தரமான பிரதிநிதித்துவத்தை வழங்கியிருக்கலாம்.