Anthropic வலுவான AI முகவர்கள் அமைதியாக சிறந்த ஒப்பந்தங்களைச் செய்கிறார்கள் எனக் கண்டறிந்தது

வலுவான மாதிரிகள் சிறப்பாக செயல்பட்டன, ஆனால் பயனாளர்கள் அதை கவனிக்கவில்லை

Anthropic நடத்திய ஒரு உள்நாட்டு சோதனை, AI சமத்துவமின்மையின் நுணுக்கமான ஆனால் முக்கியமான ஒரு வடிவம் ஏற்கனவே உருவாகி இருக்கலாம் என்பதைச் சுட்டுகிறது: வலுவான மாதிரிகள் பிரதிநிதித்துவப்படுத்தும் أشخاص, அருகில் இருக்கும் யாரும் அந்த இடைவெளியை உணராத வகையில், சிறந்த முடிவுகளைப் பெற முடியும். வழங்கப்பட்ட மூல உரையின்படி, Anthropic 2025 டிசம்பரில் ஒரு வாரம் நீண்ட உள்நாட்டு சந்தை “Project Deal” நடத்தி, அதில் 69 பணியாளர்கள் Slack வழியாக Claude-அடிப்படையிலான AI முகவர்களைப் பயன்படுத்தி உண்மையான பொருட்களை வாங்கவும் விற்கவும் செய்தனர்.

ஒவ்வொரு பங்கேற்பாளருக்கும் 100 டாலர் பட்ஜெட் வழங்கப்பட்டது. சந்தை திறக்குமுன், Claude தன்னார்வலர்களிடம் அவர்கள் என்ன வாங்க அல்லது விற்க விரும்புகிறார்கள், அவர்களின் விலை விருப்பங்கள் என்ன, மற்றும் தங்கள் முகவர் எந்த விதமான பேச்சுவார்த்தை முறையை பயன்படுத்த வேண்டும் என்று கேட்டறிந்தது. அந்த தகவல்களை வைத்து Anthropic தனிப்பட்ட system prompts உருவாக்கியது. அதன் பிறகு, AI முகவர்கள் பட்டியல்கள் எழுதுதல், எதிர்ப்பக்கங்களைத் தேடுதல், ஆஃபர்கள் இடுதல், பேரம் பேசுதல், மற்றும் ஒப்பந்தங்களை முடித்தல் ஆகிய அனைத்தையும் முடிவுவரை கையாள்ந்தனர். மனிதர்கள் இறுதியில் பொருட்களை பரிமாறுவதற்காக மட்டுமே மீண்டும் சேர்ந்தனர்.

சோதனையின் முக்கிய திருப்பம் பங்கேற்பாளர்களுக்குத் தெரியாமல் வைத்துக் கொள்ளப்பட்டது. Anthropic சந்தையின் இணை பதிப்புகளை நடத்தியது. சிலவற்றில் ஒவ்வொரு பங்கேற்பாளரும் Claude Opus 4.5 மூலம் பிரதிநிதித்துவப்படுத்தப்பட்டனர்; மூல உரையில் அது அந்த நேரத்தில் Anthropic-இன் frontier model என விவரிக்கப்பட்டுள்ளது. மற்றவற்றில், பங்கேற்பாளர்கள் 50% வாய்ப்பில் Claude Haiku 4.5 மூலம் பிரதிநிதித்துவப்படுத்தப்பட்டனர்; இது நிறுவனத்தின் சிறிய மாதிரி.

முடிவு தொழில்நுட்பமானதுமட்டுமல்ல. சமூகமானதும் கூட.

மூலத்தின் படி, அதிக திறன் கொண்ட Opus மாதிரி சராசரியாக Haiku-வை விட தொடர்ந்து சிறந்த விலைகளைப் பெற்றது மற்றும் அதிக ஒப்பந்தங்களை முடித்தது. அதே சமயம், அதிக தீவிரமான பேச்சுவார்த்தை அறிவுறுத்தல்கள் முடிவுகளில் புள்ளியியல் ரீதியாக குறிப்பிடத்தக்க வேறுபாட்டை உருவாக்கவில்லை. வேறு வார்த்தைகளில், வெறும் கடுமையாக பேரம் பேசச் சொல்வது அல்ல; மாதிரி திறனே முக்கியமானது.

இந்த முடிவு, நிறுவன AI ஏற்றுமுதலில் பொதுவாக காணப்படும் ஒரு உள்ளுணர்வுக்கு எதிராக செல்கிறது; அங்கு அமைப்புகள் சில சமயம் prompt style அல்லது வெளிப்புற நடத்தைதான் பெரும்பாலான மதிப்பை நிர்ணயிக்கும் என கருதுகின்றன. Anthropic-இன் கண்டுபிடிப்புகள், அடிப்படை மாதிரியின் வலிமை tone-ஐ விட முக்கியமாக இருக்கலாம் என்பதைக் காட்டுகின்றன. இந்த முறை பரவலாகச் செயல்பட்டால், முகவரின் தரமே டிஜிட்டல் பரிவர்த்தனைகளில் யார் நல்ல நிபந்தனைகளைப் பெறுகிறார்கள் என்பதை அமைதியாக தீர்மானிக்க முடியும்.

மிக வியப்பூட்டும் கண்டுபிடிப்பு பொருளாதாரத்தை விட உணர்வுப்பூர்வமானதாக இருக்கலாம். பலவீனமான Haiku முகவர்களைப் பெற்ற பயனாளர்கள் பொருளளவில் மோசமான முடிவுகளைப் பெற்றிருந்தாலும், தங்கள் பரிவர்த்தனைகளை Opus மூலம் பிரதிநிதித்துவப்படுத்தப்பட்ட பயனாளர்களைப் போலவே நியாயமானதாக மதிப்பிட்டதாக Anthropic கூறுகிறது. இதுதான் நிறுவனம் AI உதவியுடனான முடிவெடுத்தலில் “தெரியாத சமத்துவமின்மை” என்று குறிப்பிடும் நிலை.

இது முக்கியமான கருத்து. பாரம்பரிய சமத்துவமின்மைகள் பெரும்பாலும் விலை, அணுகல், அல்லது சேவைத் தரத்தில் தெளிவாகத் தெரியும். Anthropic சுட்டும் விஷயம் அதிகம் கண்டறிய கடினமானது: இரண்டு பேர் சமமாக திருப்தியாக உணரலாம்; ஆனால் அவர்களின் சார்பில் செயல்பட்ட இயந்திரம் ஒருவருக்கு முறையாகக் குறைந்த தரமான பிரதிநிதித்துவத்தை வழங்கியிருக்கலாம்.

Sakana AI bets AI that improves itself can break the compute arms race of frontier labs

சகானா AI மீள்சுற்று சுயமேம்பாட்டை முன்னெடுக்க ஆய்வகத்தை அமைக்கிறது

சகானா AI மீள்சுற்று சுயமேம்பாட்டுக்கான ஒரு தனித்த ஆய்வகத்தை உருவாக்கியுள்ளது; தங்கள் அடித்தளங்களைத் தாமே மேம்படுத்தும் AI அமைப்புகள் கணினி வளப் போட்டிக்கு மாற்றாக அமையலாம் என்று அது வாதிடுகிறது.

Read article

AI முகவர்கள் இடைநிலையர்களாக மாறுகிறார்கள்

Project Deal முக்கியமானது, ஏனெனில் அது உரையாடலை chatbots-இல் இருந்து agency-க்குத் தள்ளுகிறது. இந்த அமைப்புகள் கேள்விகளுக்கு பதில் அளிப்பதற்காக மட்டுமல்ல. அவை சந்தைகளில் ஒருவருக்கொருவர் எதிராக மக்களை பிரதிநிதித்துவப்படுத்தின. இதனால் அவை உற்பத்தித்திறன் கருவிகளைவிட சந்தைகளில் இயங்கும் இடைநிலையர்களைப் போல மாறுகின்றன.

இந்தப் பங்கு விரிவடையும்போது, மாதிரி வேறுபாடுகள் வாணிபம், கொள்முதல், பணியமர்த்தல், வாடிக்கையாளர் சேவை, மற்றும் உள்நாட்டு வணிகச் செயல்பாடுகளில் நேரடி விளைவுகளை ஏற்படுத்தலாம். வலுவான அமைப்புகள் தொடர்ந்து சிறந்த பேச்சுவார்த்தை நடத்தினால், தகவலைச் சிறப்பாக வகைப்படுத்தினால், அல்லது சிறந்த எதிர்ப்பக்கங்களை கண்டறிந்தால், frontier model-க்கு அணுகல் ஒரு நடைமுறை நன்மையாக மாறுகிறது. பலவீனமான பக்கம் இருப்பவர்கள் தாங்கள் பின்னடைவு நிலையில் இருப்பதை கூட அறியாமலிருக்கலாம்.

இந்த முடிவு எல்லா சந்தைகளுக்கும் தானாகப் பொருந்தும் என மூல உரை கூறவில்லை. சோதனை உள்நாட்டிலானது, குறுகிய காலத்திலானது, மற்றும் வரம்புடைய அளவிலானது. இருந்தாலும், கொள்கை நிர்ணயாளர்கள் மற்றும் நிறுவனங்கள் அடிக்கடி எதிர்கொள்ளக்கூடிய ஒரு தெளிவான விளக்கத்தை அது வழங்குகிறது: AI முகவர்கள் பயனாளர்களுக்காக செயல்படத் தொடங்கியவுடன், திறன் இடைவெளிகள் முடிவு இடைவெளிகளாக மாறக்கூடும்.

Prompting மட்டும் போதாது

அறிக்கையின் மிகப் பயனுள்ள கண்டுபிடிப்புகளில் ஒன்று, தீவிரமான பேச்சுவார்த்தை அறிவுறுத்தல்கள் புள்ளியியல் ரீதியாக குறிப்பிடத்தக்க மேம்பாட்டை வழங்கவில்லை என்பதாகும். இதன் பொருள், பலவீனமான மாதிரிகளை வெறும் prompts-ஐ கடுமையாக மாற்றுவதால் ஈடு செய்ய முடியாது என்பதை அமைப்புகள் கருதக் கூடாது.

டெவலப்பர்களுக்கும் AI அமைப்புகளை வாங்குபவர்களுக்கும், இது நடைமுறை எச்சரிக்கை. முகவர் செயல்திறன், personality framing-ஐ விட core reasoning மற்றும் decision quality-ஐ அதிகமாகச் சார்ந்திருக்கலாம். ஒரு அழகான interface அல்லது கடினமான பாணி, தானாகவே சிறந்த பிரதிநிதித்துவமாக மாறாது.

இந்த வேறுபாடு முக்கியமானது, ஏனெனில் பல AI deployments, excellence-ஐ விட adequacy-ன் அடிப்படையில் நியாயப்படுத்தப்படுகின்றன. ஒரு மலிவான அல்லது சிறிய மாதிரி உரையாடலில் போதுமானதாகத் தோன்றினாலும், பயனாளருக்காக முடிவெடுக்க அல்லது பேச்சுவார்த்தை நடத்த நம்பப்பட்டால் அது பொருள்படும் அளவில் மோசமாக செயல்படலாம்.

கொள்கை கேள்வி இப்போது இங்கே உள்ளது

Anthropic-இன் invisible inequality பற்றிய மொழி, இந்த ஒரே சோதனையைத் தாண்டியும் பொருள் பெறுகிறது. நிறுவனங்கள் பணியாளர் நிலைகள், வாடிக்கையாளர் பிரிவுகள், அல்லது பொது சேவைகளில் வேறுபட்ட AI முகவர்களைப் பயன்படுத்தினால், பயன்படுத்தும் இடத்தில் தெளிவான அநியாயத்தின் அறிகுறிகள் இல்லாமலேயே சமமற்ற நடத்தையை உருவாக்கலாம்.

இது வெறும் transparency-யை விட கடினமான governance பிரச்சினை. AI சம்பந்தப்பட்டது என்று பயனாளர்களிடம் சொல்லுவதால், மற்றொருவருக்கு வழங்கப்பட்ட AI போல இதுவும் திறன்வாய்ந்ததா என்பதற்கு பதில் கிடைப்பதில்லை. மேலும் பயனாளர் அனுபவம் இன்னும் நியாயமானதாகத் தோன்றினால், சந்தை அல்லது நிறுவனம் உடனடியாக அந்த சமமின்மையை சரிசெய்ய வேண்டிய அழுத்தத்தை எதிர்கொள்ளாது.

எனவே Project Deal ஒரு ஆரம்ப எச்சரிக்கையாகப் படிக்கப்பட வேண்டும். AI அணுகல் என்பது ஒருவருக்கு டிஜிட்டல் உதவியாளர் கிடைத்ததா என்பதற்கான கேள்வி மட்டுமல்ல; எந்த உதவியாளர் கிடைத்தது, முடிவில் பங்கு இருந்தபோது அந்த உதவியாளர் எவ்வளவு திறமையானது என்பதும்கூட.

Anthropic, Slack-இல் உண்மையான பரிவர்த்தனைகளுக்காக Claude முகவர்களைப் பயன்படுத்தி ஒரு வாரம் நீண்ட உள்நாட்டு சந்தையை நடத்தியது.
Claude Opus 4.5, சராசரியாக Claude Haiku 4.5-ஐ விட சிறந்த விலைகளையும் அதிக ஒப்பந்தங்களையும் பெற்றது.
பலவீனமான முகவர்களால் பிரதிநிதித்துவப்படுத்தப்பட்ட பயனாளர்கள், மோசமான முடிவுகளின்போதும், நியாயத்தை அதேபோல மதிப்பிட்டனர்.

இந்தக் கட்டுரை The Decoder செய்தியை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.

Originally published on the-decoder.com