AI-இன் தகவல் அடுக்கு engagement metrics மூலம் அல்ல, நிபுணர்களால் மதிப்பிடப்பட வேண்டும் என்று கேம்பல் ப்ரவுன் விரும்புகிறார்
கேம்பல் ப்ரவுன், தகவல் ஆன்லைனில் எவ்வாறு வெளிப்படுகிறது, சரிபார்க்கப்படுகிறது, நம்பப்படுகிறது என்பதை தீர்மானிக்கும் பணியில் பல ஆண்டுகளை செலவிட்டுள்ளார். இப்போது அடுத்த தகவல் தடையம் சமூக ஊடக ஊட்டங்கள் அல்ல, உருவாக்கும் AI அமைப்புகள் என்பதையும், அந்தப் பிரச்சினையை தொழில் இன்னும் போதுமான தீவிரத்துடன் எடுத்துக் கொள்ளவில்லை என்பதையும் அவர் வலியுறுத்துகிறார். அவரது புதிய நிறுவனம் Forum AI ஒரு எளிய அடிப்படையை மையமாகக் கொண்டது: பெரிய மாதிரிகள் மக்கள் உலகைப் புரிந்துகொள்ளும் முதன்மை வழியாக மாறினால், உணர்வுப்பூர்வ தலைப்புகளில் அவற்றின் பதில்கள் துறையை அறிந்த நிபுணர்கள் வடிவமைத்த தரநிலைகளுக்கு எதிராக சோதிக்கப்பட வேண்டும்.
ப்ரவுனின் கவலை கோட்பாட்டிலானது அல்ல. TechCrunch-இல் விவாதிக்கப்பட்ட கருத்துகளில், அவர் AI-யை தகவலுக்கான அதிகரித்த மையப் போக்குவரத்து வாயிலாக விவரித்து, “உயர் பங்கு கொண்ட தலைப்புகள்” மீதான செயல்திறன் இன்னும் பலவீனமாக உள்ளது என்று வாதிட்டார். அந்த தலைப்புகளில் புவியியல் அரசியல், மனநலம், நிதி, மற்றும் நியமனம் ஆகியவை அடங்கும்; இவை முழுமையற்ற அல்லது சிதைந்த பதில்கள் நிஜ உலகில் விளைவுகளை ஏற்படுத்தக்கூடியவை, மேலும் சரியான பதில் பெரும்பாலும் இருமையாக இருக்காது. அந்தத் தெளிவின்மைதான், மாதிரி உள்ளுணர்வின் மீது அதிக நம்பிக்கை வைப்பதை விட சிறந்த மதிப்பீட்டு கருவிகள் தொழில்துறைக்கு தேவை என்று ப்ரவுன் நம்புவதற்கான காரணம்.
Forum AI-யின் முறை என்பது நிபுணர் ஒருமித்த கருத்தை அளவிடக்கூடிய சோதனையாக மாற்றுவது
Forum AI-யின் அணுகுமுறை, அங்கீகரிக்கப்பட்ட நிபுணர்களை சேர்த்து பெஞ்ச்மார்க்குகளை வடிவமைப்பதிலிருந்து தொடங்குகிறது. ப்ரவுன் கூறியதன்படி, நிறுவனம் ஒரு துறையின் முன்னணி நிபுணர்களைக் கண்டறிந்து, மதிப்பீட்டு கட்டமைப்பை உருவாக்குமாறு கேட்டுக்கொண்டு, பின்னர் AI நீதிபதிகளை பயன்படுத்தி மாதிரி வெளியீடுகளை அளவுப்படி மதிப்பிடுகிறது. புவியியல் அரசியல் பணிக்காக, Forum AI குறிப்பிடத்தக்க உயர்ந்த சுயவிவர வரிசையைக் கூட்டியுள்ளது; இதில் Niall Ferguson, Fareed Zakaria, முன்னாள் வெளியுறவு செயலாளர் Tony Blinken, முன்னாள் ஹவுஸ் ஸ்பீக்கர் Kevin McCarthy, மற்றும் Obama நிர்வாகத்தின் முன்னாள் சைபர் பாதுகாப்பு அதிகாரி Anne Neuberger ஆகியோர் அடங்குவர்.
செயல்பாட்டு இலக்கு எல்லா முரண்பாடுகளையும் நீக்குவது அல்ல. ப்ரவுன் கூறியதாவது, மனித நிபுணர்களுடன் சுமார் 90% ஒருமித்த நிலைக்கு தன் AI நீதிபதிகளை கொண்டு வருவதே Forum AI-யின் நோக்கம். அவரது கூற்றுப்படி, நிறுவனம் அந்த எல்லையை அடைய முடிந்துள்ளது. இதன் பொருள், Forum AI மதிப்பீட்டையே ஒரு தொழில்நுட்பப் பொருளாக பார்க்கிறது: நிபுணர் தீர்மானத்தை, பொதுவாக விலை உயர்ந்ததும் மெதுவானதுமான ஒன்றை, பல மாதிரி வெளியீடுகளில் மீண்டும் மீண்டும் பயன்படுத்தக்கூடிய சோதனையாக மாற்றக்கூடிய ஒரு அமைப்பாகப் பார்க்கிறது.
இது முக்கியமானது, ஏனெனில் மிகச் செல்வாக்கு வாய்ந்த மாதிரி நிறுவனங்கள் கோடிங் மற்றும் கணிதம் போன்ற துறைகளில் அதிகமாக அளவிடப்படுகின்றன, அங்கு தானியங்கி பெஞ்ச்மார்க்கிங் எளிதாக உள்ளது. ப்ரவுனின் விமர்சனம், பயனர்கள் அன்றாட வாழ்க்கையில் சந்திக்கும் பிரச்சினைகள் பெரும்பாலும் வேறு இடங்களில் இருக்கின்றன என்பதாகும். அரசியல், சுகாதாரம், பணம், அல்லது வேலைவாய்ப்பு குறித்த கேள்விகள் சூழல், பார்வை, மற்றும் மதிப்பு மோதல்களால் நிரம்பியவை. அவற்றை மதிப்பிடுவது கடினம், ஆனால் அவற்றை புறக்கணித்து ஓரங்கட்டுவது இன்னும் கடினமாக இருக்க வேண்டும்.
தவறான முடிவுக்கு மேம்படுத்தப்பட்ட சமூக தளத்தை பார்த்தவரின் எச்சரிக்கை
ப்ரவுனின் வாதம் அவரின் Facebook அனுபவத்தால் கூடுதல் வலிமை பெறுகிறது; அங்கு அவர் நிறுவனத்தின் முதல் மற்றும் ஒரே தனித்துவமான செய்தித் தலைவர் ஆக இருந்தார். ChatGPT-யின் பொது வெளியீட்டுக்குப் பிறகு, Meta-வில் இருந்தபோதே இந்த மாற்றத்தின் முக்கியத்துவத்தை அவர் உணர்ந்ததாக TechCrunch-க்கு அவர் கூறினார். அவரது பார்வையில், மாற்றம் உடனடியானது: AI கருவிகள் மக்கள் தகவலைத் தேடவும் பெறவும் பயன்படுத்தும் ஆதிக்கமான பாதையாக மாறப்போகின்றன.
அந்த பார்வையே, அவர் ஊக்கங்களை ஏன் மையமாகக் கொண்டுள்ளார் என்பதையும் விளக்குகிறது. தன்னை மிகவும் விரக்தியடையச் செய்தது, துல்லியம் foundation model நிறுவனங்களின் முன்னணி முன்னுரிமையாகத் தோன்றவில்லை என்பதுதான் என்று ப்ரவுன் கூறினார். முக்கிய ஆய்வகங்கள் coding மற்றும் math செயல்திறனில் அதிக கவனம் செலுத்துகின்றன, ஆனால் தகவல் துல்லியம் தரநிலைப்படுத்த கடினமானதால் அதைத் தள்ளிப்போடுவது எளிது என்று அவர் விளக்கினார். அவரின் பதில், ஒரு பிரச்சினை கடினமானது என்றால் அது விருப்பத்தேர்வாக மாறாது என்பதே.
சமூக ஊடகத்துடன் ஒப்பீடு நேரடியானது. தவறான இலக்குக்காக ஒரு தளம் மேம்படுத்தப்படும்போது என்ன நடக்கிறது என்பதை தன் கண்களால் பார்த்ததாக ப்ரவுன் கூறினார், மேலும் செய்தி மற்றும் fact-checking-இல் Meta செய்த முந்தைய முயற்சிகள் முக்கியமான வழிகளில் தோல்வியடைந்தன என்றும் அவர் விவரித்தார். அவர் எடுத்துக்கொள்ளும் பாடம், moderation கடினம் என்பதுமட்டுமல்ல. engagement-ஐ மையமாகக் கொண்ட அமைப்புகள் சமூக மதிப்பிலிருந்து விலகிச் செல்லக்கூடும், சேதம் பின்னோக்கிப் பார்த்தால்தான் தெளிவானதாக இருந்தாலும் கூட.
தற்போதைய மாதிரிகள் என்ன தவறு செய்கின்றன என்று Forum AI கூறுகிறது
தற்போதைய மாதிரி நடத்தை குறித்து ப்ரவுனின் விமர்சனம், நிறுவனம் தனிப்பட்ட hallucinations-ஐ விட நிலையான வடிவங்களைப் பார்க்கிறது என்பதைக் காட்டும் அளவுக்கு குறிப்பிட்டதாக உள்ளது. Gemini, சீனாவுடன் தொடர்பில்லாத கதைகளுக்காக Chinese Communist Party இணையதளங்களைப் பயன்படுத்துகிறது என்று அவர் சுட்டிக்காட்டினார், மேலும் பெரும்பாலான முக்கிய மாதிரிகள் இடதுசாரி அரசியல் பாகுபாட்டைக் காட்டுகின்றன என்றும் கூறினார். அவர் இன்னும் நுணுக்கமான தோல்விகளையும் சுட்டினார்: சூழல் இல்லாமை, பார்வைகள் இல்லாமை, மற்றும் எதிர்ப்பார்வைகளை தெளிவாகக் குறிக்காமல் பலவீனமாகச் சித்தரிக்கும் வாதங்கள்.
இந்தப் புகார்கள் AI மதிப்பீட்டின் பரந்த பிரச்சினையைத் தொடுகின்றன. ஒரு மாதிரி ஓட்டமாக, வேகமாக, பயனுள்ளதாகத் தோன்றலாம், அதே நேரத்தில் தகவலை குறுகிய அல்லது நிலைதடுமாறும் பார்வையில் வழங்கலாம். வெளியீடு பொருத்தமான framing-ஐ தவறவிடுகிறதானால், தீவிரமான பார்வைகளின் வரம்பை பிரதிபலிக்கத் தவறுகிறதானால், அல்லது பலவீனமான மூலங்களை நம்புகிறதானால், பயனர்களுக்கு அதிகாரப்பூர்வமாகத் தோன்றும் ஆனால் கட்டமைப்பில் வழுவான ஏதோ ஒன்று கிடைக்கலாம். இவை அழகியல் குறைகள் அல்ல என்பதே ப்ரவுனின் வாதம். உயர்ந்த பங்கு கொண்ட தலைப்புகளில், இவை தயாரிப்பு தோல்விகளே.
சரிசெய்தல்களில் பல மிகவும் நேரடியானவை என்றும் அவர் வாதிட்டார். மேற்கோளிடப்பட்ட விவாதத்தில் அவர் முழு தொழில்நுட்ப வரைபடத்தை வெளிப்படுத்தவில்லை என்றாலும், தரத் துளையின் ஒரு பகுதி முன்னுரிமைகள், சோதனை வடிவமைப்பு, மற்றும் பின்னூட்டச் சுழற்சிகளில் இருந்து வருகிறது; தனியாகத் தீர்க்கப்படாத frontier research-இல் இருந்து மட்டுமல்ல என்பதே அவரது கருத்து.
AI போட்டியில் ஒரு புதிய முனை
Forum AI 17 மாதங்களுக்கு முன்பு New York-இல் நிறுவப்பட்டது; இதனால் அது AI governance infrastructure-க்கான வேகமாக உருவாகும் சந்தையின் நடுப்பகுதியில் உள்ளது. foundation models உருவாக்கும் நிறுவனங்கள், தங்கள் அமைப்புகள் வாழ்வாதாரம், அரசியல், சுகாதாரம், மற்றும் பாதுகாப்பை பாதிக்கும் பகுதிகளில் பொறுப்புடன் நடக்கின்றன என்பதை நிரூபிக்க regulators, enterprise customers, மற்றும் பொதுமக்கள் அழுத்தத்தின் கீழ் உள்ளனர். Forum AI-யை, அவர்கள் அப்படிச் செய்கிறார்களா இல்லையா என்பதை அளவிடக்கூடிய நிறுவனமாக ப்ரவுன் நிலைநிறுத்துகிறார்.
இது AI stack-இல் மதிப்பு எங்கு சேரக்கூடும் என்பதில் குறிப்பிடத்தக்க மாற்றம். மிகப்பெரிய labs இன்னும் model training மற்றும் distribution-ஐ ஆதிக்கப்படுத்துகின்றன, ஆனால் auditing, benchmarking, மற்றும் independent evaluation சுற்றி ஒரு இணை அடுக்கு உருவாகி வருகிறது. பல பயனர்கள் தகவலைப் பெறும் இயல்புநிலை வழியாக AI அமைப்புகள் மாறிவருகின்றன என்பது ப்ரவுன் சொல்வது சரியானதென்றால், சர்ச்சைக்குரிய தலைப்புகளில் தரத்தை மதிப்பிடும் கருவிகள் மாதிரிகளுக்கே இணையாக முக்கியத்துவம் பெறலாம்.
அவரது கருத்துகளில் ஒரு பண்பாட்டு பிரிவும் பதிந்துள்ளது. Silicon Valley-இல் ஒரு உரையாடல் நடக்கிறது, ஆனால் நுகர்வோரிடையே முற்றிலும் வேறு ஒரு உரையாடல் நடக்கிறது என்று ப்ரவுன் கூறினார். அதாவது, கட்டுமானர்கள் இன்னும் சாதாரண பயனர்கள், குறிப்பாக பெற்றோர், வாக்காளர்கள், நோயாளிகள், மற்றும் தொழிலாளர்களின் கவலைகளுடன் நேரடியாக பொருந்தாத செயல்திறன் அளவுகோல்களில் கவனம் செலுத்திக் கொண்டிருக்கலாம். Forum AI-யின் வாதம் என்னவென்றால், அந்தக் கவலைகளை அளவிடக்கூடிய தரநிலையாக மாற்ற முடியும்.
“நல்ல” AI தகவலை யார் வரையறுக்கிறார்கள் என்பதே பெரிய கேள்வி
AI தகவல் அமைப்புகளின் மையத்தில் உள்ள தத்துவப் பிரச்சினையை ப்ரவுனின் நிறுவனம் தீர்க்கவில்லை: நிபுணர்கள் ஒத்துக் கொள்ளாத தலைப்புகளில், சமநிலை, துல்லியம், அல்லது போதுமான சூழல் கொண்டது எது என்பதை யார் தீர்மானிக்க வேண்டும்? அதற்கு பதிலாக Forum AI ஒரு நடைமுறை சார்ந்த பதிலை வழங்குகிறது. அங்கீகரிக்கப்பட்ட நிபுணர்களைத் தேர்ந்தெடுக்கவும், வெளிப்படையான பெஞ்ச்மார்க்குகளை உருவாக்கவும், அவர்களின் தீர்ப்புக்கு எதிராக மதிப்பிடும் அமைப்புகளைப் பயிற்றுவிக்கவும், மற்றும் trade-off-களை காணக்கூடியதாக ஆக்கவும்.
இந்த முறை பரவலாக ஏற்றுக்கொள்ளப்படுமா என்பது இன்னும் திறந்த கேள்வியே. ஆனால் தொழில்துறை தவிர்க்க அதிகமாக கடினமாகிவரும் ஒரு பலவீனத்தை ப்ரவுன் அடையாளம் கண்டுள்ளார். Generative AI இப்போது அது code-ஐ எவ்வளவு நன்றாக எழுதுகிறது அல்லது சமன்பாடுகளைத் தீர்க்கிறது என்பதினால் மட்டும் மதிப்பிடப்படுவதில்லை. குழப்பமான, விளைவுச்சுமை கொண்ட துறைகளில் புரிதலை அது எவ்வாறு இடைநிலைப்படுத்துகிறது என்பதாலும் அது மதிப்பிடப்படுகிறது. அந்த அடுக்கு பொதுமக்கள் அறிவுக்கான புதிய வாயிலாக மாறினால், பெஞ்ச்மார்க் வடிவமைப்பைச் சுற்றிய போராட்டம் AI-யின் மிக முக்கியமான மோதல்களில் ஒன்றாக மாறக்கூடும்.
இந்தக் கட்டுரை TechCrunch செய்திகளின் அடிப்படையில் எழுதப்பட்டது. மூலக் கட்டுரையைப் படிக்கவும்.
Originally published on techcrunch.com





