கேம்பல் ப்ரவுனின் Forum AI, உயர்ந்த பங்கு கொண்ட AI பதில்களுக்காக நிபுணர் பெஞ்ச்மார்க்குகளை முன்னிறுத்துகிறது

AI-இன் தகவல் அடுக்கு engagement metrics மூலம் அல்ல, நிபுணர்களால் மதிப்பிடப்பட வேண்டும் என்று கேம்பல் ப்ரவுன் விரும்புகிறார்

கேம்பல் ப்ரவுன், தகவல் ஆன்லைனில் எவ்வாறு வெளிப்படுகிறது, சரிபார்க்கப்படுகிறது, நம்பப்படுகிறது என்பதை தீர்மானிக்கும் பணியில் பல ஆண்டுகளை செலவிட்டுள்ளார். இப்போது அடுத்த தகவல் தடையம் சமூக ஊடக ஊட்டங்கள் அல்ல, உருவாக்கும் AI அமைப்புகள் என்பதையும், அந்தப் பிரச்சினையை தொழில் இன்னும் போதுமான தீவிரத்துடன் எடுத்துக் கொள்ளவில்லை என்பதையும் அவர் வலியுறுத்துகிறார். அவரது புதிய நிறுவனம் Forum AI ஒரு எளிய அடிப்படையை மையமாகக் கொண்டது: பெரிய மாதிரிகள் மக்கள் உலகைப் புரிந்துகொள்ளும் முதன்மை வழியாக மாறினால், உணர்வுப்பூர்வ தலைப்புகளில் அவற்றின் பதில்கள் துறையை அறிந்த நிபுணர்கள் வடிவமைத்த தரநிலைகளுக்கு எதிராக சோதிக்கப்பட வேண்டும்.

ப்ரவுனின் கவலை கோட்பாட்டிலானது அல்ல. TechCrunch-இல் விவாதிக்கப்பட்ட கருத்துகளில், அவர் AI-யை தகவலுக்கான அதிகரித்த மையப் போக்குவரத்து வாயிலாக விவரித்து, “உயர் பங்கு கொண்ட தலைப்புகள்” மீதான செயல்திறன் இன்னும் பலவீனமாக உள்ளது என்று வாதிட்டார். அந்த தலைப்புகளில் புவியியல் அரசியல், மனநலம், நிதி, மற்றும் நியமனம் ஆகியவை அடங்கும்; இவை முழுமையற்ற அல்லது சிதைந்த பதில்கள் நிஜ உலகில் விளைவுகளை ஏற்படுத்தக்கூடியவை, மேலும் சரியான பதில் பெரும்பாலும் இருமையாக இருக்காது. அந்தத் தெளிவின்மைதான், மாதிரி உள்ளுணர்வின் மீது அதிக நம்பிக்கை வைப்பதை விட சிறந்த மதிப்பீட்டு கருவிகள் தொழில்துறைக்கு தேவை என்று ப்ரவுன் நம்புவதற்கான காரணம்.

Forum AI-யின் முறை என்பது நிபுணர் ஒருமித்த கருத்தை அளவிடக்கூடிய சோதனையாக மாற்றுவது

Forum AI-யின் அணுகுமுறை, அங்கீகரிக்கப்பட்ட நிபுணர்களை சேர்த்து பெஞ்ச்மார்க்குகளை வடிவமைப்பதிலிருந்து தொடங்குகிறது. ப்ரவுன் கூறியதன்படி, நிறுவனம் ஒரு துறையின் முன்னணி நிபுணர்களைக் கண்டறிந்து, மதிப்பீட்டு கட்டமைப்பை உருவாக்குமாறு கேட்டுக்கொண்டு, பின்னர் AI நீதிபதிகளை பயன்படுத்தி மாதிரி வெளியீடுகளை அளவுப்படி மதிப்பிடுகிறது. புவியியல் அரசியல் பணிக்காக, Forum AI குறிப்பிடத்தக்க உயர்ந்த சுயவிவர வரிசையைக் கூட்டியுள்ளது; இதில் Niall Ferguson, Fareed Zakaria, முன்னாள் வெளியுறவு செயலாளர் Tony Blinken, முன்னாள் ஹவுஸ் ஸ்பீக்கர் Kevin McCarthy, மற்றும் Obama நிர்வாகத்தின் முன்னாள் சைபர் பாதுகாப்பு அதிகாரி Anne Neuberger ஆகியோர் அடங்குவர்.

செயல்பாட்டு இலக்கு எல்லா முரண்பாடுகளையும் நீக்குவது அல்ல. ப்ரவுன் கூறியதாவது, மனித நிபுணர்களுடன் சுமார் 90% ஒருமித்த நிலைக்கு தன் AI நீதிபதிகளை கொண்டு வருவதே Forum AI-யின் நோக்கம். அவரது கூற்றுப்படி, நிறுவனம் அந்த எல்லையை அடைய முடிந்துள்ளது. இதன் பொருள், Forum AI மதிப்பீட்டையே ஒரு தொழில்நுட்பப் பொருளாக பார்க்கிறது: நிபுணர் தீர்மானத்தை, பொதுவாக விலை உயர்ந்ததும் மெதுவானதுமான ஒன்றை, பல மாதிரி வெளியீடுகளில் மீண்டும் மீண்டும் பயன்படுத்தக்கூடிய சோதனையாக மாற்றக்கூடிய ஒரு அமைப்பாகப் பார்க்கிறது.

இது முக்கியமானது, ஏனெனில் மிகச் செல்வாக்கு வாய்ந்த மாதிரி நிறுவனங்கள் கோடிங் மற்றும் கணிதம் போன்ற துறைகளில் அதிகமாக அளவிடப்படுகின்றன, அங்கு தானியங்கி பெஞ்ச்மார்க்கிங் எளிதாக உள்ளது. ப்ரவுனின் விமர்சனம், பயனர்கள் அன்றாட வாழ்க்கையில் சந்திக்கும் பிரச்சினைகள் பெரும்பாலும் வேறு இடங்களில் இருக்கின்றன என்பதாகும். அரசியல், சுகாதாரம், பணம், அல்லது வேலைவாய்ப்பு குறித்த கேள்விகள் சூழல், பார்வை, மற்றும் மதிப்பு மோதல்களால் நிரம்பியவை. அவற்றை மதிப்பிடுவது கடினம், ஆனால் அவற்றை புறக்கணித்து ஓரங்கட்டுவது இன்னும் கடினமாக இருக்க வேண்டும்.

Two drones, one yellow, one grey, almost identical otherwise.

FCC moves toward retroactive ban on suspected DJI front companies

The U.S. communications regulator is preparing to use a new enforcement tool against companies it says disguised DJI products to keep them on the American market.

Read article

தவறான முடிவுக்கு மேம்படுத்தப்பட்ட சமூக தளத்தை பார்த்தவரின் எச்சரிக்கை

ப்ரவுனின் வாதம் அவரின் Facebook அனுபவத்தால் கூடுதல் வலிமை பெறுகிறது; அங்கு அவர் நிறுவனத்தின் முதல் மற்றும் ஒரே தனித்துவமான செய்தித் தலைவர் ஆக இருந்தார். ChatGPT-யின் பொது வெளியீட்டுக்குப் பிறகு, Meta-வில் இருந்தபோதே இந்த மாற்றத்தின் முக்கியத்துவத்தை அவர் உணர்ந்ததாக TechCrunch-க்கு அவர் கூறினார். அவரது பார்வையில், மாற்றம் உடனடியானது: AI கருவிகள் மக்கள் தகவலைத் தேடவும் பெறவும் பயன்படுத்தும் ஆதிக்கமான பாதையாக மாறப்போகின்றன.

அந்த பார்வையே, அவர் ஊக்கங்களை ஏன் மையமாகக் கொண்டுள்ளார் என்பதையும் விளக்குகிறது. தன்னை மிகவும் விரக்தியடையச் செய்தது, துல்லியம் foundation model நிறுவனங்களின் முன்னணி முன்னுரிமையாகத் தோன்றவில்லை என்பதுதான் என்று ப்ரவுன் கூறினார். முக்கிய ஆய்வகங்கள் coding மற்றும் math செயல்திறனில் அதிக கவனம் செலுத்துகின்றன, ஆனால் தகவல் துல்லியம் தரநிலைப்படுத்த கடினமானதால் அதைத் தள்ளிப்போடுவது எளிது என்று அவர் விளக்கினார். அவரின் பதில், ஒரு பிரச்சினை கடினமானது என்றால் அது விருப்பத்தேர்வாக மாறாது என்பதே.

சமூக ஊடகத்துடன் ஒப்பீடு நேரடியானது. தவறான இலக்குக்காக ஒரு தளம் மேம்படுத்தப்படும்போது என்ன நடக்கிறது என்பதை தன் கண்களால் பார்த்ததாக ப்ரவுன் கூறினார், மேலும் செய்தி மற்றும் fact-checking-இல் Meta செய்த முந்தைய முயற்சிகள் முக்கியமான வழிகளில் தோல்வியடைந்தன என்றும் அவர் விவரித்தார். அவர் எடுத்துக்கொள்ளும் பாடம், moderation கடினம் என்பதுமட்டுமல்ல. engagement-ஐ மையமாகக் கொண்ட அமைப்புகள் சமூக மதிப்பிலிருந்து விலகிச் செல்லக்கூடும், சேதம் பின்னோக்கிப் பார்த்தால்தான் தெளிவானதாக இருந்தாலும் கூட.

தற்போதைய மாதிரிகள் என்ன தவறு செய்கின்றன என்று Forum AI கூறுகிறது

தற்போதைய மாதிரி நடத்தை குறித்து ப்ரவுனின் விமர்சனம், நிறுவனம் தனிப்பட்ட hallucinations-ஐ விட நிலையான வடிவங்களைப் பார்க்கிறது என்பதைக் காட்டும் அளவுக்கு குறிப்பிட்டதாக உள்ளது. Gemini, சீனாவுடன் தொடர்பில்லாத கதைகளுக்காக Chinese Communist Party இணையதளங்களைப் பயன்படுத்துகிறது என்று அவர் சுட்டிக்காட்டினார், மேலும் பெரும்பாலான முக்கிய மாதிரிகள் இடதுசாரி அரசியல் பாகுபாட்டைக் காட்டுகின்றன என்றும் கூறினார். அவர் இன்னும் நுணுக்கமான தோல்விகளையும் சுட்டினார்: சூழல் இல்லாமை, பார்வைகள் இல்லாமை, மற்றும் எதிர்ப்பார்வைகளை தெளிவாகக் குறிக்காமல் பலவீனமாகச் சித்தரிக்கும் வாதங்கள்.

இந்தப் புகார்கள் AI மதிப்பீட்டின் பரந்த பிரச்சினையைத் தொடுகின்றன. ஒரு மாதிரி ஓட்டமாக, வேகமாக, பயனுள்ளதாகத் தோன்றலாம், அதே நேரத்தில் தகவலை குறுகிய அல்லது நிலைதடுமாறும் பார்வையில் வழங்கலாம். வெளியீடு பொருத்தமான framing-ஐ தவறவிடுகிறதானால், தீவிரமான பார்வைகளின் வரம்பை பிரதிபலிக்கத் தவறுகிறதானால், அல்லது பலவீனமான மூலங்களை நம்புகிறதானால், பயனர்களுக்கு அதிகாரப்பூர்வமாகத் தோன்றும் ஆனால் கட்டமைப்பில் வழுவான ஏதோ ஒன்று கிடைக்கலாம். இவை அழகியல் குறைகள் அல்ல என்பதே ப்ரவுனின் வாதம். உயர்ந்த பங்கு கொண்ட தலைப்புகளில், இவை தயாரிப்பு தோல்விகளே.

சரிசெய்தல்களில் பல மிகவும் நேரடியானவை என்றும் அவர் வாதிட்டார். மேற்கோளிடப்பட்ட விவாதத்தில் அவர் முழு தொழில்நுட்ப வரைபடத்தை வெளிப்படுத்தவில்லை என்றாலும், தரத் துளையின் ஒரு பகுதி முன்னுரிமைகள், சோதனை வடிவமைப்பு, மற்றும் பின்னூட்டச் சுழற்சிகளில் இருந்து வருகிறது; தனியாகத் தீர்க்கப்படாத frontier research-இல் இருந்து மட்டுமல்ல என்பதே அவரது கருத்து.

$A fractured image of a person speaking into a microphone.$

Sony expands Udio fight with new lawsuit over 30,000 songs

Sony Music has filed a new lawsuit accusing Udio of infringing more than 30,000 songs, escalating one of the most consequential copyright fights around generative AI music.

Read article

AI போட்டியில் ஒரு புதிய முனை

Forum AI 17 மாதங்களுக்கு முன்பு New York-இல் நிறுவப்பட்டது; இதனால் அது AI governance infrastructure-க்கான வேகமாக உருவாகும் சந்தையின் நடுப்பகுதியில் உள்ளது. foundation models உருவாக்கும் நிறுவனங்கள், தங்கள் அமைப்புகள் வாழ்வாதாரம், அரசியல், சுகாதாரம், மற்றும் பாதுகாப்பை பாதிக்கும் பகுதிகளில் பொறுப்புடன் நடக்கின்றன என்பதை நிரூபிக்க regulators, enterprise customers, மற்றும் பொதுமக்கள் அழுத்தத்தின் கீழ் உள்ளனர். Forum AI-யை, அவர்கள் அப்படிச் செய்கிறார்களா இல்லையா என்பதை அளவிடக்கூடிய நிறுவனமாக ப்ரவுன் நிலைநிறுத்துகிறார்.

இது AI stack-இல் மதிப்பு எங்கு சேரக்கூடும் என்பதில் குறிப்பிடத்தக்க மாற்றம். மிகப்பெரிய labs இன்னும் model training மற்றும் distribution-ஐ ஆதிக்கப்படுத்துகின்றன, ஆனால் auditing, benchmarking, மற்றும் independent evaluation சுற்றி ஒரு இணை அடுக்கு உருவாகி வருகிறது. பல பயனர்கள் தகவலைப் பெறும் இயல்புநிலை வழியாக AI அமைப்புகள் மாறிவருகின்றன என்பது ப்ரவுன் சொல்வது சரியானதென்றால், சர்ச்சைக்குரிய தலைப்புகளில் தரத்தை மதிப்பிடும் கருவிகள் மாதிரிகளுக்கே இணையாக முக்கியத்துவம் பெறலாம்.

அவரது கருத்துகளில் ஒரு பண்பாட்டு பிரிவும் பதிந்துள்ளது. Silicon Valley-இல் ஒரு உரையாடல் நடக்கிறது, ஆனால் நுகர்வோரிடையே முற்றிலும் வேறு ஒரு உரையாடல் நடக்கிறது என்று ப்ரவுன் கூறினார். அதாவது, கட்டுமானர்கள் இன்னும் சாதாரண பயனர்கள், குறிப்பாக பெற்றோர், வாக்காளர்கள், நோயாளிகள், மற்றும் தொழிலாளர்களின் கவலைகளுடன் நேரடியாக பொருந்தாத செயல்திறன் அளவுகோல்களில் கவனம் செலுத்திக் கொண்டிருக்கலாம். Forum AI-யின் வாதம் என்னவென்றால், அந்தக் கவலைகளை அளவிடக்கூடிய தரநிலையாக மாற்ற முடியும்.

“நல்ல” AI தகவலை யார் வரையறுக்கிறார்கள் என்பதே பெரிய கேள்வி

AI தகவல் அமைப்புகளின் மையத்தில் உள்ள தத்துவப் பிரச்சினையை ப்ரவுனின் நிறுவனம் தீர்க்கவில்லை: நிபுணர்கள் ஒத்துக் கொள்ளாத தலைப்புகளில், சமநிலை, துல்லியம், அல்லது போதுமான சூழல் கொண்டது எது என்பதை யார் தீர்மானிக்க வேண்டும்? அதற்கு பதிலாக Forum AI ஒரு நடைமுறை சார்ந்த பதிலை வழங்குகிறது. அங்கீகரிக்கப்பட்ட நிபுணர்களைத் தேர்ந்தெடுக்கவும், வெளிப்படையான பெஞ்ச்மார்க்குகளை உருவாக்கவும், அவர்களின் தீர்ப்புக்கு எதிராக மதிப்பிடும் அமைப்புகளைப் பயிற்றுவிக்கவும், மற்றும் trade-off-களை காணக்கூடியதாக ஆக்கவும்.

இந்த முறை பரவலாக ஏற்றுக்கொள்ளப்படுமா என்பது இன்னும் திறந்த கேள்வியே. ஆனால் தொழில்துறை தவிர்க்க அதிகமாக கடினமாகிவரும் ஒரு பலவீனத்தை ப்ரவுன் அடையாளம் கண்டுள்ளார். Generative AI இப்போது அது code-ஐ எவ்வளவு நன்றாக எழுதுகிறது அல்லது சமன்பாடுகளைத் தீர்க்கிறது என்பதினால் மட்டும் மதிப்பிடப்படுவதில்லை. குழப்பமான, விளைவுச்சுமை கொண்ட துறைகளில் புரிதலை அது எவ்வாறு இடைநிலைப்படுத்துகிறது என்பதாலும் அது மதிப்பிடப்படுகிறது. அந்த அடுக்கு பொதுமக்கள் அறிவுக்கான புதிய வாயிலாக மாறினால், பெஞ்ச்மார்க் வடிவமைப்பைச் சுற்றிய போராட்டம் AI-யின் மிக முக்கியமான மோதல்களில் ஒன்றாக மாறக்கூடும்.

இந்தக் கட்டுரை TechCrunch செய்திகளின் அடிப்படையில் எழுதப்பட்டது. மூலக் கட்டுரையைப் படிக்கவும்.

“The Turning Point: To Be Destroyed” Premiere - 2024 Tribeca Festival

Dave Eggers Used an OpenAI Talk to Warn About Writing and Education

Author Dave Eggers reportedly told OpenAI staff that ChatGPT has made teachers’ lives harder and risks undermining students’ ability to learn how to write in their own voice.

Read article

Originally published on techcrunch.com

Forum AI-யின் முறை என்பது நிபுணர் ஒருமித்த கருத்தை அளவிடக்கூடிய சோதனையாக மாற்றுவது

FCC moves toward retroactive ban on suspected DJI front companies

தவறான முடிவுக்கு மேம்படுத்தப்பட்ட சமூக தளத்தை பார்த்தவரின் எச்சரிக்கை

தற்போதைய மாதிரிகள் என்ன தவறு செய்கின்றன என்று Forum AI கூறுகிறது

Sony expands Udio fight with new lawsuit over 30,000 songs

AI போட்டியில் ஒரு புதிய முனை

“நல்ல” AI தகவலை யார் வரையறுக்கிறார்கள் என்பதே பெரிய கேள்வி

Dave Eggers Used an OpenAI Talk to Warn About Writing and Education

Comments (0)

Related Articles

Apple Maps Ads Will Exclude Home Services

France orders ISPs to block Polymarket access

Truth Social to sell real-time API access to top accounts

OMB Grant Proposal Draws Fierce Backlash From Space Science Advocates

Joolca Hottap Go Review: A $700 Portable Shower for the Adventurous

Keep Reading