2026-ல் AI தயாரிப்புகளை ZDNET எவ்வாறு சோதிக்கிறது என்பதை விளக்குகிறது

AI பற்றிய செய்திக் கவரேஜ் அதிக செல்வாக்கு பெறுகிறது, மேலும் முறைமையும் கதையின் ஒரு பகுதியாகிறது

AI தயாரிப்புகள் மென்பொருள் கருவிகள், பட உருவாக்கிகள், மேம்பாட்டு தளங்கள், பயன்பாடுகள், மற்றும் சாதனங்கள் எனப் பரவிக் கொண்டிருக்கும் நிலையில், அவை எவ்வாறு மதிப்பீடு செய்யப்படுகின்றன என்ற கேள்வி, தயாரிப்புகளுக்கே நிகராக முக்கியத்துவம் பெறுகிறது. ZDNET இப்போது 2026-ல் AI-ஐ எவ்வாறு சோதிக்கிறது என்பதைக் குறித்த விரிவான விளக்கத்தை வெளியிட்டுள்ளது; இதில் நேரடி பயன்பாடு, நிஜ உலக சோதனை, மற்றும் தரப்படுத்தப்பட்ட ஒப்பீட்டு அளவுகோல்கள் மீது அமைந்த முறைமையை விளக்கியுள்ளது.

இது உள் ஊடக உலகின் ஒரு கதையாக தோன்றலாம், ஆனால் இது பரந்த தொழில்துறை சிக்கலைக் காட்டுகிறது. AI அறிமுகங்கள் இவ்வளவு வேகமாக வருவதால், hype-ஐ உருவாக்குவது எளிதாகவும், நிலையான மதிப்பீடு செய்வது கடினமாகவும் உள்ளது. பெஞ்ச்மார்க்குகள், மார்க்கெட்டிங் கோரிக்கைகள், மற்றும் தேர்ந்தெடுக்கப்பட்ட டெமோக்கள் ஆரம்பக் கதைகளை ஆட்கொள்ளலாம். அத்தகைய சூழலில், மதிப்பாய்வு முறைகளின் பொது விளக்கம், ஒரு அவுட்லெட் தயாரிப்பு செயல்திறனையும் அதன் நிலைநிறுத்தத்தையும் எவ்வாறு பிரிக்க முயல்கிறது என்பதைக் காட்டும் பயனுள்ள சிக்னலாகிறது.

முக்கியக் கொள்கைகள் நேரடி பயன்பாடு மற்றும் சுயாதீனம்

கொடுக்கப்பட்ட மூல உரைப்படி, ZDNET கூறுவது என்னவெனில் அனைத்து மதிப்பாய்வுகளுக்கும் நேரடி அனுபவமும் நிஜ உலக சோதனைகளும் அவசியம். மேலும், வெளியீட்டுக்கு முன் விற்பனையாளர்கள் மதிப்பாய்வுகளைப் பார்க்க முடியாது என்றும், அவற்றில் என்ன சொல்லப்படும் என்பதையும் பாதிக்க முடியாது என்றும் அந்த அவுட்லெட் கூறுகிறது. இந்த இரண்டு கொள்கைகள் வேகமாக மாறும் AI கவரேஜில் மிகச் சாதாரணமான பலவீனங்களைத் தொடுகின்றன: செய்திக்குறிப்பு பொருட்களின் மீது அதிக நம்பிக்கை, மற்றும் ஆசிரிய சுயாதீனத்தின் மங்கல்.

அது முக்கியமானது, ஏனெனில் AI தயாரிப்புகளை மிகைப்படுத்துவது மிகவும் எளிது. ஒரு நிறுவனம், நாளாந்த பயன்பாட்டை பிரதிபலிக்காத ஒரு பெஞ்ச்மார்க், டெமோ, அல்லது மிகைப்படுத்தப்பட்ட சூழலை விளம்பரப்படுத்தலாம். நேரடி மதிப்பீட்டை கட்டாயப்படுத்துவது மதிப்பாய்வு செயல்முறையை உண்மையான பயன்பாட்டுத் திறனை நோக்கி மீண்டும் தள்ளுகிறது. ஒரு மாடல் அல்லது கருவி சிறந்த சூழலில் ஒருமுறை செயல்பட முடியுமா என்பதல்ல கேள்வி; அது நடைமுறையில் பயனுள்ளதா, நம்பகமானதா, மற்றும் அர்த்தமுள்ளதா என்பதே கேள்வி.

ZDNET செய்திக் கவரேஜில் செய்திக்குறிப்புகளிலிருந்து வந்த பெஞ்ச்மார்க் முடிவுகளை அறிவிப்பதாகவும், ஆனால் மதிப்பாய்வுகளுக்கு அவை போதுமானவை அல்ல என்றும் மூல உரை குறிப்பிடுகிறது. இது பொருத்தமான வேறுபாடு. விற்பனையாளர் கோரிக்கையை அறிவிப்பது ஒன்று. அந்தக் கோரிக்கையை அடிப்படையாகக் கொண்டு தயாரிப்பை ஆதரிப்பது வேறு ஒன்று. செயல்திறன் பணி மற்றும் சூழலைப் பொறுத்து கடுமையாக மாறக்கூடிய AI சந்தையில், அந்தக் கோடு குறிப்பாக முக்கியமானது.

Anthropic hit with lawsuit over its Claude Max usage limits - Engadget

Claude Max பயன்பாட்டு வரம்புகள் குறித்து Anthropic மீது வழக்கு

Anthropic தனது Claude Max subscription tiers இன் நடைமுறை பயன்பாட்டு வரம்புகளை மிகைப்படுத்தி காட்டியதாக ஒரு federal lawsuit குற்றம் சாட்டுகிறது; இதனால் AI நிறுவனங்கள் expensive inference-க்கு அணுகலை எப்படி விலை நிர்ணயிக்கின்றன என்பதிலான பெரிய கேள்விகள் எழுகின்றன.

Read article

AI மதிப்பாய்வு இப்போது பரந்த தயாரிப்பு உலகை உள்ளடக்கியுள்ளது

2026-ல் முறைமைகள் அதிக முக்கியத்துவம் பெறுவதற்கான ஒரு காரணம், AI இனி ஒரே வகை அல்ல என்பதே. ZDNET பெரிய மொழி மாடல்கள், மேம்பாட்டு கருவிகள், பட உருவாக்கிகள், AI-உதவிய பயன்பாடுகள், மற்றும் AI சாதனங்களையும் மதிப்பீடு செய்வதாக விவரிக்கிறது. அந்தப் பல்வகை தன்மை, ஒரே அளவிலான மதிப்பாய்வு பாணியை கடினமாக்குகிறது. ஒரு chat்போட், ஒரு coding கருவி, மற்றும் ஒரு AI vacuum cleaner ஒரே விதத்தில் தோல்வியடைவதில்லை அல்லது ஒரே விதத்தில் மதிப்பை உருவாக்குவதுமில்லை.

இதனால், ஒப்பீட்டை ஆதரிக்க போதுமான அளவு தரப்படுத்தப்பட்டும், ஒவ்வொரு பிரிவின் நடைமுறைப் பயன்பாட்டை பிரதிபலிக்க போதுமான நெகிழ்வுடனும் இருக்கும் கட்டமைப்புகள் அவுட்லெட்களுக்கு தேவைப்படுகிறது. ZDNET, ஒப்பீட்டு மதிப்பாய்வுகளுக்கு மூன்று கட்ட செயல்முறையை பயன்படுத்துவதாக கூறுகிறது: மதிப்பீட்டு அளவுகோல்களை உருவாக்குதல், ஒப்பிட வேண்டிய தயாரிப்புகளைத் தேர்ந்தெடுத்தல், பின்னர் சோதனை-பின்சோதனை ஒப்பீட்டை நடத்துதல். இந்த அணுகுமுறை புரட்சிகரமானது அல்ல, ஆனால் இதை வெளிப்படையாக வெளியிடுவது பயனுள்ளதாக உள்ளது, ஏனெனில் ஒப்பீட்டு பட்டியல்கள் தற்செயலாக அல்ல, கட்டமைக்கப்பட்டவை என்பதை அது தெளிவாக்குகிறது.

அது所谓 best lists கூட அவற்றின் பின்னுள்ள அளவுகோல்களுக்கேற்ப மட்டுமே நம்பகமானவை என்பதை காட்டுகிறது. AI-யில், அளவுகோல் தேர்வு மெதுவாக முடிவுகளை வடிவமைக்க முடியும். வேகம் துல்லியத்தைவிட, அல்லது புதுமை நம்பகத்தன்மையைவிட உயர்வாக மதிக்கப்படுமானால், தரவரிசை மாறும். வெளிப்படையான செயல்முறை, அவுட்லெட்டின் முன்னுரிமைகள் தங்களுடையவற்றுடன் பொருந்துகிறதா என்பதை தீர்மானிக்க வாசகர்களுக்கு குறைந்தபட்சம் ஒரு அடிப்படையைக் கொடுக்கிறது.

சந்தைச் சிக்கல் AI தயாரிப்புகள் இல்லாமை அல்ல, அதிகமான கோரிக்கைகள்தான்

இந்த வெளிப்பாட்டின் பெரிய முக்கியத்துவம் என்னவெனில், AI தயாரிப்பு சந்தை இவ்வளவு நெருக்கடியாகி, ஆசிரிய செயல்முறை இப்போது நுகர்வோர் உள்கட்டமைப்பாக செயல்படுகிறது. வாசகர்கள் எதை ஏற்றுக்கொள்ள வேண்டும், சந்தா செய்ய வேண்டும், அல்லது நம்ப வேண்டும் என்பதைக் குறித்து முடிவெடுக்கிறார்கள். சில கருவிகளுக்கு பணம் செலவாகிறது. மற்றவற்றுக்கு நேரம், வேலைப்போக்கு இடைஞ்சல், அல்லது தரவு வெளிப்பாடு ஆகியவை செலவாகும். சோதனையை தீவிரமாக எடுத்துக்கொள்கிறோம் என்று கூறும் மதிப்பாய்வாளர்கள், அதற்கான செயல்பாட்டு அர்த்தத்தை விளக்க வேண்டும்.

ZDNET-ன் விளக்கம், அவர்கள் அதையே செய்ய முயல்கிறார்கள் என்பதைக் காட்டுகிறது. அது பக்கச்சார்பற்ற மதிப்பாய்வு நிபந்தனைகள், நேரடி பயன்பாடு, மற்றும் பிரிவு-சார்ந்த மதிப்பீடு என்பவற்றை வலியுறுத்துகிறது. வாசகர்களுக்கு இது பரிபூரண முடிவுகளை உறுதி செய்யாது; ஆனால் தீர்ப்பின் பின்னால் என்ன நிற்கிறது என்பதற்கான தெளிவான மாதிரியை வழங்குகிறது. தொடர்ந்து புதுப்பிக்கப்படும், திறன்கள் வேகமாக மாறக்கூடிய துறையில், மீண்டும் செய்யக்கூடிய முறைகள் ஒரு முறை கிடைக்கும்印象ங்களைவிட முக்கியம்.

நேரம் கூட குறிப்பிடத்தக்கது. AI இப்போது பல தயாரிப்புகளில் உட்பொதிக்கப்பட்டுள்ளதால், அதைப் பற்றிய மதிப்பாய்வு இனி ஒரு நிச் பயிற்சி அல்ல. இது பிரதான தொழில்நுட்ப பத்திரிகைத்துறையின் ஒரு பகுதி. இதனால் ஆசிரிய ஒருமைப்பாட்டின் பங்கு மேலும் உயர்கிறது. அவுட்லெட்கள் பயனர்கள் பணம் அல்லது கவனத்தை எங்கே செலவிடுகிறார்கள் என்பதைக் கட்டுப்படுத்துகின்றன என்றால், பொது சோதனைத் தரநிலைகள் அவர்களின் பொறுப்புணர்வின் ஒரு பகுதியாகிவிடும்.

Heart protection from COVID shots remains amid updates, study finds

COVID பூஸ்டர்கள் இன்னும் முக்கிய இதய ஆபத்துகளை குறைக்கின்றன, VA ஆய்வு கண்டறிகிறது

ஒரு பெரிய VA ஆய்வு, 2024-2025 COVID-19 தடுப்பூசி முக்கியமான தீவிர இதயவயிற்றியல் நிகழ்வுகளை குறைப்பதை தொடர்ந்து செய்தது; மிகுந்த பலன் வயதான மற்றும் அதிக ஆபத்து உள்ள நோயாளிகளில் காணப்பட்டது.

Read article

இது ஒரு வெளியீட்டைத் தாண்டி ஏன் முக்கியம்

ZDNET விளக்கத்தின் மதிப்பு அதன் சொந்த வாசகர்களுக்கே மட்டுப்படுத்தப்படவில்லை. அது AI கவரேஜில் ஒரு பரந்த முதிர்ச்சியை பிரதிபலிக்கிறது. ஆரம்ப AI தயாரிப்பு பத்திரிகை பெரும்பாலும் அறிவிப்புகள், டெமோக்கள், மற்றும் புதுமை சுற்றியே இருந்தது. சந்தை மேலும் நெருக்கமாகவும், மேலும் முக்கியமாகவும் மாறும் போது, முறைமையும் அதற்கேற்ப முன்னேற வேண்டும். ஒரு மதிப்பாய்வு செய்திக் குறிப்பை அடிப்படையாகக் கொண்டதா, பெஞ்ச்மார்க் தாளை அடிப்படையாகக் கொண்டதா, அல்லது நீண்டகால பயன்பாட்டை அடிப்படையாகக் கொண்டதா என்பதை வாசகர்கள் அறிந்திருக்க வேண்டும்.

பொது மதிப்பாய்வு அளவுகோல்கள் தொழில்துறையிலும் அழுத்தத்தை உருவாக்குகின்றன. ஒரு அவுட்லெட் AI-யை எவ்வாறு சோதிக்கிறது என்பதை விளக்கியவுடன், மற்றவர்கள் ஒப்பீட்டிற்குள் இழுக்கப்படுகிறார்கள், அவர்கள் அதை நோக்கமாக விரும்பினாலும் இல்லாவிட்டாலும். குறிப்பாக நுகர்வோர் குழப்பம் அதிகமாகவும், மார்க்கெட்டிங் மொழி தாக்குதல்மிக்கதுமான பகுதிகளில், இது மொத்த தரநிலைகளை மேம்படுத்த முடியும்.

2026-ல் AI சந்தை பரவலால் வரையறுக்கப்படுகிறது. புதிய மாடல்கள் மற்றும் கருவிகள் தொடர்ந்து அறிமுகமாகின்றன. அந்தப் பரவல், தீர்மானிக்கும் திறனை மதிப்புமிக்கதாக ஆக்குகிறது. ZDNET-ன் வெளியிடப்பட்ட முறைமை, ஒரு தொழில்நுட்ப அவுட்லெட் அந்தத் தீர்மானிக்கும் திறனை காப்பாற்ற எவ்வாறு முயல்கிறது என்பதைக் காட்டுகிறது: நிஜ உலக பயன்பாடு, விற்பனையாளர் தாக்கம் இல்லை, மற்றும் கட்டமைக்கப்பட்ட ஒப்பீட்டு சோதனை.

AI நிறைந்த சந்தையில் வழிகாட்டுதலை நாடும் வாசகர்களுக்கு, இது கிடைக்கக்கூடிய மிகவும் பயனுள்ள சிக்னல்களில் ஒன்றாக இருக்கலாம். தயாரிப்பு நிலப்பரப்பு தொடர்ந்து மாறும். கவரேஜ் அறிமுகச் சுழற்சியின் நீட்டிப்பாக மாறாமல் அதனைத் தொடர்ந்து செல்ல முடியுமா என்பதை தீர்மானிப்பது மதிப்பாய்வு கொள்கைகள்தான்.

இந்தக் கட்டுரை ZDNET-இன் செய்திப்பதிவை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.

Originally published on zdnet.com

2026-ல் ஒரு டெக் அவுட்லெட் AI தயாரிப்புகளை எவ்வாறு சோதிக்கிறது என்று கூறுகிறது

AI பற்றிய செய்திக் கவரேஜ் அதிக செல்வாக்கு பெறுகிறது, மேலும் முறைமையும் கதையின் ஒரு பகுதியாகிறது

முக்கியக் கொள்கைகள் நேரடி பயன்பாடு மற்றும் சுயாதீனம்

Claude Max பயன்பாட்டு வரம்புகள் குறித்து Anthropic மீது வழக்கு

AI மதிப்பாய்வு இப்போது பரந்த தயாரிப்பு உலகை உள்ளடக்கியுள்ளது

சந்தைச் சிக்கல் AI தயாரிப்புகள் இல்லாமை அல்ல, அதிகமான கோரிக்கைகள்தான்

COVID பூஸ்டர்கள் இன்னும் முக்கிய இதய ஆபத்துகளை குறைக்கின்றன, VA ஆய்வு கண்டறிகிறது

இது ஒரு வெளியீட்டைத் தாண்டி ஏன் முக்கியம்

Comments (0)

Related Articles

Google Earth தனது மறைந்த flight simulator-ஐ browser-க்கு கொண்டு வந்துள்ளது

அணியக்கூடிய ஆரோக்கியத் தரவு பயனுள்ளது, ஆனால் உரிமை இன்னும் தெளிவற்றதே

Keep Reading