DeepSeek V4 முன்னோட்டம் open-source AI போட்டியில் புதிய அழுத்தத்தை சுட்டுகிறது

DeepSeek இன் சமீபத்திய முன்னோட்டம் ஒரு மூலோபாயத் தருணத்தில் வந்துள்ளது

சீன AI நிறுவனம் DeepSeek தனது புதிய முதன்மை model ஆன V4 இன் முன்னோட்டத்தை வெளியிட்டுள்ளது, மேலும் MIT Technology Review வழங்கிய ஆரம்ப framing இந்த launch ஒன்றுக்கு மேற்பட்ட காரணங்களுக்காக முக்கியம் என்று சுட்டிக்காட்டுகிறது. வழங்கப்பட்ட source text படி, இந்த புதிய model முந்தைய தலைமுறையைவிட மிக நீண்ட prompts ஐ செயலாக்க முடியும், முன்னணி closed-source rivals உடன் சமநிலை செயல்திறனை காட்டும் நிலையில் open source ஆகவே உள்ளது, மேலும் Huawei இன் Ascend chips க்காக optimize செய்யப்பட்ட நிறுவனத்தின் முதல் release இதுவாகும்.

இவை மூன்று தனித்தனி முன்னேற்றங்கள் என்றாலும், ஒன்றாக சேர்ந்து V4 தற்போதைய AI சூழலில் ஒரு signal event ஆக மாறுகின்றன. இந்த model வெறும் மற்றொரு capability update அல்ல. அது performance competition, infrastructure independence, மற்றும் open மற்றும் closed AI ecosystems இடையிலான மேலும் முக்கியமாவது வந்துள்ள பிரிவு ஆகியவற்றின் சங்கமத்தில் நிற்கிறது.

நீண்ட context ஒரு மூலோபாய அம்சமாக மாறுகிறது

source text இல் முன்வைக்கப்பட்ட முதல் புள்ளி, பெரிய அளவில் உள்ள text ஐ மேலும் திறமையாக நிர்வகிக்கும் புதிய வடிவமைப்பின் மூலம் V4 மிக நீண்ட prompts ஐ கையாள முடியும் என்பதாகும். இது ஒரு technical upgrade போலத் தோன்றலாம், ஆனால் AI systems இல் context length இப்போது முக்கியமான நடைமுறைப் போர்க்களங்களில் ஒன்றாக மாறியுள்ளது.

நீண்ட context windows, research, coding, enterprise document analysis, மற்றும் multi-step workflows போன்றவற்றில் models ஐ அதிக பயனுள்ளதாக மாற்றக்கூடும்; இதனால் பயனர் model பல அளவிலான தகவல்களைக் கடந்து நினைவில் வைத்து reasoning செய்ய வேண்டும். DeepSeek இந்த பகுதியில் அர்த்தமுள்ள முன்னேற்றத்தை பெற்றிருந்தால், chatbot novelty க்கும் அதிகமாக sustained task handling க்கும் முக்கியத்துவம் அளிக்கும் பயனர்களிடையே நிறுவனம் தனது நிலையை வலுப்படுத்துகிறது.

இந்த முக்கியத்துவம் context மேம்பாடுகள் பலமடங்கு மதிப்பை உருவாக்குவதால் மேலும் அதிகரிக்கிறது. சிறந்த long-prompt செயல்திறன் பயனர்களை அதிக text ஐ ஒட்டுவதற்கு மட்டும் அனுமதிப்பதில்லை. அது large policy reviews முதல் நீளமான software repositories மற்றும் பரந்த internal knowledge retrieval வரை, ஒரு model நடைமுறையில் ஆதரிக்கக்கூடிய task வகைகளை மாற்றக்கூடும்.

World's first working nuclear clocks built after decades of effort

தோரியம் அணுக்கடிகாரம் செயல்படும் மைல்கல்லை எட்டியது

தோரியம் அணுக்கருவைச் சுற்றி உருவாக்கப்பட்ட ஒரு செயல்படும் அணுக்கடிகாரம், பல தசாப்தங்களின் முயற்சிக்குப் பிறகு காட்சிப்படுத்தப்பட்டதாக தெரிவிக்கப்பட்டுள்ளது; இது இயற்பியலில் புதிய துல்லிய எல்லையைத் திறக்கிறது.

Read article

Open source இன்னும் ஒரு disruptive force ஆக உள்ளது

source text இன் இரண்டாவது முக்கியப் புள்ளி, V4 open source ஆகவே இருந்து கொண்டே Anthropic, OpenAI, மற்றும் Google ஆகியோரின் முன்னணி closed-source போட்டியாளர்களின் செயல்திறனை எட்டுகிறது என்பதாகும். இந்த மதிப்பீடு சரியெனில், அது மூலோபாய ரீதியாக முக்கியமானது.

கடந்த இரண்டு ஆண்டுகளாக AI துறை, உயர்ந்த frontier performance கடுமையாக கட்டுப்படுத்தப்பட்ட proprietary systems உள்ளேயே மையப்படுத்தப்பட்டிருக்குமா அல்லது open models இடைவெளியை தொடர்ந்து குறைக்குமா என விவாதித்து வருகிறது. DeepSeek இன் release, open-source challengers இன்னும் உச்ச நிலையில் அழுத்தம் கொடுக்க முடியும் என்பதற்கான சான்றாக முன்வைக்கப்படுகிறது.

அது பல காரணங்களால் முக்கியம். Open models பரிசோதனையை வேகப்படுத்தலாம், switching costs ஐ குறைக்கலாம், மேலும் நிறுவனங்கள் அல்லது அரசுகளுக்கு deployment மீது அதிக கட்டுப்பாட்டை வழங்கலாம். performance gap access, flexibility, அல்லது cost வேறுபாட்டை நியாயப்படுத்த முடியாத அளவிற்கு சிறியதாகிவிட்டால், premium closed models க்கான business case ஐயும் அவை சிக்கலாக்குகின்றன.

Open models proprietary leaders ஐ முழுமையாக மாற்றாவிட்டாலும் கூட, buyer expectations ஐ மாற்றி சந்தையை வடிவமைக்க முடியும். அப்போது கேள்வி, closed model absolute terms இல் சிறந்ததா என்பதல்ல; openness இன் நன்மைகளை மீறுவதற்கு அது போதுமான அளவு சிறந்ததா என்பதாகிறது.

Chip கோணம் மிக அதிக geopolitically முக்கியமானதாக இருக்கலாம்

மூன்றாவது புள்ளி இறுதியில் மிக விரிவான தாக்கங்களை ஏற்படுத்தலாம்: V4, Huawei இன் Ascend chips க்காக optimize செய்யப்பட்ட DeepSeek இன் முதல் release ஆகும். MIT Technology Review இன் சுருக்கம் இதை China வின் Nvidia மீது சார்புடையதற்கான ஒரு சோதனையாகக் காட்டுகிறது, இது மிகச் சரியான பார்வை ஆகலாம்.

AI போட்டி இனி model quality பற்றி மட்டும் அல்ல. அந்த models எந்த hardware stacks மீது இயங்க முடியும், மற்றும் supply constraints இன் கீழ் national ecosystems எவ்வளவு resilient ஆக உள்ளன என்பதையும் இது குறிக்கிறது. domestic Chinese chips க்காக tuned செய்யப்பட்ட உயர்திறன் model, வணிக ரீதியாக மட்டுமல்ல, மூலோபாய ரீதியாகவும் முக்கியமானதாக இருக்கும். இது Chinese developers software மற்றும் hardware adaptation ஆகிய இரு முனைகளிலும் முன்னேறி வருகின்றனர் என்பதைக் காட்டும்.

இதனால் சார்பு சிக்கல்கள் தீர்ந்துவிட்டன என்பதல்ல. ஆனால் உரையாடல் இப்போது கோட்பாட்டைத் தாண்டி நகர்கிறது என்பதைக் குறிக்கிறது. Ascend chips க்கான optimization, non-Nvidia ecosystems உண்மையான அளவில் advanced models க்கு ஆதரவு தர முடியுமா என்பதை சோதிக்கும் ஒரு நடைமுறை benchmark ஐ உருவாக்குகிறது.

அந்த பொருளில், V4 ஒரு model release மட்டும் அல்ல. அதேசமயம் இது ஒரு infrastructure test case கூட.

The Artemis III crew poses for an official portrait (from left: Andre Douglas, Luca Parmitano, Randy Bresnik, Frank Rubio). (via nasa.gov)

சந்திரனுக்கு முன் நடைபெறும் கக்ஷை அமைப்பு சோதனைக்கான Artemis III குழுவை NASA அறிவித்துள்ளது

2028-ல் திட்டமிடப்பட்ட சந்திர மேற்பரப்புக்கு திரும்பும் பயணத்திற்கு முன்பாக, பூமி சுற்றுப்பாதையில் வணிகச் சந்திர லேண்டர்களுடன் docking மற்றும் interoperability-ஐ சோதிக்க வடிவமைக்கப்பட்ட ஒரு பணிக்காக NASA Artemis III குழுவை அறிமுகப்படுத்தியுள்ளது.

Read article

இது போட்டியாளர்கள் மீது ஏன் அழுத்தத்தை அதிகரிக்கிறது

முன்னணி U.S.-based AI firms க்கு, DeepSeek இன் இந்த நகர்வு இரண்டு திசைகளில் அழுத்தத்தை அதிகரிக்கிறது. model பக்கத்தில், performance leadership இனி மிகுந்த நிதியுடன் இயங்கும் closed systems க்கே சொந்தம் என்று கருத முடியாது என்பதை இது மீண்டும் உறுதிப்படுத்துகிறது. ecosystem பக்கத்தில், chip compatibility மற்றும் deployment independence போன்ற technical priorities களில் geopolitics நேரடியாக நுழைகிறது என்பதையும் இது காட்டுகிறது.

source text வெளிப்படையாக V4 மூன்று வழிகளில் AI யை அசைக்கக்கூடும் என்று கூறுகிறது, மற்றும் அந்த சொல்லாட்சி அதன் பரந்த முக்கியத்துவத்தைப் பிடிக்கிறது. DeepSeek வெறும் benchmark கவனத்தைப் பெற முயலவில்லை. open models, alternative compute stacks, மற்றும் Chinese AI development ஆகியவை ஒரே நேரத்தில் மேலும் நம்பகமானதாக மாறும் ஒரு narrative ஐ அது வலுப்படுத்துகிறது.

அந்த narrative முக்கியமானது, ஏனெனில் perception adoption ஐ வடிவமைக்கிறது. நிறுவனங்கள், அரசுகள், மற்றும் ஆராய்ச்சியாளர்கள் raw outputs ஐ மட்டும் ஒப்பிடுவதில்லை. அவர்கள் strategic options ஐயும் ஒப்பிடுகிறார்கள். போதுமான அளவு நல்ல செயல்திறன் கொண்ட மற்றும் அதிக கட்டுப்பாட்டில் இயங்கும் ecosystem இல் ஓடும் ஒரு model, தீர்க்கமான benchmark lead இல்லாவிட்டாலும் கூட ஈர்க்கக்கூடியதாக மாறலாம்.

பரந்த சூழல்: AI போட்டி பல அடுக்குகளாக மாறுகிறது

இந்த release AI போட்டியில் பரந்த மாற்றத்துடனும் பொருந்துகிறது. ஆரம்ப பொதுவான fascination chatbot quality மற்றும் headline features மீது கவனம் செலுத்தியது. அடுத்த கட்டம் இன்னும் layered ஆனது. அதில் prompt length, deployment flexibility, compute supply, chip sovereignty, மற்றும் open access இன் governance implications ஆகியவை அடங்கும்.

DeepSeek V4 இவை அனைத்தையும் ஒரே நேரத்தில் தொடுகிறது போல் தெரிகிறது. அதனால் தான் இந்த preview கவனத்தை ஈர்த்தது. இது வெறும் மற்றொரு வலுவான model வந்துவிட்டது என்பதற்கான அடையாளம் மட்டும் அல்ல. போட்டியின் விதிமுறைகள் தொடர்ந்து விரிவடைகின்றன என்பதற்கான அடையாளமும் அது.

அதே newsletter இல் world models உருவாக்கும் போட்டி பற்றிய குறிப்பும் frontier பலதரப்படுத்தப்பட்டு வருகிறது என்பதைக் வலுப்படுத்துகிறது. AI leadership இனி ஒரே leaderboard அல்ல. அது architectures, use cases, hardware ecosystems, மற்றும் product philosophies across போட்டிகளின் overlapping set ஆகும்.

UK orders Google to change AI search rules, allowing publishers to opt out of AI summaries - The Tech Portal (via thetechportal.com)

AI தேடலில் UK அழுத்தம் பதிப்பாளர்களுக்கு புதிய பேரச்சுவை நிலையை அளிக்கிறது

Fast Company-வில் விவரிக்கப்பட்டுள்ள UK போட்டி தீர்ப்பு, சாதாரண தேடல் காண்பித்தலை இழக்காமல் AI Overviews-இலிருந்து விலக பதிப்பாளர்களுக்கு Google வாய்ப்பு அளிக்க வேண்டும் என்று கூறுகிறது; இது AI-உள்ளடக்க போராட்டத்தில் ஒரு தெளிவான புதிய பேரச்சுவை நிலையை உருவாக்குகிறது.

Read article

அடுத்து எதை கவனிக்க வேண்டும்

வழங்கப்பட்ட source text அடிப்படையில், அடுத்த கேள்விகள் நேரடியானவை. V4 இன் long-context வடிவமைப்பு உண்மையான பயன்பாட்டில் எவ்வளவு நன்றாக நிலைத்து நிற்கிறது? வணிக ரீதியாக முக்கியமான domains இல் முன்னணி closed-source systems க்கு இது எவ்வளவு நெருக்கமாக செயல்படுகிறது? மேலும் Huawei optimization அறிவிப்பு மட்டுமல்லாமல் நடைமுறையில் எவ்வளவு பொருத்தமுள்ளது?

அந்த பதில்கள் V4 ஒரு நீடித்த போட்டி மாற்றமா அல்லது வலுவான symbolical release ஆக்கமா என்பதை தீர்மானிக்கும். ஆனால் அந்த பதில்கள் வருமுன் கூட, இந்த preview ஒன்று தெளிவாக்கியுள்ளது: open-source AI competition இன்னும் முழுமையாக உயிருடன் உள்ளது, மேலும் அது இந்த துறையை வடிவமைக்கும் hardware மற்றும் geopolitical realities உடன் மேலும் மேலும் பின்னி ஒட்டிக் கொண்டிருக்கிறது.

அந்த சேர்க்கையே DeepSeek இன் சமீபத்திய நகர்வை கவனிக்கத் தகுந்ததாக மாற்றுகிறது. இது வெறும் model upgrade அல்ல. AI யில் அடுத்த அழுத்தப் புள்ளிகள் எங்கு உருவாகலாம் என்பதற்கான ஒரு அறிகுறி.

இந்த கட்டுரை MIT Technology Review இன் செய்தியறிக்கையை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.

Originally published on technologyreview.com

DeepSeek V4 முன்னோட்டம் திறந்த மூல AI போட்டியில் ஒரு புதிய கட்டத்தைக் குறிக்கிறது

DeepSeek இன் சமீபத்திய முன்னோட்டம் ஒரு மூலோபாயத் தருணத்தில் வந்துள்ளது

நீண்ட context ஒரு மூலோபாய அம்சமாக மாறுகிறது

தோரியம் அணுக்கடிகாரம் செயல்படும் மைல்கல்லை எட்டியது

Open source இன்னும் ஒரு disruptive force ஆக உள்ளது

Chip கோணம் மிக அதிக geopolitically முக்கியமானதாக இருக்கலாம்

சந்திரனுக்கு முன் நடைபெறும் கக்ஷை அமைப்பு சோதனைக்கான Artemis III குழுவை NASA அறிவித்துள்ளது

இது போட்டியாளர்கள் மீது ஏன் அழுத்தத்தை அதிகரிக்கிறது

பரந்த சூழல்: AI போட்டி பல அடுக்குகளாக மாறுகிறது

AI தேடலில் UK அழுத்தம் பதிப்பாளர்களுக்கு புதிய பேரச்சுவை நிலையை அளிக்கிறது

அடுத்து எதை கவனிக்க வேண்டும்

Comments (0)

Keep Reading