OpenAI பாதுகாப்பு கவனத்தை தனித்த கேள்விகளிலிருந்து மாறிக்கொண்டிருக்கும் சூழலுக்கு மாற்றுகிறது
உணர்வுப்பூர்வமான உரையாடல்களில் ஆபத்தை ChatGPT மேலும் நன்றாக அடையாளம் காணும்படி, காலப்போக்கில் எச்சரிக்கை அறிகுறிகள் எப்படி வெளிப்படுகின்றன என்பதைப் பார்த்து அமைப்பு புதுப்பிக்கப்பட்டுள்ளதாக OpenAI கூறுகிறது. நிறுவனத்தின் அறிவிப்பு தற்கொலை, சுய-காயம், மற்றும் பிறருக்கு தீங்கு போன்ற தீவிர சூழல்களை மையமாகக் கொண்டுள்ளது; தீங்கான நோக்கம் எப்போதும் ஒரே செய்தியில் தெளிவாக தெரியாது, உரையாடலை வரிசையாகப் பார்த்தால்தான் அது தெளிவாகலாம் என அது வாதிடுகிறது.
இந்த மாற்றம் உரையாடல் AI-க்கு உள்ள ஒரு முக்கிய பாதுகாப்புச் சவாலை பிரதிபலிக்கிறது. தனியாகப் பார்க்கும்போது சாதாரணமாகத் தோன்றும் ஒரு கோரிக்கை, முன்பிருந்த மன உளைச்சல் குறிப்புகள், அதிகரிக்கும் மொழிநடை, அல்லது ஆபத்தான விவரங்களுக்கான மீண்டும் மீண்டும் வரும் கோரிக்கைகளுடன் இணைந்தால் வேறுபட்ட அர்த்தம் கொள்ளலாம். அந்த விரிவான சூழலை பயன்படுத்தி, எப்போது பாதுகாப்பற்ற உள்ளடக்கத்தை மறுக்க வேண்டும், நிலையை தணிக்க வேண்டும், அல்லது பயனரை உதவிக்குத் திருப்ப வேண்டும் என்பதை ChatGPT தீர்மானிக்க புதிய புதுப்பிப்புகள் உதவும் வகையில் வடிவமைக்கப்பட்டுள்ளன என்று OpenAI கூறுகிறது.
OpenAI கூறுவதில் என்ன மாற்றம் ஏற்பட்டுள்ளது
நுணுக்கமான அல்லது வளர்ந்து கொண்டிருக்கும் குறிப்புகளை, அவை அதிகரிக்கும் ஆபத்தை சுட்டிக்காட்டும்போது, அடையாளம் காண ChatGPT இப்போது மேம்பட்ட பயிற்சியும் கொள்கைகளும் கொண்டுள்ளது என்று நிறுவனம் கூறுகிறது. ஆபத்து அறிகுறிகள் தோன்றும்போது அதிக எச்சரிக்கையுடன் நடப்பதும், பெரும்பாலான சாதாரண உரையாடல்களில் தேவையற்ற மிகைப்படுத்தப்பட்ட எதிர்வினையை தவிர்ப்பதும் என்ற இரட்டை நோக்கம் இதற்குள்ளது என OpenAI கூறுகிறது.
- முந்தைய செய்திகளின் சூழல் இப்போது பின்னர் எடுக்கப்படும் பாதுகாப்பு முடிவுகளைப் பாதிக்க முடியும்
- இந்த அமைப்பு அரிதாக நிகழும் ஆனால் மிக உயர்ந்த முக்கியத்துவம் கொண்ட சூழல்களுக்காக வடிவமைக்கப்பட்டுள்ளது
- பதில்களில் நிலையை தணித்தல், தீங்கான விவரங்களை மறுத்தல், அல்லது பாதுகாப்பான மாற்று வழிகளுக்கு வழிநடத்தல் இடம்பெறலாம்
இந்த வேலை பல ஆண்டுகளாக நடந்த பயிற்சி, மதிப்பீடுகள், கண்காணிப்பு அமைப்புகள், மற்றும் மனநலம் மற்றும் பாதுகாப்பு நிபுணர்களுடன் இரு ஆண்டுகளுக்கும் மேலான ஒத்துழைப்பின் மீது கட்டப்பட்டுள்ளது என்று OpenAI கூறுகிறது. இந்த புதுப்பிப்பு, ஒரு கோரிக்கையின் பாதுகாப்பற்ற பகுதிகளை மறுத்துவிட்டு, பாதுகாப்பாகச் செய்ய முடிந்த இடங்களில் உதவியாகத் தொடரும் அதன் பரந்த “safe completion” அணுகுமுறையின் ஒரு பகுதியாகவும் வைக்கப்பட்டுள்ளது.
நடைமுறையில் சூழல் ஏன் முக்கியம்
உரையாடல் அமைப்புகள் பெரும்பாலும் செய்தி வாரியாக மதிப்பிடப்படுகின்றன, ஆனால் ஆபத்து சேர்ந்து அதிகரிக்கக்கூடும் என்பதால் இந்த நிறுவனத்தின் விளக்கம் முக்கியமானது. ஒருவர் குழப்பமான அல்லது மேற்பார்வையில் சாதாரணமாகத் தோன்றும் கேள்விகளுடன் தொடங்கி, பின்னர் தமது நோக்கத்தை மெதுவாக வெளிப்படுத்தலாம். தேவையானபோது அந்த அறிகுறிகளை இணைத்துப் பார்க்க மாதிரிக்கு இந்தப் புதுப்பிப்புகள் உதவுகின்றன என்று OpenAI கூறுகிறது.
இந்த வடிவமைப்பு இலக்கு இருவழிச் சாயல் கொண்டது. வளர்ந்து வரும் சூழலைத் தவறவிடும் ஒரு மாதிரி, உயர் ஆபத்து நிலைகளில் மிகுந்த தளர்வாகப் பதிலளிக்கலாம். சூழலை மிகைப்படுத்தி வாசிக்கும் ஒரு மாதிரி, சாதாரண பயன்பாட்டில் கடினமாகவும் பயனற்றதாகவும் மாறலாம். மக்கள் தினமும் வைத்திருக்கும் நூற்றுக்கணக்கான மில்லியன் சாதாரண உரையாடல்களையும், அதிக எச்சரிக்கை தேவைப்படும் மிக அரிதான சூழல்களையும் வேறுபடுத்துவதே தன் நோக்கம் என்று OpenAI கூறுகிறது.
தீவிர சேத சூழல்களில் கவனம்
எல்லா கடினமான அல்லது உணர்ச்சி மிகுந்த பரிமாற்றங்களையும் விட, தற்போதைய வேலை தீவிரமான வழக்குகளில் கவனம் செலுத்துகிறது என்று OpenAI கூறுகிறது. குறிப்பாக தற்கொலை, சுய-காயம், மற்றும் பிறருக்கு தீங்கு விளைவிக்கும் சூழல்களையே இந்தப் புதுப்பிப்பின் முக்கிய இலக்குகளாக நிறுவனம் குறிப்பிடுகிறது. அந்த சூழல்களில், சூழலில் வைத்து பார்க்கும்போது நிரபராத கோரிக்கைகளுக்கும் அதிக ஆபத்தைச் சுட்டிக்காட்டக்கூடிய கோரிக்கைகளுக்கும் இடையே ChatGPT மேலும் நன்றாக வேறுபடுத்த முடியும் என்று அது கூறுகிறது.
பல உணர்வுப்பூர்வமான உரையாடல்கள் இயல்பாகவே பாதுகாப்பற்றவை அல்ல என்பதால் அந்த வேறுபாடு முக்கியமானது. பயனர்கள் மனநலம், நெருக்கடி தடுப்பு, அல்லது தனிப்பட்ட மனஅழுத்தம் குறித்து நியாயமான முறையில் பேசலாம். அந்த உரையாடல்களை பொதுவாகத் தடுக்குவது அல்ல, சூழல் அந்த தொடர்பு ஆபத்தாக மாறக்கூடும் என்று சுட்டிக்காட்டும்போது மிகக் கவனமாக பதிலளிப்பதே தன் நோக்கம் என்று OpenAI கூறுகிறது.
நம்பிக்கை மற்றும் நிர்வாகத்திற்கான தாக்கங்கள்
இந்தப் புதுப்பிப்பு, நிலைமையற்ற அமைப்புகளை விட உரையாடல் சார்ந்த பாதுகாப்பு அமைப்புகளுக்கு மாறும் பெரிய தொழில் இயக்கத்தின் ஒரு பகுதியாகும். பாரம்பரிய பாதுகாப்புகள் பெரும்பாலும் தூண்டுதல் சொற்றொடர்கள் அல்லது மிகக் குறுகிய விதிகளை நம்புகின்றன. OpenAI-யின் அறிவிப்பு, உரையாடல் எவ்வாறு நகர்கிறது என்பதை அமைப்பு கண்காணித்து, அதற்கேற்ப தன் நடத்தை மாற்றும் stateful பாதுகாப்பு மாதிரியை சுட்டிக்காட்டுகிறது.
அந்த அணுகுமுறை, சேதத் தடுப்பு நோக்கில் அளவுக்கு அதிக தாக்கம் கொண்ட வரம்பு வழக்குகளில் செயல்திறனை மேம்படுத்தக்கூடும். அதே நேரத்தில், இது வெளிப்படைத்தன்மை மற்றும் ஒற்றுமை குறித்த பழக்கமான கேள்விகளையும் எழுப்புகிறது. ஒரு மாதிரி பாதுகாப்பு தீர்ப்புகளை எடுக்க சேர்ந்து வரும் சூழலை அதிகமாகப் பயன்படுத்த ככל, அந்தத் தீர்ப்புகள் நம்பகமானவை என்பதையும், மிகுந்த எச்சரிக்கையாக மாறிவிடாததையும் உறுதி செய்வது மேலும் முக்கியமாகிறது. வழங்கப்பட்ட உரையில் புதிய கணிசமான அளவுத்தர முடிவுகளை OpenAI-யின் அறிக்கை தரவில்லை; ஆனால் அரிதாக நிகழும், உயர் ஆபத்து சூழல்களை நன்றாகக் கையாள நீண்டகால சூழல் அவசியம் என்று நிறுவனம் கருதுகிறது என்பதை அது தெளிவாகக் காட்டுகிறது.
உரையாடல் பாதுகாப்பு எந்த திசையில் செல்கிறது என்பதற்கான ஒரு அறிகுறி
உரையாடல் அமைப்புகளில் AI பாதுகாப்பை OpenAI அறிவிப்பு முதிர்ச்சியடைந்த பார்வையுடன் வலியுறுத்துகிறது. பிரச்சினை இப்போது வெளிப்படையாக ஆபத்தான கோரிக்கையை மாதிரி மறுக்குமா என்பதிலேயே இல்லை. எந்த ஒரு செய்தியும் தனித்தனியாக போதாதிருந்தாலும், ஆபத்து மெதுவாக உருவாகிக் கொண்டிருக்கிறது என்பதை அது அடையாளம் காண முடியுமா என்பதே கேள்வி.
அந்த திறன் மேம்பட்டால், பாதுகாப்பு பதில்கள் அதிக அளவில் பொருத்தமானவையாகவும் இலக்குக்கேற்றவையாகவும் மாறலாம். ஒவ்வொரு குழப்பமான கூற்றையும் ஒரே அளவு ஆபத்தானதாகக் கருதுவதற்குப் பதிலாக, உரையாடல் தானே எச்சரிக்கை அதிகரிக்க வேண்டுமென சான்றுகள் அளிக்கும் இடங்களில் மட்டுமே அமைப்பு தனது வலுவான நடவடிக்கைகளை பயன்படுத்த முடியும். OpenAI இந்தப் புதுப்பிப்பை அந்தத் திசையில் ஒரு படியாகக் காட்டுகிறது; மேலும், சூழலை சரியாகப் புரிந்து கொள்வது மிக முக்கியமான அரிதான சூழல்களில்தான் அதன் கவனம் உள்ளது.
இந்த கட்டுரை OpenAI வழங்கிய செய்தியின்பேரில் அமைந்தது. அசல் கட்டுரையைப் படிக்கவும்.
Originally published on openai.com

