பொதுவான prompt சிக்கலிலிருந்து தனிப்பட்ட சூழலுக்கு AI பட உருவாக்கத்தை Google நகர்த்துகிறது
Google, Personal Intelligence-ஐ Google Photos மற்றும் Nano Banana 2 model-உடன் இணைத்து மேலும் தனிப்பட்ட படங்களை உருவாக்கும் புதிய Gemini app அம்சங்களை அறிமுகப்படுத்துகிறது. இதன் அடிப்படை யோசனை எளியது: நீளமான, கவனமாக எழுதப்பட்ட prompt-களையோ மீண்டும் மீண்டும் செய்யப்படும் கைமுறை upload-களையோ சாராமல், பயன்பாடு ஒருவரின் சேமிக்கப்பட்ட விருப்பங்களையும் இணைக்கப்பட்ட photo library-யையும் பயன்படுத்தி, அவர்களின் வாழ்க்கையுடன் நெருக்கமாக தொடர்புடைய படங்களை உருவாக்க முடியும்.
நிறுவனத்தின் தகவலின்படி, இந்த அம்சம் அடுத்த சில நாட்களில் அமெரிக்காவில் உள்ள Google AI Plus, Pro, அல்லது Ultra சந்தாதாரர்களுக்கு வெளியிடப்படுகிறது. Gemini, இணைக்கப்பட்ட கணக்குகளில் உள்ள தொடர்புடைய சூழலைப் பயன்படுத்தி, பயனர்கள் தங்களையோ அல்லது தங்களுக்கு நெருக்கமானவர்களையோ உள்ளடக்கிய காட்சிகளை கோர முடியும் என்று Google கூறுகிறது.
பொருளில் மாற்றம் இப்போது பொதுவான உருவாக்கத்திலிருந்து தனிப்பட்ட உருவாக்கத்திற்குத் திசைமாறுகிறது
பெரும்பாலான பிரதான AI image tools இன்னும் explicit prompting-ஐ அதிகமாக சார்ந்துள்ளன. பயனர்கள் பொருள், சூழல், style, மற்றும் பாதுகாக்க வேண்டிய reference details-ஐ விவரிக்கிறார்கள். Google-இன் update இதற்குப் பிற மாறுபட்ட திசையைச் சுட்டுகிறது. பயனரின் ஏற்கனவே உள்ள சூழலிலிருந்து Gemini அதிகம் ஊகிக்க அனுமதிப்பதன் மூலம், specification-இன் சுமையை குறைக்க நிறுவனம் முயல்கிறது.
இது முக்கியம், ஏனெனில் இது product quality என்ன என்பதையே மாற்றுகிறது. வழக்கமான image generator-இல் quality என்பது பெரும்பாலும் visual fidelity அல்லது stylistic control மூலம் மதிப்பிடப்படுகிறது. தனிப்பட்ட generator-இல் relevance அதற்கேற்ப முக்கியமாகிறது. ஒரு பயனுள்ள output என்பது வெறும் தொழில்நுட்ப ரீதியாக polished ஆன படம் மட்டும் அல்ல. அது சரியான நபர்கள், விருப்பங்கள், மற்றும் பின்னணி விவரங்களை குறைந்த setup friction-உடன் பிரதிபலிக்கும் ஒன்றாகும்.
உபயோகஸ்தருக்கான generative AI-யின் எதிர்காலம் என்பது model-களை சுருக்கமாக அதிக திறன் கொண்டதாக மாற்றுவது மட்டுமல்ல என்று Google வாதிடுகிறது. அதை கோரிக்கை விடுக்கும் பயனரின் பின்னணியை மேலும் உணர்வுபூர்வமாக்குவதும் ஆகும். Gemini-இல் அந்த எண்ணத்திற்கான நிறுவனத்தின் கட்டமைப்பு Personal Intelligence ஆகும்.
Google Photos, படைப்பாற்றல் output-க்கு நேரடி input ஆகிறது
அறிவிப்பின் மிக முக்கியமான பகுதிகளில் ஒன்று Google Photos உடன் உள்ள integration. தங்கள் photo library-யை இணைப்பதன் மூலம், generated images-இல் தங்களையும் தங்களுக்கு நெருக்கமானவர்களையும் சேர்க்கலாம் என்றும், முதல் output சரியில்லையெனில் reference photos-ஐ மாற்றவோ முடிவுகளை fine-tune செய்யவோ முடியும் என்றும் நிறுவனம் கூறுகிறது.
இது முக்கியமான product move, ஏனெனில் photo libraries-ல் பொதுவான AI systems-க்கு பெரும்பாலும் இல்லாத, நிலையான தனிப்பட்ட காட்சி சூழல் துல்லியமாக உள்ளது. அந்தச் சூழலைப் பயன்படுத்தி, Gemini 'ஒரு குடும்பம்' அல்லது 'என்னைப் போல உள்ள ஒருவர்' போன்ற சாத்தியமான படங்களை உருவாக்குவதைத் தாண்டி, ஒருவரின் வாழ்க்கையில் மேலும் குறிப்பிட்ட முறையில் நிலை கொண்ட ஒன்றை உருவாக்க முடியும்.
அதே நேரத்தில், இந்த அம்சம் நம்பிக்கை மற்றும் தனிப்பட்ட தரவு கையாளுதல் குறித்த தரத்தையும் உயர்த்துகிறது. Gemini பயனரின் private photo library-யில் models-ஐ train செய்யாது என்று Google நேரடியாக அறிவிப்பில் கூறுகிறது. அந்த உறுதி product pitch-இன் மையமாக உள்ளது. மேலும் தனிப்பட்டதாகி பயன்பாடாகும் கருவி, வரையறைப்படி மேலும் உணர்வாய்வாகவும் ஆகிறது.
பரந்த AI போட்டியில் இது ஏன் முக்கியம்
இந்த update, பெரிய consumer AI platforms இப்போது எதில் போட்டியிடுகின்றன என்பதை காட்டுகிறது: model performance மட்டுமல்ல, ecosystem advantage-ம். இந்த வகை தயாரிப்பில் Google-க்கு இயற்கையான முன்னிலை உள்ளது, ஏனெனில் அது ஏற்கனவே பல பயனர்கள் தினசரி நம்பும் Photos மற்றும் account-level preference signals போன்ற சேவைகளின் மேல் இருக்கிறது. இதனால், பயனர்கள் புதிதாக data layer உருவாக்க வேண்டாமலேயே personalization features-ஐ உருவாக்க முடிகிறது.
இது தந்திர ரீதியாக முக்கியம். Consumer AI products, ஒற்றைமுறை generators-இலிருந்து நிலையான assistants-ஆக மாற முயற்சிக்கின்றன. அதை நன்றாகச் செய்ய, memory, context, மற்றும் மக்கள் ஏற்கனவே digital services-ல் சேமித்து வைத்துள்ள தகவல்களுக்கான access தேவை. Gemini-யின் புதிய image features, தனித்த prompt box-இலிருந்து context-rich assistant-ஆக மாறும் பெரிய மாற்றத்துடன் பொருந்துகின்றன.
இந்த rollout, multimodal generation-ஐ mass-market பயன்பாட்டிற்காக எப்படி வழங்குகின்றனர் என்பதையும் காட்டுகிறது. Google இதை விரிவான prompt engineering தேவைப்படும் expert creative suite-ஆக அல்லாமல், குறைந்த சுமையுடன், எளிதாகப் புரியும் அனுபவமாக முன்வைக்கிறது: ஒரு scene-ஐ கேளுங்கள், system-க்கு உங்கள் context-ஐ பயன்படுத்த விடுங்கள், பின்னர் தேவைப்பட்டால் திருத்துங்கள். இப்படியான எளிமைப்படுத்தல் mainstream adoption-க்கான முக்கிய போர்க்களமாக இருக்கலாம்.
படைப்பாற்றல் வாய்ப்புடன் நடைமுறை வரம்புகளும் உள்ளன
அறிவிப்பு பயன்பாட்டு எளிமை மற்றும் personalization-ஐ முன்னிறுத்தினாலும், refinement-இல் பயனரே கட்டுப்பாட்டில் இருப்பதை அது தெளிவுபடுத்துகிறது. அவர்கள் outputs-ஐ சரிசெய்யலாம், reference photos-ஐ மாற்றலாம். இதன் மூலம் context-aware generator-களும் முதல் முயற்சியிலேயே எப்போதும் சரியான தேர்வுகளைச் செய்யாது என்பதை Google உணர்ந்திருப்பது தெரிகிறது. Personalization friction-ஐ குறைக்கிறது; iteration-ஐ அகற்றுவதில்லை.
இந்த அம்சம், குறைந்தது ஆரம்பத்தில், குறிப்பிட்ட Google AI திட்டங்களில் உள்ள அமெரிக்க சந்தாதாரர்களுக்கு மட்டுமே வரம்பிடப்பட்டுள்ளது. அதாவது rollout இன்னும் universal platform change அல்ல. இது paid access-இன் அடிப்படையில் tier செய்யப்பட்ட product capability ஆகும், இது முன்னணி பல AI features எவ்வாறு commercialize செய்யப்படுகின்றன என்பதற்கு ஏற்பவே உள்ளது.
இருப்பினும், இந்த update-இன் முக்கியத்துவம் உடனடி சந்தாதாரர் அடிப்படையை விட பெரியது. தனிப்பட்ட சூழலை optional enhancement ஆக அல்ல, primary input ஆகக் கருதும் AI image generation model-ஐ Google சோதிக்கிறது. பயனர்கள் இதற்கு நல்ல பதில் அளித்தால், இதே logic மற்ற multimodal creation வடிவங்களையும் வடிவமைக்கலாம்.
அந்த அர்த்தத்தில், இது வெறும் image-generation update அல்ல. consumer AI products எங்கு செல்கின்றன என்பதற்கான ஒரு signal இது. அடுத்த கட்டம், perfect prompt மூலம் யார் மிகச் சிறந்த படம் உருவாக்க முடியும் என்பதைக் காட்டிலும், privacy மற்றும் control-ஐ பாதுகாத்தபடியே, பயனரின் சொந்த வாழ்க்கையில் இயல்பாக அடிப்படையுடைய generation-ஐ யார் வழங்க முடியும் என்பதால் அதிகம் தீர்மானிக்கப்படும். Gemini-யை அந்த மாற்றத்திற்காகவே Google நிலைநிறுத்த முயல்கிறது.
இந்த கட்டுரை Google AI Blog-இன் செய்தியறிக்கையின் அடிப்படையில் உள்ளது. மூல கட்டுரையைப் படிக்கவும்.
Originally published on blog.google



