Gemini वैयक्तिक संदर्भ आणि Google Photos वापरून AI प्रतिमा तयार करते

सामान्य प्रॉम्प्ट गुंतागुंतीपासून वैयक्तिक संदर्भाकडे AI प्रतिमा निर्मितीला Google वळवत आहे

Google Gemini अॅपमध्ये नवीन फीचर्स सादर करत आहे, जे Personal Intelligence ला Google Photos आणि Nano Banana 2 model सोबत एकत्र करून अधिक वैयक्तिक प्रतिमा तयार करतात. मूलभूत कल्पना सोपी आहे: लांब, काळजीपूर्वक लिहिलेल्या प्रॉम्प्टवर किंवा वारंवार कराव्या लागणाऱ्या हाताने uploads वर अवलंबून न राहता, अॅप एखाद्या व्यक्तीच्या जतन केलेल्या पसंती आणि जोडलेल्या photo library चा वापर करून त्यांच्या आयुष्याशी अधिक जवळचे प्रतिमा तयार करू शकते.

कंपनीनुसार, हे फीचर पुढील काही दिवसांत अमेरिकेतील Google AI Plus, Pro, किंवा Ultra subscribers साठी रोल आउट होत आहे. Gemini जोडलेल्या accounts मधील संबंधित संदर्भ वापरून, स्वतःबद्दल किंवा प्रियजनांबद्दलच्या दृश्यांची विनंती करता येईल, असे Google सांगते.

उत्पादनातील बदल आता generic generation कडून individualized generation कडे

बहुतेक mainstream AI image tools अजूनही explicit prompting वर मोठ्या प्रमाणावर अवलंबून असतात. वापरकर्ते विषय, वातावरण, शैली, आणि जपायचे reference details सांगतात. Google चे update वेगळी दिशा दाखवते. कंपनी Gemini ला वापरकर्त्याच्या विद्यमान संदर्भातून अधिक अनुमान काढू देऊन specification चे ओझे कमी करण्याचा प्रयत्न करत आहे.

हे महत्त्वाचे आहे, कारण यामुळे product quality ची व्याख्या बदलते. पारंपरिक image generator मध्ये quality अनेकदा visual fidelity किंवा stylistic control ने मोजली जाते. वैयक्तिक generator मध्ये relevance तितकीच महत्त्वाची होते. उपयुक्त परिणाम म्हणजे फक्त तांत्रिकदृष्ट्या polished प्रतिमा नाही. ती अशी प्रतिमा आहे जी योग्य लोक, पसंती, आणि पार्श्वभूमी तपशील कमी setup friction मध्ये प्रतिबिंबित करते.

Google मुळात हे मांडत आहे की consumer generative AI चे भविष्य केवळ models अधिक सक्षम बनवण्यात नाही. ते त्या models ना विनंती करणाऱ्या वापरकर्त्याबद्दल अधिक जागरूक बनवण्यातही आहे. Gemini मध्ये या कल्पनेसाठी कंपनीचे framework म्हणजे Personal Intelligence.

How we used Gemini to build Google I/O 2026

Google ने सांगितले की Gemini ने I/O 2026 तयार करण्यात कशी मदत केली

Googleचे म्हणणे आहे की टीम्सनी Google I/O 2026 साठी चित्रपट, दृश्ये आणि इव्हेंट घटक तयार करण्यासाठी Gemini आणि इतर AI साधनांचा वापर केला, आणि हा परिषद AI-सहाय्यित निर्मितीचा अंतर्गत नमुना म्हणून मांडला.

Read article

Google Photos सर्जनशील output मध्ये थेट input बनत आहे

या घोषणेतील सर्वात परिणामकारक भागांपैकी एक म्हणजे Google Photos सोबतचे integration. कंपनी सांगते की users photo library जोडून generated images मध्ये स्वतःला आणि प्रियजनांना समाविष्ट करू शकतात, आणि पहिला output योग्य नसेल तर reference photos बदलू शकतात किंवा results refine करू शकतात.

हा महत्त्वाचा product move आहे, कारण photo libraries मध्ये तीच कायमस्वरूपी, वैयक्तिक visual context असते जी generic AI systems कडे अनेकदा नसते. त्या संदर्भाचा वापर करून Gemini 'एक कुटुंब' किंवा 'माझ्यासारखा एखादा व्यक्ती' यापलीकडे जाऊन, वापरकर्त्याच्या आयुष्याशी अधिक विशिष्टपणे जुळलेली गोष्ट तयार करू शकते.

त्याच वेळी, हे फीचर trust आणि personal data handling चा मानकही उंचावते. Google ने थेट सांगितले आहे की Gemini वापरकर्त्याच्या private photo library वर models train करत नाही. हे आश्वासन product pitch चे केंद्र आहे. जे tool अधिक वैयक्तिक होत जाऊन अधिक उपयुक्त होते, ते व्याख्येने अधिक संवेदनशीलही होते.

मोठ्या AI स्पर्धेत हे का महत्त्वाचे आहे

हे update दाखवते की मोठे consumer AI platforms आता कशावर स्पर्धा करत आहेत: फक्त model performance वर नाही, तर ecosystem advantage वरही. या प्रकारच्या product मध्ये Google ला नैसर्गिक आघाडी आहे, कारण तो आधीच Photos आणि व्यापक account-level preference signals सारख्या सेवांवर उभा आहे, ज्यांवर अनेक वापरकर्ते रोज अवलंबून असतात. याचा अर्थ, वापरकर्त्यांना शून्यातून नवी data layer तयार करायला लावल्याशिवाय personalization features तयार करता येतात.

हे धोरणात्मकदृष्ट्या महत्त्वाचे आहे. consumer AI products सतत one-off generators ऐवजी persistent assistants बनण्याचा प्रयत्न करत आहेत. ते नीट करण्यासाठी memory, context, आणि लोक आधीच digital services मध्ये साठवून ठेवतात त्या माहितीस प्रवेश हवा. Gemini चे नवीन image features isolated prompt box कडून context-rich assistant कडे जाणाऱ्या मोठ्या संक्रमणाशी जुळतात.

हा rollout multimodal generation mass-market वापरासाठी कशी पॅकेज केली जाते, हेही दाखवतो. Google हे expert creative suite म्हणून सादर करत नाही ज्याला विस्तृत prompt engineering लागते. ते हे हलके, अधिक सहज अनुभव म्हणून मांडत आहे: एक दृश्य मागा, system ला तुमचा context वापरू द्या, मग गरज असल्यास refine करा. अशी साधीकरणे mainstream adoption साठी मोठे युद्धक्षेत्र ठरू शकतात.

OpenAI starts with infrastructure robots but aims for "everyone having a personal robot doing anything they need"

OpenAI चे रोबोटिक्स इन्फ्रास्ट्रक्चर काम आणि दीर्घकालीन ग्राहकदृष्टीभोवती पुन्हा उभारले जात आहे

OpenAI ने आपली रोबोटिक्स टीम पुन्हा उभी केली आहे, सुरुवात इन्फ्रास्ट्रक्चर कामांपासून करत, तर CEO Sam Altman सर्वांसाठी वैयक्तिक रोबोट हा दीर्घकालीन उद्देश सांगतात.

Read article

सर्जनशील संधीसोबत व्यावहारिक मर्यादाही आहेत

घोषणा वापरण्याची सुलभता आणि personalization यावर भर देते, पण refinement वर नियंत्रण वापरकर्त्याकडेच राहते हेही स्पष्ट करते. ते outputs tweak करू शकतात आणि reference photos बदलू शकतात. यावरून Google ला हे मान्य आहे की context-aware generator देखील पहिल्या प्रयत्नात नेहमीच योग्य निर्णय घेणार नाही. Personalization friction कमी करते; iteration पूर्णपणे संपवत नाही.

हे फीचर, किमान सुरुवातीला, विशिष्ट Google AI plans मधील U.S. subscribers पुरते मर्यादित आहे. म्हणजे rollout अद्याप सार्वत्रिक platform change नाही. ही paid access शी जोडलेली tiered product capability आहे, जी अनेक आघाडीच्या AI फीचर्सचे commercialisation कसे होत आहे, त्याच्याशी सुसंगत आहे.

तरीही, या update चे महत्त्व तात्काळ subscriber base पेक्षा मोठे आहे. Google एक असे AI image generation model तपासत आहे जे personal context ला optional enhancement नव्हे तर primary input मानते. वापरकर्त्यांनी याला चांगला प्रतिसाद दिला तर, हाच logic इतर multimodal creation प्रकारांवरही प्रभाव टाकू शकतो.

त्या अर्थाने, हे केवळ image-generation update नाही. consumer AI products कुठे जात आहेत याचा हा संकेत आहे. पुढचा टप्पा बहुधा perfect prompt ने कोण सर्वात प्रभावी प्रतिमा तयार करू शकते यापेक्षा, privacy आणि control जपत वापरकर्त्याच्या स्वतःच्या आयुष्यात नैसर्गिकपणे आधारलेली generation कोण देऊ शकते, यावर अधिक ठरेल. Google Gemini ला नेमक्या त्या बदलासाठी स्थितीत आणण्याचा प्रयत्न करत आहे.

हा लेख Google AI Blog च्या अहवालावर आधारित आहे. मूळ लेख वाचा.

Originally published on blog.google

Gemini वैयक्तिक संदर्भ आणि Google Photos वापरून AI प्रतिमा निर्मिती अधिक सुलभ करत आहे

सामान्य प्रॉम्प्ट गुंतागुंतीपासून वैयक्तिक संदर्भाकडे AI प्रतिमा निर्मितीला Google वळवत आहे

उत्पादनातील बदल आता generic generation कडून individualized generation कडे

Google ने सांगितले की Gemini ने I/O 2026 तयार करण्यात कशी मदत केली

Google Photos सर्जनशील output मध्ये थेट input बनत आहे

मोठ्या AI स्पर्धेत हे का महत्त्वाचे आहे

OpenAI चे रोबोटिक्स इन्फ्रास्ट्रक्चर काम आणि दीर्घकालीन ग्राहकदृष्टीभोवती पुन्हा उभारले जात आहे

सर्जनशील संधीसोबत व्यावहारिक मर्यादाही आहेत

Comments (0)

Related Articles

उमेदवारांची चाचणी घेण्यासाठी Anthropic ने मुलाखतींमध्ये AI साधनांवर बंदी घातली

Keep Reading