Gemini ने व्यक्तिगत संदर्भ और Google Photos से AI इमेज बनाई

Google AI इमेज जेनरेशन को प्रॉम्प्ट की जटिलता से हटाकर व्यक्तिगत संदर्भ की ओर ले जा रहा है

Google Gemini ऐप में नए फीचर पेश कर रहा है जो उसके अनुसार Personal Intelligence को Google Photos और Nano Banana 2 मॉडल के साथ मिलाकर अधिक व्यक्तिगत इमेज बनाते हैं। मुख्य विचार सरल है: लंबे, सावधानी से लिखे गए प्रॉम्प्ट या बार-बार किए जाने वाले मैनुअल अपलोड पर निर्भर रहने के बजाय, ऐप किसी व्यक्ति की सहेजी गई पसंद और जुड़ी हुई फोटो लाइब्रेरी का उपयोग करके ऐसी इमेज बना सकता है जो उसकी ज़िंदगी से अधिक निकटता से जुड़ी हों।

कंपनी के अनुसार यह फीचर अगले कुछ दिनों में अमेरिका में Google AI Plus, Pro, या Ultra के ग्राहकों के लिए जारी किया जा रहा है। Google का कहना है कि उपयोगकर्ता अपने या अपने प्रियजनों को शामिल करते हुए दृश्यों का अनुरोध कर सकेंगे, और Gemini जुड़े हुए खातों में उपलब्ध संदर्भ का उपयोग करेगा।

उत्पाद में बदलाव अब सामान्य जनरेशन से व्यक्तिगत जनरेशन की ओर है

अधिकांश मुख्यधारा के AI इमेज टूल अभी भी स्पष्ट प्रॉम्प्टिंग पर काफी हद तक निर्भर करते हैं। उपयोगकर्ता विषय, परिवेश, शैली और कोई भी संदर्भ विवरण बताते हैं जिन्हें वे बनाए रखना चाहते हैं। Google का अपडेट दूसरी दिशा में इशारा करता है। कंपनी Gemini को उपयोगकर्ता के मौजूदा संदर्भ से अधिक अनुमान लगाने की अनुमति देकर विशिष्टताओं का बोझ कम करने की कोशिश कर रही है।

यह इसलिए महत्वपूर्ण है क्योंकि यह तय करता है कि उत्पाद की गुणवत्ता का अर्थ क्या होगा। पारंपरिक इमेज जनरेटर में गुणवत्ता अक्सर दृश्य सटीकता या शैलीगत नियंत्रण से आंकी जाती है। व्यक्तिगत जनरेटर में प्रासंगिकता उतनी ही महत्वपूर्ण हो जाती है। उपयोगी परिणाम सिर्फ तकनीकी रूप से सजी हुई इमेज नहीं है। वह ऐसी इमेज है जो कम तैयारी के साथ सही लोगों, पसंदों और पृष्ठभूमि विवरणों को दर्शाती है।

Google मूलतः यह तर्क दे रहा है कि उपभोक्ता जनरेटिव AI का भविष्य सिर्फ मॉडलों को सैद्धांतिक रूप से अधिक सक्षम बनाना नहीं है। यह उन्हें अनुरोध करने वाले उपयोगकर्ता के प्रति अधिक जागरूक बनाने के बारे में भी है। Gemini के भीतर इस विचार के लिए Personal Intelligence कंपनी का ढांचा है।

OpenAI starts with infrastructure robots but aims for "everyone having a personal robot doing anything they need"

OpenAI ने इन्फ्रास्ट्रक्चर काम और लंबे उपभोक्ता विजन के इर्द-गिर्द रोबोटिक्स को फिर से खड़ा किया है

OpenAI ने अपनी रोबोटिक्स टीम को फिर से बनाया है, शुरुआत इन्फ्रास्ट्रक्चर कार्यों से करते हुए, जबकि CEO Sam Altman एक लंबे समय के लक्ष्य के रूप में सभी के लिए निजी रोबोटों की बात कर रहे हैं।

Read article

Google Photos रचनात्मक आउटपुट में सीधे इनपुट बन रहा है

घोषणा का सबसे महत्वपूर्ण हिस्सा Google Photos के साथ एकीकरण है। कंपनी का कहना है कि उपयोगकर्ता अपनी फोटो लाइब्रेरी जोड़कर जनरेट की गई इमेज में स्वयं और अपने प्रियजनों को शामिल कर सकते हैं, और यदि पहला आउटपुट सही न हो तो वे संदर्भ फ़ोटो बदल सकते हैं या परिणामों को परिष्कृत कर सकते हैं।

यह एक महत्वपूर्ण उत्पाद कदम है, क्योंकि फोटो लाइब्रेरी में वही स्थायी, व्यक्तिगत दृश्य संदर्भ होता है जो सामान्य AI सिस्टम्स के पास अक्सर नहीं होता। उस संदर्भ का उपयोग करके Gemini 'एक परिवार' या 'मेरे जैसा एक व्यक्ति' जैसी संभावित इमेज बनाने से आगे बढ़कर, उपयोगकर्ता के जीवन में अधिक विशिष्ट रूप से जड़ित कुछ बना सकता है।

साथ ही, यह फीचर विश्वास और व्यक्तिगत डेटा के प्रबंधन के मानक को भी ऊंचा करता है। Google ने घोषणा में सीधे इस बिंदु को संबोधित करते हुए कहा कि Gemini उपयोगकर्ता की निजी फोटो लाइब्रेरी पर अपने मॉडल प्रशिक्षित नहीं करता। यह आश्वासन उत्पाद के प्रस्ताव का केंद्रीय हिस्सा है। जो उपकरण अधिक व्यक्तिगत होकर अधिक उपयोगी बनता है, वह परिभाषा के अनुसार अधिक संवेदनशील भी हो जाता है।

व्यापक AI प्रतिस्पर्धा में यह क्यों मायने रखता है

यह अपडेट दिखाता है कि बड़े उपभोक्ता AI प्लेटफ़ॉर्म अब किस पर प्रतिस्पर्धा कर रहे हैं: सिर्फ मॉडल प्रदर्शन पर नहीं, बल्कि इकोसिस्टम लाभ पर भी। Google के पास इस तरह के उत्पाद में स्वाभाविक बढ़त है, क्योंकि वह पहले से उन सेवाओं पर बैठा है जिन पर बहुत से उपयोगकर्ता रोज़ निर्भर रहते हैं, जिनमें Photos और व्यापक खाता-स्तरीय प्राथमिकता संकेत शामिल हैं। इसका मतलब है कि वह उपयोगकर्ताओं से नया डेटा लेयर खरोंच से बनवाए बिना निजीकरण फीचर बना सकता है।

यह रणनीतिक रूप से महत्वपूर्ण है। उपभोक्ता AI उत्पाद तेजी से एक-बार के जनरेटर के बजाय स्थायी सहायक बनने की कोशिश कर रहे हैं। इसे अच्छी तरह करने के लिए उन्हें मेमोरी, संदर्भ और उन सूचनाओं तक पहुंच चाहिए जिन्हें लोग पहले से डिजिटल सेवाओं में संग्रहीत करते हैं। Gemini के नए इमेज फीचर इस अलग-थलग प्रॉम्प्ट बॉक्स से संदर्भ-समृद्ध सहायक की व्यापक संक्रमण प्रक्रिया के अनुरूप हैं।

यह रोलआउट यह भी दिखाता है कि बहु-मोडल जनरेशन को जन-उपयोग के लिए कैसे पैक किया जा रहा है। Google इसे ऐसे विशेषज्ञ रचनात्मक सूट के रूप में नहीं पेश कर रहा जो विस्तृत प्रॉम्प्ट इंजीनियरिंग मांगता हो। इसे एक हल्के, अधिक सहज अनुभव के रूप में पेश किया जा रहा है: एक दृश्य माँगें, सिस्टम को आपका संदर्भ उपयोग करने दें, फिर आवश्यकता हो तो सुधार करें। ऐसी सरलता मुख्यधारा में अपनाने के लिए बड़ी लड़ाई का क्षेत्र बन सकती है।

अध्ययन में पाया गया कि सामाजिक विज्ञान में एआई कोडिंग-एजेंट का उपयोग बेहद असमान है

Anthropic के एक अध्ययन में सामाजिक विज्ञान में कोडिंग-एजेंट अपनाने में बड़े अंतर पाए गए, जो लिंग, क्षेत्र, करियर चरण और विश्वविद्यालय रैंक के आधार पर बदलते हैं।

Read article

रचनात्मक अवसर के साथ व्यावहारिक सीमाएँ भी हैं

घोषणा उपयोग में आसानी और निजीकरण पर जोर देती है, लेकिन यह यह भी स्पष्ट करती है कि सुधार पर नियंत्रण उपयोगकर्ता के पास रहता है। वे आउटपुट को बदल सकते हैं और संदर्भ फ़ोटो स्वैप कर सकते हैं। यह दर्शाता है कि Google समझता है कि संदर्भ-सचेत जनरेटर भी हर बार पहली कोशिश में सही विकल्प नहीं चुनेंगे। निजीकरण घर्षण घटाता है; वह पुनरावृत्ति को समाप्त नहीं करता।

यह फीचर, कम से कम शुरुआती चरण में, केवल विशिष्ट Google AI योजनाओं पर अमेरिका के ग्राहकों तक सीमित है। इसका मतलब है कि यह रोलआउट अभी सार्वभौमिक प्लेटफ़ॉर्म बदलाव नहीं है। यह एक टियर-आधारित उत्पाद क्षमता है जो सशुल्क पहुंच से जुड़ी है, जो इस बात के अनुरूप है कि कई अग्रणी AI फीचरों का व्यवसायीकरण कैसे किया जा रहा है।

फिर भी, इस अपडेट का महत्व तत्काल ग्राहक आधार से बड़ा है। Google AI इमेज जेनरेशन के लिए एक ऐसा मॉडल परख रहा है जो व्यक्तिगत संदर्भ को वैकल्पिक सुधार नहीं बल्कि प्राथमिक इनपुट मानता है। यदि उपयोगकर्ता इसे अच्छी तरह स्वीकार करते हैं, तो यही तर्क अन्य बहु-मोडल निर्माण रूपों को भी आकार दे सकता है।

इस अर्थ में, यह सिर्फ एक इमेज-जेनरेशन अपडेट नहीं है। यह संकेत है कि उपभोक्ता AI उत्पाद किस दिशा में बढ़ रहे हैं। अगला चरण संभवतः इस बात से कम परिभाषित होगा कि सही प्रॉम्प्ट से कौन सबसे शानदार इमेज बना सकता है, और अधिक इस बात से कि कौन उपयोगकर्ता के अपने जीवन में स्वाभाविक रूप से जमी हुई जनरेशन दे सकता है, वह भी गोपनीयता और नियंत्रण को बनाए रखते हुए। Google Gemini को ठीक इसी बदलाव के लिए स्थिति में लाने की कोशिश कर रहा है।

यह लेख Google AI Blog की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on blog.google

जेमिनी में व्यक्तिगत संदर्भ और Google Photos से AI इमेज निर्माण बेहतर हुआ

Google AI इमेज जेनरेशन को प्रॉम्प्ट की जटिलता से हटाकर व्यक्तिगत संदर्भ की ओर ले जा रहा है

उत्पाद में बदलाव अब सामान्य जनरेशन से व्यक्तिगत जनरेशन की ओर है

OpenAI ने इन्फ्रास्ट्रक्चर काम और लंबे उपभोक्ता विजन के इर्द-गिर्द रोबोटिक्स को फिर से खड़ा किया है

Google Photos रचनात्मक आउटपुट में सीधे इनपुट बन रहा है

व्यापक AI प्रतिस्पर्धा में यह क्यों मायने रखता है

अध्ययन में पाया गया कि सामाजिक विज्ञान में एआई कोडिंग-एजेंट का उपयोग बेहद असमान है

रचनात्मक अवसर के साथ व्यावहारिक सीमाएँ भी हैं

Comments (0)

Related Articles

AI मॉडल ने रेसिपी की तर्क-प्रणाली को स्वाद-रसायन से अलग किया

MISUMI ने $1 अरब के AI निर्माण दांव के साथ Americas अभियान शुरू किया

Microsoft और Nvidia कथित तौर पर AI PCs को स्थानीय एजेंटों की ओर धकेल रहे हैं

Keep Reading