సాధారణ prompt సంక్లిష్టత నుంచి వ్యక్తిగత సందర్భం వైపు AI చిత్రం సృష్టిని Google మళ్లిస్తోంది

Google, Personal Intelligence‌ను Google Photos మరియు Nano Banana 2 model‌తో కలిపి మరింత వ్యక్తిగతీకరించిన చిత్రాలను సృష్టించే కొత్త Gemini app features‌ను పరిచయం చేస్తోంది. ప్రధాన భావన సులభం: పొడవైన, జాగ్రత్తగా రాసిన prompt‌లు లేదా పదే పదే చేసే manual uploads‌పై ఆధారపడకుండా, app ఒక వ్యక్తి నిల్వ చేసిన ప్రాధాన్యతలు మరియు అనుసంధానించిన photo library‌ను ఉపయోగించి వారి జీవితానికి మరింత దగ్గరగా ఉండే చిత్రాలను సృష్టించగలదు.

కంపెనీ ప్రకారం, ఈ feature రాబోయే కొన్ని రోజుల్లో U.S. లోని Google AI Plus, Pro, లేదా Ultra subscribers‌కు విడుదల అవుతోంది. అనుసంధానించిన accounts‌లోని సంబంధిత సందర్భాన్ని తీసుకుని, తాము లేదా తమ దగ్గరి వారు పాల్గొనే దృశ్యాలను కోరుకోవచ్చు అని Google చెబుతోంది.

ఉత్పత్తి మార్పు ఇప్పుడు సాధారణ సృష్టి నుంచి వ్యక్తిగతీకృత సృష్టికి మారుతోంది

ప్రధాన AI image tools చాలా వరకూ ఇప్పటికీ explicit prompting‌పై ఆధారపడుతున్నాయి. వినియోగదారులు subject, setting, style, మరియు నిలుపుకోవాలనుకునే reference details‌ను వివరిస్తారు. Google యొక్క update వేరే దిశను సూచిస్తోంది. వినియోగదారి ఇప్పటికే కలిగిన context నుంచి Gemini మరింత అర్థం చేసుకునేలా చేసి, specification భారాన్ని తగ్గించేందుకు కంపెనీ ప్రయత్నిస్తోంది.

ఇది ముఖ్యమైనది, ఎందుకంటే product quality అంటే ఏమిటో ఇది మార్చేస్తుంది. సంప్రదాయ image generator‌లో quality‌ను సాధారణంగా visual fidelity లేదా stylistic control‌తో కొలుస్తారు. వ్యక్తిగతీకృత generator‌లో relevance కూడా అంతే ముఖ్యమవుతుంది. ఉపయోగకరమైన ఫలితం అంటే కేవలం సాంకేతికంగా మెరుగు పరచబడిన చిత్రం మాత్రమే కాదు. తక్కువ setup friction‌తో సరైన వ్యక్తులు, ప్రాధాన్యతలు, మరియు నేపథ్య వివరాలను ప్రతిబింబించే చిత్రం.

consumer generative AI భవిష్యత్తు models‌ను సారాంశంగా మరింత సామర్థ్యం కలిగినవిగా చేయడమే కాకుండా, అభ్యర్థిస్తున్న వినియోగదారుడి పట్ల మరింత అవగాహన కలిగినవిగా చేయడమూ అని Google వాదిస్తోంది. Geminiలో ఆ ఆలోచనకు company framework Personal Intelligence.

Google Photos సృజనాత్మక output‌లో ప్రత్యక్ష input అవుతోంది

ప్రకటనలో అత్యంత ప్రభావవంతమైన భాగాలలో ఒకటి Google Photosతో integration. తమ photo libraryని అనుసంధానించడం ద్వారా generated images‌లో తమను మరియు తమ కుటుంబ సభ్యులను చేర్చుకోవచ్చని, మొదటి output సరిపోకపోతే reference photos‌ను మార్చవచ్చని లేదా ఫలితాలను fine-tune చేయవచ్చని కంపెనీ చెబుతోంది.

ఇది ఒక ముఖ్యమైన product move, ఎందుకంటే photo libraries‌లో సాధారణ AI systems‌కు చాలాసార్లు లేని, నిలకడైన వ్యక్తిగత దృశ్య సందర్భం ఉంటుంది. ఆ సందర్భాన్ని ఉపయోగించి, Gemini 'ఒక కుటుంబం' లేదా 'నాతో పోలి ఉన్న వ్యక్తి' వంటి సాధ్యమైన చిత్రాలను సృష్టించడం నుంచి, వినియోగదారి జీవితంలో మరింత నిర్దిష్టంగా ఆధారపడిన దాన్ని తయారు చేయడంలోకి మారగలదు.

అదే సమయంలో, ఈ feature trust మరియు personal data handling ప్రమాణాన్ని కూడా పెంచుతుంది. Gemini వినియోగదారి private photo library‌పై తమ models‌ను train చేయదని Google ప్రకటనలో నేరుగా పేర్కొంది. ఆ హామీ product pitchలో కేంద్ర భాగం. మరింత వ్యక్తిగతంగా మారుతూ ఉపయోగకరంగా మారే tool, నిర్వచనప్రకారం మరింత సున్నితమైనదిగా కూడా మారుతుంది.

విస్తృత AI పోటీలో ఇది ఎందుకు ముఖ్యం

ఈ update, పెద్ద consumer AI platforms ఇప్పుడు దేనిపై పోటీ పడుతున్నాయో చూపిస్తోంది: కేవలం model performance‌పై కాదు, ecosystem advantage‌పై కూడా. ఈ రకమైన productలో Googleకు సహజమైన లాభం ఉంది, ఎందుకంటే అది ఇప్పటికే Photos మరియు విస్తృత account-level preference signals వంటి సేవలపై నిలబడి ఉంది, వీటిని చాలా మంది వినియోగదారులు రోజూ ఉపయోగిస్తారు. అంటే, కొత్త data layer‌ను మొదటి నుంచి నిర్మించాల్సిన అవసరం లేకుండా personalization features‌ను నిర్మించగలదు.

ఇది వ్యూహాత్మకంగా ముఖ్యం. consumer AI products, ఒకసారి ఉపయోగించే generators‌ నుంచి స్థిరమైన assistants‌గా మారాలని ప్రయత్నిస్తున్నాయి. అది బాగా చేయాలంటే memory, context, మరియు ప్రజలు ఇప్పటికే digital servicesలో నిల్వ చేసుకున్న సమాచారానికి access అవసరం. Gemini యొక్క కొత్త image features, isolated prompt box నుంచి context-rich assistant‌కు జరుగుతున్న పెద్ద మార్పుకు సరిపోతాయి.

ఈ rollout multimodal generation‌ను mass-market ఉపయోగానికి ఎలా package చేస్తున్నారో కూడా చూపిస్తుంది. Google దీనిని విస్తృత prompt engineering అవసరమయ్యే expert creative suite‌గా కాదు, తేలికైన, సహజమైన అనుభవంగా చూపిస్తోంది: ఒక scene అడగండి, system‌ను మీ context‌ను ఉపయోగించనివ్వండి, తర్వాత అవసరమైతే refine చేయండి. ఈ రకం సరళీకరణ ప్రధాన ప్రవేశానికి పెద్ద యుద్ధభూమి అయ్యే అవకాశం ఉంది.

సృజనాత్మక అవకాశానికి ప్రాయోగిక పరిమితులు కూడా ఉన్నాయి

ప్రకటన సౌలభ్యం మరియు వ్యక్తిగతీకరణపై దృష్టి పెడుతున్నప్పటికీ, refinement‌పై వినియోగదారుడే నియంత్రణలో ఉంటాడని కూడా స్పష్టంగా చెబుతోంది. వారు outputs‌ను సరిచేయవచ్చు మరియు reference photos‌ను మార్చవచ్చు. ఇది context-aware generator కూడా మొదటి ప్రయత్నంలో ఎప్పుడూ సరైన ఎంపికలు చేయదని Google గుర్తించినట్లు సూచిస్తుంది. Personalization friction‌ను తగ్గిస్తుంది; iteration‌ను పూర్తిగా తొలగించదు.

ఈ feature, కనీసం ప్రారంభంలో, నిర్దిష్ట Google AI plans‌లోని U.S. subscribers‌కే పరిమితం. అంటే rollout ఇప్పటికీ universal platform change కాదు. ఇది paid access‌కు అనుసంధానించిన tiered product capability, ఇది ప్రముఖ AI features ఎలా commercialize అవుతున్నాయో అదే విధంగా ఉంది.

అయినా, ఈ update ప్రాధాన్యం తక్షణ subscriber base కంటే పెద్దది. వ్యక్తిగత సందర్భాన్ని optional enhancement‌గా కాకుండా primary input‌గా పరిగణించే AI image generation model‌ను Google పరీక్షిస్తోంది. వినియోగదారులు సానుకూలంగా స్పందిస్తే, ఇదే logic ఇతర multimodal creation రూపాలను కూడా ఆకృతీకరించవచ్చు.

ఆ అర్థంలో, ఇది కేవలం image-generation update కాదు. consumer AI products ఎటు వెళ్తున్నాయనే దానికి ఒక signal. తదుపరి దశ perfect prompt‌తో ఎవరెక్కువ అద్భుతమైన చిత్రం సృష్టించగలరు అనే దానికంటే, privacy మరియు control‌ను కాపాడుతూ వినియోగదారి స్వంత జీవితంలో సహజంగా ఆధారపడిన generation‌ను ఎవరు ఇవ్వగలరు అన్నదానితో ఎక్కువగా నిర్వచించబడుతుంది. Geminiను ఆ మార్పుకు సరిపడేలా ఉంచేందుకు Google ప్రయత్నిస్తోంది.

ఈ వ్యాసం Google AI Blog నివేదికపై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.

Originally published on blog.google