సాధారణ prompt సంక్లిష్టత నుంచి వ్యక్తిగత సందర్భం వైపు AI చిత్రం సృష్టిని Google మళ్లిస్తోంది
Google, Personal Intelligenceను Google Photos మరియు Nano Banana 2 modelతో కలిపి మరింత వ్యక్తిగతీకరించిన చిత్రాలను సృష్టించే కొత్త Gemini app featuresను పరిచయం చేస్తోంది. ప్రధాన భావన సులభం: పొడవైన, జాగ్రత్తగా రాసిన promptలు లేదా పదే పదే చేసే manual uploadsపై ఆధారపడకుండా, app ఒక వ్యక్తి నిల్వ చేసిన ప్రాధాన్యతలు మరియు అనుసంధానించిన photo libraryను ఉపయోగించి వారి జీవితానికి మరింత దగ్గరగా ఉండే చిత్రాలను సృష్టించగలదు.
కంపెనీ ప్రకారం, ఈ feature రాబోయే కొన్ని రోజుల్లో U.S. లోని Google AI Plus, Pro, లేదా Ultra subscribersకు విడుదల అవుతోంది. అనుసంధానించిన accountsలోని సంబంధిత సందర్భాన్ని తీసుకుని, తాము లేదా తమ దగ్గరి వారు పాల్గొనే దృశ్యాలను కోరుకోవచ్చు అని Google చెబుతోంది.
ఉత్పత్తి మార్పు ఇప్పుడు సాధారణ సృష్టి నుంచి వ్యక్తిగతీకృత సృష్టికి మారుతోంది
ప్రధాన AI image tools చాలా వరకూ ఇప్పటికీ explicit promptingపై ఆధారపడుతున్నాయి. వినియోగదారులు subject, setting, style, మరియు నిలుపుకోవాలనుకునే reference detailsను వివరిస్తారు. Google యొక్క update వేరే దిశను సూచిస్తోంది. వినియోగదారి ఇప్పటికే కలిగిన context నుంచి Gemini మరింత అర్థం చేసుకునేలా చేసి, specification భారాన్ని తగ్గించేందుకు కంపెనీ ప్రయత్నిస్తోంది.
ఇది ముఖ్యమైనది, ఎందుకంటే product quality అంటే ఏమిటో ఇది మార్చేస్తుంది. సంప్రదాయ image generatorలో qualityను సాధారణంగా visual fidelity లేదా stylistic controlతో కొలుస్తారు. వ్యక్తిగతీకృత generatorలో relevance కూడా అంతే ముఖ్యమవుతుంది. ఉపయోగకరమైన ఫలితం అంటే కేవలం సాంకేతికంగా మెరుగు పరచబడిన చిత్రం మాత్రమే కాదు. తక్కువ setup frictionతో సరైన వ్యక్తులు, ప్రాధాన్యతలు, మరియు నేపథ్య వివరాలను ప్రతిబింబించే చిత్రం.
consumer generative AI భవిష్యత్తు modelsను సారాంశంగా మరింత సామర్థ్యం కలిగినవిగా చేయడమే కాకుండా, అభ్యర్థిస్తున్న వినియోగదారుడి పట్ల మరింత అవగాహన కలిగినవిగా చేయడమూ అని Google వాదిస్తోంది. Geminiలో ఆ ఆలోచనకు company framework Personal Intelligence.
Google Photos సృజనాత్మక outputలో ప్రత్యక్ష input అవుతోంది
ప్రకటనలో అత్యంత ప్రభావవంతమైన భాగాలలో ఒకటి Google Photosతో integration. తమ photo libraryని అనుసంధానించడం ద్వారా generated imagesలో తమను మరియు తమ కుటుంబ సభ్యులను చేర్చుకోవచ్చని, మొదటి output సరిపోకపోతే reference photosను మార్చవచ్చని లేదా ఫలితాలను fine-tune చేయవచ్చని కంపెనీ చెబుతోంది.
ఇది ఒక ముఖ్యమైన product move, ఎందుకంటే photo librariesలో సాధారణ AI systemsకు చాలాసార్లు లేని, నిలకడైన వ్యక్తిగత దృశ్య సందర్భం ఉంటుంది. ఆ సందర్భాన్ని ఉపయోగించి, Gemini 'ఒక కుటుంబం' లేదా 'నాతో పోలి ఉన్న వ్యక్తి' వంటి సాధ్యమైన చిత్రాలను సృష్టించడం నుంచి, వినియోగదారి జీవితంలో మరింత నిర్దిష్టంగా ఆధారపడిన దాన్ని తయారు చేయడంలోకి మారగలదు.
అదే సమయంలో, ఈ feature trust మరియు personal data handling ప్రమాణాన్ని కూడా పెంచుతుంది. Gemini వినియోగదారి private photo libraryపై తమ modelsను train చేయదని Google ప్రకటనలో నేరుగా పేర్కొంది. ఆ హామీ product pitchలో కేంద్ర భాగం. మరింత వ్యక్తిగతంగా మారుతూ ఉపయోగకరంగా మారే tool, నిర్వచనప్రకారం మరింత సున్నితమైనదిగా కూడా మారుతుంది.
విస్తృత AI పోటీలో ఇది ఎందుకు ముఖ్యం
ఈ update, పెద్ద consumer AI platforms ఇప్పుడు దేనిపై పోటీ పడుతున్నాయో చూపిస్తోంది: కేవలం model performanceపై కాదు, ecosystem advantageపై కూడా. ఈ రకమైన productలో Googleకు సహజమైన లాభం ఉంది, ఎందుకంటే అది ఇప్పటికే Photos మరియు విస్తృత account-level preference signals వంటి సేవలపై నిలబడి ఉంది, వీటిని చాలా మంది వినియోగదారులు రోజూ ఉపయోగిస్తారు. అంటే, కొత్త data layerను మొదటి నుంచి నిర్మించాల్సిన అవసరం లేకుండా personalization featuresను నిర్మించగలదు.
ఇది వ్యూహాత్మకంగా ముఖ్యం. consumer AI products, ఒకసారి ఉపయోగించే generators నుంచి స్థిరమైన assistantsగా మారాలని ప్రయత్నిస్తున్నాయి. అది బాగా చేయాలంటే memory, context, మరియు ప్రజలు ఇప్పటికే digital servicesలో నిల్వ చేసుకున్న సమాచారానికి access అవసరం. Gemini యొక్క కొత్త image features, isolated prompt box నుంచి context-rich assistantకు జరుగుతున్న పెద్ద మార్పుకు సరిపోతాయి.
ఈ rollout multimodal generationను mass-market ఉపయోగానికి ఎలా package చేస్తున్నారో కూడా చూపిస్తుంది. Google దీనిని విస్తృత prompt engineering అవసరమయ్యే expert creative suiteగా కాదు, తేలికైన, సహజమైన అనుభవంగా చూపిస్తోంది: ఒక scene అడగండి, systemను మీ contextను ఉపయోగించనివ్వండి, తర్వాత అవసరమైతే refine చేయండి. ఈ రకం సరళీకరణ ప్రధాన ప్రవేశానికి పెద్ద యుద్ధభూమి అయ్యే అవకాశం ఉంది.
సృజనాత్మక అవకాశానికి ప్రాయోగిక పరిమితులు కూడా ఉన్నాయి
ప్రకటన సౌలభ్యం మరియు వ్యక్తిగతీకరణపై దృష్టి పెడుతున్నప్పటికీ, refinementపై వినియోగదారుడే నియంత్రణలో ఉంటాడని కూడా స్పష్టంగా చెబుతోంది. వారు outputsను సరిచేయవచ్చు మరియు reference photosను మార్చవచ్చు. ఇది context-aware generator కూడా మొదటి ప్రయత్నంలో ఎప్పుడూ సరైన ఎంపికలు చేయదని Google గుర్తించినట్లు సూచిస్తుంది. Personalization frictionను తగ్గిస్తుంది; iterationను పూర్తిగా తొలగించదు.
ఈ feature, కనీసం ప్రారంభంలో, నిర్దిష్ట Google AI plansలోని U.S. subscribersకే పరిమితం. అంటే rollout ఇప్పటికీ universal platform change కాదు. ఇది paid accessకు అనుసంధానించిన tiered product capability, ఇది ప్రముఖ AI features ఎలా commercialize అవుతున్నాయో అదే విధంగా ఉంది.
అయినా, ఈ update ప్రాధాన్యం తక్షణ subscriber base కంటే పెద్దది. వ్యక్తిగత సందర్భాన్ని optional enhancementగా కాకుండా primary inputగా పరిగణించే AI image generation modelను Google పరీక్షిస్తోంది. వినియోగదారులు సానుకూలంగా స్పందిస్తే, ఇదే logic ఇతర multimodal creation రూపాలను కూడా ఆకృతీకరించవచ్చు.
ఆ అర్థంలో, ఇది కేవలం image-generation update కాదు. consumer AI products ఎటు వెళ్తున్నాయనే దానికి ఒక signal. తదుపరి దశ perfect promptతో ఎవరెక్కువ అద్భుతమైన చిత్రం సృష్టించగలరు అనే దానికంటే, privacy మరియు controlను కాపాడుతూ వినియోగదారి స్వంత జీవితంలో సహజంగా ఆధారపడిన generationను ఎవరు ఇవ్వగలరు అన్నదానితో ఎక్కువగా నిర్వచించబడుతుంది. Geminiను ఆ మార్పుకు సరిపడేలా ఉంచేందుకు Google ప్రయత్నిస్తోంది.
ఈ వ్యాసం Google AI Blog నివేదికపై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.
Originally published on blog.google



