Google Gemini 3.1 Flash-Lite ఆవిష్కరించింది: వేగవంతమైన, చాలా సుళువైన Gemini 3 మాదిరి

ఖర్చు-ఉచితమైన AI మాదిరుల తర్కం

Google Gemini 3.1 Flash-Lite ఆవిష్కరించారు, సంస్థ దీనిని Gemini 3 సిరీజ్‌లో వేగవంతమైన మరియు సుళువైన మాదిరిగా వర్ణించింది. ఈ విడుదల AI మాదిరి కుటుంబాల యొక్క నమూనాను కొనసాగిస్తుంది—ఇక్కడ చాలా సూచిత మాదిరులు కష్టమైన పనులకు సేవ చేస్తుండగా చిన్న, వేగవంతమైన, సుళువైన వైవిధ్యాలు ఉచ్చ-వాల్యూమ్ కార్యభారాలను నిర్వహిస్తాయి AI-at-స్కేల్ నిస్సరణ యొక్క ఆర్థిక గణితాన్ని సృష్టిస్తుంది లేదా చెదరగొట్టుతుంది. Gemini 3.1 Flash-Lite Gemini 3 కుటుంబం యొక్క సమర్థ చివర యొక్క కూర్చున్న, అనువర్తనాలకు రూపొందించిన ఇక్కడ inference ఖర్చు మరియు ప్రతిస్పందన సమయం ప్రధాన అడ్డంకులు.

Flash-Lite ఎటువంటి కోసం ఉచితమైనది

పేరు మాదిరి యొక్క స్థితిని స్పష్టంగా సూచిస్తుంది. Flash వేగం మరియు సమర్థతను సూచిస్తుంది—Flash హోదా Gemini కుటుంబం అంతటా వైవిధ్యాలకు వర్తించింది ఇవి గరిష్ట సామర్థ్యం కంటే వేగవంతమైన, సుళువైన inference కోసం ఉచితమైనవి. Lite ప్రమాణ Flash వైవిధ్యం కంటే parameter సంఖ్య మరియు గణనీయ అవసరాలలో మరో పగ సూచిస్తుంది. కలిపి, ఈ లక్షణాలు Flash-Lite కోసం అనువర్తనాలకు చేస్తాయి ఇవి పెద్ద మాదిరుల inference బడ్జెట్ లేకుండా ఉచ్చ వాల్యూమ్‌లో AI సామర్థ్యాలను చెప్పాలి..

నిజమైన ఉపయోగ సందర్భాలు వర్గీకరణ మరియు మార్గ దర్శన పనులను కలిగి ఉంటాయి ఇక్కడ AI మాదిరి ఇన్‌కమింగ్ డేటాను త్వరగా వర్గీకరించాలి—customer సపోర్టు టిక్కెట్ మార్గ దర్శన, సంఘటన నిర్ణయం, spam గుర్తుపట్టుకుంటుంది, డాక్యుమెంట్ వర్గీకరణ. ఈ కార్యభారాలు పెద్ద సంస్థలు మరియు consumer ప్ల్యాట్‌ఫార్మ్‌ల స్కేల్‌పై భారీ query వాల్యూమ్‌లను ఉత్పత్తి చేస్తాయి; ప్రతి query కోసం frontier-స్కేల్ మాదిరిని ఉపయోగించటం ఆర్థికమైనది ఖరీద చేస్తుంది. బాగా-రూపొందించిన lite మాదిరి ఇవి ఖచ్చితంగా మరియు సుళువుగా ఈ పనులను నిర్వహిస్తాయి, ఆర్థిక గణితాన్ని సక్షమ చేస్తాయి ఇది నిజ-పెద్ద-స్కేల్ AI సమన్వయ సాధ్యమైనదిగా చేస్తుంది..

సారాంశ నిర్మాణం, short-form సంఘటన సృష్టి, search ఫలితం ప్రక్రియ, మరియు real-time సిఫారసు స్కోరింగ్ వర్ధిత ఉపయోగ సందర్భాలు ఇక్కడ Flash-Lite ఉచితమైన వేగం మరియు ఖర్చు విన్నపటి పద్దతిలో నిజమైన నిస్సరణ సాధ్యమైనదిగా అనువదిస్తాయి భారీ మాదిరులు నిచ్చని చేయలేవు. Real-time అనువర్తనాలలో ఎక్కడ users తక్షణ ప్రతిస్పందనలను ఆశించారు, చిన్న మాదిరి latency ప్రయోజనాలు ఖర్చు అంతగా ముఖ్యమైనవి.

A Gatik autonomous truck at a PepsiCo distribution center.

Gatik PepsiCo నెట్‌వర్క్‌లో autonomous freight పాత్రను లోతుగా పెంచుతోంది

PepsiCo, Gatikతో తన పనిని multi-year deal ద్వారా విస్తరించింది; ఇది North American food and beverage logisticsలో autonomous middle-mile freightను మరింత లోతుగా తీసుకెళ్తోంది.

Read article

Performance మరియు సామర్థ్యం

Google Gemini 3.1 Flash-Lite నుండి సరిపోలిక rivals స్థానం సామర్థ్యం barracks నుండి విస్తృత benchmark డేటా విడుదల చేయలేదు, కానీ మాదిరి OpenAI GPT-4o Mini, Anthropic Claude Haiku, Meta చిన్న Llama వైవిధ్యాలతో పోటీ చేయడానికి ఉంచిన. Gemini 3 architecture సరిదిద్దలు ఇవి కుటుంబం చిన్న మాదిరులకు ప్రయోజనం చేస్తాయి—structured డేటా పై మెరుగైన తర్కం ఉంటుందని మరియు మెరుగైన సూచన కిందటవల—Flash-Lite వైవిధ్యంలో ప్రవాహితమవుతుంది అని పేర్కొనబడింది, సామర్థ్యం బందాలు సహజంగా తీసుకున్న parameter సంఖ్య కారణంగా తక్కువ..

అనువర్తనాల కోసం ఇవి long-context తర్కం, సంక్లిష్ట multi-step విశ్లేషణ, లేదా సూక్ష్మ creative నిర్మాణం చేయాల్సిన, Flash-Lite సామర్థ్యం సిండ్ చాలా నిచ్చని. developers కోసం సరిపోలిక ప్రశ్న ఇది కాదు ఇది GPT-4o లేదా Gemini Ultra చేసిన కష్టమైన తర్కం బెంచ్‌మార్క్‌ల పోలుకుంటుందా—ఇది కూడా—కానీ చేసిన సామర్థ్యం నిర్దిష్ట చేవి సరిపోలు లేదా చేసిన ఖర్చు మరియు latency బందాలు అనువర్తనాన్ని ఆర్థికమైనది చేయవుటకు..

టిర్డ్ మాదిరి మార్కెట్

Gemini 3.1 Flash-Lite విడుదల వాణిజ్య AI మాదిరు మార్కెట్ యొక్క టిర్డ్ నిర్మాణంలో రిపోర్టీజ సూచిస్తుంది సంస్థ software మార్కెట్‌లు సాధారణంగా లెవలు నిర్మాణం చేస్తాయి. మార్కెట్ కుటుంబం వెనుకకు రోజుల్లో, కొనుగోలువారు ఆవశ్యకమైన ఎంపిక లేదా దానికి సంబంధం లేనిదానిను ఎంచుకోండి. మార్కెట్ రోగిందిస్తున్నప్పుడు, సంస్థలను సామర్థ్యం, ఖర్చు, మరియు ఉపయోగ సందర్భం విస్తృతం చేస్తుంది. AI మాదిరు మార్కెట్ ఈ పెరుగుదల ద్వారా విడిగా ఎత్తుకుంది.

Google ఇపుడు Gemini Ultra గరిష్ట సామర్థ్యం కోసం, Gemini Pro సాధారణ వృత్తిపరమైన పనుల కోసం, Gemini Flash సమర్థత-ఉచితమైన అనువర్తనాల కోసం, మరియు Gemini Flash-Lite సమర్థ నిర్గమం కనీసం ఖర్చుకు ఇస్తుంది. ఈ టిర్డ్ నిర్మాణం Google కు ఉపయోగ సందర్భాల సంపూర్ణ జాబితా నుండి రాజస్వం సంగ్రహిస్తుంది—Ultra కష్టమైన ప్రయోగాలు నిర్వహణ AI పరిశోధకుడు నుండి సమర్థ్య కు millions సపోర్టు టిక్కెట్‌ల మార్గ సంస్థ వరకు. రిద్ధులు సమానమైన టిర్డ్‌లను రూపొందించారు, మరియు ప్రతి టిర్డ్‌ని సరఫరాదారుల మధ్య భేదం ఇపుడు ప్రధానంగా సామర్థ్యం బెంచ్‌మార్క్, ఖర్చు, మరియు సమన్వయ పరిస్థితి సూచిస్తుంది..

Google మరియు OpenAI చైనాతో సంబంధం ఉన్న వేర్వేరు AI దుర్వినియోగ కార్యకలాపాలను బయటపెట్టాయి

Google ఒక AI-సক্ষম మోసపు నెట్‌వర్క్‌పై దావా వేసింది, అదే సమయంలో US చర్చలు మరియు మౌలిక సదుపాయాల కథనాలను లక్ష్యంగా చేసుకున్న చైనాతో సంబంధం ఉన్న రెండు ప్రభావ క్లస్టర్లను అడ్డుకున్నామని OpenAI తెలిపింది.

Read article

AI అభివృద్ధి ఆర్థిక గణితం కోసం ఫలితాలు

తక్కువ ఖర్చుకు సామర్థ్య lite మాదిరుల వాణిజ్య లభ్యత రంగ AI సమన్వయ ఆర్థిక గణితాన్ని మార్చటం ఆరంభించటం. అనువర్తనాలు ఇవి గతంలో పెద్ద ఖర్చు-నిషిద్ధ థీలు—ప్రతి customer సంభాషణకు AI సహాయం, ప్రతి డాక్యుమెంట్ AI సమీక్ష, ప్రతి ఇన్‌కమింగ్ డేటా బిందువు AI తెరలు—inference ఖర్చు ప్రతి query చిన్న సంఖ్యలో పరిమితం చేయుటకు ఆర్థికమైనది సక్షమ. Gemini 3.1 Flash-Lite చల్లని వేగం తక్కువ తర్కం భాగం ఖర్చు తక్కువీకరణ సరఫరాదారుల AI ఆర్థికమైనదిగా నిస్సరణ చేయుట సాధ్యమైన సరిహద్దు విస్తరిస్తుంది.

ఈ నిবంధనం Google AI Blog reporting ఆధారితం. అసలైన నిబంధనం చదువుకోండి.

Originally published on blog.google

Google Gemini 3.1 Flash-Lite ఉচ్చ-స్థాయ AI నిస్సరణ కోసం ప్రారంభించింది