பட உருவாக்கத்தை மேலும் பயன்பாடுடையதாக மாற்றும் தயாரிப்பு வழிகாட்டி

ChatGPT-யுடன் images உருவாக்குவதற்கான புதிய Academy guide-ஐ OpenAI வெளியிட்டுள்ளது. Elaborate prompt writing-ஐ நம்பாமல், image generation மற்றும் editing-இலிருந்து சிறந்த முடிவுகளை விரும்பும் users-க்கு இது ஒரு நடைமுறை கட்டமைப்பை வழங்குகிறது. April 10-ஆம் தேதி வெளியிடப்பட்ட இந்த ஆவணம், image generation-ஐ நீண்ட அல்லது அலங்காரமான instructions-ஐ விட clarity, iteration, மற்றும் constraint ஆகியவற்றின் அடிப்படையில் இயங்கும் workflow ஆகக் காட்டுகிறது.

இது எளிமையாகத் தோன்றலாம், ஆனால் AI image tools எவ்வாறு அறிமுகப்படுத்தப்படுகின்றன என்பதில் ஒரு முக்கியமான product shift-ஐ இது பிரதிபலிக்கிறது. ஆரம்பத்தில் public use-இல் image generators பெரும்பாலும் prompt tricks, aesthetic keyword lists, மற்றும் trial-and-error experimentation ஆகியவற்றைச் சுற்றியே இருந்தன. OpenAI-யின் guidance அதற்கு மாற்றாக, tool-ஐ ஒரு collaborative production system போல அமைக்கிறது: image எதற்காக, subject மற்றும் setting என்ன, visual style எப்படியிருக்க வேண்டும் என்பதை வரையறுத்து, பின்னர் சிறிய, குறிவைத்த திருத்தங்கள் மூலம் முடிவை மேம்படுத்துவது.

மற்ற சொற்களில், novelty-யாக அல்லாமல், கட்டுப்படுத்தக்கூடிய, மீண்டும் செய்யக்கூடிய ஒரு பணியாக image generation-ஐ சாதாரணமாக்க நிறுவனம் முயல்கிறது. Editorial visuals, design concepts, marketing assets, அல்லது உள்ள existing images-இன் adaptations உருவாக்கும் users-க்கு அந்த வேறுபாடு முக்கியமானது.

முக்கிய பரிந்துரை: அலங்காரமாக அல்ல, தெளிவாக இருக்கவும்

Guide-இன் மிகத் தெளிவான கருத்துகளில் ஒன்று, ஒரு நல்ல image prompt நீளமாக இருக்க வேண்டிய அவசியமில்லை என்பதாகும். பெரும்பாலான சந்தர்ப்பங்களில் ஒன்று முதல் மூன்று தெளிவான sentences போதும் என்று OpenAI கூறுகிறது. படம் எதற்காக, முக்கிய subject என்ன, என்ன நடக்கிறது, அது எங்கு நடைபெறுகிறது, மற்றும் விரும்பப்படும் visual style என்ன என்பதை விளக்குவதே நோக்கம். Layout, framing, lighting அல்லது பிற constraints முக்கியமானவை என்றால், அவை நேரடியாகச் சேர்க்கப்பட வேண்டும்.

Clarity, clever phrasing-ஐ விட சிறப்பாக வேலை செய்கிறது என்பதை guide தெளிவாகக் கூறுகிறது, குறிப்பாக materials, texture, அல்லது light சார்ந்த விவரங்களில். “beautiful lighting” போன்ற மங்கலான மொழியைப் பயன்படுத்துவதற்குப் பதிலாக, குறிப்பிட்ட திசையிலிருந்து வரும் soft natural light போன்ற நேரடி விளக்கங்களை OpenAI பரிந்துரைக்கிறது. அந்த ஆலோசனை image prompting-ஐ creative writing-ஐ விட design briefing-க்கு நெருக்கமாக்குகிறது.

பல திருப்தியளிக்காத AI image முடிவுகள் mood-ஐ மட்டும் தெரிவிக்கும் ஆனால் போதுமான structure-ஐ கட்டுப்படுத்தாத prompts-இலிருந்து வருகின்றன என்பதால் இது பயனுள்ள வேறுபாடு. ஒரு model, பயனாளர் polished அல்லது cinematic ஒன்றை விரும்புகிறார் என்பதைப் புரிந்துகொள்ளலாம், ஆனால் composition-இல் திசைமாறி, தேவையற்ற elements சேர்த்து, intended use case-ஐ தவறவிடலாம். Guide-இன் பதில் instruction level-இல் ambiguity-ஐ குறைப்பதே.

திருத்தங்கள் இறுக்கமாக வரையறுக்கப்பட்டால் சிறப்பாக செயல்படும்

Existing images-ஐ edit செய்வதற்கான பகுதியில் இதே philosophy இன்னும் வலுவாக தெரிகிறது. என்ன மாற்ற வேண்டும், எது அப்படியே இருக்க வேண்டும் என்பதைச் சரியாகக் குறிப்பிடுமாறு OpenAI users-க்கு அறிவுறுத்துகிறது. அதன் எடுத்துக்காட்டு instruction நேர்மையானது: பெயரிடப்பட்ட ஒரு element-ஐ மட்டும் மாற்றி, மற்ற அனைத்தையும் முற்றிலும் அதேபடி வைத்திருக்கவும்.

இது முக்கியமானது, ஏனெனில் iterative editing தான் பல generative-image systems consistency-யை இழக்கும் இடம். ஒரு user background color-ஐ மாற்றலாம், brightness-ஐ adjust செய்யலாம், அல்லது composition மற்றும் subject identity-ஐ பாதுகாத்துக்கொண்டே ஒரு object-ஐ மாற்றலாம். பரந்த feedback model-ஐ முழு scene-ஐ மீண்டும் விளக்கத் தூண்டும். Targeted edits மற்றும் fixed constraints-ஐ மீண்டும் வலியுறுத்துதல் drift-ஐத் தடுக்க உதவும் என்று OpenAI-யின் guide கூறுகிறது.

சிறிய, படிப்படியான revisions மூலம் முடிவுகளை மேம்படுத்தவும் இந்த document பரிந்துரைக்கிறது. Core idea-யுடன் தொடங்கி, பின்னர் ஒரு நேரத்தில் ஒரு element-ஐ மட்டும் மாற்றுங்கள். உதாரண edits-ஆக image-ஐ மேலும் bright ஆக்குவது, colors-ஐ மங்கச் செய்வது, background-ஐ எளிமைப்படுத்துவது, அல்லது style-ஐ மாற்றியபடியே same composition-ஐ வைத்திருப்பது ஆகியவை குறிப்பிடப்படுகின்றன. குறிப்பிட்ட feedback-ஐ broad dissatisfaction-ஐ விட system எளிதாக பின்பற்ற முடியும் என்பதே இதன் செயல்முறை கருத்து.

இந்த workflow professional use-க்கு குறிப்பாகப் பொருந்துகிறது. Visual assets உருவாக்கும் teams-க்கு radical reinterpretation-ஐ விட controlled variation அதிகம் தேவைப்படலாம். Style-ஐ மாற்றியபடியே composition-ஐ பாதுகாக்கும் அல்லது ஒரு விஷயத்தைத் தவிர மற்ற அனைத்தையும் fixed-ஆக வைத்திருக்கக் கூடிய model, real production work-இல் இயல்பாகப் பொருந்தலாம்.

புதியவர்களைத் தாண்டியும் இந்த guide ஏன் முக்கியம்

ஒரு நிலையில், OpenAI-யின் வெளியீடு ஒரு tutorial ஆகும். மற்றொரு நிலையில், அது product maturity குறித்த ஒரு அறிவிப்பாகும். ChatGPT image generation-ஐ users சில நிமிடங்களில் “production-ready assets” ஆக refine செய்யக்கூடிய ஒன்றாக நிறுவனம் நிலைநிறுத்துகிறது; வெறும் experimental creative feature ஆக அல்ல. Plain-language prompts மூலம் original images உருவாக்க, variations கேட்க, composition அல்லது size-ஐ சரிசெய்ய, மற்றும் புதிய திசைகளை விரைவாக ஆராய users முடியும் என்று guide கூறுகிறது.

இந்த framing முக்கியமானது, ஏனெனில் இது entry barrier-ஐ குறைப்பதுடன் control எவ்வாறு பயன்படுத்தப்பட வேண்டும் என்பதற்கான எதிர்பார்ப்புகளையும் அமைக்கிறது. Users-ஐ ஒரு special syntax-ஐ கற்றுக்கொள்ளுமாறு கேட்பதற்குப் பதிலாக, OpenAI அவர்கள் art directors போல சிந்திக்கச் சொல்கிறது: objective, subject, environment, style, மற்றும் மாற்றமடைய முடியாத constraints ஆகியவற்றை வரையறுக்கவும்.

சேர்க்கப்பட்ட sample prompt இந்த அணுகுமுறையை உறுதிப்படுத்துகிறது. இதில் desk-இல் புதிய AI skill கற்றுக்கொள்கிற நபரின் polished editorial illustration, scene-இல் குறிப்பிட்ட objects, clean minimal background, மற்றும் logos, brand references, sci-fi imagery, மற்றும் overly abstract design-ஐத் தவிர்க்கும் instructions ஆகியவை கோரப்படுகின்றன. இந்த example சிக்கலானதாக இருப்பதால் குறிப்பிடத்தக்கது அல்ல. அது purpose-driven மற்றும் bounded என்பதால் குறிப்பிடத்தக்கது.

OpenAI-யின் guide வலியுறுத்துவது

  • பெரும்பாலான பயனுள்ள prompts ஒன்று முதல் மூன்று தெளிவான sentences-இல் எழுத முடியும்.
  • Prompts-இல் image-இன் purpose, subject, action, setting, மற்றும் visual style குறிப்பிடப்பட வேண்டும்.
  • Specific constraints fixed elements-ஐ பாதுகாக்கவும், unwanted changes-ஐ குறைக்கவும் உதவுகின்றன.
  • Editing broad rewrites-ஐ விட சிறிய, குறிவைத்த revisions வழியாக முன்னெடுக்கப்பட வேண்டும்.
  • மங்கலான அல்லது அலங்காரமான phrasing-ஐ விட நேரடி wording அதிக நம்பகமானது.

AI image tools experimentation-இலிருந்து routine use-க்கு நகரும் நிலையில், இத்தகைய guidance மேலும் முக்கியமாகும். போட்டித் கேள்வி இனி striking images யார் உருவாக்க முடியும் என்பதோடு மட்டும் இல்லை. சாதாரண instructions-ஐ revision cycles-ஐத் தாங்கக்கூடிய controllable outputs-ஆக யார் மாற்ற முடியும் என்பதுதான். OpenAI-யின் புதிய Academy guide அந்தத் தேவைக்கு ஒரு நடைமுறை பதிலாகும். அது magic-ஐ வாக்குறுதி அளிக்கவில்லை. ஒரு சிறந்த process-ஐ வாக்குறுதி அளிக்கிறது.

அதுவே முக்கியமான முன்னேற்றமாக இருக்கலாம். Generative tools-இன் வரலாறு, impressive capability ordinary usability-ஐ முந்திய தருணங்களால் நிரம்பியுள்ளது. Brevity, specificity, iteration ஆகியவற்றை மையமாகக் கொண்ட workflow-ஐ வெளியிடுவதன் மூலம் OpenAI அந்த இடைவெளியை குறைக்க முயல்கிறது. Users-க்கு செய்தி எளிது: சிறந்த images prompt mythology-யை விட model-க்கு செய்ய வேண்டிய துல்லியமான job-ஐ கொடுப்பதில்தான் அதிகம் சார்ந்திருக்கின்றன.

இந்த கட்டுரை OpenAI-யின் reporting-ஐ அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.

Originally published on openai.com