ابزارها و گجت‌ها

هوش مصنوعی نانو بنانا nano-banana چیست؟ آموزش تصویری نصب و استفاده

مدل هوش مصنوعی گوگل با نام Gemini 2.5 Flash Image (nano-banana) گام مهم تیم هوش مصنوعی گوگل به‌سمت ادیت تصاویر بصورت پایدار است؛ با این حال موفقیت عملی آن به نحوهٔ به‌کارگیری، دستورالعمل‌ها و آگاهی کاربران نسبت به نحوه استفاده از آن بستگی دارد.

مدل نانو بنانا nano-banana گوگل – تغییر تصویر رامبد جوان

فهرست دسترسی سریع

نانوبنانا 🍌 چیست؟

گوگل اخیراً از NanoBanana (با نام دیگر Gemini 2.5 Flash Image) رونمایی کرده است؛ مدلی که با معماری مولتی‌مودال بومی ساخته شده و قادر است متن و تصویر را در یک مرحله پردازش کند.
این ویژگی، قابلیت‌هایی مثل ویرایش تعاملی تصاویر، ترکیب چند تصویر، رندر متون دقیق و منطق پیشرفته را ممکن می‌سازد.

Nano Banana Google (با نام دیگر Gemini 2.5 Flash Image)

Gemini 2.5 Flash Image: ویرایش تصاویر با دقت بی‌سابقه

گوگل دیپ‌مایند نسخهٔ جدید مدل تصویری خود را با نام Gemini 2.5 Flash Image (که در میانهٔ سروصداها «nano-banana» لقب گرفت) رونمایی کرده است. نکتهٔ برجسته این نسخه، توانایی انجام ویرایش‌های دقیق و حفظ یکپارچگی شخصیت‌ها (یک شخص، حیوان خانگی یا محصول) در چند تصویر و چند دورِ ویرایشی است؛ قابلیتی که پیش‌تر یکی از نقاط ضعف ابزارهای ویرایش تصویری مبتنی بر هوش مصنوعی بود.

خبر داغ ۱۴ شهریور(این مطلب بصورت مداوم بروز خواهد شد)

یکی از ویژگی‌های کلیدی نانو بنانا، حفظ شباهت و یکپارچگی چهره‌ها در تصاویر است؛ قابلیتی که همیشه یکی از چالش‌های اصلی مدل‌های ویرایشگر تصویر بوده است. افزون بر این، کاربران می‌توانند چندین عکس را به‌طور هم‌زمان بارگذاری کرده، سبک‌های هنری مختلف را منتقل کنند و حتی در چند مرحله با پرامپت‌های متوالی، تغییرات دلخواه خود را اعمال کنند.

این محبوبیت گسترده باعث شده که جمینی در رتبه‌بندی فروشگاه‌ها جهشی چشمگیر داشته باشد؛ اکنون در اپ استور جایگاه دوم بخش Productivity و در پلی استور رتبه ۱۳ جدول اپلیکیشن‌های رایگان را در اختیار دارد. حضور ایموجی موز در نوار پرامپت جمینی و حتی حساب کاربری اختصاصی @NanoBanana، نشان می‌دهد که گوگل به‌طور رسمی این نام غیررسمی را پذیرفته است.

به موازات این دستاورد، گوگل فوتوز نیز نسخه‌ی Veo 3 را برای تبدیل عکس به ویدئو منتشر کرده که کیفیت بالاتری نسبت به Veo 2 ارائه می‌دهد و اکنون برای تمامی کاربران در دسترس است.

ویژگی‌های کلیدی مدل “nano-banana”

  1. تبدیل متن به تصویر: تولید تصاویر باکیفیت از توضیحات ساده یا پیچیده.
  2. ویرایش تصویر با متن: افزودن، حذف یا تغییر عناصر، استایل یا رنگ‌ها.
  3. حفظ یکپارچگی شخصیت‌ها:
    کاربران می‌توانند افراد، حیوانات خانگی یا محصولات را در صحنه‌های مختلف بدون تغییر ظاهر اصلی آن‌ها ویرایش کنند. این شامل تغییر لباس، مدل مو، دوره زمانی یا محیط است.
  4. ترکیب چند تصویر:
    مدل قادر است چند تصویر را با هم ترکیب کرده و تغییرات خاصی بر اساس دستور زبان طبیعی اعمال کند. این امکان برای ایجاد صحنه‌های جدید یا آزمایش ایده‌های طراحی بسیار کاربردی است.
  5. اصلاح تدریجی یا ویرایش چندمرحله‌ای (Multi-turn Editing):
    کاربران می‌توانند چندین تغییر متوالی را روی تصویر خود اعمال کنند؛ مثلاً اضافه کردن مبلمان، تغییر دکوراسیون، یا اعمال الگوهای مختلف از تصاویر دیگر.
  6. ایمنی و علامت‌گذاری تصاویر:
    هر تصویر تولیدشده شامل علامت واضح AI و یک واترمارک دیجیتال نامرئی SynthID است. گوگل اعلام کرده که SynthID حتی پس از ویرایش‌های رایج قابل شناسایی باقی می‌ماند، تا اصالت تصاویر مصنوعی قابل تأیید باشد.
  7. رندر متن: ایجاد تصاویر با متن واضح و درست (برای لوگو، پوستر، نمودار و …).
کاربردها و مزایای مدل تولید تصویر گوگل

کاربردها و مزایا

  • تبلیغات و برندینگ: حفظ ظاهر محصول یا کاراکتر در کمپین‌های تصویری متعدد؛ مناسب برای تولید مجموعهٔ تصاویر هم‌پوشان (consistency).
  • تولید محتوای محصول: نمایش محصول از زوایا و محیط‌های مختلف بدون نیاز به استقاده متعدد از فتو‌شات‌.
  • نمونه‌سازی سریع در طراحی داخلی و تبلیغات: تغییر دکور، افزودن مبلمان یا الگوها در یک اتاق به‌صورت مرحله‌ای.
  • خلاقیت و هنر دیجیتال: ترکیب عناصر از تصاویر گوناگون برای خلق آثار جدید با حفظ یک هویت بصری.

کاربردی دیگر مدل نانوبنانا nano-banana گوگل حذف اشیاء از تصاویر و ایجاد مدل‌های سه بعدی از آنها برای بازی‌ها است!

حذف اشیاء از تصاویر و ایجاد مدل‌های سه بعدی از آنها برای بازی‌ها است!

الف) تولید صحنه‌های فوتورئالیستی (واقع‌گرایانه)

برای تولید تصاویر واقعی باید مثل یک عکاس فکر کنید. زاویه دوربین، نوع لنز، نورپردازی و جزئیات دقیق باعث می‌شود نتیجه طبیعی‌تر باشد.

تولید تصاویر صحنه‌های فوتورئالیستی (واقع‌گرایانه) با نانوبنانا nano-banana
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="A photorealistic close-up portrait of an elderly Japanese ceramicist with deep, sun-etched wrinkles and a warm, knowing smile. He is carefully inspecting a freshly glazed tea bowl. The setting is his rustic, sun-drenched workshop with pottery wheels and shelves of clay pots in the background. The scene is illuminated by soft, golden hour light streaming through a window, highlighting the fine texture of the clay and the fabric of his apron. Captured with an 85mm portrait lens, resulting in a soft, blurred background (bokeh). The overall mood is serene and masterful.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('photorealistic_example.png')
    image.show()
from google import genai
from PIL import Image
from io import BytesIO

# Configure the client with your API key
client = genai.Client(api_key="YOUR_API_KEY")

prompt = """Create a photorealistic image of an orange cat
with a green eyes, sitting on a couch."""

# Call the API to generate content
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=prompt,
)

# The response can contain both text and image data.
# Iterate through the parts to find and save the image.
for part in response.candidates[0].content.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = Image.open(BytesIO(part.inline_data.data))
        image.save("cat.png")

ب) ساخت تصاویر استیکر و ایلوستریشن (Illustration)

برای طراحی استیکر، آیکون یا المان‌های گرافیکی، سبک موردنظر، ویژگی‌های کلیدی و پس‌زمینه سفید را حتماً ذکر کنید.

تولید تصاویر استیکر و ایلوستریشن (Illustration) با نانوبنانا nano-banana
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="A kawaii-style sticker of a happy red panda wearing a tiny bamboo hat. It's munching on a green bamboo leaf. The design features bold, clean outlines, simple cel-shading, and a vibrant color palette. The background must be white.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('red_panda_sticker.png')
    image.show()

پ) تولید تصاویر حاوی متن بدون مشکل (لوگو یا پوستر)

نانوبنانا در رندر متن عملکردی بسیار خوب از خود به نمایش گذاشته است. کافی است نوع فونت، سبک طراحی و رنگ‌بندی را مشخص کنید.

تولید تصاویر یا متن دقیق در تصویر (لوگو یا پوستر) با نانوبنانا nano-banana
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="Create a modern, minimalist logo for a coffee shop called 'The Daily Grind'. The text should be in a clean, bold, sans-serif font. The design should feature a simple, stylized icon of a a coffee bean seamlessly integrated with the text. The color scheme is black and white.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('logo_example.png')
    image.show()

ت) موکاپ محصول و عکاسی تبلیغاتی

برای ساخت تصاویر تبلیغاتی یا شات محصول، نورپردازی استودیویی، زاویه دوربین و جزئیات محصول را توضیح دهید.

تولید تصاویر موکاپ محصول و عکاسی تبلیغاتی با نانوبنانا nano-banana
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="A high-resolution, studio-lit product photograph of a minimalist ceramic coffee mug in matte black, presented on a polished concrete surface. The lighting is a three-point softbox setup designed to create soft, diffused highlights and eliminate harsh shadows. The camera angle is a slightly elevated 45-degree shot to showcase its clean lines. Ultra-realistic, with sharp focus on the steam rising from the coffee. Square image.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('product_mockup.png')
    image.show()

ث) طراحی مینیمالیستی و فضای خالی (Negative Space)

این نوع طراحی برای پس‌زمینه وب‌سایت، پرزنتیشن یا پوسترها مناسب است. کافی است یک عنصر ساده با فضای خالی زیاد توصیف کنید.

تولید طراحی مینیمالیستی و فضای خالی (Negative Space) با نانوبنانا nano-banana
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="A minimalist composition featuring a single, delicate red maple leaf positioned in the bottom-right of the frame. The background is a vast, empty off-white canvas, creating significant negative space for text. Soft, diffused lighting from the top left. Square image.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('minimalist_design.png')
    image.show()

ج) طراحی استوری‌بورد (Comic / Storyboard)

برای روایت تصویری یا طراحی استوری‌بورد، هر صحنه را واضح توصیف کنید: شخصیت‌ها، محیط و حال‌وهوای نورپردازی.

تولید طراحی استوری‌بورد (Comic / Storyboard) با نانوبنانا nano-banana
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

# Generate an image from a text prompt
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents="A single comic book panel in a gritty, noir art style with high-contrast black and white inks. In the foreground, a detective in a trench coat stands under a flickering streetlamp, rain soaking his shoulders. In the background, the neon sign of a desolate bar reflects in a puddle. A caption box at the top reads \"The city was a tough place to keep secrets.\" The lighting is harsh, creating a dramatic, somber mood. Landscape.",
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    image.save('comic_panel.png')
    image.show()
کاربردهای مدل نانو بنانا nano-banana

ویرایش تصویر با کمک متن و تصویر ورودی

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client(api_key="YOUR_API_KEY")

prompt = """Using the image of the cat, create a photorealistic,
street-level view of the cat walking along a sidewalk in a
New York City neighborhood, with the blurred legs of pedestrians
and yellow cabs passing by in the background."""

image = Image.open("cat.png")

# Pass both the text prompt and the image in the 'contents' list
response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt, image],
)

for part in response.candidates[0].content.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = Image.open(BytesIO(part.inline_data.data))
        image.save("cat2.png")

ترمیم عکس با نانو موز!

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client(api_key="YOUR_API_KEY")

prompt = "Restore and colorize this image from 1932"

image = Image.open("lunch.jpg")  # "Lunch atop a Skyscraper, 1932"

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt, image],
)

for part in response.candidates[0].content.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = Image.open(BytesIO(part.inline_data.data))
        image.save("lunch-restored.png")
ابزار ادیت تصویر گوگل

ترکیب چند تصویر

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client(api_key="YOUR_API_KEY")

prompt = "Make the girl wear this t-shirt. Leave the background unchanged."

image1 = Image.open("girl.png")
image2 = Image.open("tshirt.png")

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt, image1, image2],
)

for part in response.candidates[0].content.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = Image.open(BytesIO(part.inline_data.data))
        image.save("girl-with-tshirt.png")

بهترین شیوه و نکات پرامپت‌دهی برای Nano Banana

برای رسیدن به نتایج بهتر با کمک مدل Nano Banana، دانستن روش‌های مؤثر پرامپت‌دهی اهمیت ویژه‌ای دارد. در این بخش، شما را با کلیدهای موفقیت در تولید تصاویر خلاقانه و دقیق آشنا می‌کنیم:

۱. جزئیات، جزئیات و باز هم جزئیات

هرچه اطلاعات بیشتری درباره موضوع، رنگ‌ها، نورپردازی و ترکیب‌بندی ارائه دهید، کنترل بیشتری هم روی خروجی خواهید داشت. همیشه به یاد داشته باشید مدل هیچ چیزی از ذهن یا تصورات شما نمیداند و یک پیشگو نیست. بنابراین ذکر جزئیات دقیق باعث خواهد شد تا مدل دقیقاً همان چیزی را تولید کند که در ذهن شماست.

۲. ارائه زمینه و هدف تصویر

توضیح دادن هدف یا حس مورد نظرتان در تصویر به هر مدلی، تاثیری مستقیم بر تولید اثری خلاقانه دارد. آیا می‌خواهید یک تصویر واقعی باشد یا فضایی فانتزی و سورئال؟ این توضیحات، نتایج تولید شده را به‌طور چشمگیری بهبود می‌بخشد.

۳. تکرار و اصلاح تدریجی

پرامپت‌های اولیه همیشه کامل نیستند. از قابلیت ویرایش محاوره‌ای مدل استفاده کنید و با اعمال تغییرات جزئی و اصلاحات تدریجی، تصویر نهایی را به بهترین شکل ممکن شکل دهید. (برای یادگیری نحوه نوشتن پرامپت به مقاله آموزشی “اصول و تکنیک‌های استاندارد پرامپت نویسی” و “آموزش نوشتن پرامپت چت‌ جی‌ پی‌ تی Chatgpt” مراجعه نمایید.)

۴. دستورالعمل‌های گام‌به‌گام

برای صحنه‌های پیچیده، پرامپت خود را به دستورات واضح و شفاف و چند بخشی تقسیم کنید. این کار کمک می‌کند مدل هر بخش از تصویر را به‌طور مستقل پردازش نموده و نتیجه دقیق‌تر و منسجم‌تری تولید شود.

۵. چارچوب مثبت پرامپت‌ها

به‌جای استفاده از دستورات منفی مانند “بدون ماشین”، صحنه مورد نظر خود را به صورت مثبت توصیف کنید: “یک خیابان خالی و آرام بدون ترافیک”. این شیوه باعث تولید خروجی طبیعی‌تر و نزدیک‌تر به تصور شما خواهد شد.

۶. کنترل زاویه دوربین

از اصطلاحات عکاسی و سینمایی برای هدایت ترکیب‌بندی تصویر استفاده کنید: “نمای واید”، “ماکرو شات” یا “زاویه پایین”. این نکته، قدرت شما در طراحی صحنه و روایت تصویری نیز افزایش می‌دهد.

دسترسی و قیمت‌گذاری (برای توسعه‌دهندگان)

Gemini 2.5 Flash Image هم‌اکنون در دسترس توسعه‌دهندگان از طریق Gemini API، Google AI Studio و Vertex AI قرار گرفته و در حالت پیش‌نمایش عرضه شده است. قیمت اعلام‌شده برای خروجی تصویر: $۳۰ به ازای هر ۱,۰۰۰,۰۰۰ توکن خروجی؛ هر تصویر (تا ابعاد ۱۰۲۴×۱۰۲۴) برابر با حدود ۱۲۹۰ توکن خروجی محاسبه شده که تقریبا معادل $۰.۰۳۹ به ازای هر تصویر است. جزئیات قیمت و مستندات توسعه‌دهندگان در داکیومنت‌های رسمی قابل‌دسترسی است.

تولید تصویر با نانو بنانا به ازای هر تصویر ۰٫۰۳۹ دلار هزینه دارد. با ۱ دلار می توانید تقریباً ۲۵ تصویر تولید کنید

۱. دسترسی از طریق Google AI Studio

  • وارد Google AI Studio شوید؛ این سکوی وبی امکانات تعامل بدون کدنویسی با مدل‌های هوش مصنوعی را مهیا می‌کند. مدل Gemini 2.5 Flash Image در حالت پیش‌نمایش (preview) در این محیط قابل دسترسی است.
دسترسی به گوگل بنانا nano-banana از طریق گوگل استودیو
nano-banana
  • در AI Studio، می‌توانید از قالب‌های آماده مانند «ویرایش تصویر از طریق فرمان متنی» (prompt-based image editing) بهره ببرید که امکان ادغام چند تصویر، ویرایش مرحله‌ای، و حفظ یکپارچگی شخصیت‌ها را فراهم می‌کنند.

۲. استفاده از Gemini API

  • برای استفاده برنامه‌محور، مدل nano-banana در قالب API قابل استفاده است. مدل با نام gemini-2.5-flash-image-preview از طریق API در دسترس قرار دارد.
  • برای شروع:
    • به Google Cloud Console وارد شوید.
    • فعال‌سازی API مربوط به Vertex AI یا Gemini API را انجام دهید.
    • کلید API را ایجاد کرده و در کدتان برای احراز هویت استفاده کنید.
    • درخواست‌ها با قالب‌های استاندارد، شامل ورودی‌های متنی و تصویری، به مدل ارسال می‌شوند.
    • نصب SDK
pip install -U google-genai
# Install the Pillow library for image manipulation
pip install Pillow

npm install @google/genai

۳. استفاده از Vertex AI (برای سازمان‌ها و پروژه‌های بزرگ)

  • اگر سازمان یا پروژه تحت پلتفرم Google Cloud دارید:
    • به Vertex AI مراجعه کرده و مدل را از Model Garden انتخاب کنید.
    • مدل gemini-2.5-flash-image-preview در حالت پیش‌نمایش قابل مشاهده و استفاده است.
    • برای فعال‌سازی، نیاز به پروژه فعال با Billing و همچنین فعال‌کردن APIهاست.
  • دسترسی معمولاً نیازمند هماهنگی با نماینده فروش یا حساب Google Cloud شماست.

۴. دسترسی از طریق Adobe Firefly و Adobe Express

  • گوگل مدل خود را در Adobe Firefly و Adobe Express نیز ادغام کرده است.
  • کاربران این ابزارها می‌توانند ضمن ساخت تصاویر استایلی و گرافیک‌های متنوع، از قدرت Gemini 2.5 Flash Image نیز بهره‌مند شوند.
  • برای مدت محدود (تا سپتامبر ۲۰۲۵)، کاربران Pro فایرفلای امکان تولید نامحدود با این مدل را دارند.

۵. استفاده از nano-banana در رابط کاربری (اپ Gemini)

  • در اپلیکیشن Gemini (نسخه موبایل/وب)، ویرایش تصاویر با محوریت حفظ شباهت شخصیت‌ها فعال شده است.
  • شما می‌توانید تصویری را بارگذاری کرده، تغییراتی مانند تغییر لباس، ترکیب با محیط جدید یا اضافه‌کردن المان‌های دیگر را بدون از دست دادن شباهت سوژه اعمال کنید.
    blog.google

چکیده دسترسی به nano-banana به‌صورت جدول:

پلتفرمنحوه دسترسی و توضیح
Google AI Studioبدون نیاز به کد، در محیط وب، با قالب‌های آماده برای ویرایش و تولید تصویر.
Gemini APIبرنامه‌محور، با کلید API، ارسال تصویر و متن، استفاده از مدل gemini-2.5-flash-image-preview.
Vertex AIبرای کاربردهای سازمانی، نیاز به پروژه فعال، فعال‌سازی API، دسترسی در Model Garden.
Adobe Firefly/Expressادغام در ابزارهای Firefly و Express برای خلاقیت بصری، با تولید نامحدود برای کاربران Pro.
اپلیکیشن Geminiویرایش مستقیم تصاویر در اپ، با تمرکز بر حفظ یکپارچگی شخصیت.

چند نمونه تصویر تولید شده به همراه پرامپت مربوطه:

یک تصویر ادیت شده توسط مدل نانو بنانا nano-banana

پرامپت استفاده شده در این تغییر:

Keep the eyes, facial features, and expression unchanged. Only add the new glasses to the person without altering the eyes or skin.

💡آموزش تنظیمات مدل نانو بنانا(nano-banana):

👈🏻 Token count
نشون میده الان چند توکن از ظرفیت مکالمه استفاده شده (هر کلمه یا بخش جمله یه توکن حساب میشه).
👈🏻 Temperature (1)
درجه خلاقیت یا تصادفی بودن خروجی.
مقدار پایین‌تر (مثل ۰.۲ یا ۰.۳): خروجی دقیق‌تر، قابل پیش‌بینی‌تر.
مقدار بالاتر (۱ یا بیشتر): خروجی خلاقانه‌تر، متنوع‌تر، ولی شاید غیرقابل‌اعتمادتر.
👈🏻 Advanced settings
تنظیمات پیشرفته برای کنترل ریزتر خروجی.
👈🏻 Safety settings (Edit)
فیلترهای محتوایی برای جلوگیری از تولید خروجی نامناسب.

👈🏻 Add stop sequence
میشه یه توالی (مثلاً “###”) مشخص کنی که مدل وقتی بهش رسید، تولید متن رو قطع کنه.
👈🏻 Output length (8192)
حداکثر طول خروجی که مدل می‌تونه تولید کنه (بر حسب توکن).
👈🏻 Top P (0.95)
بهش می‌گن nucleus sampling.
اینکه چه بخشی از توزیع احتمالاتی مدل در نظر گرفته بشه را مدیریت میکنه.
اگر پایین باشه (مثلاً ۰.۵): خروجی محدودتر و متمرکزتری خواهید داشت.
اگر بالاتر باشه (۰.۹۵ یا ۱): خروجی متنوع‌تر و با جزئیات بیشتری خواهید داشت.

پرامپت استفاده شده:

place the 3 women from image in chairs talking happily to each other in image 2 corresponding to the matching colored circles. blend in environment as hyper real. enhance final result

ℹ نکات مهم برای شروع کار با nano-banana

  • برای توسعه‌دهندگان: با استفاده از Google AI Studio سریع‌ترین راه برای آشنایی بدون نیاز به کدنویسی است. در ادامه، با Gemini API و محیط‌های برنامه‌نویسی مانند Python وارد مرحله توسعه شوید.
    Google Developers Blogapidog
  • برای تیم‌های سازمانی یا کسب‌وکارها: ورود از طریق Vertex AI با امکان پیاده‌سازی و استقرار مدل در تولید توصیه می‌شود. حتماً حساب Google Cloud با فاکتورینگ فعال داشته باشید.
    Google Cloud
  • برای تولیدکنندگان محتوا: استفاده از Adobe Firefly یا اپ Gemini، ساده‌ترین تجربه کاربری را فراهم می‌کند.

ایمنی، اخلاق و ریسک‌های احتمالی

با وجود پیشرفت فنی، «nano-banana» همان‌گونه که امکان خلق محتوای سازگار و واقع‌نمایانه را فراهم می‌کند، نگرانی‌هایی دربارهٔ سوءاستفاده (مثلاً ساخت دیپ‌فیک‌ها یا تصاویر گمراه‌کننده) نیز به‌وجود آورده است. گوگل برای کاهش این خطرات از واترمارک‌های مرئی و نامرئی (SynthID) استفاده می‌کند، اما برخی کارشناسان رسانه‌ای بر این باورند که این تدابیر کامل نیست و نیاز به شفافیت و ابزارهای تشخیص قوی‌تر دارد. در نتیجه، استفادهٔ مسئولانه و سیاست‌گذاری روشن برای انتشار و توزیع تصاویر تولیدشده ضروری است.


نتیجه‌گیری

معرفی مدل Gemini 2.5 Flash Image یا “nano-banana” نشان‌دهنده پیشرفت چشمگیر گوگل در حوزه ویرایش تصاویر با هوش مصنوعی است. این مدل، با قابلیت‌های منحصربه‌فرد خود، تجربه‌ای متفاوت از کنترل دقیق و ترکیب تصاویر را برای توسعه‌دهندگان و کاربران فراهم کرده است.

اندرویدیفای Androidify چیست: خلق ربات اندرویدی با هوش مصنوعی

ترمیم تصاویر خانوادگی قدیمی با نانو بنانا + آپدیت ۶ مهر

چطوری عکس‌های قدیمی خانوادگی را با کمک هوش مصنوعی Gemini و مدل «Nano Banana» ترمیم کنیم؟ (قدم‌به‌قدم و عملی)

تقریباً همه ما عکس‌های قدیمی و لکه‌داری داریم که گنجینه‌ای از خاطرات زندگی ما هستند، اما متأسفانه، خط‌وخش‌ها، رنگ‌پریدگی یا پارگی‌ها بسیاری از آن‌ها را تقریباً غیرقابل استفاده کرده است.

خبر خوب اینجاست: اکنون می‌توانید با استفاده از مدل تصویری جدید گوگل (Nano Banana) در پلتفرم Gemini، این عکس‌ها را در عرض چند دقیقه ترمیم و حتی رنگی کنید! این کار با نتایجی واقع‌گرایانه و کم‌هزینه انجام می‌شود.

در ادامه، یک راهنمای کوتاه، دقیق و عملی برای علاقه‌مندان به عکس‌های میراث خانوادگی آماده کرده‌ام—راهنمایی که خودم آن را امتحان کرده‌ام و نتیجه داده است.

ترمیم تصاویر خانوادگی قدیمی با نانو بنانا | nano-banana

چرا این روش مؤثر است؟

این روش به دو دلیل اصلی برای ترمیم عکس‌های قدیمی شما موثر است:

۱. قدرت مدل Nano-Banana

Nano-Banana به‌طور خاص برای ویرایش و بازسازی تصاویر توسعه داده شده است. این مدل قادر است:

  • خراش‌ها و آسیب‌ها را به صورت هوشمندانه رفع می‌نماید.
  • جزئیات از دست‌رفته (مثل بخشی از صورت یا بافت لباس) را بازسازی ‌میکند.
  • عکس‌ها را با حساسیت تاریخی و دقت بالا ، به گونه‌ای که رنگ‌ها طبیعی به نظر برسند، رنگ‌آمیزی میکند.

۲. اهمیت پرامپت (دستور) دقیق

کلید موفقیت شما در استفاده از هوش‌مصنوعی Gemini این است که بدانید چگونه با مدل صحبت کنید یا درخواست خود را مطرح نمایید. شما باید:

  • یک پرامپت واضح و مشخص بنویسید (مثلاً: “خراش‌ها را حذف کن و رنگ‌آمیزی کن”).
  • از عکس با کیفیت نسبتاً مناسب استفاده کنید (هرچه ورودی بهتر باشد، خروجی بهتر است).
  • محدودیت‌های شفاف برای مدل تعیین کنید، مثلاً با جملاتی مانند: «هیچ عنصر یا شیء اضافی به عکس اضافه نشود» تا مدل از حدس و گمان‌های غیرضروری پرهیز کند و فقط بر ترمیم تمرکز کند.

بسیار عالی. در اینجا راهنمای کامل، گام‌به‌گام و نکات کلیدی برای شروع ترمیم عکس‌های میراث خانوادگی شما با استفاده از ابزار Nano Banana در پلتفرم جِمینی (Gemini) آمده است.


راهنمای سریع (در ۵ قدم عملی)

برای شروع ترمیم عکس‌های قدیمی خود، این پنج گام ساده را دنبال کنید:

۱. آماده‌سازی عکس (اسکن با کیفیت)

  • اسکن: عکس فیزیکی را با بالاترین کیفیت ممکن اسکن کنید. حداقل ۳۰۰ DPI ضروری است.
  • کیفیت بهتر: برای ثبت بهتر جزئیات ریز، استفاده از ۶۰۰ DPI یا بالاتر شدیداً توصیه می‌شود.
  • (اگر اسکنر ندارید، با دوربین گوشی و در نور مناسب، بدون سایه و لرزش عکس بگیرید، اما اسکنر ارجح است).

۲. ورود به پلتفرم

  • وارد یکی از آدرس‌های زیر شوید:
    • gemini.google.com (و یک گفتگوی جدید را آغاز کنید)
    • یا aistudio.google.com → Generate Media → Nano-Banana.

۳. آپلود و شروع کار

  • عکس آماده‌شده (فایل تصویری) را در پنجرهٔ چت یا رابط کاربری ابزار آپلود کنید.

۴. استفاده از پرامپت (دستور)

  • یکی از پرامپت‌های پیشنهادی را (ترجیحاً انگلیسی) کپی و در کادر وارد کنید.
  • اگر نتیجهٔ اول رضایت‌بخش نبود، کمی در متن پرامپت تغییر ایجاد کرده و چند بار با تنظیمات مختلف را بررسی و آزمایش کنید.

۵. ذخیره و نگهداری

  • عکس خروجی ترمیم‌شده را دانلود کنید.
  • همیشه یک نسخه از عکس اصلی و ویرایش‌نشده را جداگانه نگه دارید.

پرامپت‌های آماده (کپی و استفاده کنید)

همانطور که گفته شد، پرامپت‌های انگلیسی اغلب نتایج دقیق‌تری می‌دهند. کافیست متن مورد نظر را کپی و در بخش گفتگو یا پرامپت وارد کنید:

۱) ترمیم کامل (بدون رنگی‌سازی)

هدف: رفع آسیب‌ها بدون تغییر رنگ‌های اصلی (سیاه‌وسفید یا سپیا).

Restore this photograph to its original quality by repairing scratches, folds, discoloration, and missing details. Keep the people, objects, and background realistic while preserving the original style, lighting, and colors. Do not add new elements or alter the identity of the people—only repair the damaged areas.

۲) ترمیم + رنگی‌سازی محافظه‌کارانه

هدف: رفع آسیب‌ها و افزودن رنگ‌هایی طبیعی و واقع‌گرایانه.

Restore this photograph to its original quality by repairing scratches, folds, discoloration, and missing details. Then carefully colorize the image, keeping skin tones, clothing, objects, and background realistic. Preserve the original style, lighting, and atmosphere without adding new elements or changing the identity of the people.

نکات عملی برای نتایج بهتر

برای اینکه بیشترین بهره را از Nano-Banana ببرید و به بهترین نتایج برسید، این نکات را در ذهن داشته باشید:

  • حفظ نسخهٔ اصلی: همیشه قبل از شروع کار و ایجاد هر تغییری، یک نسخهٔ پشتیبان از عکسِ اصلی خود تهیه کنید.
  • تأکید بر رنگ خاص: اگر می‌خواهید رنگ خاصی در لباس، چشم یا شیء حفظ شود یا به آن اضافه شود، آن را در پرامپت ذکر کنید، مثلاً: «Keep the dress color as blue.»
  • واقع‌بینی در آسیب شدید: اگر عکس شما به‌شدت آسیب دیده (و کمتر از حدود ۷۰٪ آن سالم است)، انتظار معجزه نداشته باشید. این عکس‌ها ممکن است همچنان به کمی ویرایش دستی نهایی نیاز داشته باشند.
  • تکرار با نیت‌های مختلف: اول فقط با پرامپت «Repair» امتحان کنید، و سپس «Repair + Colorize». گاهی ترکیب دو خروجی در یک نرم‌افزار سادهٔ ویرایش تصویر، نتیجهٔ نهایی بهتری می‌دهد.
  • پرهیز از مدرن‌سازی: برای تضمین اصالت، صراحتاً در پرامپت بنویسید: «do not add modern elements» (عناصر مدرن اضافه نکن).
تحریریه هوش مصنوعی سیمرغ

Recent Posts

۱۰۰ فرد تأثیرگذار حوزه هوش مصنوعی در ایران، آمریکا و سایر نقاط جهان

۱۰۰ فرد تأثیرگذار حوزه هوش مصنوعی از دید رسانه هوش مصنوعی سیمرغ هوش مصنوعی در…

5 روز ago

ChatGPT Pulse: دستیار هوشمند شما

ChatGPT Pulse آغازگر نسلی تازه از دستیارهای هوش مصنوعی است؛ این مدل از پاسخ به…

7 روز ago

از تهدید تا فرصت: نقشه راه فریلنسرها برای امنیت آینده شغلی

نقشه راه فریلنسرها برای تامین امنیت آینده شغلی در عصر هوش مصنوعی فهرست دسترسی سریعنقشه…

2 هفته ago

راهنمای راه‌اندازی مدل‌ Grok 4 در Cursor با استفاده از xAI API

راهنمای راه‌اندازی مدل‌ Grok 4 در Cursor با استفاده از xAI API مدل‌های هوش مصنوعی…

2 هفته ago

مرورگر هوش مصنوعی جنسپارک Genspark

مرورگرها مدت‌هاست فقط وسیله‌ای برای باز کردن وب‌سایت‌ها بوده‌اند، اما حالا با معرفی مرورگر Genspark…

2 هفته ago

Prompt Optimizer یا پرامپت آپتیمایزر چیست؟

بهینه‌سازی پرامپت‌ها در GPT-5 با استفاده از «Prompt Optimizer» با معرفی خانواده مدل‌های GPT-5، اوپن‌اِی‌آی…

2 هفته ago