در دنیای پرسرعت هوش مصنوعی، یک مدل جدید و مرموز برای تولید و ویرایش تصویر با نام Nano-Banana بدون هیچ‌گونه معرفی رسمی، بی‌سر و صدا ظاهر شده و توجه جامعه فناوری را به خود جلب کرده است. این مدل با عملکرد خیره‌کننده خود در پلتفرم LMArena، نشان داده که قادر به اجرای دستورات متنی پیچیده با دقتی باورنکردنی است.

دستیار ویرایش تصویر با دقت یک جراح

 

برخلاف مدل‌های مشهور که با کمپین‌های تبلیغاتی بزرگ معرفی می‌شوند، Nano-Banana به صورت مخفیانه در بخش ویرایش تصویر پلتفرم LMArena ظاهر شد. طولی نکشید که کاربران با دیدن خروجی‌های شگفت‌انگیز آن، از توانایی بی‌نظیرش در دنبال کردن دستورات چندمرحله‌ای متعجب شدند. برای مثال، این مدل می‌تواند دستوراتی مانند "شخصیت پایینی را به 2B از بازی Nier: Automata و شخصیت بالایی را به Master Chief از بازی Halo تبدیل کن" را با دقتی خیره‌کننده اجرا کند، بدون اینکه نورپردازی، پرسپکتیو یا ترکیب‌بندی کلی صحنه را تغییر دهد.

این قدرت اصلی Nano-Banana است که می‌تواند با درک لایه‌های مختلف تصویر (درست مانند فتوشاپ)، ویرایش‌های پیچیده‌ای را انجام دهد. این مدل می‌تواند پس‌زمینه را تغییر دهد، حالت چهره را عوض کند، وضوح عکس‌های تار را بهبود بخشد، یا دو تصویر مجزا را در یک تصویر واحد ترکیب کند. همچنین در حفظ پیوستگی شخصیت‌ها در تصاویر متوالی و تبدیل صحنه‌ها به سبک‌های هنری مختلف (مثل آبرنگ و رنگ روغن) نیز برتری دارد.


 

چه کسی پشت این هوش مصنوعی مرموز است؟

 

عملکرد فوق‌العاده مدل Nano-Banana باعث شده تا گمانه‌زنی‌های زیادی درمورد هویت سازنده آن شکل بگیرد. اگرچه هیچ شرکتی به طور رسمی مسئولیت ساخت آن را بر عهده نگرفته، اما قوی‌ترین نظریه به گوگل اشاره دارد. دو دلیل اصلی برای این گمانه‌زنی وجود دارد:

  1. کیفیت بصری: کیفیت و بافت تصاویر تولیدشده شباهت زیادی به مدل‌های Imagen و Gemini گوگل دارد.

  2. نام‌گذاری: گوگل سابقه‌ای طولانی در استفاده از نام میوه‌ها به عنوان اسم رمز برای پروژه‌های داخلی خود دارد.


 

نکات منفی و دسترسی محدود

 

با این حال، Nano-Banana بی‌نقص نیست. کاربران به مشکلاتی مانند گلیچ‌های بصری در بازتاب‌ها، رندر ناقص متون و خطاهای آناتومیک رایج (مانند خطا در نمایش دست و انگشتان) اشاره کرده‌اند. در حال حاضر، هیچ راه رسمی برای دسترسی به این مدل وجود ندارد و کاربران ممکن است به صورت تصادفی در بخش "Battle" پلتفرم LMArena با آن مواجه شوند.

اگر این مدل واقعاً پروژه‌ای مخفی از گوگل باشد، عرضه رسمی آن می‌تواند بار دیگر رقابت در بازار هوش مصنوعی مولد تصویر را به شکل چشمگیری دگرگون کند.