در دنیای پرسرعت هوش مصنوعی، یک مدل جدید و مرموز برای تولید و ویرایش تصویر با نام Nano-Banana بدون هیچگونه معرفی رسمی، بیسر و صدا ظاهر شده و توجه جامعه فناوری را به خود جلب کرده است. این مدل با عملکرد خیرهکننده خود در پلتفرم LMArena، نشان داده که قادر به اجرای دستورات متنی پیچیده با دقتی باورنکردنی است.
دستیار ویرایش تصویر با دقت یک جراح
برخلاف مدلهای مشهور که با کمپینهای تبلیغاتی بزرگ معرفی میشوند، Nano-Banana به صورت مخفیانه در بخش ویرایش تصویر پلتفرم LMArena ظاهر شد. طولی نکشید که کاربران با دیدن خروجیهای شگفتانگیز آن، از توانایی بینظیرش در دنبال کردن دستورات چندمرحلهای متعجب شدند. برای مثال، این مدل میتواند دستوراتی مانند "شخصیت پایینی را به 2B از بازی Nier: Automata و شخصیت بالایی را به Master Chief از بازی Halo تبدیل کن" را با دقتی خیرهکننده اجرا کند، بدون اینکه نورپردازی، پرسپکتیو یا ترکیببندی کلی صحنه را تغییر دهد.
این قدرت اصلی Nano-Banana است که میتواند با درک لایههای مختلف تصویر (درست مانند فتوشاپ)، ویرایشهای پیچیدهای را انجام دهد. این مدل میتواند پسزمینه را تغییر دهد، حالت چهره را عوض کند، وضوح عکسهای تار را بهبود بخشد، یا دو تصویر مجزا را در یک تصویر واحد ترکیب کند. همچنین در حفظ پیوستگی شخصیتها در تصاویر متوالی و تبدیل صحنهها به سبکهای هنری مختلف (مثل آبرنگ و رنگ روغن) نیز برتری دارد.
چه کسی پشت این هوش مصنوعی مرموز است؟
عملکرد فوقالعاده مدل Nano-Banana باعث شده تا گمانهزنیهای زیادی درمورد هویت سازنده آن شکل بگیرد. اگرچه هیچ شرکتی به طور رسمی مسئولیت ساخت آن را بر عهده نگرفته، اما قویترین نظریه به گوگل اشاره دارد. دو دلیل اصلی برای این گمانهزنی وجود دارد:
کیفیت بصری: کیفیت و بافت تصاویر تولیدشده شباهت زیادی به مدلهای Imagen و Gemini گوگل دارد.
نامگذاری: گوگل سابقهای طولانی در استفاده از نام میوهها به عنوان اسم رمز برای پروژههای داخلی خود دارد.
نکات منفی و دسترسی محدود
با این حال، Nano-Banana بینقص نیست. کاربران به مشکلاتی مانند گلیچهای بصری در بازتابها، رندر ناقص متون و خطاهای آناتومیک رایج (مانند خطا در نمایش دست و انگشتان) اشاره کردهاند. در حال حاضر، هیچ راه رسمی برای دسترسی به این مدل وجود ندارد و کاربران ممکن است به صورت تصادفی در بخش "Battle" پلتفرم LMArena با آن مواجه شوند.
اگر این مدل واقعاً پروژهای مخفی از گوگل باشد، عرضه رسمی آن میتواند بار دیگر رقابت در بازار هوش مصنوعی مولد تصویر را به شکل چشمگیری دگرگون کند.