حالا تصاویر بهتری با هوش مصنوعی تولید کنید!
نسخه جدید GPT-4o، که حدود یک سال پیش توسط شرکت OpenAI عرضه شد، اکنون با قابلیت جدیدی در تولید تصاویر با متن، جهشی بزرگ را تجربه کرده است. این پیشرفت به کاربران امکان می دهد تا با استفاده از دستورات متنی، تصاویر باکیفیت و بسیار دقیق ایجاد کنند و سپس با تعاملات محاوره ای، آنها را مطابق با تصورات ذهنی خود تغییر دهند. دیگر خبری از نشانه های مبهم و حروف نامفهوم که در مدل های قدیمی تر هوش مصنوعی مشاهده می شد، نیست.
برخلاف روش های سنتی تولید تصویر که در آن کاربران فقط می توانند یک دستور واحد را تغییر دهند، GPT-4o روشی کاملاً پویا را ارائه می کند. کاربران می توانند با یک درخواست اولیه، مانند ایجاد تصویر یک گربه، شروع کنند و سپس با تعاملات گفتاری، جزئیات تصویر را مطابق با سلیقه خود تغییر دهند. برای مثال، می توانند به تصویر گربه، یک کلاه کارآگاهی یا یک عینک اضافه کنند یا هر تغییر دیگری که در ذهن دارند، اعمال نمایند.
OpenAI با قابلیت جدید مدل GPT-4o، نمونه هایی را به نمایش گذاشته است. کاربران می توانند صحنه ها را مرحله به مرحله خلق و تغییر دهند، به گونه ای که عناصر مختلف از تصاویر متعدد را در یک خروجی یکپارچه و هماهنگ ادغام کنند. این مدل در تولید متن های خوانا روی تابلوها یا اشیاء، عملکردی بی نظیر ارائه می دهد که در مقایسه با خروجی های نامفهوم مدل های پیشین هوش مصنوعی، پیشرفتی چشمگیر محسوب می شود.
OpenAI گفته که برخی از تصاویر، منتخبی از بهترین ها هستند؛ به عنوان مثال، «بهترین از میان ۲» یا «بهترین از میان ۸». اما با این وجود، نتایج همچنان قابل توجه هستند، به ویژه با رابط کاربری بسیار ساده ای که ارائه شده است. GPT-4o حتی می تواند با استفاده از عکس های شما به عنوان نقطه شروع، تغییرات را به صورت لایه بندی اعمال کند و صحنه هایی را با ۱۰ تا ۲۰ شیء مدیریت کند، در حالی که مدل های رقیب در مدیریت ۵ تا ۸ شیء با مشکل مواجه می شوند.
با وجود همه این توانایی ها، GPT-4o هنوز از نقص هایی رنج می برد. شرکت OpenAI به وجود برخی ویژگی های نامتعارف مانند ناتوانی در برش دقیق تصاویر، توهمات بصری، مشکل در پردازش متون غیر لاتین و محدودیت در تشخیص بیش از ۲۰ شیء مختلف اذعان کرده است.
آنچه GPT-4o را از سایر مدل ها متمایز می کند، قدرت بی نظیر آن در خلق تصاویر پیچیده و سرشار از جزئیات، تنها با استفاده از زبان انگلیسی ساده است. این ابزار، بهویژه در طراحی پوسترهای تبلیغاتی و هنری، سطحی از دقت و انعطاف پذیری را ارائه می دهد که مدلهای قدیمی تر حتی تصورش را هم نمی کردند.