zhaket logo

هوش مصنوعی DALL-E و گسترش تصاویری فراتر از کادر

اخبار روز حوزه وب

3 دقیقه زمان مطالعه

شرکت OpenAI قابلیت جدیدی را به مدل هوش مصنوعی DALL-E اضافه کرده که Outpainting نام دارد و به سیستم اجازه می‌دهد کادر تصاویر را گسترش داده و با توجه به سبک و سیاق محتوای اولیه اثر، به آن محتوای جدید اضافه کند. مدل هوش مصنوعی تبدیل متن به تصویر DALL-E چند وقت پیش با قابلیت‌های خارق‌العاده خود سروصدای زیادی به پا کرد. این مدل حالا ویژگی جدیدی را ارائه کرده که دوباره کاربران را شگفت‌زده کرده است. در یکی از مثال‌هایی که از این ویژگی منتشر شده، می‌توان دید که DALL-E با کمک قدرت هوش مصنوعی خود می‌تواند بیرون از کادر پرتره معروف «دختری با گوشواره مروارید» به خلق محتوا ادامه دهد.

 

تقلید از سبک های هنری با هوش مصنوعی

در ویدیویی که در ادامه خواهید دید، این سیستم با الگوبرداری از اطلاعات نسبتا کمی که از تصویر اصلی در اختیار دارد، به خوبی می‌تواند سبک نقاش هر اثری همچون یوهانس فرمیر را تقلید کند و برای نقاشی او پس‌زمینه بسیار بزرگ‌تری بکشد. در این آزمایش که توسط هنرمندی به نام آگوست کمپ انجام شده، می‌توان دید که او بسط اثر را به‌صورت تکه‌تکه انجام می‌دهد و گاهاً DALL-E را دوباره اجرا می‌کند تا به بهترین خروجی برسد.

 

 

در ویدیویی که در بالا می‌بینید، پیداست که این سیستم با الگوبرداری از اطلاعات نسبتا کمی که از تصویر اصلی در اختیار دارد، چگونه به خوبی می‌تواند سبک نقاش این اثر، «یوهانس فرمیر» را تقلید کند و برای نقاشی او پس‌زمینه بسیار بزرگ‌تری بکشد. در این آزمایش که توسط هنرمندی به نام «آگوست کمپ» انجام شده، می‌توان دید که او بسط اثر را به‌صورت تکه‌تکه انجام می‌دهد و گاهاً DALL-E را دوباره اجرا می‌کند تا به بهترین خروجی برسد.

 

Extend creativity and tell a bigger story with DALL-E images

 

هوش مصنوعی DALL-E از عکس اصلی الگوبرداری می کند

بسیاری از کاربران با ویژگی Outpainting دست به خلاقیت‌های گوناگونی زده و آثار متفاوتی را گسترش داده‌اند تا ببینند این هوش مصنوعی چه کارهایی می‌تواند انجام دهد. Outpainting از دید کلی‌تر، توانایی مدل‌های تبدیل متن به تصویر را ارتقا نمی‌دهد، اما مشخص می‌کند که OpenAI چطور می‌تواند از این فناوری در بازار بزرگ‌تری که پیش رو دارد، استفاده کند. مدل هوش مصنوعی DALL-E در حال حاضر در فاز بتا قرار دارد، اما بیش از یک میلیون کاربر به آن دسترسی پیدا کرده‌اند. هر کاربر بتا می‌تواند در ماه اول تا 50 تصویر رایگان با آن بسازد و در ماه بعد 15 تصویر رایگان دیگر دریافت کند. افراد برای ساخت تصاویر بیشتر می‌توانند به ازای هر 115 تصویر 15 دلار هزینه بپردازند.

 

در ادامه می توانید تجربه سایر کاربران را از frame of famous images مشاهده کنید

 

frame of famous images

 

frame of famous images

 

frame of famous images

 

frame of famous images

 

هوش مصنوعی Dall-E 2 Mini و خلاقیت بی حد و مرز

شرکت OpenAI در سال 2020 الگوریتمی به نام GPT-3 را منتشر کرد که قادر است متونی با شباهت بالا به متون انسانی بسازد. Dall-E الگوریتم دیگری است که بر اساس GPT-3 ساخته شده و قادر به تبدیل متن به تصویر است. یکی از نسخه‌های این الگوریتم موسوم به Dall-E 2 mini حالا به صورت رایگان و آنلاین در اختیار عموم قرار گرفته و می‌تواند هر متنی را به تصویر تبدیل کند، اما نتیجه آن ممکن است یک خروجی عجیب و غریب و حتی ترسناک باشد. شرکت OpenAI به تازگی دست به انتشار الگوریتم Dall-E 2 mini زده و از آن‌جایی که آن را در اینترنت در اختیار عموم گذاشته، توجه بسیاری از کاربران را به خود جلب کرده است. این الگوریتم که نام خود را از انیمیشن محبوب Wall-E گرفته، با گردآوری میلیون‌ها عکس اینترنتی آموزش دیده تا تصاویر را تشخیص دهد. Dall-E حالا می‌تواند چینش تصاویر را به نحوی که کاربر مدنظر دارد، تغییر دهد.

 

Dall-E 2 Mini artificial intelligence and limitless creativity

 

با این حال، اگر نگاهی به نمونه‌های حاصل از پردازش Dall-E داشته باشید، می‌توانید ببینید که چهره بسیاری از افراد کمی ترسناک و عجیب شده است. توسعه‌دهندگان می‌گویند به‌صورت عمدی بخشی از داده‌های آموزشی را حذف کرده‌اند و همین مسئله باعث شده Dall-E 2 mini در نمایش چهره‌ها ناموفق باشد. متاسفانه علت دقیق این تصمیم اعلام نشده است. با این حال، «بورین دیما»، مهندس مدل یادگیری ماشینی و توسعه‌دهنده این الگوریتم می‌گوید اتفاقات هیجان‌انگیز زیادی در راه است و یادگیری ماشینی با تکرار و تمرین بهتر و بهتر می‌شود.


نویسنده علیرضا ناجی

سایر مقالات نویسنده

علیرضا ناجی، فعال حوزه سئو و اسکیما می‌باشد. وی در زمینه تحقیق و ترجمه مقالات و آموزش حوزه فناوری اطلاعات، سئو و اسکیمای حرفه ای، بازی های رایانه ای و شبکه های اجتماعی فعالیت می‌کند و جدیدترین عناوین را به صورت محتوی غنی منتشر می‌نماید.

0

دیدگاه ها

ارسال دیدگاه

ارسال دیدگاه