شرکت OpenAI قابلیت جدیدی را به مدل هوش مصنوعی DALL-E اضافه کرده که Outpainting نام دارد و به سیستم اجازه میدهد کادر تصاویر را گسترش داده و با توجه به سبک و سیاق محتوای اولیه اثر، به آن محتوای جدید اضافه کند. مدل هوش مصنوعی تبدیل متن به تصویر DALL-E چند وقت پیش با قابلیتهای خارقالعاده خود سروصدای زیادی به پا کرد. این مدل حالا ویژگی جدیدی را ارائه کرده که دوباره کاربران را شگفتزده کرده است. در یکی از مثالهایی که از این ویژگی منتشر شده، میتوان دید که DALL-E با کمک قدرت هوش مصنوعی خود میتواند بیرون از کادر پرتره معروف «دختری با گوشواره مروارید» به خلق محتوا ادامه دهد.
تقلید از سبک های هنری با هوش مصنوعی
در ویدیویی که در ادامه خواهید دید، این سیستم با الگوبرداری از اطلاعات نسبتا کمی که از تصویر اصلی در اختیار دارد، به خوبی میتواند سبک نقاش هر اثری همچون یوهانس فرمیر را تقلید کند و برای نقاشی او پسزمینه بسیار بزرگتری بکشد. در این آزمایش که توسط هنرمندی به نام آگوست کمپ انجام شده، میتوان دید که او بسط اثر را بهصورت تکهتکه انجام میدهد و گاهاً DALL-E را دوباره اجرا میکند تا به بهترین خروجی برسد.
در ویدیویی که در بالا میبینید، پیداست که این سیستم با الگوبرداری از اطلاعات نسبتا کمی که از تصویر اصلی در اختیار دارد، چگونه به خوبی میتواند سبک نقاش این اثر، «یوهانس فرمیر» را تقلید کند و برای نقاشی او پسزمینه بسیار بزرگتری بکشد. در این آزمایش که توسط هنرمندی به نام «آگوست کمپ» انجام شده، میتوان دید که او بسط اثر را بهصورت تکهتکه انجام میدهد و گاهاً DALL-E را دوباره اجرا میکند تا به بهترین خروجی برسد.
هوش مصنوعی DALL-E از عکس اصلی الگوبرداری می کند
بسیاری از کاربران با ویژگی Outpainting دست به خلاقیتهای گوناگونی زده و آثار متفاوتی را گسترش دادهاند تا ببینند این هوش مصنوعی چه کارهایی میتواند انجام دهد. Outpainting از دید کلیتر، توانایی مدلهای تبدیل متن به تصویر را ارتقا نمیدهد، اما مشخص میکند که OpenAI چطور میتواند از این فناوری در بازار بزرگتری که پیش رو دارد، استفاده کند. مدل هوش مصنوعی DALL-E در حال حاضر در فاز بتا قرار دارد، اما بیش از یک میلیون کاربر به آن دسترسی پیدا کردهاند. هر کاربر بتا میتواند در ماه اول تا 50 تصویر رایگان با آن بسازد و در ماه بعد 15 تصویر رایگان دیگر دریافت کند. افراد برای ساخت تصاویر بیشتر میتوانند به ازای هر 115 تصویر 15 دلار هزینه بپردازند.
در ادامه می توانید تجربه سایر کاربران را از frame of famous images مشاهده کنید
هوش مصنوعی Dall-E 2 Mini و خلاقیت بی حد و مرز
شرکت OpenAI در سال 2020 الگوریتمی به نام GPT-3 را منتشر کرد که قادر است متونی با شباهت بالا به متون انسانی بسازد. Dall-E الگوریتم دیگری است که بر اساس GPT-3 ساخته شده و قادر به تبدیل متن به تصویر است. یکی از نسخههای این الگوریتم موسوم به Dall-E 2 mini حالا به صورت رایگان و آنلاین در اختیار عموم قرار گرفته و میتواند هر متنی را به تصویر تبدیل کند، اما نتیجه آن ممکن است یک خروجی عجیب و غریب و حتی ترسناک باشد. شرکت OpenAI به تازگی دست به انتشار الگوریتم Dall-E 2 mini زده و از آنجایی که آن را در اینترنت در اختیار عموم گذاشته، توجه بسیاری از کاربران را به خود جلب کرده است. این الگوریتم که نام خود را از انیمیشن محبوب Wall-E گرفته، با گردآوری میلیونها عکس اینترنتی آموزش دیده تا تصاویر را تشخیص دهد. Dall-E حالا میتواند چینش تصاویر را به نحوی که کاربر مدنظر دارد، تغییر دهد.
با این حال، اگر نگاهی به نمونههای حاصل از پردازش Dall-E داشته باشید، میتوانید ببینید که چهره بسیاری از افراد کمی ترسناک و عجیب شده است. توسعهدهندگان میگویند بهصورت عمدی بخشی از دادههای آموزشی را حذف کردهاند و همین مسئله باعث شده Dall-E 2 mini در نمایش چهرهها ناموفق باشد. متاسفانه علت دقیق این تصمیم اعلام نشده است. با این حال، «بورین دیما»، مهندس مدل یادگیری ماشینی و توسعهدهنده این الگوریتم میگوید اتفاقات هیجانانگیز زیادی در راه است و یادگیری ماشینی با تکرار و تمرین بهتر و بهتر میشود.
نویسنده علیرضا ناجی
سایر مقالات نویسندهعلیرضا ناجی، فعال حوزه سئو و اسکیما میباشد. وی در زمینه تحقیق و ترجمه مقالات و آموزش حوزه فناوری اطلاعات، سئو و اسکیمای حرفه ای، بازی های رایانه ای و شبکه های اجتماعی فعالیت میکند و جدیدترین عناوین را به صورت محتوی غنی منتشر مینماید.