بیایید هوش های مصنوعی تولیدکننده عکس را با هم مقایسه کنیم و ببینیم تخیل کدام یک بهتر یا واقع گراتر است: مقایسه DALL، E ، Midjourney و Stable Diffusion

به گزارش گردش 360 به دور دنیا، فابیان استلزر اخیراً یک آزمایش مقایسه تصویری بین سه مولد متن به تصویر مبتنی بر هوش مصنوعی (AI) انجام داده است: DALL-E ، Midjourney و Stable Diffusion.

بیایید هوش های مصنوعی تولیدکننده عکس را با هم مقایسه کنیم و ببینیم تخیل کدام یک بهتر یا واقع گراتر است: مقایسه DALL، E ، Midjourney و Stable Diffusion

استلزر یافته های خود را در توییتر منتشر نموده و در آن فرآیند را شرح داده. او درخواست متنی یکسانی به هر هوش مصنوعی فرستاده و نسبت تصویر 1:1 را در نظر گرفته تا مقایسه در شرایط یکسان انجام گردد.

استلزر می گوید که هر برنامه ای را که ترکیب های تصویر را تبدیل می نماید، به عنوان ابزار می بیند و هر مولد سبک، لحن و حالت خاص خود را فراوری می نماید.

Midjourney من را به یاد یک سینتی سایزر آنالوگ زیبای Moog می اندازد - تقریبا غیرممکن است که از آن صدای بدی خارج بگردد و می توانید کارهای باورنکردنی با آن انجام دهید، اما در عوض، تنوع آن محدودتر است. خروجی آن مانند اعوجاج های آنالوگ هستند و بسیار خوشایند می نمایند.

شاید شناخته شده ترین فراورینماینده تصویر هوش مصنوعی، DALL-E 2، شبیه یک ایستگاه کاری دیجیتالی باشد. تنوع خروجی آن باورنکردنی است، اما تقریباً همواره کمی بیش از حد دیجیتال به نظر می رسد.

Stable Diffusion مانند یک سینت سایزر ماژولار پیچیده است، تقریباً می توانید هر صدایی را از آن بگیرید، اما استفاده از آن کمی دشوارتر است.

این آزمایش خلاقانه بینشی از نحوه تفسیر هر مولد تصویر هوش مصنوعی از دستورالعمل ها به ما می دهد و ما را با سبک هر هوش مصنوعی آشنا می نماید.

Midjourney نسبت به دو مورد دیگر به طور مداوم احساسی منفی گرا دارد. مثل این می ماند که وقتی عکس ماه را درخواست می کنید، به جای عکس های آشنای زیبا از جلوی ماه، یک عکس از پشت ماه به شما تحویل داده گردد.

در حالی که DALL-E 2 و Stable Diffusion تصویری به مراتب واقعی تری فراوری می نمایند. پیشنهاد Midjourney حسی آخرالزمانی دارد.

با این حال، به نظر می رسد Midjourney قادر به ایجاد یک تصویر فوتورئالیستی نیست، Stable Diffusion در آزمایش به برترین وجه واقع گرا بوده است.

در زمانه عجیبی هستیم و همان طور که قبلا هم برایتان نوشتم از زمان ظهور عکاسی و پیدایش روتوش و ویرایش دیجیتال عکس، چنین تحولی را ندیده بودیم.

فراورینماینده های هوشمند تصویر کارهای خلاقانه را متحول می نمایند. من کم کم با تماشا خروجی های آنها یاد فصل تازه وست ورلد می افتم، جایی که هنرمند تصویرساز شرکت گیم، کارش تنها تخیل کردن است و هوش مصنوعی بر پایه درخواست های کلامی و ویرایش گام به گام خودش تصویرسازی می نماید.

یعنی ما کم کم داریم وارد عصری می شویم که دیگر احتیاج نیست کار با قلم مو یا نرم افزارهای فراوری عکس دوبعدی و سه بعدی را بلد باشیم، کافی است در فکر چیزی را تصور کنیم و با هوش مصنوعی گام به گام تصویر فکری را متحول کنیم. در این میان هوش مصنوعی این قابلیت را دارد که ایده های تازهی به مغز شما تزریق کند!

کسی چه می داند شاید دو سه دهه بعد به سرعت بتوانیم چیزی تعریف کنیم و پیش فرض هایی را به صورت کلامی به نرم افزارهای هوش مصنوعی بدهیم تا به سرعت فیلمی برای ما فراوری گردد.

آینده شگفت انگیز است، گرچه تاب آوردن در دنیای مملو از مصیبت های انسانی و محیط زیست نابود شده و بیماری های فراگیر سخت است، اما همین چیزها وسوسه مان می نماید که بیشتر تحمل کنیم!

منبع: یک پزشک

به "بیایید هوش های مصنوعی تولیدکننده عکس را با هم مقایسه کنیم و ببینیم تخیل کدام یک بهتر یا واقع گراتر است: مقایسه DALL، E ، Midjourney و Stable Diffusion" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "بیایید هوش های مصنوعی تولیدکننده عکس را با هم مقایسه کنیم و ببینیم تخیل کدام یک بهتر یا واقع گراتر است: مقایسه DALL، E ، Midjourney و Stable Diffusion"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید