من در مورد تصویر هوش مصنوعی WebUi (تفاوت پایدار) برای شما تعریف خواهم کرد


 


امروز من سایتی را که تصویر را به صورت رایگان با AI ترسیم می کند ، راهنمایی می کنم!
شما می توانید یک عکس را به راحتی بکشید!

webui (تفاوت پایدار)

پایداری هوش مصنوعی ، که در 22 اوت 2022 منتشر شد ، یک مدل هوش مصنوعی است که متن را به یک تصویر تبدیل می کند. این مدل به عنوان مجوز منبع باز توزیع می شود و به کاربران متنوعی امکان می دهد تا از آن آزادانه استفاده کنند. هنگامی که متن را وارد می کنید ، AI پایداری تصویری با کیفیت بالا بر اساس آن متن ایجاد می کند.

آدرس وب سایت :
https://stability.ai/


مشخصه :
انتشار پایدار یک مدل هوش مصنوعی یادگیری عمیق است که بر اساس "تحقیقات سنتز تصویر با وضوح بالا" توسط آزمایشگاه دستگاه Vision & Learning Group (COMPVIS) در دانشگاه مونیخ در مونیخ ، آلمان ساخته شده است. این کشور با پشتیبانی از پایداری AI و باند ML ساخته شده است.

پایداری AI یک شرکت انگلیسی به نام Emad Mostaque است و منابع محاسباتی را برای تفاوت پایدار فراهم می کند و به شما امکان می دهد یک پایگاه داده Laion-5B را یاد بگیرید. بر خلاف مدل های متن به تصویر مانند Dall-E 2 یا Imagen ، این مدل همچنین می تواند در رایانه هایی با VRAM های 4 گیگابایتی یا کمتر با کاهش منابع رایانه ای استفاده شود.

علاوه بر این ، حتی اگر گران باشد ، برای منبع باز باز است و می تواند توسط عموم مردم مورد استفاده قرار گیرد. این سن نقاشی هوش مصنوعی را باز کرده است و عملکرد خدمات تصویر هوش مصنوعی بر اساس مدل همچنان در حال افزایش است.

می توانید از پلاگین -in "Controlnet" برای ایجاد یک نمایش استفاده کنید. علاوه بر این ، با استفاده از مدل های مختلف کمکی Controlnet ، مانند مدل CANNY که از Openpose مشتق شده است ، محصولات ناحیه بدنه را تنظیم می کند تا به طرح سطح خط کمک کند.

تفاوت پایدار عمدتاً از سه شبکه عصبی مصنوعی تشکیل شده است: کلیپ ، Unet و VAE (VAE). هنگامی که کاربر وارد متن می شود ، رمزگذار متن ، کلیپ ، متن را به نشانه ای که Unet می تواند درک کند تبدیل می کند. UNET با از بین بردن نویزهای تصادفی بر اساس نشانه ها ، تصویری را ایجاد می کند. تکرار فرآیند Dinoizing یک تصویر دقیق ایجاد می کند و VAE در تبدیل این تصاویر به پیکسل ها نقش دارد.

بر خلاف مدل ایجاد تصویر احتمال انتشار سنتی ، تفاوت پایدار قبل و بعد از آن را برای حل مشکل معرفی کرده است که با افزایش وضوح ، مصرف منابع افزایش می یابد. این به شما امکان می دهد با دستکاری نویز در یک سطح کوچک از فضای بالقوه ، نه کل تصویر ، یک تصویر با وضوح نسبتاً بزرگ ایجاد کنید و نیازی به منابع محاسباتی زیادی نداشته باشید. بنابراین ، تفاوت پایدار می تواند به عنوان منبع کارتهای گرافیکی مورد استفاده در فرضیات عمومی استفاده شود.


مجوز:
AI پایدار مجوز منبع باز [4] را برای یادگیری ماشین جدید معرفی کرد. این مجوز ویژگی متفاوتی از مجوز منبع باز معمول دارد. اگر خدماتی را با استفاده از تفاوت پایدار ارائه می دهید ، کاربر باید صریحاً آن مجوز را رعایت کند. علاوه بر این ، هنگام تنظیم پین مدل ، باید فقط برای استفاده خاص مشخص شده در مجوز استفاده شود و نباید برای اهداف دیگر استفاده شود.

نحوه استفاده:
پروژه های مختلف منبع باز با استفاده از تفاوت پایدار توسعه یافته اند. در زیر توضیحات هر پروژه آورده شده است:

1. پایدار Differness Web UI: پروژه ای که یک رابط کاربری مبتنی بر وب را فراهم می کند تا استفاده از مدل انتشار پایدار را آسان کند. توسعه دهندگان همچنان علاوه بر عملکرد انتهای جلوی انتشار پایدار ، ویژگی های مختلفی از قبیل تصحیح GFPGAN ، افزایش Esrgan و وارونگی متنی را نیز به روز می کنند.

2. نویسنده اصلی: پروژه اصلی منتشر شده توسط Compvis. قابلیت استفاده محدود است ، بنابراین می توان از آن برای اهداف مرجع استفاده کرد.

3. دیفیوزرها: این یک قاب برای مدل جدید انتشار است که توسط Herging Face ، یک ارائه دهنده چارچوب یادگیری ماشین مشهور ارائه شده است. این راهی را فراهم می کند که Finetuneng از انتشار پایدار را به راحتی انجام دهد. همچنین شامل چارچوب هایی مانند ترانسفورماتور یا مجموعه داده ها است.

4- DiffnessBee: می توانید تفاوت پایدار را مستقیماً با برنامه MAC اجرا کنید. ورود به متن و تصاویر امکان پذیر است و همچنین در توابع نقاشی و پاسگاه پشتیبانی می کند. نسخه Apple Silicon از یک موتور عصبی در داخل Apple Silicon استفاده می کند و نسخه HQ از GPU برای افزایش کیفیت استفاده می کند ، اما سرعت کند است. همچنین از Intel Mac پشتیبانی می کند و در آینده از ویندوز پشتیبانی می کند.

5. ترسیم چیزها: شما می توانید تفاوت های پایدار را با برنامه های iOS ، iPados و MacOS اجرا کنید. از سه حالت پشتیبانی می کند: CPU + GPU ، CPU + موتور عصبی ، CPU + GPU + موتور عصبی (ALL). می توانید از پاسگاه ، لورا ، وارونگی متنی و غیره استفاده کنید و ویژگی مشابهی را به WebUI ارائه می دهید. عملکرد انبساط پشتیبانی نمی شود ، و به دلیل محدودیت ظرفیت حافظه ، اگر بیش از یک وضوح خاص در دستگاه های قدیمی و جدید اجرا شود ، ممکن است برنامه به دلیل کمبود حافظه به پایان برسد.

6. Riffusion: این نمونه ای از استفاده از آن برای ترکیب AI با استفاده از طیف سنجی است.

7. ظرف داخل گالری تصویر هوش مصنوعی: ما یک گالری اختصاصی افتتاح کرده ایم که می تواند با استفاده از سرویس Civitai تصاویر هوش مصنوعی ایجاد کند.

پروژه های فوق از انتشار پایدار برای ایجاد تصاویر AI در توابع و محیط های مختلف استفاده می کنند.




نظرات