برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید
Reve Ai ، Inc. ، یک استارتاپ هوش مصنوعی مستقر در پالو آلتو ، کالیفرنیا ، به طور رسمی Reve Image 1.0 را راه اندازی کرده است ، یک مدل تولید پیشرفته متن به تصویر که برای برتری در پیروی سریع ، زیبایی شناسی و تایپوگرافی طراحی شده است. این اولین نسخه این شرکت است که انتظار می رود ابزارهای آینده از آن پیروی کنند.
Reve Image در حال حاضر برای پیش نمایش رایگان در Preview.Reve.Art در دسترس است ، و به کاربران امکان می دهد بدون نیاز به مهندسی سریع پیشرفته ، تصاویر را از توضیحات متن تولید کنند.
این شرکت هنوز برنامه API Access یا برنامه های قیمت گذاری طولانی مدت را اعلام نکرده است ، و همچنین مشخص نیست که آیا این مدل اختصاصی خواهد بود یا منبع آزاد ساخته شده است و اگر چنین است ، تحت چه مجوز.
یک رویکرد جدید برای تصاویر هوش مصنوعی
تصویر Reve با هدف درک عمیق تر از قصد کاربر ، خود را متمایز می کند. این امکان را به کاربران می دهد که نه تنها تصاویر را از متن تولید کنند بلکه تصاویر موجود را با دستورات زبان ساده اصلاح کنند.
تغییرات مثال شامل تغییر رنگ ، تنظیم متن و تغییر دیدگاه ها است. این مدل همچنین از بارگذاری تصاویر مرجع پشتیبانی می کند و به کاربران این امکان را می دهد تا تصویری ایجاد کنند که با یک سبک یا الهام خاص مطابقت داشته باشد.
یکی از قابلیت های برجسته مدل ، عملکرد قوی در متن آن است که به یک چالش مشترک در تصاویر تولید شده توسط AI پرداخته است-و آن را مستقیم تر با مدل های تصویری با محوریت متن مانند ایدوگرافی رقابتی تر می کند ، که برای کسانی که آرم ها و مارک ها را طراحی می کنند با ارزش تر هستند.
علاوه بر این ، تست های اولیه کاربر نشان می دهد که تصویر مجدد تصویر چند شخصیت را به طور مؤثرتری از مدل های قبلی می برد.
در حال حاضر در صدر نمودارهای معیار شخص ثالث قرار گرفته است
تصویر REVE قبلاً توسط آنالیز مصنوعی سرویس تست مدل AI شخص ثالث ارزیابی شده است.
در عرصه تصویر تجزیه و تحلیل مصنوعی ، که در رتبه بندی مدل های مختلف تولید تصویر بر اساس بررسی کاربر و سایر معیارهای کمی قرار دارد ، Reve در حال حاضر در شماره 1 برای “کیفیت تولید تصویر” در صدر جدول قرار دارد ، از رقبای برتر مانند Midjourney V6.1 ، Google's Imagen 3 ، بازسازی V3 و Black Forest Lab.1.1 (Pro).
گروه معیار ، توانایی Reve Image را در تولید متن واضح و قابل خواندن در تصاویر برجسته کرد ، یک کار تاریخی دشوار برای مدل های AI.
قبل از رونمایی رسمی ، تصویر Reve با نام کد “Halfmoon” در رسانه های اجتماعی شناخته می شد و حدس و گمان و پیش بینی را در جامعه هوش مصنوعی ایجاد می کرد.
ادغام درک انسان و هوش مصنوعی برای ایجاد تصاویر بهتر ، با کیفیت بالاتر و زندگی بیشتر
Reve خود را به عنوان “تیم کوچکی از محققان پرشور ، سازندگان ، طراحان و داستان نویسان با ایده های بزرگ” توصیف می کند. این شرکت بر توسعه ابزار خلاق متمرکز است که باعث می شود نحوه تعامل کاربران با تصاویر دارای هوش مصنوعی باشد.
در X ، Michaël Gharbi ، بنیانگذار و دانشمند تحقیقاتی در Reve ، بینش های خود را در مورد چشم انداز بلند مدت این شرکت به اشتراک گذاشت و بر هدف ساخت مدلهای هوش مصنوعی که به جای ایجاد صرفه جویی در خروجی های بصری قابل قبول ، تأکید می کنند ، تأکید کرد.
غاربی گفت: “گرفتن هدف خلاق مستلزم درک پیشرفته دستگاه از زبان طبیعی و سایر تعاملات است.” “چشم انداز ما ساختن یک بازنمایی واسطه معنایی جدید است که هم یک انسان و هم یک ماشین می توانند درک کنند ، استدلال کنند و روی آن کار کنند.”
اعضای دیگر تیم ، از جمله مهندس هانتر لوفتیس و محقق Taesung Park ، از اهمیت آوردن منطق به تصاویر ناشی از AI ابراز کردند.
پارک مدل های فعلی متن به تصویر را با مدلهای اولیه زبان بزرگ (LLMS) مقایسه کرد ، و اظهار داشت که آنها اغلب نتایج بصری جذاب اما از نظر منطقی متناقض تولید می کنند.
گزارش های اولیه کاربر وعده و محدودیت ها را نشان می دهد
بازخورد اولیه کاربر در مورد Subreddit R/Singularity AI سنگین (در Reddit) ، تا حد زیادی مثبت بوده است ، و بسیاری از آنها ستایش سریع مدل زیر ، ارائه متن با کیفیت بالا و سرعت تولید سریع.
برخی از کاربران موفقیت در تولید صحنه های چند شخصیت و محیط های پیچیده را گزارش کرده اند ، مناطقی که مدل های قبلی اغلب با آن دست و پنجه نرم می کردند.
با این حال ، برخی از چالش ها باقی مانده است. کاربران خاطرنشان کرده اند که تصویر Reve:
- مبارزات با اشیاء پیچیده خاصی (به عنوان مثال ، مواد شفاف مانند یک لیوان شراب کامل).
- در شناخت شخصیت های خاص داستانی مشکل دارد (به عنوان مثال ، کاربرانی که سعی در تولید کاراکترهای بازی های ویدیویی دارند ، این مدل را پیدا کرده است که نتایج عمومی تری تولید می کند).
- گاهی اوقات جزئیات را در ترکیبات چند هدف قرار می دهد.
با وجود این موانع ، تیم REVE به طور فعال با جامعه کاربر درگیر بوده و بازخورد را در پیشرفت های مداوم گنجانیده است.
در دست کوتاه خودم در هنگام تهیه و ایجاد تصویر هدر برای همین مقاله ، من دریافتم که Reve نسبتاً بصری و کاربردی آسان است ، با تصاویر چشمگیر و پایبندی سریع. مانند بسیاری از ژنراتورهای تصویر AI ، یک جعبه متن سریع وجود دارد ، اگرچه برخلاف Midjourney و Ideogram ، Reve آن را در انتهای وب سایت قرار می دهد و محتوای تولید شده شما را از بالا می گذارد تا اکثر فضا را پر کند.

علاوه بر این ، جعبه متن ورودی سریع همچنین شامل چهار دکمه در زیر آن برای تنظیمات دقیق بیشتر در توالی سریع تولید تصویر ، از جمله یک تنظیم کننده نسبت ابعاد (با اندازه استاندارد بین 16: 9 (منظره صفحه گسترده) و 9:16 (پرتره مانند تلفن هوشمند) …

یکی دیگر از گزینه های انتخاب کننده برای چند تصویر وجود دارد که می خواهید از هر سریع (1 ، 2 ، 4 ، 8) تهیه کنید ، یک دکمه برای تغییر و خاموش کردن متن سریع متن را تغییر دهید (این پیش فرض پیش فرض است ، و این بدان معناست که در صورتی که عکسبرداری را به طور خودکار ویرایش می کند بر اساس آنچه می خواهید در تصویر خود مشاهده کنید ، می خواهید در تصویر خود اضافه کنید ، اضافه کردن جزئیات غنی تر از آنچه که شما می خواهید به رنگ و زبانی بیشتر از آنچه که ممکن است در ابتدا بذر باشد) برای تهیه بذرها “و برای اولین بار از آن استفاده کنید) و برای اولین بار از آن استفاده می کنید. از یک تصویر تولید شده قبلی برای راهنمایی نسل های پیش رو.
این تنظیمات به مراتب کمتر است و هیچ ویرایشگر مبتنی بر بصری مانند Midjourney را شامل نمی شود ، اما اصول اولیه وجود دارد و باید بیش از حد کافی باشد تا بیشتر کاربران تصویری گاه به گاه AI شروع کنند.
آزمایشات مختصر من همچنین نشان داد که در ارائه متن خوانا که در تصاویر پخته شده در تصاویر (و فراتر از Midjoruney) و همچنین بیش از کیفیت ارائه چهره های عمومی قابل تشخیص به عنوان Grok (مجدداً ، میان دوره ای و بسیاری از ژنراتورهای تصویر دیگر این امر را ممنوع می کنند) از نظر یا بهتر از ایدوگرافی است.

چه چیزی برای تصویر reve وجود دارد؟
در حالی که این مدل در حال حاضر فقط از طریق وب سایت شرکت در دسترس است ، پیش بینی در حال افزایش برای دسترسی API یا گزینه های بالقوه منبع باز وجود دارد.
کاربران همچنین به ویژگی های اضافی مانند آموزش مدل سفارشی ، ابزارهای کنترل برای انیمیشن و ادغام با نرم افزار خلاق ابراز علاقه کرده اند.
در حال حاضر ، Reve Image در Preview.Reve.Art آزادانه در دسترس است و به کاربران این امکان را می دهد تا قابلیت های خود را دست اول کشف کنند. از آنجا که Reve همچنان به اصلاح مدل های هوش مصنوعی خود و گسترش پیشنهادات خود ادامه می دهد ، این شرکت در حال قرار گرفتن خود به عنوان یک بازیگر اصلی در دنیای در حال تحول ابزار خلاق AI است.
ارسال پاسخ