برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید
اکنون مردم می توانند بومی باشند تصاویر استودیوی Ghibli با الهام از استودیو ایجاد شده توسط chatgpt را وارد کنید مشاغل آنها OpenAI مدل پشت ابزار تولید تصویر بسیار محبوب خود را که در Chatgpt استفاده می شود ، به API خود اضافه کرده است.
مدل GPT-Image-1 به توسعه دهندگان و شرکت ها اجازه می دهد تا “تولید تصویر با کیفیت بالا و حرفه ای را مستقیماً در ابزارها و سیستم عامل های خود ادغام کنند.”
اوپای در یک پست وبلاگ گفت: “تطبیق پذیری این مدل به آن اجازه می دهد تا تصاویر را در سبک های متنوع ایجاد کند ، با وفاداری از دستورالعمل های سفارشی ، اهرم دانش جهان و ارائه دقیق متن – باز کردن برنامه های کاربردی بی شماری در حوزه های مختلف ، پیروی کند.”
قیمت گذاری برای API نشانه های متن و تصاویر را از هم جدا می کند. نشانه های ورودی متن ، یا متن سریع ، 5 دلار در هر 1 میلیون نشانه هزینه خواهد داشت. نشانه های ورودی تصویر 10 دلار در هر میلیون دلار خواهد بود ، در حالی که نشانه های خروجی تصویر یا تصویر تولید شده ، 40 دلار در هر میلیون دلار خواهد بود.
رقبا مانند ثبات AI یک سیستم مبتنی بر اعتبار را برای API خود ارائه می دهند که در آن یک اعتبار برابر با 0.01 دلار است. با استفاده از تصویر پایدار پرچمدار خود Ultra هشت اعتبار در هر نسل هزینه دارد. مدل تولید تصویر Google ، Imagen ، هزینه پرداخت کاربران 0.03 دلار برای هر تصویر تولید شده با استفاده از API Gemini را پرداخت می کند.
تولید تصویر در یک مکان
OpenAI به کاربران ChatGPT اجازه داد تا در ماه آوریل ، چند ماه پس از افزودن تولید تصویر به ChatGPT از طریق مدل GPT-4O ، تصاویر را مستقیماً در رابط چت تولید و ویرایش کنند.
این شرکت گفت که تولید تصویر در سکوی گپ “به سرعت یکی از محبوب ترین ویژگی های ما شد.” Openai گفت بیش از 130 میلیون کاربر به این ویژگی دسترسی پیدا کرده اند و تنها در هفته اول 700 میلیون عکس ایجاد کرده اند.
با این حال ، این محبوبیت همچنین OpenAI را با برخی از چالش ها ارائه داد. کاربران رسانه های اجتماعی به سرعت فهمیدند که می توانند چتپپ را به تولید تصاویر با الهام از استودیوی انیمیشن ژاپنی Ghibli و در نتیجه ، فیدهای رسانه های اجتماعی من برای کل آخر هفته با همان عکس ها پر شوند. این روند باعث شد مدیرعامل OpenAi سام آلتمن ادعا کند که GPU های این شرکت “ذوب می شوند”.
OpenAI قبلاً مدل تصویر خود Dall-E 3 را در Chatgpt اضافه کرده بود. این مدل یک مدل ترانسفورماتور انتشار بود و نه درک چندمدی بومی که GPT-4O دارد.
موارد استفاده شرکت
شرکت ها توانایی تولید تصاویر را برای پروژه های خود می خواهند و بسیاری نمی خواهند یک برنامه جداگانه برای انجام این کار باز کنند. OpenAI با افزودن مدل تصویر به API خود ، به شرکتها اجازه می دهد GPT-Image-1 را به اکوسیستم های خود متصل کنند.
Openai گفت که قبلاً دیده شده است که چندین شرکت و استارتاپ ها از این مدل برای پروژه های خلاق ، محصولات و تجربیات استفاده می کنند و چندین مارک مشهور را در پست وبلاگ خود نامگذاری می کنند.
بنا بر گزارش ها ، Canva در حال بررسی راه های ادغام GPT-Image-1 برای ابزارهای Canva AI و Magic Studio است. Godaddy قبلاً آزمایش با تولید تصویر را برای ایجاد آرم های خود آغاز کرده است ، و Airtable اکنون بازاریابی شرکت و تیم های خلاق را قادر می سازد تا به راحتی گردش کار دارایی را در مقیاس مدیریت کنند.
Openai گفت GPT-Image-1 همان نگهبان ایمنی را در API مانند Chatgpt دریافت می کند. این شرکت گفت تصاویر تولید شده با مدل به طور بومی شامل ابرداده از ائتلاف برای اثبات محتوا و اصالت (C2PA) است که محتوا را به عنوان AI تولید می کند و مالکیت آن را دنبال می کند. Openai بخشی از کمیته فرمان C2PA است.
کاربران همچنین می توانند اعتدال محتوا را برای تولید تصاویری که به بهترین وجه با برند خود مطابقت دارند ، کنترل کنند.
OpenAI قول داد که از داده های API مشتری استفاده نمی کند ، از جمله هر تصویری که توسط GPT-Image-1 بارگذاری شده یا تولید شده است برای آموزش مدل های آن.
ارسال پاسخ