ماری Moonvalley یک مدل ویدیویی پیشرفته از AI است که روی داده های کاملاً دارای مجوز آموزش دیده است
ماری Moonvalley یک مدل ویدیویی پیشرفته از AI است که روی داده های کاملاً دارای مجوز آموزش دیده است

ماری Moonvalley یک مدل ویدیویی پیشرفته از AI است که روی داده های کاملاً دارای مجوز آموزش دیده است

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید


چند سال پیش ، هیچ چیز به عنوان “مدل ویدیویی هوش مصنوعی” وجود نداشت.

امروزه ، ده ها نفر وجود دارد ، از جمله بسیاری از قادر به ارائه فیلم های با کیفیت فوق العاده با کیفیت بالا ، با کالیبر فوق العاده واقع گرایانه هالیوود در ثانیه از متن متن یا تصاویر بارگیری شده توسط کاربر و کلیپ های ویدیویی موجود. اگر در چند ماه گذشته VentureBeat را خوانده اید ، بدون شک مقالاتی در مورد این مدل ها و شرکت های پشت سر آنها پیدا کرده اید ، از Gen-3 Bunway گرفته تا Veo 2 Google تا با تأخیر طولانی مدت Openai اما در نهایت در دسترس Sora به Luma AI ، Pika و Upstarts Kling و Hailuo. حتی Alibaba و یک استارتاپ به نام Genmo نسخه های منبع باز را ارائه داده اند.

در حال حاضر ، از آنها برای تهیه بخش هایی از Blockbusters اصلی استفاده شده است همه چیز ، همه جا همه به یکباره به کارآگاه واقعی HBO: کشور شبانه برای موسیقی فیلم ها و تبلیغات تلویزیونی توسط Toys R 'Us و Coca Cola. اما علی رغم آغوش نسبتاً سریع هالیوود و فیلمسازان ، هنوز یک مسئله بزرگ بالقوه وجود دارد: نگرانی های مربوط به حق چاپ.

همانطور که می توانیم بگوییم با توجه به اینکه بیشتر این راه اندازی های مدل ویدیویی هوش مصنوعی به طور عمومی جزئیات دقیق داده های آموزشی خود را به اشتراک نمی گذارند ، بیشتر آنها روی بخش های گسترده ای از فیلم های بارگذاری شده در وب یا جمع آوری شده از سایر منابع بایگانی ، از جمله کسانی که دارای حق چاپ هستند ، آموزش داده می شوند که ممکن است یا ممکن است در واقع مجوز صریح شرکت های ویدئویی AI را دریافت کرده اند. در حقیقت ، باند فرودگاه در بین شرکت هایی است که در یک دادخواست اقدام طبقاتی قرار دارند (هنوز هم از طریق دادگاه ها کار می کنند) ، در این مورد ، و طبق گزارش ها ، Nvidia تعداد زیادی از فیلم های YouTube را نیز برای این منظور خراب کرد. این اختلاف در حال انجام است – خواه داده های خراش از جمله فیلم ها استفاده منصفانه و تحول گرا را تشکیل دهند ، یا خیر.

اما اکنون یک جایگزین جدید برای کسانی که نگران کپی رایت هستند وجود دارد و نمی خواهند از مدل هایی استفاده کنند که در آن یک علامت سؤال وجود داشته باشد: یک استارتاپ به نام Moonvalley – که توسط Google Deepminders و محققان سابق از متا ، مایکروسافت و Tiktok تأسیس شده است – در میان دیگران – ماری ، یک مدل ویدئویی تولیدی طراحی شده برای Hollywood Studios ، Filmmakers و Enterprise Brands را معرفی کرده است. ماری که به عنوان یک مدل ویدیویی “تمیز” از پیشرفته AI قرار دارد ، ماری به طور انحصاری بر روی داده های متعلق و دارای مجوز آموزش دیده است و یک جایگزین اخلاقی برای مدل های هوش مصنوعی تهیه شده با استفاده از محتوای خراشیده ارائه می دهد.

نعیم تالوكدار ، مدیرعامل و بنیانگذار Moonvalley ، در مصاحبه ویدیویی اخیر با VentureBeat گفت: “مردم گفتند كه ساخت یك مدل ویدیوی هوش مصنوعی برش بدون استفاده از داده های خراشیده ، از نظر فنی امكان پذیر نیست.” “ما در غیر این صورت ثابت کردیم.”

ماری ، که هم اکنون به صورت لیست انتظار فقط دعوت شده است ، به مدل ویدیویی Firefly Adobe می پیوندد ، که آن فروشنده نرم افزار طولانی تأسیس شده همچنین می گوید همچنین درجه سازمانی است-فقط با داده های دارای مجوز و داده های سهام Adobe (به بحث و جدال برخی از مشارکت کنندگان) آموزش داده شده است-و شرکت های مربوط به استفاده را برای استفاده فراهم می کند. Moonvalley همچنین در بند 7 این سند جبران خسارت می کند و می گوید با هزینه خود از مشتریان خود دفاع خواهد کرد.

Moonvalley امیدوار است که این ویژگی ها باعث شود ماری برای استودیوهای بزرگ جذاب شود-حتی مانند سایر مواردی که باند با آنها معامله می کنند-و فیلمسازان ، بیش از مجموعه های بی شماری و رو به رشد از گزینه های جدید ایجاد ویدیویی هوش مصنوعی.

فیلم هوش مصنوعی “اخلاقی” بیشتر؟

ماری نتیجه همکاری بین Moonvalley و Asteria ، یک فیلم AI AI AI AIT و Animation Studio است. این مدل برای کمک به کمک به جای جایگزینی متخصصان خلاق ساخته شده است و در عین حال که استانداردهای صنعت سنتی را حفظ می کند ، ابزارهای جدیدی را برای تولید فیلم های محور AI در اختیار فیلمسازان قرار می دهد.

تالوکدار گفت: “اعتقاد ما این بود که شما نمی خواهید در این صنعت اتخاذ کنید ، مگر اینکه این کار را با صنعت انجام دهید.” وی گفت: “این صنعت با صدای بلند و واضح بوده است که برای اینکه آنها واقعاً از این مدل ها استفاده کنند ، باید بفهمیم که چگونه می توان یک مدل تمیز ساخت. و تا امروز ، مسیر برتر این بود که شما نمی توانید این کار را انجام دهید. “

Moonvalley به جای اینکه اینترنت را برای محتوا بکشید ، روابط مستقیمی با این سازندگان ایجاد کرد تا فیلم های خود را مجوز دهد. این شرکت برای ایجاد این مشارکت ها چندین ماه طول کشید و اطمینان حاصل کرد که تمام داده های مورد استفاده برای آموزش به طور قانونی به دست آمده و کاملاً دارای مجوز است.

استراتژی صدور مجوز Moonvalley همچنین برای پشتیبانی از سازندگان محتوا با جبران آنها برای کمک های آنها طراحی شده است.

تالوكدار گفت: “بیشتر روابط ما در حال ورود به سیستم است كه مردم شروع به شنیدن درباره آنچه ما انجام می دهیم.” وی گفت: “برای سازندگان شهر کوچک ، بسیاری از فیلم های آنها فقط در اطراف نشسته اند. ما می خواهیم به آنها کمک کنیم تا از آن درآمد کسب کنند و می خواهیم مدل های متمرکز بر هنرمند را انجام دهیم. این یک رابطه بسیار خوب به پایان می رسد. “

تالوکدار به VentureBeat گفت که در حالی که این شرکت هنوز در حال ارزیابی و تجدید نظر در مدل های جبران خسارت خود است ، اما به طور کلی سازندگان را بر اساس مدت زمان فیلم خود جبران می کند ، و به آنها نرخ ساعتی یا کوچک تحت توافق نامه های صدور مجوز ثابت پرداخت می کند (به عنوان مثال ، 12 یا 4 ماه). در صورت ادامه استفاده از محتوا ، این امکان را برای پرداختهای مکرر بالقوه فراهم می کند.

هدف این شرکت این است که تولید فیلم های سطح بالا را در دسترس تر و مقرون به صرفه تر قرار دهد و به فیلمسازان ، استودیوها و تبلیغ کنندگان اجازه می دهد داستان های تولید شده توسط AI را بدون نگرانی های قانونی یا اخلاقی کشف کنند.

کنترل فیلمبرداری بیشتر فراتر از متن ، تصاویر و جهت دوربین

تالوکدار توضیح داد که Moonvalley با تمرکز بر روی تولید حرفه ای و نه برنامه های مصرف کننده ، با مدل ویدیویی ماری AI از مدل های ویدیویی AI موجود رویکرد متفاوتی اتخاذ کرده است.

وی گفت: “امروزه بیشتر شرکت های ویدیویی مولد متمرکز بر مصرف کننده هستند.” آنها مدل های ساده ای می سازند که در آن شما یک چت بابات را فوریت می کنید ، برخی از کلیپ ها را تولید می کنید و جلوه های جالبی را اضافه می کنند. تمرکز ما متفاوت است – فناوری مورد نیاز برای استودیوهای هالیوود چیست؟ مارک های اصلی برای ایجاد تبلیغات Super Bowl به چه مواردی نیاز دارند؟ “

ماری چندین پیشرفت در فیلم های تولید شده توسط AI ، از جمله:

  • نسل HD بومی -فیلم با کیفیت بالا و بدون تکیه بر مجلل و کاهش مصنوعات تجسمی تولید می کند.
  • طول فیلم طولانی -بر خلاف اکثر مدل های ویدیویی هوش مصنوعی ، که تنها چند ثانیه فیلم تولید می کنند ، ماری می تواند در یک پاس واحد سکانس های 30 ثانیه ای ایجاد کند.
  • ویرایش مبتنی بر لایه – بر خلاف سایر مدلهای ویدیویی تولیدی ، ماری به کاربران اجازه می دهد تا به طور جداگانه پیش زمینه ، میانه و پیش زمینه را ویرایش کنند و کنترل دقیق تری بر ترکیب ویدیو ارائه دهند.
  • ورودی های داستانی و ورودی های مبتنی بر طرح -به جای تکیه فقط به متن متن (که بسیاری از مدل های هوش مصنوعی انجام می دهند) ، ماری فیلمسازان را قادر می سازد با استفاده از تابلوهای داستانی ، طرح ها و حتی منابع عمل زنده بسازند و آن را برای متخصصان بصری تر می کند.
  • بیشتر در مورد ورودی های تهویه پاسخگوتر است -این مدل برای تفسیر بهتر ورودی های خارجی مانند نقشه ها و منابع حرکتی طراحی شده است و باعث می شود فیلم تولید شده با AI قابل کنترل تر شود.
  • ویراستار ویدیوی “تولید بومی” -Moonvalley در حال توسعه نرم افزار همراه در کنار ماری است ، که به عنوان یک ابزار ویرایش ویدیویی بومی تولید می شود که به کاربران کمک می کند تا پروژه ها و جدول زمانی را به طور مؤثرتری مدیریت کنند.

تالوکدار توضیح داد: “این مدل به خودی خود بسیار به شدت در اطراف کنترل ساخته شده است.” وی گفت: “شما باید کنترل های قابل توجهی در اطراف خروجی داشته باشید – قادر به تغییر شخصیت ها باشید. این اولین مدلی است که به شما امکان می دهد ویرایش مبتنی بر لایه را انجام دهید ، بنابراین می توانید پیش زمینه ، میانه زمین و پس زمینه را به طور جداگانه ویرایش کنید. این همچنین اولین مدلی است که برای هالیوود ساخته شده است و هدفمند تولید است. “

علاوه بر این ، وی به VentureBeat گفت که ماری به یک مدل ترکیبی انتشار دهنده ترجمه کننده متکی است که ترکیبی از معماری های انتشار و ترانسفورماتور است.

تالوکدار گفت: “این مدل ها مدل های ترجمه کننده انتشار هستند ، بنابراین معماری ترانسفورماتور است ، و سپس شما به عنوان بخشی از لایه ها انتشار دارید.” “وقتی کنترل پذیری را معرفی می کنید ، معمولاً از طریق آن لایه ها این کار را انجام می دهید.”

با نام Big Name VCS تأمین می شود اما به اندازه سایر راه اندازی های ویدئویی AI (هنوز)

Moonvalley همچنین در این هفته با اعلام یک دور بذر 70 میلیون دلاری به رهبری Bessemer Venture Partners ، Khosla Ventures و General Catalyst اعلام می شود. سرمایه گذاران Hemant Taneja ، Samir Kaul و Byron Deeter نیز به هیئت مدیره شرکت پیوسته اند.

تالوکدار خاطرنشان کرد: بودجه Moonvalley به طور قابل توجهی کمتر از برخی از رقبای خود است ، تاکنون – گزارش شده است که باند فرودگاه 270 میلیون دلار در کل در چندین دور جمع آوری کرده است – اما با جمع آوری یک تیم نخبه از محققان و مهندسان هوش مصنوعی ، منابع خود را بهینه کرده است.

وی گفت: “ما حدود 70 میلیون دلار جمع آوری کردیم ، کاملاً کمتر از رقبای خود.” “اما این واقعاً به تیم فرو می رود – تیمی که می تواند آن معماری را به طور قابل توجهی کارآمدتر ، محاسبه و همه آن چیزهای مختلف بسازد.”

ماری در حال حاضر در یک مرحله با دسترسی محدود قرار دارد و استودیوهای منتخب و فیلمسازان مدل را آزمایش می کنند. Moonvalley قصد دارد به تدریج دسترسی را طی هفته های آینده گسترش دهد.

تالوکدار تأیید کرد: “در حال حاضر ، تعدادی استودیو وجود دارد که به آن دسترسی پیدا می کنند ، و ما یک گروه آلفا با دوجین فیلمساز از آن استفاده می کنیم.” “امید این است که طی دو هفته ، ظرف دو ماه ، در عرض دو هفته کاملاً در دسترس باشد.”

با راه اندازی ماری ، Moonvalley و Asteria قصد دارند خود را در صدر فیلمبرداری با کمک AI قرار دهند و استودیوها و مارک ها را راه حلی ارائه دهند که AI را بدون به خطر انداختن یکپارچگی خلاقانه ادغام می کند. اما با استفاده از رقبای راه اندازی ویدیویی هوش مصنوعی مانند باند ، پیکا و هیدرا همچنان به افزودن ویژگی های جدید مانند صدای شخصیت و حرکات ادامه می دهند.