Groq و Playai فقط صدای صدا را صدا کردند
Groq و Playai فقط صدای صدا را صدا کردند

Groq و Playai فقط صدای صدا را صدا کردند

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید


Groq و Playai امروز از همکاری برای ارائه گفتگو ، یک مدل پیشرفته متن به گفتار ، برای بازاریابی از طریق پلت فرم استنتاج پر سرعت Groq خبر دادند.

این مشارکت تخصص Playai را در AI AI با زیرساخت های تخصصی پردازش Groq ترکیب می کند و آنچه را که شرکت ها ادعا می کنند یکی از سیستم های طبیعی و پاسخگو ترین سیستم های متن به گفتار است ، ایجاد می کند.

ایان اندروز ، مدیر ارشد درآمد در Groq ، در مصاحبه اختصاصی با VentureBeat گفت: “Groq یک سیستم کامل و کم تأخیر برای تشخیص خودکار گفتار (ASR) ، Genai و متن به گفتار را در یک مکان فراهم می کند.” “با گفتگو اکنون در GroqCloud ، این بدان معنی است که مشتریان مجبور نیستند از چندین ارائه دهنده برای یک مورد استفاده واحد استفاده کنند – Groq یک راه حل یک توقف است.”

https://www.youtube.com/watch؟v=JSWHGD5L8GK

Groq Powers اولین صدای عربی AI ، با گسترش حضور فناوری خاورمیانه

گفتگوی به دلیل موجود در انگلیسی و عربی قابل توجه است ، با نسخه عربی نشان دهنده اولین صدای هوش مصنوعی است که به طور خاص برای منطقه خاورمیانه طراحی شده است. گنجاندن عربی به عنوان یکی از پیشنهادات اولیه برای هر دو شرکت استراتژیک بود.

اندروز به VentureBeat گفت: “عربی چهارمین زبان گفتاری در سطح جهان است – با همکاری با Playai برای ارائه یک مدل عربی TTS ، Groq در حال باز کردن یک بازار کلیدی جهانی و امکان دسترسی گسترده تر به استنتاج سریع AI است.”

شرکت ها ادعا می کنند که راه حل خود به کاستی های کلیدی در فن آوری های صوتی موجود ، به ویژه در مورد الگوهای گفتار طبیعی و سرعت پاسخ می پردازد. طبق آزمایش معیار انجام شده توسط ارزیابی کننده شخص ثالث Podonos ، گفتگوی توسط کاربران با نرخ 10: 1 در مقابل یازدهلااب V2.5 توربو و بیش از 3: 1 در برابر Elevenlabs Multwwdual V2.0 ترجیح داده شد.

نوآورانه “گفتار سازگار سازگار” AI مکالمه را تغییر می دهد

آنچه گفتگو را از هم جدا می کند ، رویکرد پیچیده آن به متن است. این سیستم به جای اینکه هر صدا را به عنوان یک رویداد منزوی درمان کند ، آگاهی از کل جریان مکالمه را حفظ می کند.

محمود فلفل ، بنیانگذار و مدیرعامل Playai ، در مصاحبه ای با VentureBeat گفت: “ما یک معماری جدید ایجاد کردیم که ما آن را” متن گفتار تطبیقی ​​”(ASC) می نامیم ، که به مدل اجازه می دهد تا از متن و تاریخچه مکالمه استفاده کند.” “این بدان معنی است که هر پاسخ فقط یک خروجی مستقل نیست ؛ بلکه با دادرس ، لحن و احساسی مناسب غنی شده است که منعکس کننده جریان مکالمه است.”

برای شرکت هایی که به دنبال اجرای هوش مصنوعی مکالمه هستند ، تأخیر بین درخواست و پاسخ – یک چالش مداوم بوده است. به نظر می رسد واحدهای تخصصی پردازش زبان Groq (LPU) مزیت قابل توجهی در این زمینه دارند.

اندروز توضیح داد: “بر اساس آزمایش داخلی اولیه ، GROQ در مدل گفتگوی Playai حداکثر 140 کاراکتر در ثانیه ارائه می دهد ، یک افزایش قابل توجه در مقایسه با همان مدل که در GPU ها با 86 کاراکتر در ثانیه کار می کند.” “این بدان معنی است که گفتگو تا 10 برابر سریعتر از زمان واقعی ، متن را ایجاد می کند.”

Groq 1.5 میلیارد دلار سرمایه گذاری سعودی را برای ساخت زیرساخت های AI در سطح جهانی تأمین می کند

این مشارکت در زمان گسترش قابل توجهی برای Groq انجام می شود ، که اخیراً تعهد 1.5 میلیارد دلاری از عربستان سعودی را برای تأمین بودجه زیرساخت های اضافی تضمین کرده است. این شرکت یک مرکز داده در Dammam ایجاد کرده است که آن را “بزرگترین خوشه استنباط منطقه” توصیف می کند.

فلفل گفت: “همکاری با Groq یک فرد بدون مغز بود ؛ آنها رهبر صنعت در زیرساخت های استنتاج پیشرفته AI هستند.” “با TTS و نمایندگان ، تأخیر کم بسیار مهم است. ما قبلاً گفتگوی را برای این برنامه های زمان واقعی بهینه کرده ایم ، اما همکاری با Groq به ما امکان می دهد تا مدل صوتی کمترین تأخیر را در بازار ارائه دهیم.”

بازار صوتی AI شاهد رشد سریع بوده است زیرا مشاغل به دنبال حفظ تعامل مشتری در حالی که تجربه ای طبیعی و مانند انسان دارند ، به دنبال خودکار هستند. برنامه های کاربردی از خدمات مشتری و اتوماسیون فروش گرفته تا صدا و سیما و ویژگی های دسترسی برای کمبود بینایی.

برنامه های سازمانی فراتر از موارد سنتی استفاده از خدمات مشتری گسترش می یابد

اندروز گفت: “فراتر از خدمات مشتری ، سایر موارد استفاده از شرکت ها شامل خودکارآمدی فروش و برنامه ریزی قرار ملاقات ، دستیاران در هیئت مدیره و شخصی ، ایجاد صدای صوتی به محتوای موجود ، ترجمه محتوای صوتی و تصویری انگلیسی به عربی ، افزایش وب سایت و دسترسی به محتوای استاتیک برای افراد بینایی و موارد دیگر است.”

برای Playai ، که توسط کارآفرینان از منطقه خاورمیانه و شمال آفریقا تأسیس شده است ، گنجاندن قابلیت های زبان عربی به ویژه معنی دار بود.

فلفل گفت: “به عنوان بنیانگذاران MENA ، ما می دانیم که این منطقه به شدت در توانایی های هوش مصنوعی و زیرساخت ها سرمایه گذاری هایی مانند Groq ، بلکه پذیرش پیشرو در جهان است.” “عربی یک زبان تجاری جهانی است و ما در حال صحبت کردن هستیم ، بنابراین این یک انتخاب طبیعی به عنوان یکی از زبانهای اصلی ما بود.”

این شرکت ها فناوری گفتگو را از طریق مدل خدمات مرتب شده Groqcloud در دسترس قرار داده اند که شامل گزینه های رایگان و پرداخت شده است. این رویکرد به توسعه دهندگان این امکان را می دهد تا قبل از تعهد به پیاده سازی های بزرگتر ، با این فناوری آزمایش کنند.

اندروز توضیح داد: “Groqcloud برنامه های رایگان و پرداخت شده را ارائه می دهد. هر کسی می تواند یک حساب کاربری ایجاد کند و یک کد API را به صورت رایگان ایجاد کند.” “ردیف توسعه دهنده پرداخت شده ما از خود خدمت است ، به این معنی که هر کسی که دارای کارت اعتباری است می تواند خود را ثبت نام کند.”

از آنجا که صدا به یک رابط به طور فزاینده ای برای سیستم های هوش مصنوعی تبدیل می شود ، این مشارکت هر دو شرکت را برای سرمایه گذاری در روزافزون تقاضا برای تجربیات مکالمه طبیعی و پاسخگوتر قرار می دهد. با پرداختن به چالش های فنی تأخیر و الگوهای گفتار طبیعی ، Groq و Playai ممکن است موانع قابل توجهی را برای پذیرش گسترده تر AI صوتی در تنظیمات شرکت ها حذف کرده باشد.