Baidu LLMS New LLMS Ernie 4.5 و Ernie X1 را تحت پوشش Deepseek ، Openai با هزینه ارائه می دهد – اما آنها منبع باز نیستند (هنوز)

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید


در طول آخر هفته ، غول جستجوی وب چینی Baidu از راه اندازی دو مدل جدید هوش مصنوعی ، ارنی 4.5 و ارنی X1 ، یک مدل زبان چند حالته و مدل استدلال خبر داد.

Baidu ادعا می کند که آنها عملکرد پیشرفته ای را در مورد معیارهای مختلف ارائه می دهند ، V3 غیر فصلی Deepseek و GPT-4.5 OpenSeek را ارائه می دهند (چگونه نام خانوادگی نزدیک را دوست دارید که Baidu نیز انتخاب کرده است؟) در چندین تست معیار شخص ثالث مانند C-Eval (ارزیابی Multive LLM LLM با دانش و استدلال در سراسر 52 موضوع) ، CMMLU (CMMLU) ، CMMLU (CMMLU). GSM8K (مشکلات کلمه ریاضی).

همچنین ادعا می کند که هزینه هر دو مدل استدلال R1 Deepseek Wunderkind's Deepseek را با Ernie X1 با 50 ٪ و AI Juggernaut Openai's GPT-4.5 با ارنی 4.5 به ترتیب 99 ٪ کاهش می دهد.

با این حال ، هر دو محدودیت های مهمی دارند ، از جمله عدم صدور مجوز منبع باز در مورد قبلی (که Deepseek R1 ارائه می دهد) و زمینه ای بسیار کاهش یافته در مقایسه با دومی (8000 توکن به جای 128،000 ، صریحاً کم به طرز حیرت انگیزی در ویندوزهای زمینه میلیون نفخ.

همانطور که کاربر X ClaudeGlass در یک پست خاطرنشان کرد ، پنجره زمینه کوچک باعث می شود که فقط برای Chatbots خدمات مشتری مناسب باشد.

بایدو در X نوشت که قصد دارد منبع باز خانواده Ernie 4.5 مدل را در تاریخ 30 ژوئن 2025 تهیه کند.

Baidu از طریق رابط برنامه نویسی برنامه (API) و چت بابات به زبان چینی به Chatgpt ، معروف به “Ernie Bot” ، دسترسی به مدل ها را امکان پذیر کرده است-به سؤالات پاسخ می دهد ، متن را ایجاد می کند ، نوشتن خلاق را ایجاد می کند و با کاربران ارتباط برقرار می کند-و Ernie Bot را آزاد کرد.

ارنی 4.5: نسل جدیدی از AI multimodal

Ernie 4.5 آخرین مدل بنیاد Baidu است که به عنوان یک سیستم مولتییمال بومی که قادر به پردازش و درک متن ، تصاویر ، صدا و فیلم است ، طراحی شده و یک رقیب واضح برای مدل GPT-4.5 OpenAI است که در فوریه 2025 منتشر شد.

این مدل برای درک بهتر ، تولید ، استدلال و حافظه بهینه شده است. پیشرفت ها شامل بهبود پیشگیری از توهم ، استدلال منطقی و قابلیت های برنامه نویسی است.

به گفته بایدو ، ارنی 4.5 از GPT-4.5 در معیارهای مختلف بهتر عمل می کند و در عین حال هزینه قابل توجهی پایین تر نیز دارد.

پیشرفت های این مدل ناشی از چندین فن آوری کلیدی است ، از جمله ماسک توجه پویا فلش ، مخلوط چند مدلی ناهمگن ، و بازخورد خود را تقویت می کند.

ارنی X1 قابلیت های استدلال عمیق و تفکر عمیق را معرفی می کند و بر درک ، برنامه ریزی ، تأمل و تکامل تأکید می کند.

بر خلاف مدل های استاندارد Multimodal AI ، Ernie X1 به طور خاص برای استدلال پیچیده و استفاده از ابزار طراحی شده است ، و این امکان را برای انجام کارهایی مانند جستجوی پیشرفته ، پرسش و پاسخ مبتنی بر اسناد ، تفسیر تصویر تولید شده توسط AI ، اجرای کد و تجزیه و تحلیل صفحه وب طراحی می کند.

این مدل از طیف وسیعی از ابزارها ، از جمله جستجوی دانشگاهی بایدو ، جستجوی اطلاعات کسب و کار و ابزارهای تحقیقاتی حق رای دادن پشتیبانی می کند. توسعه آن مبتنی بر یادگیری تقویت کننده مترقی ، آموزش پایان به پایان زنجیره های اندیشه و عمل و یک سیستم پاداش چند وجهی واحد است.

دسترسی و در دسترس بودن API

اکنون کاربران می توانند از طریق وب سایت رسمی Ernie Bot به هر دو Ernie 4.5 و Ernie X1 دسترسی پیدا کنند.

برای کاربران و توسعه دهندگان سازمانی ، ارنی 4.5 اکنون از طریق پلت فرم Qianfan Baidu AI Cloud از طریق API Access در دسترس است. پیش بینی می شود ارنی X1 به زودی در دسترس باشد.

قیمت گذاری برای دسترسی API:

  • ارنی 4.5:
    • ورودی: 0.55 دلار در هر 1 میلیون توکن
    • خروجی: 2.2 دلار در هر نشانه 1 میلیون
  • ارنی X1:
    • ورودی: 0.28 دلار در هر نشانه 1M
    • خروجی: 1.1 دلار در هر 1 میلیون نفر

آن را با:

  • Deepseek R1
    • ورودی: 0.55 دلار در هر توکن 1 میلیون
    • خروجی: 2.19 دلار در هر توکین

بایدو همچنین برنامه هایی را برای ادغام ارنی 4.5 و ارنی X1 در اکوسیستم گسترده تر خود ، از جمله جستجوی بایدو و برنامه Wenxiaoyan اعلام کرده است.

ملاحظات تصمیم گیرندگان سازمانی

برای CIO ، CTO ، رهبران IT و تیم های DevOps ، راه اندازی ارنی 4.5 و ارنی X1 هم فرصت ها و هم برای آنها ارائه می دهد:

  • عملکرد در مقابل هزینه – با قیمت گذاری به طور قابل توجهی پایین تر از مدل های رقیب ، سازمان هایی که راه حل های AI را ارزیابی می کنند ممکن است با ادغام مدل های ارنی از طریق API ، صرفه جویی در هزینه را مشاهده کنند. با این حال ، معیار بیشتر و آزمایش در دنیای واقعی ممکن است برای ارزیابی عملکرد برای برنامه های تجاری خاص لازم باشد.
  • قابلیت های چند مدلی و استدلال – توانایی پردازش و درک متن ، تصاویر ، صدا و فیلم می تواند برای مشاغل موجود در صنایعی مانند پشتیبانی مشتری ، تولید محتوا ، فناوری حقوقی و امور مالی ارزشمند باشد.
  • ادغام ابزار -توانایی ارنی X1 در کار با ابزارهایی مانند جستجوی پیشرفته ، پرسش و پاسخ مبتنی بر اسناد و تفسیر کد می تواند اتوماسیون و بهره وری را در محیط های سازمانی فراهم کند.
  • اکوسیستم و بومی سازی -از آنجا که مدل های هوش مصنوعی بایدو برای پردازش زبان چینی و دانش منطقه ای بهینه می شوند ، بنگاه هایی که در چین کار می کنند یا بازارهای چینی زبان را هدف قرار می دهند ممکن است مدل های ارنی را مؤثرتر از گزینه های جهانی بدانند.
  • صدور مجوز و حریم خصوصی داده ها -در حالی که Baidu اعلام کرده است که GPT-4.5 در اواخر تابستان ، 30 ژوئن 2025 منبع آزاد خواهد شد ، اما هنوز هم سه ماه از آن فاصله دارد ، بنابراین شرکت ها باید حداقل تا آن زمان صبر کنند تا ارزیابی کنند که آیا ارزش استقرار محلی یا خدمات ابری میزبان ایالات متحده را دارد. کاربران سازمانی باید قبل از ادغام این راه حل های هوش مصنوعی ، سیاست های بایدو را در مورد حریم خصوصی داده ها ، انطباق و استفاده از مدل بررسی کنند.

گسترش AI و چشم انداز آینده

با سرعت بخشیدن به توسعه هوش مصنوعی در سال 2025 ، بایدو خود را به عنوان یک رهبر در فن آوری های AI چند مدلی و مبتنی بر استدلال قرار می دهد.

این شرکت قصد دارد سرمایه گذاری در هوش مصنوعی ، مراکز داده و زیرساخت های ابری را برای ارتقاء قابلیت های مدل های بنیاد خود ادامه دهد.

با ارائه ترکیبی از عملکرد قدرتمند و هزینه های پایین تر ، آخرین مدل های هوش مصنوعی بایدو با استفاده از ابزارهای AI در دسترس و پیشرفته تر ، مشاغل و کاربران فردی را فراهم می کند.

برای اطلاعات بیشتر ، به وب سایت رسمی Ernie Bot مراجعه کنید.