برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید
آخرین گزارش استفاده پو نشان می دهد OpenAi و Google باعث تقویت موقعیت های خود در دسته های اصلی هوش مصنوعی می شوند در حالی که انسان شناسی از دست می دهد و قابلیت های استدلال تخصصی به عنوان یک میدان نبرد رقابتی مهم ظاهر می شود.
براساس داده های منتشر شده امروز توسط POE ، بستری که دسترسی به بیش از 100 مدل هوش مصنوعی را ارائه می دهد ، تغییرات قابل توجهی در سهم بازار بین ژانویه و مه 2025 در کلیه دسته های اصلی هوش مصنوعی رخ داده است. داده ها ، که از مشترکان POE گرفته شده است ، دید نادر را در ترجیحات واقعی کاربر فراتر از معیارهای صنعت فراهم می کند.
نیک هوبر ، رهبری اکوسیستم هوش مصنوعی پو ، در مصاحبه اختصاصی با VentureBeat گفت: “به عنوان یک دروازه جهانی به 100+ مدل AI ، POE یک نمای منحصر به فرد از روند استفاده در سراسر اکوسیستم دارد.” “شگفت آور ترین اتفاقاتی که در حال حاضر اتفاق می افتد نوآوری سریع است (3 برابر تعداد نسخه های Jan-May 2025 در مقابل مدت مشابه سال 2024) ، یک چشم انداز رقابتی به طور فزاینده متنوع و مدل های استدلال داستان موفقیت آشکار اوایل سال 2025 است.”
GPT-4O تسلط خود را حفظ می کند در حالی که مدل های جدید به سرعت سهم بازار را ضبط می کنند
در تولید متن اصلی ، GPT-4O OpenAi موقعیت فرماندهی خود را با 35.8 ٪ سهم پیام حفظ کرد ، در حالی که خانواده جدیدتر GPT-4.1 این شرکت به سرعت 9.4 ٪ از استفاده را در طی چند هفته پس از راه اندازی به دست آورد. Google’s Gemini 2.5 Pro به طور مشابه تقریباً 5 ٪ اشتراک پیام را اندکی پس از معرفی آن به دست آورد.
این دستاوردها عمدتاً به هزینه مدل های کلود انسان شناسی ، که شاهد کاهش 10 ٪ مطلق سهم در طول دوره گزارش بود ، حاصل شد. در این گزارش آمده است که Claude 3.7 Sonnet اکنون به طور قابل توجهی جایگزین غزل قبلی Claude 3.5 در اولویت کاربر شده است ، اگرچه دومی هنوز هم سهم قابل توجه 12 ٪ را حفظ می کند.
Deepseek ، که در اوایل سال جاری رشد ویروسی را تجربه کرده است ، حرکت خود را کند کرده است زیرا رقبا مدلهای استدلال مقرون به صرفه و کلامی خود را منتشر کرده اند. سهم پیام Deepseek R1 از اوج 7 ٪ در اواسط فوریه به 3 ٪ تا پایان آوریل کاهش یافته است.
قابلیت های پیچیده حل مسئله به تمایز اصلی در بازار هوش مصنوعی تبدیل می شود
شاید مهمترین روند مشخص شده در این گزارش ، رشد چشمگیر در مدلهای استدلال تخصصی باشد که از تقریباً 2 ٪ به 10 ٪ از کل پیام های متنی ارسال شده در POE از ابتدای سال 2025 گسترش یافته است.
هوبر به VentureBeat گفت: “مدلهای استدلال ، حتی در روزهای اولیه ، توانایی قابل توجهی برای انجام کارهای پیچیده با افزایش دقت نشان داده اند.” “پذیرندگان اولیه به وضوح در این مورد ارزش پیدا می کنند و مایل هستند برای نتایج بهتر ، معاملات در هزینه و زمان پردازش را به دست آورند.”
در این بخش با رشد بالا ، Gemini 2.5 Pro به سرعت خود را به عنوان یک رهبر تأسیس کرد و تقریباً 31 ٪ از استفاده از مدل استدلال را تنها در شش هفته از راه اندازی به دست آورد. اکنون این گروه را پیش می برد ، پیش از مدلهای خاص استدلال کلود.
Openai همچنان در این فضا به سرعت در این فضا نوآوری می کند و چندین مدل استدلال (O1-Pro ، O3-Mini ، O3-Mini-High ، O3 و O4-Mini) را در چهار ماه اول سال 2025 منتشر می کند. این گزارش حاکی از آن است که کاربران POE به سرعت جدیدترین پیشنهادات Openai را اتخاذ می کنند و از مدل های قدیمی تر مانند O1 به گزینه های جدیدتر مانند O3 منتقل می شوند.
در این گزارش همچنین به ظهور مدلهای استدلال ترکیبی مانند Gemini 2.5 Flash Preview و QWEN 3 اشاره شده است که می تواند به صورت پویا سطح استدلال خود را در مکالمات تنظیم کند. با این حال ، این مدل ها در حال حاضر فقط حدود 1 ٪ از استفاده از مدل استدلال را نشان می دهند.
تحلیلگران صنعت پیشنهاد می کنند که این تغییر به سمت قابلیت های استدلال تخصصی نشان دهنده یک بازار هوش مصنوعی بالغ است که در آن تولید متن خام در حال تبدیل شدن به کالا است و ارائه دهندگان را وادار می کند تا از طریق قابلیت های با ارزش بالاتر که می توانند قیمت گذاری حق بیمه را صادر کنند ، متمایز شوند.
Google’s Imagen 3 چالش بازیکنان را در Visual AI Arena ایجاد کرد
بازار تولید تصویر به طور فزاینده ای رقابتی به نظر می رسد ، با خانواده Google Imagen 3 به طور پیوسته از حدود 10 ٪ به 30 ٪ سهم در سال 2025 در حال رشد است ، که اکنون با خانواده مدلهای Flux Flabs Labs ، رهبر گروه رقیب است ، که در اواخر ماه آوریل حدود 35 ٪ سهم را در اختیار داشتند.
GPT-Image-1 Openai ، که در اواخر ماه آوریل به API معرفی شد ، به سرعت 17 ٪ از تولید تصویر را در تنها دو هفته به دست آورد و در برنامه چتپپ در طول ماه مارس و اوایل آوریل ، تصویب ویروسی خود را در برنامه چتپپ نشان داد.
این گزارش نشان می دهد که مدل های Flux سهم کلی خود را در تولید تصویر در POE حفظ کرده اند ، اما در دوره گزارش ، کاهش متوسطی از تقریباً 45 ٪ به 35 ٪ را تجربه کرده اند.
این رقابت سه جانبه بین آزمایشگاه های Google ، Openai و Black Forest ، تغییر قابل توجهی از اوایل سال 2024 نشان می دهد ، هنگامی که انواع Midjourney و Patable Dispusion بر این فضا حاکم بودند. پیشرفت سریع در کیفیت تصویر ، پیروی از پیشبرد ها و سرعت بخشیدن به این گروه به یکی از مناطق نبرد AI که به شدت مورد بحث قرار گرفته است ، تبدیل شده است.
براساس داده های صنعت تکمیلی ، اتخاذ سازمانی از تولید تصویر در شش ماه گذشته به طور قابل توجهی تسریع کرده است ، در حالی که بخش های بازاریابی و آژانس های خلاق به طور فزاینده ای این ابزارها را در گردش کار تولید خود ادغام می کنند.
Kling Upstart چینی بازار AI را مختل می کند ، و منجر به ابتدای باند باند می شود
در تولید ویدیو ، آزمایشگاه چینی های تازه منتشر شده Kling ، آزمایشگاه چینی Kuaishou به سرعت بازار را مختل کرده است و به طور جمعی حدود 30 ٪ سهم استفاده را به خود اختصاص داده است. مهمتر از همه ، Kling-2.0-Master تا پایان ماه آوریل ، فقط سه هفته پس از انتشار ، 21 ٪ از کل تولید فیلم در POE را بدست آورد.
Google’s Veo 2 پس از راه اندازی فوریه خود ، موقعیت محکمی با حدود 20 ٪ سهم حفظ کرد ، در حالی که گروه Pioneer Bunway در طول دوره گزارش ، سهم استفاده از آن را از حدود 60 ٪ به 20 ٪ کاهش داد.
سرعت نفوذ بازار کلینگ نشان می دهد که چگونه چشم انداز رقابتی می تواند در دسته های هوش مصنوعی نوظهور تغییر کند ، جایی که بازیکنان مستقر ممکن است مزایای اولیه خود را حفظ نکنند زیرا تازه واردان به سرعت تکرار می شوند و بهبود می یابند.
تولید ویدیو همچنان محاسباتی فشرده ترین برنامه هوش مصنوعی در حال مصرف کننده است که مدل ها برای ایجاد کلیپ های کوتاه نیاز به قدرت پردازش قابل توجهی دارند. این کار استفاده محدودتر از تولید متن یا تصویر بوده است ، اما انتظار می رود که به سرعت در حال کاهش هزینه ها و بهبود کیفیت باشد تا در سال 2025 پذیرش گسترده تری را انجام دهد.
پذیرندگان شرکت های اولیه شامل آژانس های تبلیغاتی ، سازندگان محتوای رسانه های اجتماعی و سیستم عامل های آموزشی هستند که با وجود محدودیت های فعلی فناوری ، ادغام فیلم های تولید شده AI را در استراتژی های محتوای خود آغاز کرده اند.
Elevenlabs بر AI AI حاکم است در حالی که شرکت کنندگان جدید موارد استفاده تخصصی را هدف قرار می دهند
Elevenlabs همچنان به رهبری گروه تولید صوتی ادامه می دهد و تقریباً 80 ٪ از درخواست های متن به گفتار مشترکان را در طول دوره گزارش انجام می دهد. با این حال ، این گزارش ، رقابت نوظهور از تازه واردان دکارتیا ، گفتار غیرواقعی ، Playai و Orpheus را نشان می دهد که گزینه های صوتی ، جلوه ها و مدل های قیمت گذاری متفاوت را ارائه می دهند.
این تسلط بازار توسط یک بازیکن واحد در تضاد با رقابت پراکنده تر در سایر دسته های هوش مصنوعی است. کارشناسان صنعت رهبری مداوم Elevenlabs را به ورود اولیه بازار ، کتابخانه صوتی گسترده و پیشرفت های کیفیت مداوم که دارای یک فنی بر رقبا بوده است ، نسبت می دهند.
متقاضیان جدیدتر با هدف قرار دادن سوله های خاص بازار ، موفقیت را پیدا می کنند. گفتار غیرواقعی با ارائه بازیگران تخصصی صدا و قابلیت های دامنه عاطفی ، با تولید کنندگان پادکست و ناشران صوتی به دست آورده است. در همین حال ، دکارتیا روی صداهای چند زبانه با لهجه های معتبر متمرکز شده است و علاقه شرکت های جهانی و سیستم عامل های آموزشی را به خود جلب می کند.
پیش بینی می شود که بازار هوش مصنوعی از طریق سال 2025 به طور قابل ملاحظه ای رشد کند زیرا قابلیت های متن به گفتار به کیفیت مانند انسان نزدیک می شوند و برنامه هایی را در خدمات به مشتری ، راه حل های دسترسی و ایجاد محتوا پیدا می کنند. الزامات محاسباتی نسبتاً کم در مقایسه با تولید ویدیو امکان استقرار و آزمایش گسترده تر را فراهم می کند.
پیامدهای استراتژیک برای مشاغل که در حال حرکت به یک منظره هوش مصنوعی هستند
ماهیت پویا از منظره مدل هوش مصنوعی هم فرصت ها و هم برای مشاغل را برای مشاغل ادغام این فناوری ها فراهم می کند.
هوبر به VentureBeat گفت: “این می تواند چالش برانگیز باشد که با جدیدترین موارد در هوش مصنوعی همراه باشید و سرعت فقط سرعت خود را افزایش می دهد.” “اگر شما شغلی هستید که دارای هوش مصنوعی در مقیاس است ، سرمایه گذاری در خطوط لوله ارزیابی قوی ، ارائه دهنده-آگنوستیک بسیار مهم است زیرا الگویی که بهترین ماه در این ماه ممکن است ماه دوم باشد.”
این نوسانات در ترجیحات مدل ، ارزش سیستم عامل هایی مانند POE را نشان می دهد که از طریق یک رابط واحد دسترسی به چندین مدل را ارائه می دهند و به کاربران این امکان را می دهد تا خروجی ها را مقایسه کرده و با اکوسیستم AI در حال تغییر سازگار شوند.
تحلیلگران صنعت پیشنهاد می کنند که اهمیت روزافزون قابلیت های استدلال ممکن است نشان دهنده تغییر در نحوه ارزیابی و استقرار مدلهای AI ، با تمرکز بیشتر بر دقت و قابلیت اطمینان برای کارهای پیچیده باشد نه فقط سرعت یا راندمان هزینه.
از آنجا که آزمایشگاه های مرزی همچنان مدلهای توانمندتری را با سرعت شتاب آزاد می کنند ، مشاغل با تصمیمات دشواری روبرو می شوند که چه موقع باید در سیستم عامل های خاص در مقابل حفظ انعطاف پذیری استاندارد شوند. بسیاری از رهبران AI شرکت در حال اتخاذ رویکرد نمونه کارها هستند و از مدل های مختلف برای کارهای مختلف استفاده می کنند و در عین حال توانایی تغییر ارائه دهندگان را به عنوان قابلیت های تکامل دارند.
هوبر در مورد مدل های استدلال خاطرنشان کرد: “این یک فضای مهم برای تماشای خواهد بود ، به ویژه در بین ارائه دهندگان مرزی ، زیرا این بهترین چیزی است که AI در حال حاضر می تواند انجام دهد.”
این گزارش حاکی از آن است که قابلیت های چندرسانه ای نیز به طور فزاینده ای رقابتی می شوند ، نشان می دهد که تولید متن ، طولانی مدت تمرکز اصلی توسعه AI ، ممکن است جای خود را به یک اکوسیستم متعادل تر نشان دهد که در آن تصویر ، فیلم و تولید صوتی نقش های یکسان را به همان اندازه بازی می کنند.
مشاغل که با موفقیت در این منظره پیچیده حرکت می کنند ، احتمالاً مواردی هستند که چارچوب های ارزیابی را حفظ می کنند و به جای تعقیب آخرین نسخه های مدل ، بر روی موارد استفاده خاص متمرکز شده اند ، در حالی که همزمان در زیرساخت های فنی ایجاد می شوند که در صورت ظهور پیشرفت های معنی دار امکان پذیرش سریع را فراهم می کند.
با ادامه مدل های هوش مصنوعی ، بازی صندلی های موسیقی خود را در بالای رتبه ها ادامه می دهد ، یک چیز مشخص می شود: در بازار امروز ، تاج به ندرت در همان سر می ماند-و شرکت هایی که آینده خود را در قهرمان دیروز AI شرط می بندند ممکن است خود را با فردا هماهنگ کنند.
ارسال پاسخ