ساختار بذر 4.1 میلیون دلاری را برای تبدیل داده های وب بدون ساختار به مجموعه داده های آماده سازمانی افزایش می دهد
ساختار بذر 4.1 میلیون دلاری را برای تبدیل داده های وب بدون ساختار به مجموعه داده های آماده سازمانی افزایش می دهد

ساختار بذر 4.1 میلیون دلاری را برای تبدیل داده های وب بدون ساختار به مجموعه داده های آماده سازمانی افزایش می دهد

به گزارش سرویس تازه های دنیای فناوری وبسایت اخبار تکنولوژی تک فاکس،

برای آخرین به روزرسانی ها و مطالب اختصاصی در مورد پوشش هوش مصنوعی پیشرو در صنعت ، به خبرنامه های روزانه و هفتگی ما بپیوندید. بیشتر بدانید


یک استارتاپ مبتنی بر بروکلین با هدف یکی از بدنام ترین نقاط درد در دنیای هوش مصنوعی و تجزیه و تحلیل داده ها: روند پر دردسر آماده سازی داده ها.

ساختار امروز از حالت مخفیگاه ظهور کرد و اعلام کرد که در کنار 41 میلیون دلار بودجه بذر به رهبری Bain Capital Ventures ، با مشارکت 8VC ، سرمایه گذاری های یکپارچه و سرمایه گذاران فرشته استراتژیک ، از راه اندازی عمومی خود در کنار 41 میلیون دلار بودجه بذر به رهبری Bain Capital Ventures خبر داد.

پلت فرم این شرکت از یک مدل زبان بصری اختصاصی به نام Dora برای خودکارسازی جمع آوری ، تمیز کردن و ساخت داده ها استفاده می کند – فرایندی که طبق نظرسنجی های صنعت به طور معمول تا 80 ٪ از زمان دانشمندان داده مصرف می کند.

روناک گاندی ، بنیانگذار Structify ، در مصاحبه اختصاصی با VentureBeat گفت: “حجم اطلاعات موجود امروز کاملاً منفجر شده است.” “ما به یک نقطه اصلی در دسترس بودن داده ها رسیده ایم ، که هم یک نعمت و هم یک نفرین است. در حالی که ما دسترسی بی سابقه ای به اطلاعات داریم ، اما تا حد زیادی غیرقابل دسترسی است زیرا تبدیل شدن به قالب مناسب برای تصمیم گیری های معنادار تجاری بسیار دشوار است.”

رویکرد Structrify نشان دهنده تمرکز در حال رشد در صنعت بر حل آنچه متخصصان داده ها “تنگنا آماده سازی داده ها” می نامند. تحقیقات گارتنر نشان می دهد که تهیه داده های ناکافی یکی از موانع اصلی اجرای موفقیت آمیز هوش مصنوعی است ، به طوری که چهار از پنج مشاغل فاقد پایه های داده لازم برای سرمایه گذاری کامل در AI تولیدی هستند.

چگونه تحول داده های AI با قدرت باز می شود ، هوش مخفی تجارت را در مقیاس باز می کند

در هسته اصلی خود ، ساختار به کاربران امکان می دهد با مشخص کردن طرح داده ، انتخاب منابع و استفاده از عوامل هوش مصنوعی برای استخراج آن داده ها ، مجموعه داده های سفارشی ایجاد کنند. این پلتفرم می تواند همه چیز را از پرونده های SEC و پروفایل های LinkedIn گرفته تا مقالات خبری و اسناد تخصصی صنعت اداره کند.

به گفته گاندی ، آنچه را که ساختار را از هم جدا می کند ، مدل داخلی آنها دورا است که مانند یک انسان در وب حرکت می کند.

گاندی توضیح داد: “این با کیفیت بسیار بالایی است. دقیقاً مانند یک شخص با چیزهایی حرکت می کند و در تعامل است.” “بنابراین ما در مورد کیفیت انسان صحبت می کنیم – این اولین و مهمترین مرکز اصول دورا است. این اینترنت را به روشی که یک انسان می خواند ، می خواند.”

این رویکرد به ساختار اجازه می دهد تا از یک ردیف رایگان پشتیبانی کند ، که گاندی معتقد است به دموکراتیک کردن دسترسی به داده های ساختاری کمک می کند.

گاندی گفت: “روشی که اکنون در مورد داده ها فکر می کنید ، این شیء واقعا گرانبها است.” “این چیز بسیار ارزشمند که شما آنقدر وقت خود را صرف می کنید و می توانید در اطراف خود قرار بگیرید و کشتی بگیرید ، و وقتی آن را دارید ، دوست دارید ،” اوه ، اگر کسی آن را حذف می کرد ، من گریه می کردم. “

چشم انداز ساختار “کالایی کردن داده ها” است – ساختن آن چیزی است که در صورت از بین رفتن می توان به راحتی بازآفرینی کرد.

از امور مالی تا ساخت و ساز: چگونه مشاغل در حال استفاده از مجموعه داده های سفارشی برای حل چالش های خاص صنعت هستند

این شرکت قبلاً شاهد پذیرش در بخش های مختلف بوده است. تیم های مالی از آن برای استخراج اطلاعات از عرشه های زمین استفاده می کنند ، شرکت های ساختمانی اسناد پیچیده ژئوتکنیکی را به جداول قابل خواندن تبدیل می کنند و تیم های فروش نمودارهای سازمانی در زمان واقعی را برای حساب های خود جمع می کنند.

Slater Stich ، شریک در Bain Capital Ventures ، این تطبیق پذیری را در اعلامیه بودجه برجسته کرد: “هر شرکتی که من با آنها کار کرده ام دارای تعداد انگشت شماری از منابع داده است که هم بسیار مهم هستند و چه درد بزرگی برای کار با آنها ، چه این ارقام در PDF ها ، پراکنده در صدها صفحه وب ، پنهان در پشت یک API SOAP ENCEPRISE ، و غیره.”

تنوع پایگاه مشتری اولیه ساختار نشان دهنده ماهیت جهانی چالش های تهیه داده ها است. طبق تحقیقات TechTarget ، تهیه داده ها به طور معمول شامل یک سری مراحل فشرده کار است: جمع آوری ، کشف ، پروفایل ، پاکسازی ، ساختار ، تحول و اعتبارسنجی-همه قبل از شروع هرگونه تجزیه و تحلیل واقعی.

چرا تخصص انسانی برای صحت هوش مصنوعی بسیار مهم است: در سیستم “تأیید چهارگانه” در داخل ساختار

یک تمایز دهنده اصلی برای ساختار فرآیند “تأیید چهارگانه” آن است که AI را با نظارت انسانی ترکیب می کند. این رویکرد به یک نگرانی اساسی در توسعه هوش مصنوعی می پردازد: اطمینان از صحت.

گاندی توضیح داد: “هر وقت کاربر چیزی را مشکوک می بیند ، یا برخی از داده ها را به عنوان بالقوه مشکوک می بینیم ، می توانیم آن را به یک متخصص در آن مورد استفاده خاص ارسال کنیم.” “این متخصص می تواند به همان روشی که (دورا) عمل می کند ، به سمت اطلاعات مناسب حرکت کند ، آن را استخراج کند ، آن را ذخیره کند و سپس تأیید کند که آیا درست است.”

این فرآیند نه تنها داده ها را اصلاح می کند بلکه نمونه های آموزشی را نیز ایجاد می کند که عملکرد مدل را با گذشت زمان بهبود می بخشد ، به خصوص در حوزه های تخصصی مانند ساخت و ساز یا تحقیقات دارویی.

گاندی خاطرنشان کرد: “این چیزها بسیار کثیف هستند.” “من هرگز در زندگی خود فکر نکردم که درک جدی از زمین شناسی داشته باشم. اما فکر می کنم در آنجا هستیم و این یک قدرت عظیم است – قادر به یادگیری از این متخصصان و قرار دادن مستقیم آن در دورا است.”

هرچه ابزارهای استخراج داده ها قدرتمندتر می شوند ، نگران کننده حریم خصوصی به ناچار بوجود می آیند. ساختار حفاظت هایی را برای رسیدگی به این مسائل اجرا کرده است.

گاندی گفت: “ما هیچگونه احراز هویت را انجام نمی دهیم ، هر کاری که نیاز به ورود به سیستم داشته باشد ، هر چیزی که شما را ملزم به پشت سر گذاشتن برخی از اطلاعات می کند – نماینده ما این کار را نمی کند زیرا این یک نگرانی از حریم خصوصی است.”

این شرکت همچنین با ارائه اطلاعات مستقیم منابع ، شفافیت را در اولویت قرار می دهد. “اگر شما علاقه مند به کسب اطلاعات بیشتر در مورد یک بخش خاص از اطلاعات هستید ، مستقیماً به آن محتوا می روید و آن را می بینید ، بر خلاف نوع ارائه دهندگان میراث که در آن جعبه سیاه است.”

ساختار وارد یک منظره رقابتی می شود که شامل بازیکنان مستقر و سایر راه اندازی هایی است که به جنبه های مختلف چالش تهیه داده ها می پردازد. شرکت هایی مانند Alteryx ، Informatica ، Microsoft و Tableau همه قابلیت های تهیه داده را ارائه می دهند ، در حالی که چندین متخصص در سالهای اخیر به دست آمده اند.

طبق گفته مدیرعامل الکس ریچنباخ ، ساختار آن ، ترکیبی از سرعت و دقت آن است. یک پست LinkedIn اخیر توسط Reichenbach ادعا کرده است که آنها از طریق بهینه سازی مدل و پیشرفت های زیرساختی ، نماینده خود را “10 برابر در حالی که هزینه 16 برابر” را کاهش داده اند ، افزایش داده اند.

راه اندازی این شرکت در اثر علاقه فزاینده به اتوماسیون داده های دارای هوش مصنوعی انجام می شود. براساس گزارش TechTarget ، خودکار سازی آماده سازی داده ها “اغلب به عنوان یکی از مناطق مهم سرمایه گذاری برای تیم های داده و تجزیه و تحلیل” ذکر می شود ، با قابلیت های تقویت شده داده ها به طور فزاینده ای اهمیت می یابد.

چگونه تجربیات آماده سازی داده ها ناامید کننده به دو دوست الهام بخش برای انقلابی در صنعت است

برای گاندی ، ساختاری به مشکلاتی که در نقش های قبلی با دست اول روبرو شده است ، می پردازد.

گاندی به یاد می آورد: “نکته مهم در مورد داستان بنیانگذار ساختار این است که هم یک نوع شخصی و هم یک چیز حرفه ای است.” “من در مورد زمانی که من به عنوان یک تحلیلگر داده کار می کردم و OPS و مشاوره را انجام می دادم ، می گفتم (الکس) ، تهیه این مجموعه داده های واقعاً برای مشتری ها – لیست همه تأثیرگذار تناسب اندام و معیارهای زیر آنها ، لیست شرکت ها و چه شغلی که آنها ارسال می کنند ، موزه ها در ساحل شرقی … من همه وقت را صرف می کردم و به طور دستکاری می کردم ، داده ها را به صورت دستکاری می کنم.

عدم توانایی در تکرار سریع از ایده به مجموعه داده به ویژه ناامید کننده بود. گاندی گفت: “چیزی که من را به وجود آورد این بود که شما نمی توانید تکرار کنید و از ایده به داده ها به صورت سریع استفاده کنید.”

بنیانگذار وی ، الکس ریچنباخ ، هنگام کار در یک بانک سرمایه گذاری با چالش های مشابهی روبرو شد ، جایی که مسائل مربوط به کیفیت داده ها مانع تلاش برای ساخت مدل ها در بالای مجموعه داده های ساختاری شد.

چگونه برنامه ریزی برای استفاده از بودجه بذر 4.1 میلیون دلاری خود برای تبدیل داده های سازمانی ایجاد می کند

با بودجه جدید ، برنامه هایی را برای رشد تیم فنی خود و خود را به عنوان “ابزار داده های Go-to در سراسر صنایع” تنظیم کنید. این شرکت در حال حاضر هر دو ردیف رایگان و پرداخت شده را ارائه می دهد ، با گزینه های سازمانی برای کسانی که به ویژگی های پیشرفته مانند استقرار در پیش فرض یا استخراج داده های بسیار تخصصی نیاز دارند.

از آنجا که شرکت های بیشتری در ابتکارات هوش مصنوعی سرمایه گذاری می کنند ، اهمیت با کیفیت بالا ، داده های ساختاری فقط افزایش می یابد. یک گزارش اخیر در مورد بررسی فناوری MIT نشان داد که چهار از پنج مشاغل به دلیل پایه های ضعیف داده ها آماده سرمایه گذاری در هوش مصنوعی تولیدی نیستند.

برای گاندی و تیم ساختار ، حل این چالش اساسی می تواند ارزش قابل توجهی را در صنایع باز کند.

گاندی گفت: “این واقعیت که شما حتی می توانید دنیایی را تصور کنید که مجموعه داده ها را ایجاد می کند ، تکراری است ، نوعی ذهن برای بسیاری از کاربران ما است.” “در پایان روز ، زمین در مورد توانایی داشتن این کنترل و تنظیم پذیری است.”