چگونه یادگیری ماشینی می تواند رویدادهای نادر فاجعه بار – مانند زلزله یا بیماری های همه گیر را پیش بینی کند
به گفته محققان براون و MIT ، دانشمندان می توانند از ترکیبی از یادگیری ماشینی پیشرفته و تکنیک های نمونه برداری متوالی برای پیش بینی رویدادهای شدید بدون نیاز به مجموعه داده های بزرگ استفاده کنند .
وقتی نوبت به پیشبینی بلایای ناشی از رویدادهای شدید میرسد (به زمینلرزهها، همهگیریها یا «امواج سرکش» که میتوانند سازههای ساحلی را نابود کنند)، مدلسازی محاسباتی با یک چالش تقریباً غیرقابل حل مواجه میشود: از نظر آماری، این رویدادها آنقدر نادر هستند که به اندازه کافی وجود ندارد. دادههای مربوط به آنها برای استفاده از مدلهای پیشبینی برای پیشبینی دقیق زمان وقوع بعدی.
با این حال، گروهی از دانشمندان دانشگاه براون و موسسه فناوری ماساچوست پیشنهاد میکنند که لازم نیست اینطور باشد.
در مطالعهای که در Nature Computational Science منتشر شده است، محققان توضیح میدهند که چگونه از الگوریتمهای آماری که به دادههای کمتری برای پیشبینیهای دقیق نیاز دارند، در ترکیب با تکنیک یادگیری ماشینی قدرتمند که در دانشگاه براون توسعه یافته است، استفاده کردند. این ترکیب به آنها اجازه داد تا سناریوها، احتمالات و حتی جدول زمانی رویدادهای نادر را با وجود کمبود داده های تاریخی پیش بینی کنند.
با انجام این کار، تیم تحقیقاتی دریافت که این چارچوب جدید میتواند راهی برای دور زدن نیاز به مقادیر عظیم دادهای که به طور سنتی برای این نوع محاسبات مورد نیاز است، فراهم کند، در عوض اساساً چالش بزرگ پیشبینی رویدادهای نادر را به یک موضوع با کیفیت تبدیل کند. بیش از مقدار
جورج کارنیاداکیس، استاد ریاضیات کاربردی و مهندسی در براون و نویسنده مطالعه، گفت: «شما باید متوجه باشید که اینها رویدادهای تصادفی هستند. طغیان یک بیماری همه گیر مانند کووید-19 ، فاجعه زیست محیطی در خلیج مکزیک، زلزله، آتش سوزی های عظیم در کالیفرنیا، موج 30 متری که کشتی را واژگون می کند – اینها رویدادهای نادری هستند و چون نادر هستند، ما چنین نمی کنیم. داده های تاریخی زیادی ندارند. ما نمونه های کافی از گذشته برای پیش بینی بیشتر آنها در آینده نداریم. سوالی که در این مقاله به آن می پردازیم این است: بهترین داده ممکن است که می توانیم برای به حداقل رساندن تعداد نقاط داده مورد نیاز خود استفاده کنیم؟
محققان پاسخ را در روش نمونه گیری متوالی به نام یادگیری فعال یافتند. این نوع از الگوریتمهای آماری نه تنها قادر به تجزیه و تحلیل دادههای ورودی در آنها هستند، بلکه مهمتر از آن، میتوانند از اطلاعات یاد بگیرند تا نقاط داده مرتبط جدیدی را که به همان اندازه یا حتی برای نتیجهای که محاسبه میشود اهمیت دارند، برچسبگذاری کنند. در ابتدایی ترین سطح، آنها اجازه می دهند کارهای بیشتری با کمتر انجام شود.
این برای مدل یادگیری ماشینی که محققان در این مطالعه استفاده کردند بسیار مهم است. این مدل که DeepOnet نام دارد، نوعی شبکه عصبی مصنوعی است که از گره های به هم پیوسته در لایه های متوالی استفاده می کند که تقریباً اتصالات ایجاد شده توسط نورون ها در مغز انسان را تقلید می کند. DeepOnet به عنوان یک عملگر عصبی عمیق شناخته می شود. این شبکه از شبکه های عصبی مصنوعی معمولی پیشرفته تر و قدرتمندتر است زیرا در واقع دو شبکه عصبی در یک است و داده ها را در دو شبکه موازی پردازش می کند. این به آن اجازه میدهد تا مجموعههای عظیمی از دادهها و سناریوها را با سرعتی سرسامآور تجزیه و تحلیل کند تا به محض اینکه بفهمد به دنبال چه چیزی میگردد، مجموعههای به همان اندازه عظیمی از احتمالات را از بین ببرد.
گلوگاه این ابزار قدرتمند، به ویژه در رابطه با رویدادهای نادر، این است که اپراتورهای عصبی عمیق برای انجام محاسبات مؤثر و دقیق به هزاران داده نیاز دارند تا آموزش ببینند.
در این مقاله، تیم تحقیقاتی نشان میدهد که همراه با تکنیکهای یادگیری فعال، مدل DeepOnet میتواند در مورد پارامترها یا پیشسازهایی که به دنبال رویداد فاجعهباری است که کسی در حال تجزیه و تحلیل است، آموزش ببیند، حتی زمانی که نقاط داده زیادی وجود ندارد.
کارنیاداکیس گفت: «هدف این نیست که همه دادههای ممکن را بگیریم و آنها را در سیستم قرار دهیم، بلکه به دنبال رویدادهایی باشیم که نشانهای از رویدادهای نادر باشند. ما ممکن است نمونه های زیادی از رویداد واقعی نداشته باشیم، اما ممکن است آن پیش سازها را داشته باشیم. از طریق ریاضیات، آنها را شناسایی می کنیم، که همراه با رویدادهای واقعی به ما کمک می کند تا این اپراتور تشنه داده را آموزش دهیم.
در این مقاله، محققان این رویکرد را برای تعیین دقیق پارامترها و دامنههای مختلف احتمالات برای سنبلههای خطرناک در طول یک بیماری همهگیر، یافتن و پیشبینی امواج سرکش، و تخمین زمانی که یک کشتی به دلیل استرس به نصف میشکند، اعمال میکنند. به عنوان مثال، با امواج سرکش – امواجی که بزرگتر از دو برابر امواج اطراف هستند – محققان دریافتند که می توانند با بررسی شرایط موج احتمالی که به صورت غیرخطی در طول زمان برهمکنش غیرخطی دارند و گاهی اوقات سه بار منجر به امواج می شوند، کشف کنند و کمیت کنند که امواج سرکش تشکیل می شوند. اندازه اصلی آنها
محققان دریافتند روش جدید آنها بهتر از تلاشهای مدلسازی سنتی است و معتقدند چارچوبی را ارائه میدهد که میتواند به طور موثر انواع رویدادهای نادر را کشف و پیشبینی کند.
در این مقاله، تیم تحقیقاتی چگونگی طراحی آزمایشهای آینده توسط دانشمندان را مشخص میکند تا بتوانند هزینهها را به حداقل برسانند و دقت پیشبینی را افزایش دهند . به عنوان مثال، کارنیاداکیس در حال حاضر با دانشمندان محیط زیست کار می کند تا از روش جدید برای پیش بینی رویدادهای آب و هوایی مانند طوفان ها استفاده کند