محققان دانشگاه دوک نشان دادهاند که ترکیب فیزیک شناختهشده در الگوریتمهای یادگیری ماشینی میتواند به جعبههای سیاه غیرقابل درک کمک کند تا سطوح جدیدی از شفافیت و بینش نسبت به خواص مواد را به دست آورند.
در یکی از اولین پروژهها در نوع خود، محققان یک الگوریتم یادگیری ماشینی مدرن برای تعیین خواص طبقهای از مواد مهندسی شده به نام فرامواد و پیشبینی نحوه تعامل آنها با میدانهای الکترومغناطیسی ساختند.
از آنجا که ابتدا باید محدودیت های فیزیکی شناخته شده فراماده را در نظر می گرفت، برنامه اساساً مجبور شد کار خود را نشان دهد. این رویکرد نه تنها به الگوریتم اجازه میدهد تا ویژگیهای فراماده را بهطور دقیق پیشبینی کند، بلکه این کار را در مقایسه با روشهای قبلی کارآمدتر انجام داد و در عین حال بینشهای جدیدی را ارائه داد.
نتایج به صورت آنلاین در هفته 9 مه در مجله ظاهر می شود مواد نوری پیشرفته
ویلی پادیلا، استاد مهندسی برق و کامپیوتر در دوک، می گوید: «با ترکیب فیزیک شناخته شده مستقیماً در یادگیری ماشین، این الگوریتم می تواند راه حل هایی را با داده های آموزشی کمتر و در زمان کمتر پیدا کند. در حالی که این مطالعه عمدتاً نمایشی بود که نشان میداد این رویکرد میتواند راهحلهای شناختهشده را بازآفرینی کند، همچنین بینشهایی را در مورد عملکرد درونی فرامواد غیرفلزی نشان داد که هیچکس قبلاً نمیدانست.
فرامواد مواد مصنوعی متشکل از بسیاری از ویژگیهای مهندسی شده منفرد هستند که در کنار هم خواصی را که در طبیعت یافت نمیشوند از طریق ساختارشان و نه از طریق شیمی تولید میکنند. در این مورد، متامتریال از شبکه بزرگی از سیلندرهای سیلیکونی تشکیل شده است که شبیه صفحه پایه لگو است.
بسته به اندازه و فاصله استوانه ها، متاماده به روش های مختلفی با امواج الکترومغناطیسی تعامل دارد، مانند جذب، انتشار یا انحراف طول موج های خاص. در مقاله جدید، محققان به دنبال ساخت نوعی مدل یادگیری ماشینی به نام شبکه عصبی بودند تا کشف کنند که چگونه دامنه ارتفاع و عرض یک استوانه بر این فعل و انفعالات تأثیر می گذارد. اما آنها همچنین می خواستند پاسخ های آن منطقی باشد.
جردن مالوف، استادیار پژوهشی مهندسی برق و کامپیوتر در دوک، میگوید: «شبکههای عصبی سعی میکنند الگوهایی را در دادهها بیابند، اما گاهی اوقات الگوهایی که پیدا میکنند از قوانین فیزیک تبعیت نمیکنند و مدلی را که ایجاد میکند غیرقابل اعتماد میکند.» ما با وادار کردن شبکه عصبی به اطاعت از قوانین فیزیک، از یافتن روابطی که ممکن است با داده ها مطابقت داشته باشند اما در واقع درست نیستند، جلوگیری کردیم.»
فیزیک که تیم تحقیقاتی بر شبکه عصبی تحمیل کرد، مدل لورنتز نامیده می شود – مجموعه ای از معادلات که چگونگی تشدید خواص ذاتی یک ماده با یک میدان الکترومغناطیسی را توصیف می کند. به جای اینکه مستقیماً برای پیشبینی پاسخ سیلندر بپرد، مدل باید پارامترهای لورنتس را پیشبینی میکرد که سپس برای محاسبه پاسخ استوانه استفاده میکرد.
با این حال، گفتن این مرحله اضافی بسیار ساده تر از انجام آن است.
عمر خطیب، محقق فوق دکتری که در آزمایشگاه پادیلا کار میکند، گفت: «وقتی یک شبکه عصبی را قابل تفسیرتر میسازید، که به نوعی همان کاری است که ما اینجا انجام دادهایم، تنظیم دقیقتر میتواند چالشبرانگیزتر باشد.» ما قطعاً برای بهینهسازی آموزش برای یادگیری الگوها زمان سختی داشتیم.»
با این حال، هنگامی که مدل کار می کرد، ثابت شد که کارآمدتر از شبکه های عصبی قبلی است که گروه برای کارهای مشابه ایجاد کرده بود. به طور خاص، گروه دریافتند که این رویکرد می تواند به طور چشمگیری تعداد پارامترهای مورد نیاز برای مدل را برای تعیین ویژگی های فراماده کاهش دهد.
آنها همچنین دریافتند که این رویکرد مبتنی بر فیزیک به تنهایی قادر به اکتشافات است.
همانطور که یک موج الکترومغناطیسی از یک جسم عبور می کند، لزوماً در ابتدای سفر دقیقاً به همان شکلی که در انتهای آن انجام می شود با آن تعامل ندارد. این پدیده به عنوان پراکندگی فضایی شناخته می شود. از آنجایی که محققان مجبور بودند پارامترهای پراکندگی فضایی را تغییر دهند تا مدل به طور دقیق کار کند، آنها بینش هایی را در مورد فیزیک این فرآیند کشف کردند که قبلاً نمی دانستند.
پادیلا گفت: «اکنون که نشان دادیم میتوان این کار را انجام داد، میخواهیم این رویکرد را در سیستمهایی که فیزیک آنها ناشناخته است، اعمال کنیم.
مالوف افزود: «بسیاری از مردم از شبکههای عصبی برای پیشبینی خواص مواد استفاده میکنند، اما دریافت دادههای آموزشی کافی از شبیهسازیها دردسر بزرگی است. این کار همچنین مسیری را برای ایجاد مدلهایی نشان میدهد که به دادههای زیادی نیاز ندارند، که در کل مفید است.»
این تحقیق توسط وزارت انرژی (DESC0014372) پشتیبانی شده است.
منبع داستان:
مواد تهیه شده توسط دانشگاه دوک. نوشته اصلی توسط کن کینگری. توجه: محتوا ممکن است برای سبک و طول ویرایش شود.