HINDSIGHT رویکردی است که از شبکه های عصبی برای محاسبه توصیفگرهای اشیا در حین عبور اتومبیل از آنها استفاده می کند. سپس این توصیفها را که گروه آنها را ویژگیهای SQuaSH نامیدهاند، فشرده میکند و آنها را بر روی یک نقشه مجازی ذخیره میکند، مانند یک «حافظه» ذخیره شده در مغز انسان.
“این اطلاعات را می توان به عنوان ویژگی به هر آشکارساز شی سه بعدی مبتنی بر LiDAR اضافه کرد.” دانشجوی دکتری یورونگ یو گفت. هر دو آشکارساز و نمایش SQuaSH می توانند به طور مشترک بدون هیچ نظارت اضافی یا حاشیه نویسی انسانی، که زمان و کار زیادی دارد، آموزش ببینند.
در حالی که HINDSIGHT هنوز فرض میکند که شبکه عصبی مصنوعی قبلاً برای تشخیص اشیا و تقویت آن با قابلیت ایجاد حافظه آموزش دیده است، MODEST فرض میکند که شبکه عصبی مصنوعی در وسیله نقلیه هرگز در معرض هیچ شی یا خیابانی قرار نگرفته است. از طریق پیمایش های متعدد در یک مسیر، می تواند یاد بگیرد که چه قسمت هایی از محیط ثابت و کدام اشیاء متحرک هستند. آهسته آهسته به خود می آموزد که چه چیزی دیگر شرکت کنندگان در ترافیک را تشکیل می دهد و چه چیزی را نادیده می گیرد.
مواد تهیه شده توسط دانشگاه کرنل. نوشته اصلی توسط تام فلیشمن، توسط کورنل کرونیکل. توجه: محتوا ممکن است برای سبک و طول ویرایش شود.
منبع
ماشینهایی که از شبکههای عصبی مصنوعی استفاده میکنند هیچ خاطرهای از گذشته ندارند و برای اولین بار در حالت ثابتی هستند که دنیا را میبینند – مهم نیست قبلاً چند بار در یک جاده خاص رانندگی کردهاند.
دفعه بعد که خودروی خودران از همان مکان عبور کرد، میتواند از پایگاه داده محلی SQuaSH هر نقطه LiDAR در طول مسیر پرس و جو کند و آنچه را که آخرین بار آموخته است، “به خاطر بیاورد”. پایگاه داده به طور مداوم به روز می شود و در بین وسایل نقلیه به اشتراک گذاشته می شود، بنابراین اطلاعات موجود برای انجام شناسایی غنی می شود.
HINDSIGHT پیشروی برای تحقیقات بیشتری است که این تیم انجام می دهد، MODEST (تشخیص اشیاء متحرک با زودگذر بودن و خودآموزی)، که حتی فراتر می رود و به خودرو امکان می دهد کل خط لوله ادراک را از ابتدا یاد بگیرد.
سپس الگوریتم می تواند این اشیاء را به طور قابل اعتماد تشخیص دهد – حتی در جاده هایی که بخشی از پیمایش های مکرر اولیه نیستند.
محققان سه مقاله همزمان با هدف غلبه بر این محدودیت تولید کرده اند. دو مورد در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR 2022) که از 19 تا 24 ژوئن در نیواورلئان برگزار می شود، ارائه شده است.
این گروه به سرپرستی دانشجوی دکترا، کارلوس دیاز-روئیز، مجموعهای از دادهها را با رانندگی ماشینی مجهز به حسگرهای LiDAR (تشخیص و تشخیص نور) به طور مکرر در امتداد یک حلقه 15 کیلومتری در ایتاکا و اطراف آن، 40 بار در یک دوره 18 ماهه جمعآوری کردند. پیمایشها محیطهای مختلف (بزرگراه، شهری، محوطه دانشگاه)، شرایط آب و هوایی (آفتابی، بارانی، برفی) و زمانهای روز را ضبط میکنند. این مجموعه داده حاصل بیش از 600000 صحنه دارد.
منبع داستان:
دیاز-روئیز گفت: “این به عمد یکی از چالش های کلیدی در خودروهای خودران را نشان می دهد: شرایط آب و هوایی بد.” “اگر خیابان پوشیده از برف باشد، انسان ها می توانند به خاطرات تکیه کنند، اما بدون خاطرات، شبکه عصبی به شدت آسیب می بیند.”
محققان دانشگاه کرنل راهی برای کمک به وسایل نقلیه خودران ابداع کردهاند که «خاطرات» تجربیات قبلی را ایجاد کرده و از آنها در مسیریابی آینده استفاده کنند، بهویژه در شرایط آب و هوایی نامساعد که خودرو نمیتواند به طور ایمن به حسگرهای خود تکیه کند.
سوال اساسی این است که آیا میتوانیم از پیمایشهای مکرر درس بگیریم؟ کیلیان واینبرگر، نویسنده ارشد، استاد علوم کامپیوتر گفت. به عنوان مثال، یک ماشین ممکن است اولین باری که اسکنر لیزری آن را از راه دور تشخیص می دهد، یک درخت با شکل عجیب و غریب را با یک عابر پیاده اشتباه بگیرد، اما وقتی به اندازه کافی نزدیک شد، دسته بندی اشیا مشخص می شود. بنابراین، بار دوم که از کنار آن عبور می کنید. همان درخت، حتی در مه یا برف، شما امیدوارید که ماشین اکنون یاد گرفته باشد که آن را به درستی تشخیص دهد.”
محققان امیدوارند که این رویکردها بتواند هزینه توسعه وسایل نقلیه خودران را به شدت کاهش دهد (که در حال حاضر هنوز به شدت به داده های حاشیه نویسی پرهزینه انسان متکی است) و با یادگیری مکان هایی که بیشتر از آنها استفاده می شود، چنین وسایل نقلیه ای کارآمدتر شوند.
Matthew Newman
Matthew Newman
Matthew has over 15 years of experience in database management and software development, with a strong focus on full-stack web applications. He specializes in Django and Vue.js with expertise deploying to both server and serverless environments on AWS. He also works with relational databases and large datasetsView all posts by Matthew Newman →