پلتفرم مجازی چگونگی ردیابی محرک‌های چشم انسان از مکالمات به گالری‌های هنری را تکرار می‌کند — ScienceDaily

با این طیف گسترده از پیچیدگی، ایجاد چشم‌های مجازی که واکنش یک انسان معمولی به طیف گسترده‌ای از محرک‌ها را تقلید می‌کند، کاری دشوار به نظر می‌رسد. برای بالا رفتن از کوه، گورلاتووا و تیمش – از جمله دانشیار سابق فوق دکتری، گوهائو لان، که اکنون استادیار دانشگاه صنعتی دلفت در هلند است، و دانشجوی فعلی دکترا، تیم اسکارگیل – وارد ادبیات علوم شناختی می شوند که به کاوش می پردازند. چگونه انسان جهان را می بیند و اطلاعات بصری را پردازش می کند.

مهندسان کامپیوتر در دانشگاه دوک چشم‌های مجازی ایجاد کرده‌اند که نحوه نگاه انسان‌ها به دنیا را به اندازه کافی برای شرکت‌ها برای آموزش برنامه‌های واقعیت مجازی و واقعیت افزوده شبیه‌سازی می‌کند. این برنامه که به اختصار EyeSyn نامیده می شود، به توسعه دهندگان کمک می کند تا همزمان با محافظت از داده های کاربر، برنامه هایی برای متاورس به سرعت در حال گسترش ایجاد کنند.

گورلاتوا گفت: “داده های مصنوعی به تنهایی کامل نیستند، اما نقطه شروع خوبی هستند.” شرکت‌های کوچک‌تر می‌توانند به جای صرف زمان و هزینه برای ساخت مجموعه داده‌های دنیای واقعی خود (با افراد انسانی) از آن استفاده کنند. در مورد اینکه داده های حرکات چشم خصوصی آنها بخشی از یک پایگاه داده بزرگ می شود.”

Gorlatova گفت: “اگر ورودی های مختلف زیادی را به EyeSyn بدهید و آن را به اندازه کافی اجرا کنید، مجموعه داده ای از حرکات مصنوعی چشم ایجاد خواهید کرد که به اندازه کافی بزرگ است تا یک طبقه بندی کننده (یادگیری ماشینی) را برای یک برنامه جدید آموزش دهد.”

برای آزمایش دقت چشم های مصنوعی خود، محققان به داده های در دسترس عموم روی آوردند. آن‌ها ابتدا ویدیوهای دکتر آنتونی فائوچی را که در کنفرانس‌های مطبوعاتی به رسانه‌ها می‌خواند، تماشا کردند و آن را با داده‌های حرکات چشم بینندگان واقعی مقایسه کردند. آنها همچنین یک مجموعه داده مجازی از چشم های مصنوعی خود را که به هنر نگاه می کنند با مجموعه داده های واقعی جمع آوری شده از افرادی که در حال بازدید از یک موزه هنر مجازی بودند مقایسه کردند. نتایج نشان داد که EyeSyn قادر است الگوهای متمایز سیگنال‌های نگاه واقعی را کاملاً مطابقت دهد و روش‌های مختلف واکنش چشم افراد مختلف را شبیه‌سازی کند.

بینش شاعرانه‌ای که چشم‌ها را دریچه‌های روح توصیف می‌کند، حداقل از زمان‌های کتاب مقدس به دلایل خوبی تکرار شده است: حرکات کوچک نحوه حرکت چشم‌های ما و گشاد شدن مردمک‌ها اطلاعات شگفت‌آوری را ارائه می‌دهد. چشم‌های انسان می‌تواند نشان دهد که آیا ما خسته یا هیجان‌زده هستیم، تمرکز ما در کجا متمرکز است، آیا در یک کار خاص متخصص یا مبتدی هستیم یا نه، یا حتی اگر به یک زبان خاص مسلط هستیم.

این تحقیق توسط بنیاد ملی علوم (CSR-1903136، CNS-1908051، IIS-2046072) و جایزه هیئت علمی IBM تامین شده است.

نتایج پذیرفته شده است و در کنفرانس بین‌المللی پردازش اطلاعات در شبکه‌های حسگر (IPSN)، 4 تا 6 مه 2022، یک انجمن سالانه پیشرو در زمینه تحقیقات در سنجش و کنترل شبکه‌ای، ارائه خواهد شد.

گورلاتووا گفت: «جایی که بینش خود را در اولویت قرار می دهید، چیزهای زیادی درباره شما به عنوان یک فرد نیز می گوید. این می‌تواند ناخواسته سوگیری‌های جنسی و نژادی، علایقی که نمی‌خواهیم دیگران درباره آن‌ها بدانند و اطلاعاتی که ممکن است حتی درباره خودمان هم ندانیم را آشکار کند.»

داده‌های حرکت چشم برای شرکت‌هایی که پلتفرم‌ها و نرم‌افزارها را در متاورس می‌سازند بسیار ارزشمند است. به عنوان مثال، خواندن چشم‌های کاربر به توسعه‌دهندگان اجازه می‌دهد تا محتوا را برای پاسخ‌های تعاملی تنظیم کنند یا وضوح در دید محیطی خود را کاهش دهند تا در توان محاسباتی صرفه‌جویی کنند.

مواد تهیه شده توسط دانشگاه دوک. نوشته اصلی توسط کن کینگری. توجه: محتوا ممکن است برای سبک و طول ویرایش شود.



منبع

ماریا گورلاتوا، استادیار مهندسی برق و کامپیوتر شبکه های نورتل در دوک، می گوید: «اگر شما علاقه مند هستید که بفهمید شخصی در حال خواندن کتاب کمیک یا ادبیات پیشرفته تنها با نگاه کردن به چشمانش است، می توانید این کار را انجام دهید.

گورلاتوا افزود: «اما آموزش این نوع الگوریتم به داده‌های صدها نفر نیاز دارد که ساعت‌ها در یک زمان از هدست استفاده می‌کنند. ما می‌خواستیم نرم‌افزاری توسعه دهیم که نه تنها نگرانی‌های مربوط به حفظ حریم خصوصی ناشی از جمع‌آوری این نوع داده‌ها را کاهش دهد، بلکه به شرکت‌های کوچک‌تری که آن سطوح از منابع را ندارند، اجازه می‌دهد وارد بازی متاورس شوند.»

منبع داستان:

به عنوان مثال، زمانی که فردی در حال تماشای صحبت های شخصی است، چشمان او به طور متناوب بین چشم ها، بینی و دهان فرد برای مدت زمان های مختلف تغییر می کند. هنگام توسعه EyeSyn، محققان مدلی را ایجاد کردند که محل قرارگیری آن ویژگی‌ها را بر روی یک بلندگو استخراج می‌کند و چشم‌های مجازی آن‌ها را طوری برنامه‌ریزی می‌کنند که از نظر آماری زمان صرف شده برای تمرکز روی هر منطقه را شبیه‌سازی کنند.

به گفته Gorlatova، این سطح از عملکرد به اندازه کافی خوب است تا شرکت ها از آن به عنوان پایه ای برای آموزش پلت فرم ها و نرم افزارهای جدید متاورس استفاده کنند. نرم‌افزار تجاری با داشتن سطح اولیه شایستگی می‌تواند با شخصی‌سازی الگوریتم‌های خود پس از تعامل با کاربران خاص، به نتایج بهتری دست یابد.

Matthew Newman

Matthew Newman Matthew has over 15 years of experience in database management and software development, with a strong focus on full-stack web applications. He specializes in Django and Vue.js with expertise deploying to both server and serverless environments on AWS. He also works with relational databases and large datasets
[ Back To Top ]