یکتا فراهانی: در دنیای هوش مصنوعی یکی از چالشهای بزرگ، تلاش برای شبیهسازی روشهای شناختی انسانها در پردازش اطلاعات بصری است. اخیراً گروهی از محققان MIT سیستمی جدید توسعه دادهاند که به ماشینها کمک میکند تا دنیای اطراف خود را به شیوهای مشابه انسانها تحلیل کنند.
چرا انسانها دقیقتر میبینند؟
بینایی کامپیوتری معمولاً از الگوریتمهای پیچیدهای برای تحلیل تصاویر استفاده میکند، اما گاهی اوقات این سیستمها نتایج عجیبی میدهند. برای مثال، درحالیکه یک ربات ممکن است یک ظرف غذا را نادیده بگیرد یا یک بشقاب را در هوا شناور فرض کند، انسانها معمولاً این اشکالات را سریع شناسایی میکنند. این عدم تطابق با واقعیت میتواند در کاربردهای حیاتی مانند خودروهای خودران یا رباتهای سرویسدهنده مشکلات بزرگی ایجاد کند.
استفاده از «برنامهنویسی احتمالاتی»
برای بهبود بینایی ماشین
محققان MIT رویکردی نوین برای حل این مشکلات پیشنهاد کردهاند که از «برنامهنویسی احتمالاتی» بهره میبرد. این رویکرد به ماشینها اجازه میدهد تا تصاویر را از زوایای مختلف تجزیهوتحلیل و با استفاده از دادههای احتمالاتی، احتمال تطابق یا خطا در شبیهسازی صحنهها را پیشبینی کنند. این روش نهتنها به تشخیص اشیای دقیقتر کمک میکند؛ بلکه اشتباهات معمول در الگوریتمهای یادگیری عمیق را نیز اصلاح میکند.
یادگیری از چند تصویر برای درک بهتر اشیا
به گزارش سایت scitechdaily یکی از ویژگیهای برجسته این سیستم جدید این است که تنها با مشاهده چند تصویر از یک شیء میتواند شکل و ابعاد آن را در فضای سهبعدی شبیهسازی کند. برخلاف سیستمهای یادگیری عمیق که نیاز به هزاران نمونه داده دارند، سیستم جدید MIT تنها به پنج تصویر از یک شیء نیاز دارد تا شکل و ویژگیهای آن را بیاموزد. این ویژگی باعث میشود مدل بهراحتی و سریعتر از دیگر روشها یاد بگیرد و دقت بیشتری در تشخیص اشیا و صحنهها داشته باشد.
پیشرفتهای قابلتوجه در دقت و سرعت
محققان این سیستم را با مدلهای رایج یادگیری عمیق مقایسه کردهاند و در اکثر موارد، سیستم ۳DP۳ توانسته است دقت بالاتری در شبیهسازی اشیا و صحنهها ارائه دهد. برای مثال، وقتی که یک شیء جزئی از نظر بصری مسدود شده باشد، این سیستم قادر است بهدرستی موقعیت آن را تصحیح کند. منبع: همشهری آنلاین