هوش مصنوعی در پردازش تصویر: یادگیری عمیق در مقایسه با روش‌های متعارف

 

مقاله ما مروری بر امکاناتی است که در حال حاضر توسط هوش مصنوعی مبتنی بر یادگیری عمیق در پردازش تصویر صنعتی ارائه شده است. مزایا و مشکلات در مقایسه با روش‌های معمول مورد بررسی قرار گرفته است. همچنین شما متوجه نقش این رویکردها در آینده نزدیک خواهید شد. روش‌های مبتنی بر یادگیری در حوزه بینایی ماشین به‌عنوان بخشی از کارهای استاندارد تعریف‌شده‌اند. بسیاری از تولیدکنندگان بخش بزرگی از ظرفیت‌های تحقیق و توسعه خود را به گسترش ویژگی‌های مبتنی بر یادگیری عمیق اختصاص می‌دهند. آیا استفاده از روش‌های “سنتی” برای پردازش تصویر و تجزیه‌وتحلیل تصویر منسوخ خواهد شد؟ آیا این روش‌ها به‌طور کامل با توابع مبتنی بر یادگیری عمیق جایگزین خواهند شد؟

این مقاله، مروری بر احتمالات ارائه شده توسط هوش مصنوعی مبتنی بر یادگیری عمیق است که در پردازش تصویر صنعتی مورد استفاده قرار می‌گیرد. مزایا و معایب هوش مصنوعی مبتنی بر یادگیری عمیق در مقایسه با روش‌های سنتی مورد بررسی قرار خواهد گرفت.

اصطلاح “روش‌های سنتی” شامل روش‌های ساده و مبتنی بر قانون در تجزیه‌وتحلیل تصویر و همچنین روش‌هایی است که از طریق داده‌های تصویری و با کمک الگوریتم‌های یادگیری ماشین که مبتنی بر یادگیری عمیق نیستند؛ اشاره می‌کند.

 

فهرست مطالب

  • زمینه‌های کاربرد یادگیری عمیق در پردازش تصویر صنعتی
  • مزایای روش‌های مبتنی بر یادگیری عمیق
  • هزینه‌های استفاده از یادگیری عمیق
  • بهینه‌سازی شبکه‌های یادگیری عمیق از طریق روش ترکیبی
  • زمینه‌های کاربردی برای راه‌حل‌های بدون یادگیری عمیق
  • چشم‌انداز

هوش مصنوعی در پردازش تصویر: یادگیری عمیق در مقایسه با روش‌های متعارف

 

مقاله ما مروری بر امکاناتی است که در حال حاضر توسط هوش مصنوعی مبتنی بر یادگیری عمیق در پردازش تصویر صنعتی ارائه شده است. مزایا و مشکلات در مقایسه با روش‌های معمول مورد بررسی قرار گرفته است. همچنین شما متوجه نقش این رویکردها در آینده نزدیک خواهید شد. روش‌های مبتنی بر یادگیری در حوزه بینایی ماشین به‌عنوان بخشی از کارهای استاندارد تعریف‌شده‌اند. بسیاری از تولیدکنندگان بخش بزرگی از ظرفیت‌های تحقیق و توسعه خود را به گسترش ویژگی‌های مبتنی بر یادگیری عمیق اختصاص می‌دهند. آیا استفاده از روش‌های “سنتی” برای پردازش تصویر و تجزیه‌وتحلیل تصویر منسوخ خواهد شد؟ آیا این روش‌ها به‌طور کامل با توابع مبتنی بر یادگیری عمیق جایگزین خواهند شد؟

این مقاله، مروری بر احتمالات ارائه شده توسط هوش مصنوعی مبتنی بر یادگیری عمیق است که در پردازش تصویر صنعتی مورد استفاده قرار می‌گیرد. مزایا و معایب هوش مصنوعی مبتنی بر یادگیری عمیق در مقایسه با روش‌های سنتی مورد بررسی قرار خواهد گرفت.

اصطلاح “روش‌های سنتی” شامل روش‌های ساده و مبتنی بر قانون در تجزیه‌وتحلیل تصویر و همچنین روش‌هایی است که از طریق داده‌های تصویری و با کمک الگوریتم‌های یادگیری ماشین که مبتنی بر یادگیری عمیق نیستند؛ اشاره می‌کند.

فهرست مطالب

  • زمینه‌های کاربرد یادگیری عمیق در پردازش تصویر صنعتی
  • مزایای روش‌های مبتنی بر یادگیری عمیق
  • هزینه‌های استفاده از یادگیری عمیق
  • بهینه‌سازی شبکه‌های یادگیری عمیق از طریق روش ترکیبی
  • زمینه‌های کاربردی برای راه‌حل‌های بدون یادگیری عمیق
  • چشم‌انداز

 

1. کاربرد یادگیری عمیق در پردازش تصویر صنعتی

کاربرد اصلی یادگیری عمیق شامل تشخیص ناهنجاری، دسته‌بندی (classification) تصویر، تقسیم‌بندی (segmentation) تصویر و تشخیص شی می‌شود. شبکه‌های عصبی مصنوعی (ANN) خوب آموزش‌دیده با دقت و انعطاف بالاتر و بیشتر در مقایسه با روش‌های مرسوم تجزیه‌وتحلیل تصویر عمل می‌کنند.

  • تشخیص ناهنجاری به تقسیم کل تصاویر به “خوب” یا “بد” اشاره دارد. به‌عنوان‌مثال توانایی تشخیص اشیاء و ساختارهای معیوب

 

 

  • دسته‌بندی تصویر به دسته‌بندی کل تصاویر در کلاس‌های تعریف‌شده اشاره دارد. به‌عنوان‌مثال اختصاص تصاویر به گروهی خاص که فقط شامل یک شی واحد هستند.
  • تقسیم‌بندی تصویر به دسته‌بندی پیکسل به پیکسل اشاره دارد که می‌توان برای تشخیص و موقعیت‌یابی ساختارهای معیوب سطح مورد استفاده قرار گیرد.

 

 

  • تشخیص شی شامل طبقه‌بندی و موقعیت‌یابی یک یا چند شیء در یک تصویر، به‌عنوان‌مثال شمارش اشیاء خاص یا تعیین موقعیت و جهت‌گیری اشیاء است.

 

 

2. مزایای روش‌های مبتنی بر یادگیری عمیق

علاوه بر بهبود دقت، روش‌های مبتنی بر یادگیری عمیق برای کاربردهای بینایی ماشین، انعطاف و اطمینان‌پذیری بالایی فراهم می‌کنند که با روش‌های سنتی، دست‌یافتنی نیستند. در مقایسه با روش‌های سنتی یادگیری ماشین، مرحله مهندسی ویژگی حذف‌شده است. با مهندسی ویژگی، الگوریتم یادگیری ماشین قبل از آموزش، برای تشخیص خواص مربوطه به‌صورت دستی تنظیم می‌شوند تا اشیاء به‌درستی تشخیص داده شوند. آنچه شبکه یادگیری عمیق را متمایز می‌کند؛ تشخیص مستقل ویژگی‌ها در طول آموزش (train) است.

 

 

تشخیص اشیاء و ویژگی‌های مختلف: یکی از مزایای روش یادگیری عمیق، توانایی تشخیص اشیاء یا خواصی است که در اشکال مختلف ارائه‌شده‌اند؛ مانند خش روی سطوح مختلف، محصولات طبیعی با اشکال مختلف و یا دست خط. به‌عنوان‌مثال برای تشخیص ناهنجاری، آموزش شبکه عصبی تنها با تصاویر نمونه بی‌عیب و نقص برای تشخیص عیوب جسم در طول زمان استفاده می‌شود.

تشخیص مطمئن شیء: اشیاء در محیط‌های مختلف، به‌عنوان‌مثال آن‌هایی که دارای پیش‌زمینه متغیر، وضوح تصویر مختلف و یا روشنایی متفاوت هستند؛ قابل‌تشخیص خواهند بود. این امر مستلزم شبکه‌های عصبی خوب آموزش‌دیده است و نیازی به آموزش مجزا و تنظیم برای تمامی حالات ممکن نیست.

 

3. هزینه‌های استفاده از یادگیری عمیق

در مقایسه با روش‌های متداول، به‌منظور بهره‌مندی از مزایای روش‌های مبتنی بر یادگیری عمیق سرمایه‌گذاری بیشتری در بخش سخت‌افزار مورد استفاده در پروژه و معمولاً تعداد زياد تصویر برای آموزش شبکه عصبی مورد نیاز است.

سخت‌افزار اضافی: معماری قدرتمند و پیچیده یادگیری عمیق با تعداد بالاتری از لایه‌های شبکه عصبی تمیز داده می‌شوند. اجرای پروژه یادگیری عمیق مستلزم حافظه بزرگ‌تر و ظرفیت بیشتر پردازشی است. فقط با برون‌سپاری وظایف محاسباتی به پردازنده اضافی -به‌عنوان‌مثال در GPUها (کارت‌های گرافیکی)- برای اجرای هم‌زمان محاسبات است که می‌توان به زمان کوتاه پردازشی دست پیدا کرد.

افزایش دما، مصرف انرژی: نیاز به توان محاسباتی بالا در شبکه‌های عصبی بزرگ، مصرف انرژی برنامه را افزایش می‌دهد. در نتیجه گرما تولید می‌شود. این امر می‌تواند خصوصاً برای سیستم‌های تعبیه‌شده که اغلب انتظار می‌رود برای مصرف کم و مدیریت گرما بهینه‌شده باشند؛ مشکل‌ساز خواهد بود.

حجم عظیمی از داده‌های آموزشی: شناخت مطمئن اشیاء، نیاز به تعداد زیادی از تصاویر آموزش‌دیده دارد. تا همه اشیاء و خواص مختلف موجود را به تصویر بکشید و علامت‌گذاری کنید. تعداد بیشتر داده‌های تصویری برای آموزش شبکه برابر با تشخیص ساده‌تر اشیا توسط شبکه یادگیری عمیق خواهد شد. دریافت صدها و گاهی حتی چندین هزار تصویر می‌تواند بحرانی در توسعه برنامه بینایی ماشین شمرده شود.

 

4. بهینه‌سازی شبکه‌های یادگیری عمیق از طریق یک روش ترکیبی

پردازش تصویر در شبکه‌های عصبی مصنوعی می‌تواند با روش‌های مرسوم ترکیب شود و برای پردازش داده‌های تصویری مورد استفاده قرار بگیرد. ابتدا روش‌های مرسوم، تصویر را پیش‌پردازش می‌کنند. سپس شبکه عصبی مصنوعی، نتایج دلخواه را از داده‌های پیش‌پردازش شده استخراج می‌نماید. مزیت: کارایی بالا به همراه نیاز کم به حافظه و انرژی.

در ضمن، این رویکرد ترکیبی باعث می‌شود تا تعداد تصاویر اخذشده برای آموزش شبکه‌های یادگیری عمیق کاهش پیدا کند.

بهینه‌سازی می‌تواند با روش‌های معمول حاصل شود؛ مانند كاهش اندازه تصوير، افزایش واریانس و تعداد داده‌های آموزش از طریق عملیات ساده (keyword augmentation)

 

  • 4.1 کاهش اندازه تصویر

کاهش وضوح تصاویر ورودی به معنای کاهش حجم داده‌پردازشی است. در نتیجه شبکه عصبی می‌تواند با لایه‌های کمتری کار کند و به حافظه و محاسبات کمتری نیاز داشته باشد. بریدن تصویر و جداسازی هدف مربوطه (ROI – منطقه مورد نظر) می‌تواند منجر به نتیجه یکسان در وضوح پایین‌تر با همان جزئیات برای پردازش تصویر باشد. با پس‌زمینه همگن، بخش مربوطه تصویر می‌تواند از طریق مقایسه ساده رنگ و یا مقیاس خاکستری تشخیص داده شود.

 

 

  • 4.2 به حداقل رساندن واریانس تصاویر مورد بازرسی

اگر تفاوت‌های اجتناب‌پذیر در تصاویر مورد بازرسی کاهش یابد به داده‌های کمتری برای آموزش شبکه عصبی نیاز خواهد بود. شرایط محیطی پایدار مانند روشنایی پایدار، پس‌زمینه تک‌رنگ ثابت، موقعیت ثابت اشیاء مورد بازرسی و زاویه ثابت، تشخیص اشیاء و ساختارها را با کمترین تلاش ممکن می‌سازد.

 

 

روش‌های مرسوم به کمک فیلترهای ساده و عملیات کانترست می‌توانند اطلاعات بی‌ربط را حذف نمایند. این امر به شبکه یادگیری عمیق کمک می‌کند تا به‌طور دقیق اشیاء و ساختارهای خاص را با داده و شبکه‌های کوچک‌تر تشخیص بدهند.

 

  • 4.3 افزایش تعداد و واریانس داده‌های آموزشی

کمیت و تنوع داده‌های آموزشی موجود می‌تواند با تولید داده‌های آموزش اضافی افزایش یابد. به چنین عملیاتی در اصطلاح ازدیاد (augmentation) گفته می‌شود. در عملیات ازدیاد از تصاویر اصلی برای ایجاد واریانس‌های متفاوت به کمک روش‌های مرسوم استفاده می‌شود. به‌عنوان‌مثال با چرخش، انتقال و یا کشش تصویر اصلی. این امر به شبکه عصبی اجازه می‌دهد تا یاد بگیرند که چگونه یک شیء را به‌طور مستقل از زاویه چرخش و موقعیت در تصویر تشخیص دهد.

 

 

5. پروژه‌هایی بدون نیاز به یادگیری عمیق

روش‌های مبتنی بر یادگیری عمیق در بسیاری از موارد، مزیتی بر روش‌های سنتی ندارند به جز اینکه هزینه‌های اضافی به سیستم اضافه می‌کنند. به‌عنوان‌مثال، راه‌اندازی و آموزش شبکه یادگیری عمیق فقط برای تمییز دادن بین اشیاء سبز و قرمز، کاری بیهوده است. این کار تنها نیاز به یک قاعده ساده مبتنی بر مقایسه رنگ دارد که بسیار مناسب‌تر و قوی‌تر از شبکه یادگیری عمیق خواهد بود.

خواندن بارکد، کدهای QR و ماتریس داده‌ها نیز به‌طورکلی نیازی به شبکه یادگیری عمیق ندارد. در چنین مواردی روش‌های پیشرفته بدون یادگیری عمیق دارای عملکرد و دقت بالا بدون نیاز به حافظه و محاسبات زیاد است.

موارد دیگر استفاده از الگوریتم‌های سنتی، معمولاً شامل اندازه‌گیری و فاصله سنجی دقیق است. روش‌های سنتی در این حوزه نیز اثبات‌شده هستند؛ در نتیجه اجرای الگوریتم یادگیری عمیق می‌تواند دشوار و بدون مزیت خاصی باشد.

به‌طورکلی، پروژه‌های پیچیده بینایی ماشین شامل روش‌های سنتی به همراه الگوریتم‌های بینایی ماشین است. در بسیاری از موارد گام‌های مختلف هم‌زمان صورت می‌پذیرد. برای مثال خواندن بارکد با روش‌های مرسوم و به‌طور هم‌زمان تشخیص شی و بازرسی ساختار به کمک شبکه یادگیری عمیق صورت می‌پذیرد.

 

6. چشم‌انداز

بسیاری از پروژه‌های فعلی تحقیقاتی و توسعه‌ای جدید، مبتنی بر معماری‌های شبکه یادگیری عمیق بر بهینه‌سازی استراتژی به‌منظور دستیابی به کارایی بهتر تمرکز کرده‌اند. هدف، اغلب رسیدن به پردازش به لحظه است. برای مثال استفاده در سامانه‌های بدون راننده.

 

مترجم: محمد کیانی (کارشناس سامانه‌‎های بینایی ماشین)

 

منبع

سایر مقالات