هوش مصنوعی در پردازش تصویر: یادگیری عمیق در مقایسه با روشهای متعارف
مقاله ما مروری بر امکاناتی است که در حال حاضر توسط هوش مصنوعی مبتنی بر یادگیری عمیق در پردازش تصویر صنعتی ارائه شده است. مزایا و مشکلات در مقایسه با روشهای معمول مورد بررسی قرار گرفته است. همچنین شما متوجه نقش این رویکردها در آینده نزدیک خواهید شد. روشهای مبتنی بر یادگیری در حوزه بینایی ماشین بهعنوان بخشی از کارهای استاندارد تعریف شدهاند. بسیاری از تولیدکنندگان بخش بزرگی از ظرفیتهای تحقیق و توسعه خود را به گسترش ویژگیهای مبتنی بر یادگیری عمیق اختصاص میدهند. آیا استفاده از روشهای “سنتی” برای پردازش تصویر و تجزیهوتحلیل تصویر منسوخ خواهد شد؟ آیا این روشها بهطور کامل با توابع مبتنی بر یادگیری عمیق جایگزین خواهند شد؟
این مقاله، مروری بر احتمالات ارائه شده توسط هوش مصنوعی مبتنی بر یادگیری عمیق است که در پردازش تصویر صنعتی مورد استفاده قرار میگیرد. مزایا و معایب هوش مصنوعی مبتنی بر یادگیری عمیق در مقایسه با روشهای سنتی مورد بررسی قرار خواهد گرفت.
اصطلاح “روشهای سنتی” شامل روشهای ساده و مبتنی بر قانون در تجزیهوتحلیل تصویر و همچنین روشهایی است که از طریق دادههای تصویری و با کمک الگوریتمهای یادگیری ماشین که مبتنی بر یادگیری عمیق نیستند؛ اشاره میکند.
فهرست مطالب
- زمینههای کاربرد یادگیری عمیق در پردازش تصویر صنعتی
- مزایای روشهای مبتنی بر یادگیری عمیق
- هزینههای استفاده از یادگیری عمیق
- بهینهسازی شبکههای یادگیری عمیق از طریق روش ترکیبی
- زمینههای کاربردی برای راهحلهای بدون یادگیری عمیق
- چشمانداز
هوش مصنوعی در پردازش تصویر: یادگیری عمیق در مقایسه با روشهای متعارف
مقاله ما مروری بر امکاناتی است که در حال حاضر توسط هوش مصنوعی مبتنی بر یادگیری عمیق در پردازش تصویر صنعتی ارائه شده است. مزایا و مشکلات در مقایسه با روشهای معمول مورد بررسی قرار گرفته است. همچنین شما متوجه نقش این رویکردها در آینده نزدیک خواهید شد. روشهای مبتنی بر یادگیری در حوزه بینایی ماشین بهعنوان بخشی از کارهای استاندارد تعریفشدهاند. بسیاری از تولیدکنندگان بخش بزرگی از ظرفیتهای تحقیق و توسعه خود را به گسترش ویژگیهای مبتنی بر یادگیری عمیق اختصاص میدهند. آیا استفاده از روشهای “سنتی” برای پردازش تصویر و تجزیهوتحلیل تصویر منسوخ خواهد شد؟ آیا این روشها بهطور کامل با توابع مبتنی بر یادگیری عمیق جایگزین خواهند شد؟
این مقاله، مروری بر احتمالات ارائه شده توسط هوش مصنوعی مبتنی بر یادگیری عمیق است که در پردازش تصویر صنعتی مورد استفاده قرار میگیرد. مزایا و معایب هوش مصنوعی مبتنی بر یادگیری عمیق در مقایسه با روشهای سنتی مورد بررسی قرار خواهد گرفت.
اصطلاح “روشهای سنتی” شامل روشهای ساده و مبتنی بر قانون در تجزیهوتحلیل تصویر و همچنین روشهایی است که از طریق دادههای تصویری و با کمک الگوریتمهای یادگیری ماشین که مبتنی بر یادگیری عمیق نیستند؛ اشاره میکند.
فهرست مطالب
- زمینههای کاربرد یادگیری عمیق در پردازش تصویر صنعتی
- مزایای روشهای مبتنی بر یادگیری عمیق
- هزینههای استفاده از یادگیری عمیق
- بهینهسازی شبکههای یادگیری عمیق از طریق روش ترکیبی
- زمینههای کاربردی برای راهحلهای بدون یادگیری عمیق
- چشمانداز
1. کاربرد یادگیری عمیق در پردازش تصویر صنعتی
کاربرد اصلی یادگیری عمیق شامل تشخیص ناهنجاری، دستهبندی (classification) تصویر، تقسیمبندی (segmentation) تصویر و تشخیص شی میشود. شبکههای عصبی مصنوعی (ANN) خوب آموزشدیده با دقت و انعطاف بالاتر و بیشتر در مقایسه با روشهای مرسوم تجزیهوتحلیل تصویر عمل میکنند.
بهتر است بدانید که قطعه بندی تصویر و همچنین بخش بندی تصویر بر اساس طبقه بندی می تواند به پردازش هر چه بهتر تصاویر کمک بسیار شایانی کند.
- تشخیص ناهنجاری به تقسیم کل تصاویر به “خوب” یا “بد” اشاره دارد. بهعنوانمثال توانایی تشخیص اشیاء و ساختارهای معیوب
- دستهبندی تصویر به دستهبندی کل تصاویر در کلاسهای تعریفشده اشاره دارد. بهعنوانمثال اختصاص تصاویر به گروهی خاص که فقط شامل یک شی واحد هستند.
- تقسیمبندی تصویر به دستهبندی پیکسل به پیکسل اشاره دارد که میتوان برای تشخیص و موقعیتیابی ساختارهای معیوب سطح مورد استفاده قرار گیرد.
- تشخیص شی شامل طبقهبندی و موقعیتیابی یک یا چند شیء در یک تصویر، بهعنوانمثال شمارش اشیاء خاص یا تعیین موقعیت و جهتگیری اشیاء است.
2. مزایای روشهای مبتنی بر یادگیری عمیق
علاوه بر بهبود دقت، روشهای مبتنی بر یادگیری عمیق برای کاربردهای بینایی ماشین، انعطاف و اطمینانپذیری بالایی فراهم میکنند که با روشهای سنتی، دستیافتنی نیستند. در مقایسه با روشهای سنتی یادگیری ماشین، مرحله مهندسی ویژگی حذفشده است. با مهندسی ویژگی، الگوریتم یادگیری ماشین قبل از آموزش، برای تشخیص خواص مربوطه بهصورت دستی تنظیم میشوند تا اشیاء بهدرستی تشخیص داده شوند. آنچه شبکه یادگیری عمیق را متمایز میکند؛ تشخیص مستقل ویژگیها در طول آموزش (train) است.
تشخیص اشیاء و ویژگیهای مختلف: یکی از مزایای روش یادگیری عمیق، توانایی تشخیص اشیاء یا خواصی است که در اشکال مختلف ارائهشدهاند؛ مانند خش روی سطوح مختلف، محصولات طبیعی با اشکال مختلف و یا دست خط. بهعنوانمثال برای تشخیص ناهنجاری، آموزش شبکه عصبی تنها با تصاویر نمونه بیعیب و نقص برای تشخیص عیوب جسم در طول زمان استفاده میشود.
تشخیص مطمئن شیء: اشیاء در محیطهای مختلف، بهعنوانمثال آنهایی که دارای پیشزمینه متغیر، وضوح تصویر مختلف و یا روشنایی متفاوت هستند؛ قابلتشخیص خواهند بود. این امر مستلزم شبکههای عصبی خوب آموزشدیده است و نیازی به آموزش مجزا و تنظیم برای تمامی حالات ممکن نیست.
3. هزینههای استفاده از یادگیری عمیق
در مقایسه با روشهای متداول، بهمنظور بهرهمندی از مزایای روشهای مبتنی بر یادگیری عمیق سرمایهگذاری بیشتری در بخش سختافزار مورد استفاده در پروژه و معمولاً تعداد زياد تصویر برای آموزش شبکه عصبی مورد نیاز است.
سختافزار اضافی: معماری قدرتمند و پیچیده یادگیری عمیق با تعداد بالاتری از لایههای شبکه عصبی تمیز داده میشوند. اجرای پروژه یادگیری عمیق مستلزم حافظه بزرگتر و ظرفیت بیشتر پردازشی است. فقط با برونسپاری وظایف محاسباتی به پردازنده اضافی -بهعنوانمثال در GPUها (کارتهای گرافیکی)- برای اجرای همزمان محاسبات است که میتوان به زمان کوتاه پردازشی دست پیدا کرد.
افزایش دما، مصرف انرژی: نیاز به توان محاسباتی بالا در شبکههای عصبی بزرگ، مصرف انرژی برنامه را افزایش میدهد. در نتیجه گرما تولید میشود. این امر میتواند خصوصاً برای سیستمهای تعبیهشده که اغلب انتظار میرود برای مصرف کم و مدیریت گرما بهینهشده باشند؛ مشکلساز خواهد بود.
حجم عظیمی از دادههای آموزشی: شناخت مطمئن اشیاء، نیاز به تعداد زیادی از تصاویر آموزشدیده دارد. تا همه اشیاء و خواص مختلف موجود را به تصویر بکشید و علامتگذاری کنید. تعداد بیشتر دادههای تصویری برای آموزش شبکه برابر با تشخیص سادهتر اشیا توسط شبکه یادگیری عمیق خواهد شد. دریافت صدها و گاهی حتی چندین هزار تصویر میتواند بحرانی در توسعه برنامه بینایی ماشین شمرده شود.
4. بهینهسازی شبکههای یادگیری عمیق از طریق یک روش ترکیبی
پردازش تصویر در شبکههای عصبی مصنوعی میتواند با روشهای مرسوم ترکیب شود و برای پردازش دادههای تصویری مورد استفاده قرار بگیرد. ابتدا روشهای مرسوم، تصویر را پیشپردازش میکنند. سپس شبکه عصبی مصنوعی، نتایج دلخواه را از دادههای پیشپردازش شده استخراج مینماید. مزیت: کارایی بالا به همراه نیاز کم به حافظه و انرژی.
در ضمن، این رویکرد ترکیبی باعث میشود تا تعداد تصاویر اخذشده برای آموزش شبکههای یادگیری عمیق کاهش پیدا کند.
بهینهسازی میتواند با روشهای معمول حاصل شود؛ مانند كاهش اندازه تصوير، افزایش واریانس و تعداد دادههای آموزش از طریق عملیات ساده (keyword augmentation)
- 4.1 کاهش اندازه تصویر
کاهش وضوح تصاویر ورودی به معنای کاهش حجم دادهپردازشی است. در نتیجه شبکه عصبی میتواند با لایههای کمتری کار کند و به حافظه و محاسبات کمتری نیاز داشته باشد. بریدن تصویر و جداسازی هدف مربوطه (ROI – منطقه مورد نظر) میتواند منجر به نتیجه یکسان در وضوح پایینتر با همان جزئیات برای پردازش تصویر باشد. با پسزمینه همگن، بخش مربوطه تصویر میتواند از طریق مقایسه ساده رنگ و یا مقیاس خاکستری تشخیص داده شود.
- 4.2 به حداقل رساندن واریانس تصاویر مورد بازرسی
اگر تفاوتهای اجتنابپذیر در تصاویر مورد بازرسی کاهش یابد به دادههای کمتری برای آموزش شبکه عصبی نیاز خواهد بود. شرایط محیطی پایدار مانند روشنایی پایدار، پسزمینه تکرنگ ثابت، موقعیت ثابت اشیاء مورد بازرسی و زاویه ثابت، تشخیص اشیاء و ساختارها را با کمترین تلاش ممکن میسازد.
روشهای مرسوم به کمک فیلترهای ساده و عملیات کانترست میتوانند اطلاعات بیربط را حذف نمایند. این امر به شبکه یادگیری عمیق کمک میکند تا بهطور دقیق اشیاء و ساختارهای خاص را با داده و شبکههای کوچکتر تشخیص بدهند.
- 4.3 افزایش تعداد و واریانس دادههای آموزشی
کمیت و تنوع دادههای آموزشی موجود میتواند با تولید دادههای آموزش اضافی افزایش یابد. به چنین عملیاتی در اصطلاح ازدیاد (augmentation) گفته میشود. در عملیات ازدیاد از تصاویر اصلی برای ایجاد واریانسهای متفاوت به کمک روشهای مرسوم استفاده میشود. بهعنوانمثال با چرخش، انتقال و یا کشش تصویر اصلی. این امر به شبکه عصبی اجازه میدهد تا یاد بگیرند که چگونه یک شیء را بهطور مستقل از زاویه چرخش و موقعیت در تصویر تشخیص دهد.
5. پروژههایی بدون نیاز به یادگیری عمیق
روشهای مبتنی بر یادگیری عمیق در بسیاری از موارد، مزیتی بر روشهای سنتی ندارند به جز اینکه هزینههای اضافی به سیستم اضافه میکنند. بهعنوانمثال، راهاندازی و آموزش شبکه یادگیری عمیق فقط برای تمییز دادن بین اشیاء سبز و قرمز، کاری بیهوده است. این کار تنها نیاز به یک قاعده ساده مبتنی بر مقایسه رنگ دارد که بسیار مناسبتر و قویتر از شبکه یادگیری عمیق خواهد بود.
خواندن بارکد، کدهای QR و ماتریس دادهها نیز بهطورکلی نیازی به شبکه یادگیری عمیق ندارد. در چنین مواردی روشهای پیشرفته بدون یادگیری عمیق دارای عملکرد و دقت بالا بدون نیاز به حافظه و محاسبات زیاد است.
موارد دیگر استفاده از الگوریتمهای سنتی، معمولاً شامل اندازهگیری و فاصله سنجی دقیق است. روشهای سنتی در این حوزه نیز اثباتشده هستند؛ در نتیجه اجرای الگوریتم یادگیری عمیق میتواند دشوار و بدون مزیت خاصی باشد.
بهطورکلی، پروژههای پیچیده بینایی ماشین شامل روشهای سنتی به همراه الگوریتمهای بینایی ماشین است. در بسیاری از موارد گامهای مختلف همزمان صورت میپذیرد. برای مثال خواندن بارکد با روشهای مرسوم و بهطور همزمان تشخیص شی و بازرسی ساختار به کمک شبکه یادگیری عمیق صورت میپذیرد.
6. چشمانداز
بسیاری از پروژههای فعلی تحقیقاتی و توسعهای جدید، مبتنی بر معماریهای شبکه یادگیری عمیق بر بهینهسازی استراتژی بهمنظور دستیابی به کارایی بهتر تمرکز کردهاند. هدف، اغلب رسیدن به پردازش به لحظه است. برای مثال استفاده در سامانههای بدون راننده.
مترجم: محمد کیانی (کارشناس سامانههای بینایی ماشین)