دسته‌بندی نشده

سیستم‌های دوربینی برای یادگیری عمیق

 

در این مطلب ما قصد داریم تا در مورد سیستم‌های دوربینی برای یادگیری عمیق توضیح دهیم، لطفا با ما همراه باشید.

 

مقدمه

توسعه و گسترش الگوریتم‌های یادگیری عمیق بخصوص در حوزه شبکه‌های عصبی مصنوعی (ANNها) ، به‌سرعت در حال افزایش است. حتی درصورتی‌که کاربردهای مختلف از این نوع هوش مصنوعی سود نبرند، شبکه‌های عصبی مصنوعی در بسیاری از موارد، دقت و نیرومندی یک کاربرد را – آن‌هم نه فقط در حوزه اتوماسیون صنعتی- افزایش می‌دهند.

در حوزه علوم زیستی، الگوریتم‌های یادگیری، امکان انجام کاربردهای کاملاً جدیدی را فراهم می‌کند که پیش‌ازاین در مورد ماشین‌ها غیرممکن تلقی می‌شدند ولی هم‌اکنون به کمک دقت و قابلیت اطمینان چشمگیر ایجاد شده، امکان‌پذیر شده‌اند. مقاله سفید حاضر، به کاربردهای احتمالی سیستم‌های بینایی مبتنی بر دوربین در خصوص مدل‌های یادگیری عمیق در علوم پزشکی و زیستی می‌پردازد.

 

1-مقدمه

تاکنون از الگوریتم‌های یادگیری عمیق در تصویربرداری پزشکی و در زمینه‌های متعدد کاربردی نظیر طبقه‌بندی معاینات ماموگرافی، قطعه‌بندی پروستات، قطعه‌بندی ضایعه‌ها در مغز یا قطعه‌بندی دستگاه تنفسی استفاده می‌شده است. روش‌های تصویربرداری شامل تمامی روش‌ها ازجمله آزمایش‌های اشعه ایکس و اولتراساند (سونوگرافی) گرفته تا توموگرافی رزونانسی کامپیوتری و مغناطیسی و توموگرافی انسجام نوری می‌شود.

 

2-یادگیری عمیق در میکروسکوپ

در حوزه میکروسکوپی پزشکی، به‌طور خاص دو زمینه از پتانسیل بالایی برای یادگیری عمیق برخوردارند: آسیب‌شناسی (پاتولوژی) دیجیتال و رنگ‌آمیزی مجازی قطعات بافتی.

 

2.1- مثال: آسیب‌شناسی دیجیتال

آسیب‌شناسی دیجیتال به آنالیز مقدمات بافت‌شناسی و سیتولوژیک (سلول‌شناسی) به‌منظور شناسایی و آنالیز تغییرات پاتولوژیک بافت‌ها یا سلول‌ها می‌پردازد. این آزمایش‌های بافت‌شناسی و سلول‌شناسی به همراه آزمایش‌های دیگر به‌عنوان بخشی از چکاب‌های پزشکی پیشگیرانه، به‌منظور شناسایی اولیه التهاب یا تشکیل تومور مورداستفاده قرار می‌گیرند. آسیب‌شناسی دیجیتال، هسته اصلی میکروسکوپی بوده و کاربردهای زیادی را شامل می‌شود. به‌طور طبیعی، پتانسیل شبکه‌های عصبی مصنوعی در این زمینه بسیار زیاد است: بخصوص همکاری بین هوش مصنوعی و تخصص انسانی نویدبخش و امیدوارکننده به نظر می‌رسد. رویه‌های تشخیصی خودکار، مزایای متعددی دارند: در مورد آسیب‌شناسان، مقدار قطعات بافتی اسکن شده کاهش یافته و نیاز به بازرسی دستی مستقیم به کمک میکروسکوپ نیز کاهش یافته، نتیجه و بیانیه تشخیصی و اقدامات درمانی متناظر برای بیماران بهبود یافته و درنهایت هزینه‌ها کاهش می‌یابند.

 

سیستم‌های دوربینی برای یادگیری عمیق

برش تصویر

سیستم‌های دوربینی برای یادگیری عمیق

نقشه احتمالات مناطق سرطانی

سیستم‌های دوربینی برای یادگیری عمیق

همپوشانی تصویر فلورسانس لکه دار نشده (ورودی)

 

 

2.2- مثال: رنگ‌آمیزی مجازی قطعات بافتی

به‌منظور شناسایی و ارزیابی تغییرات پاتولوژیک در بافت انسانی، قطعات بسیار نرمی از بافت‌ها به‌طور شیمیایی رنگ‌‌آمیزی شده و زیر نور میکروسکوپ بررسی می‌شود. بسته به نوع رنگ مورداستفاده، ساختارهای مختلفی ممکن است در بافت ظاهر شوند. این فرآیند رنگ‌آمیزی، بسیار وقت‌گیر و پرهزینه است. به‌عنوان‌مثال درصورتی‌که یک نمونه بافتی قرار باشد طی یک فرآیند جراحی رنگ‌آمیزی شود تا به‌سرعت اطلاعات دقیقی درباره تغییرات پاتولوژیک به دست آید، این هزینه زمانی بسیار سنگین و گاهی اوقات بحرانی است.

در این صورت، یک شبکه عصبی مصنوعی که تصاویر میکروسکوپی را «به‌صورت مجازی رنگ می‌کند» قادر است کمک ارزشمند و مفیدی باشد. این شبکه به‌گونه‌ای تعلیم می‌بیند که از تصاویر رنگ‌نشده حاصل از میکروسکوپ فلوئورسانسی به‌عنوان ورودی استفاده کرده و آن‌ها را به تصاویر میکروسکوپ نوری رنگ‌شده تبدیل کند.  مزیت این روش عبارت است از: راه‌حل و پاسخی خودکار که در زمان صرفه‌جویی کرده و هزینه‌ها را کاهش می‌دهد.

 

سیستم‌های دوربینی برای یادگیری عمیق

تصویر مجازی لکه دار

سیستم‌های دوربینی برای یادگیری عمیق

تصویر لکه دار بافتی (مرجع)

3-محصولات مبتنی بر شبکه عصبی مصنوعی را چگونه می‌توان به لحاظ تجاری امکان‌پذیر کرد؟

وظیفه اصلی شبکه عصبی مصنوعی به زبان ساده، تقلید عملکرد کورتکس بینایی مغز انسان–یعنی ادراک بصری انسان- است و انجام هرچه سریع‌تر و دقیق‌تر این کار است. به‌منظور عملکرد قابل‌اطمینان یک شبکه عصبی مصنوعی، می‌بایست ابتدا این شبکه آموزش داده شود. این آموزش معمولاً مبتنی بر هزاران تصویر مشخص و علامت‌گذاری شده است که «یادگیری نظارت‌شده» نامیده می‌شود. در خصوص معماری شبکه، در اکثر موارد از کتابخانه‌های نرم‌افزاری منبع باز نظیر تنسورفلو، کافی، تیانو  یا تورچ استفاده می‌شود.

بنابراین، استفاده از شبکه عصبی مصنوعی شامل دو مرحله می‌شود: مرحله 1 شامل آموزش توصیف‌شده[1] و مرحله 2 شامل اجرا می‌شود. در این مقاله سفید، شبکه‌های عصبی مصنوعی از پیش آموزش‌دیده مدنظر قرار می‌گیرند که قرار است در یک مجموعه محصول بکار برده شوند.

پیش‌نیاز اساسی برای ورود سیستم‌های مبتنی بر هوش مصنوعی به بازار، یک سیستم بینایی است که آبراهه داده‌های پردازش تصویر معمول بر روی آن قابل‌اجرا است. این فرآیند شامل چهار مرحله زیر است:

 

سیستم‌های دوربینی برای یادگیری عمیق

سیستم‌های دوربینی برای یادگیری عمیق

پردازش تصویر برای سیستم بینایی یادگیری عمیق

 

1-تهیه تصویر (ورودی)

دوربین تنظیم شده و با پارامترهای مناسب نظیر مدت‌زمان قرارگیری در برابر نور یا ناحیه موردنظر (ROI) برنامه‌نویسی می‌شود. حسگر، تصویر را ثبت می‌کند.

2-پردازش تصویر

تصویر حسگر به کمک الگوریتم‌های خاص نظیر دبایرینگ، اصلاح رنگ، بهینه‌سازی میزان وضوح تصویر و غیره پردازش اولیه می‌شوند. تصویر یادشده برای اجرا- استنتاج- یک شبکه عصبی مصنوعی مورد آماده می‌شود.

3-استنتاج-شبکه عصبی مصنوعی

حال، شبکه عصبی مصنوعی از تصویر پردازش اولیه شده به‌عنوان ورودی استفاده کرده و آن را مطابق با مشخصاتی که مطابق با آن آموزش دیده است، دسته‌بندی می‌کند.

4-ارائه نتایج (خروجی)

خروجی استنتاج- شبکه عصبی می‌بایست به شیوه‌ای واضح و آشکار در قالب یک فرم بصری از پیش آماده‌شده، ارائه شود.

اگرچه آموزش یک شبکه عصبی مصنوعی به کمک کتابخانه‌های نرم‌افزاری فوق‌الذکر، بسیار ساده است، لیکن چالش اصلی، تدارک یک ساختار سخت‌افزاری برای این شبکه عصبی مصنوعی آموزش دیده است که از یک‌سو الزامات بازار را برآورده ساخته و از سوی دیگر ازنقطه‌نظر هزینه‌ای قابل‌قبول باشد. این سخت‌افزار می‌بایست الزامات یاد شده برای فرآیندهای توصیف‌شده اسکن و پردازش را برآورده سازد. این امر مستلزم وجود سه مؤلفه اصلی در یک سیستم بینایی است:

  • یک دوربین
  • یک واسط کاربری
  • یک واحد پردازش که پردازش استنتاج بر روی آن صورت می‌گیرد («میزبان استنتاج»)

 

سیستم‌های دوربینی برای یادگیری عمیق

نمایش شماتیک یک سیستم بینایی برای یادگیری عمیق: یک دوربین برای دستیابی به تصویر ، یک رابط برای انتقال داده و یک رابط برای استنباط ANN

 
4- سه نوع سیستم بینایی به‌منظور یادگیری عمیق

بسته به کاربرد و الزامات، می‌توان سه معماری مختلف سیستم بینایی برای شبکه‌های عصبی مصنوعی امروزی طرح‌ریزی کرد که در برخی موارد ازلحاظ عملکرد، تلاش مهندسی و هزینه کل مالکیت (TCO) ، تفاوت چشمگیری دارند.

  • سیستم‌های تعبیه‌شده
  • سیستم‌های مبتنی بر رایانه شخصی
  • سیستم‌های مبتنی بر قلاب چارچوب FPGA

 

4.1- سیستم‌های بینایی تعبیه‌شده

مشخصات اصلی یک سیستم تعبیه‌شده، هزینه کل مالکیت تقریباً اندک آن است که از مؤلفه‌های زیر تشکیل می‌شود:

 

سیستم‌های دوربینی برای یادگیری عمیق

 

یکی از موارد مهم در کاربردهای یادگیری عمیق، وجود سخت‌افزاری است که شبکه عصبی مصنوعی بتواند به‌طور سریع و مؤثر بر روی آن مورداستفاده قرار گیرد. به‌عنوان‌مثال، بردهای I.MX8 شرکت NXP به دلیل انعطاف‌پذیری، قابلیت دسترس‌پذیری بلندمدت و مستندسازی خوب، محبوب هستند.

نتیجه‌گیری نهایی در خصوص سیستم‌های بینایی تعبیه‌شده برای یادگیری عمیق:

 

سیستم‌های دوربینی برای یادگیری عمیق

 

4.2- سیستم‌های مبتنی بر PC

ویژگی اصلی یک سیستم مبتنی بر PC، یکپارچگی و تلاش مهندسی اندک آن به لطف قطعات سخت‌افزاری موجود به لحاظ تجاری است.

این موارد به کمک مثال یک کاربرد پزشکی نشان داده می‌شود:

 

سیستم‌های دوربینی برای یادگیری عمیق

 

داده‌های تصویری تولیدشده توسط این حسگر، قبلاً در دوربین مرحله پیش‌پردازش (پردازش اولیه) را – در GPGA (آرایه ورودی قابل برنامه‌نویسی میدانی) – با استفاده از مشخصه‌های ویژه نظیر دبایرینگ، اصلاح رنگ یا میزان وضوح تصویر گذرانده‌اند. این تصویر پیش‌پردازش شده، از طریق واسط داده به میزبان استنتاج منتقل می‌شود. ازآنجاکه بخش زیادی از توان رایانشی برای پیش‌پردازش تصویر قبلاً توسط دوربین صورت گرفته است، ظرفیت رایانشی بیشتری در اختیار شبکه عصبی مصنوعی قرار دارد.

کتابخانه‌های نرم‌افزاری رایج برای مرجع یادگیری عمیق نظیر اوپن سی وی یا تنسورفلو و یک زیرساخت نرم‌افزاری مناسب برای کنترل دوربین، امکان نصب-و-اجرای نرم و ساده بین رایانه‌های مختلف را میسر می‌کنند.

نتیجه‌گیری نهایی در خصوص سیستم‌های مبتنی بر رایانه شخصی برای یادگیری عمیق:

 

سیستم‌های دوربینی برای یادگیری عمیق

 

4.3-سیستم‌های مبتنی بر قلاب چارچوب FPGA

مشخصه اصلی یک سیستم مبتنی بر قلاب چارچوب FPGA، عملکرد آن ازلحاظ نیرومندی، دسترس‌پذیری و عملکرد است.

 

 

به لطف استاندارد جدید CoaXPress 2.0، رابط CXP-12 می‌تواند داده‌های تصویر را با پهنای باند حداکثر 12.5 گیگابایت بر ثانیه انتقال داده و پردازش کند که تقریباً سه برابر سریع‌تر از USB 3.0 است.

رابط CXP برخلاف USB 3.0 یا GigE ، یک رابط معمولی نیست که قابلیت اتصال به یک رایانه شخصی داشته باشد. برای ثبت و پردازش اولیه یک تصویر، یک قلاب چارچوب لازم است که شامل یک FPGA بزرگ است که می‌توان شبکه عصبی مصنوعی از قبل آموزش‌دیده را بر روی آن قرار داد. برنامک‌های تصویری با ساده‌سازی اجرای شبکه‌های عصبی مصنوعی آموزش‌دیده در نرم‌افزارهای واقع بر FPGA، استفاده از یادگیری عمیق مبتنی بر قلاب چارچوب را شدیداً تسهیل می‌کنند.

نتیجه‌گیری نهایی در خصوص سیستم‌های مبتنی بر قلاب قاب برای یادگیری عمیق:

 

سیستم‌های دوربینی برای یادگیری عمیق

 

5-خلاصه

در صورت تمایل به استفاده مؤثر از بسیاری از زمینه‌های کاربردی جدید یادگیری عمیق در علوم پزشکی و زیستی، معیارهای زیر نقش مهمی در طراحی سیستم بینایی دارند:

  • سهولت یکپارچگی
  • کارایی
  • نیرومندی
  • دسترسی
  • قیمت

اگر این عوامل از همان ابتدا هنگام انتخاب یک سیستم بینایی عمیق یادگیری در نظر گرفته شوند، تبدیل یک مفهوم اثبات شده به یک محصول رقابتی با شبکه‌های عصبی مصنوعی بسیار آسان‌تر می‌شود.

 

تهیه کننده: مهندس محمد طالبی
منبع
سایر مطالب اکادمی