در عصر حاضر، همه چیز در هوش مصنوعی خلاصه میشود. ویژگیهای بینظیر هوش مصنوعی، محبوبیت آن را نزد مردم روزافزون کرده است. بینایی ماشین یکی از شاخههای هوش مصنوعی است که با ویژگیهای منحصر بهفرد و کاربردهای کمنظیر، جای خود را در صنایع بزرگ جهان باز کرده و معنای جدیدی به خطوط کنترل و بازرسی کیفیت بخشیدهاست. بینایی ماشین و یادگیری عمیق، به نسبت کمتر از دیگر رشتههای هوش مصنوعی شناخته شدهاند. قبلا به ابعاد مختلف بینایی ماشین و کاربردهای متعددی از آن پرداختهایم. یکی از محبوبترین و جالب توجهترین کاربردهای سیستم دیپ لرنینگ، در حوزه تشخیص کاراکترها و حروف است. در این مقاله، به کاربرد یادگیری عمیق در تشخیص اتوماتیک حروف روی صفحات فلزی میپردازیم.
یادگیری عمیق و تشخیص اتوماتیک حروف
تشخیص اتوماتیک حروف یا OCR به فرآیند تشخیص متن از منبع تصاویر و تبدیل آن به یک نسخه دیجیتال که قابل مدیریت، اصلاح و ذخیرهسازی سریع باشد، اطلاق میشود. باوجود اینکه OCR یکی از محبوبترین کاربردهای سیستمهای یادگیری عمیق است، پیچیدگی فرآیند آن غیر قابل انکار است. پیچیدگی این فرآیند بهعلت وجود دو دامنه متفاوت هوش مصنوعی است:
بینایی رایانهای (CV)
Computer Vision یا بینایی رایانهای مدلهای ML را برای مشاهده و پردازش دنیای تجسمی درست مشابه با سیستم پردازشی آموزش میدهد.
پردازش طبیعی زبان (NLP)
Natural Language Processing یا پردازش طبیعی زبان عمدتا با متن و دادههای گفتار به نوشتار (speech-to-text) سروکار دارد و تمرکز خود را بر آموزش ماشینها برای درک و پردازش گفتار انسانی میگذارد. از تشخیص شکل ظاهری حروف گرفته تا تفسیر پایانی متون، همگی درحوزه اختیارات NLP است.
چالشهای تشخیص اتوماتیک حروف روی صفحات فلزی
مشکل OCR زمانی پیچیدهتر میشود که متنهایی که باید شناسایی شوند، در محیط طبیعی قرار دارند؛ به عنوان مثال، پلاک ماشینها، تابلوهای خیابانی، لیستهای دستنویس و مواردی از این دست. کاراکترهای حروفی ممکن است در اندازه و فونت متفاوت باشند و این یک چالش اصلی در فرآیند تشخیص اتوماتیک حروف است. تشخیص حروف روی سطوح فلزی هم چالشهای خاص خود را دارد؛ تشخیص حروف روی سطوح فلزی بهعلت بازتاب زیاد نور، در شرایط نوری مختلف حتی برای نیروی انسانی هم دشوار است.
کاربرد یادگیری ماشین در حوزه تشخیص اتوماتیک حروف روی صفحات فلزی، یکی از پرطرفدارترین زوایای این شیوه مدرن کنترل کیفی خطوط تولید، همواره صنعتگران را به دنبال کردن دستگاههای یادگیری عمیق و پیادهسازی آن در پروژههای خود، ترغیب میکند. شرکت نوین ایلیا صنعت، با بهرهگیری از جدیدترین علوم رو این شیوه مدرن، موفقیتهای شگرفی در طراحی و پیادهسازی موفق پروژههای کنترل کیفی براساس یادگیری ماشین، کسب کرده است.
نحوه تشخیص اتوماتیک حروف روی صفحات فلزی (OCR)
پیش پردازش
این مرحله شامل سادهسازی، تشخیص لبههای معنیدار، و تعریف طرح کلی متن شخصیتها میشود. البته این مرحله در اکثر پردازشهای تصویری، متداول است.
تشخیص متن
این مرحله از پروژه OCR ترسیم یک کادر مشخص در اطراف متون موجود در تصویر مورد توجه قرار میگیرد. چند نمونه از تکنیکهای قدیمی مورد استفاده برای این مرحله شامل SSD، Real-Time YOLO، ردیاب EAST و مواردی از این دست میباشد. متن در تصاویر به دقت تفکیک و کادربندی میشود و آماده تشخیص دقیق حروف میشود.
شناخت متن
آخرین مرحله و مهمترین مرحله OCR تشخیص متون کادربندی شده است. برای تحقق این امر، یک و یا ترکیبی از شبکههای عصبی Convolutional با تقلید سیستم پردازش انسانی، تلاش بر تفکیک حروف و معنایابی ترکیبات حروفی حتی با دستخطهای مختلف دارند.
CNN با RNN چه تفاوتی دارد؟
CNN یکی از بهترین روشهای موجود برای بکارگیری در یادگیری عمیق OCR در مرحله تشخیص متن هستند. لایههای Convolution معمولا برای تفسیر و بررسی متن با توجه به پیچیدگی ظاهری آن استفاده میشوند. آنها تشخیص زوایا و برآمدگیهای معنادار را میسر میسازند (حتی در سطوح بالاتر) و پیچیدگی اشیاء هم مانع پیشروی فرآیند آن نمیشود.
RNN برای تشخیص رابطه بین حروف استفاده میشود. شبکههای recurrent در پردازش دنبالهها عالی هستند؛ ورودیهایی که دارای طولهای متغیر هستند، مانند تشخیص گفتار و متن بدون ساختار (به عنوان مثال تشخیص دستخط برای OCR) معمولا از سلولهای حافظه کوتاهمدت برای جلوگیری از این مشکل استفاده میشود.
شرکت نوین ایلیا صنعت، به عنوان نماینده رسمی محصولات سنسوپارت (SensoPart) و باسلر در ایران، بهترین گزینه برای مشاوره و راهنمایی درباره انواع سنسورها، سیستمهای بینایی ماشین و پردازش تصویر است. کارشناسان ما با ارائه بهترین راهحلها برای ساخت و اجرای پروژههای اتوماسیون صنعتی و بینایی ماشین و همچنین راهنمایی برای انتخاب بهترین و باکیفیتترین برندهای روز دنیا در خدمت شما هستند. مجموعه نوین ایلیا صنعت قبل از فروش به معرفی، آموزش و ارائه یک ورژن دمو از تجهیزات و نرمافزارهای مربوطه میپردازد. گارانتی، بهروزسانی نرمافزارها و کالیبراسیون از جمله خدمات پس از فروش شرکت در حوزههای مختلف اجرایی میباشد. برای اطلاعات بیشتر از خدمات ما نیز میتوانید با کارشناسان ما تماس بگیرید.