درود!
موضوع جلسه سوم: تشخیص حروف کتابی به روش template matching
مقدمه
همان طور که گفته شد در روش Template Matching تعدادی template از کاراکترها یا کلمات از قبل حاضر شده است . عکس های قطعه قطعه شده با این template ها مقایسه می شود و با توجه به شباهت برنده انتخاب می شود .
مراحل کار
همان طور که می دانید زبان فارسی شامل 32 حرف اصلی می باشد که به قرار زیر می باشند.
الف، ب، پ، ت، ث، ج، چ، ح، خ، د، ذ، ر، ز، ژ، س، ش، ص، ض، ط، ظ، ع، غ، ف، ق، ک، گ، ل، م، ن، و، ه، ی
از آنجایی که قرار است این حروف از روی تصویر دیجیتال شده آنها تشخیص داده شود ابتدا تصاویری از آنها تهیه می کنیم. برای این کار ما حروف را در محیط Microsoft office word با فرمت B nazanin به طور جداگانه تایپ کرده و از هر یک با نرم افزار snagit81 (این نرم افزار در قسمت نرم افزارهای سایت موجود می باشد) تصویر تهیه و با فرمت jpg در ابعاد 320در320 در پوشه ای واحد ذخیره نمودیم.
تصاویر حروف با دو فونت bnazanin و arial با فرمت.jpg ، در ابعاد 320*320 به همراه این فایل آموزشی پیوست می باشد.
الگوریتم برنامه به این صورت می باشد که تصویر را دریافت و با تمام تصاویر موجود در پوشه مورد نظر مقایسه می کند. سپس تصویری که بیشترین شباهت را به تصویر ورودی داشت به عنوان برنده انتخاب می شود.
1.2 ملاحضات لازم جهت پیاده سازی این الگوریتم
تمامی تصاویر باید بعد از ورود به نرم افزار به باینری تبدیل شوند.
تصاویر باید بدون نویز باشند.
اندازه ی دو تصاویری که با هم مقایسه می شوند باید برابر باشند، و در صورتی که برابر نبودند باید با دستورات مربوطه به یک سایز تغییر پیدا کنند.
تشریح الگوریتم برنامه
ما ابتدا از اولین ویژگی که در فصل دوم به آن اشاره شد استفاده کردیم همان طور که در این فصل گفته شد بيشتر حروف فارسي داراي بيش از يک بخش هستند که شامل نقطه، سرکج و ... مي باشند. اين ويژگي کمک شاياني به تفکيک حروف از يکديگر مي کند، مخصوصاً براي آن دسته از حروف با بدنه اصلي مشابه که داراي بخش(هاي) اضافي متفاوت در شکل طبيعيشان هستند
بداین منظور ما حروف را به چهار بخش زیر تقسیم بندی کرده و تصاویر هر یک را در دسته مربوطه ذخیره نمودیم.
ادامه مقاله در فایل PDF
سورس متلب بعلاوه تصاویر و دیتابیس نیز ضمیمه ی فایل می باشد، کافیست فایل ها را در قسمت مشخص شده کپی کنید و سپس برنامه را مطابق دستورالعمل مقاله اجرا و نتیجه را مشاهده کنید.
شاد و پیروز باشید!