صفحه اصلي > آموزشی, علمی > بازشناسی کلمات دست نویس فارسی

بازشناسی کلمات دست نویس فارسی


17 مرداد 1392. نويسنده: rana

در اﻳﻦ ﺗﺤﻘﻴﻖ ﺷﻴﻮهاي از ﺗﺸﺨﻴﺺ اﻟﮕﻮي دﺳﺖ ﻧﻮﻳﺲ ﻓﺎرﺳﻲ ﺑﻪ روش ﺑﺮﺧﻂ ﻣﻌﺮﻓﻲ ﺷﺪه اﺳﺖ ﻛﻪ در آن واﺣﺪﻫﺎي ﺗﺸﺨﻴﺼﻲ ﺣﺮوف ﻣﺠﺰاي ﻓﺎرﺳﻲ ﻫﺴﺘﻨﺪ. در اداﻣﻪ ﻋﻤﻠﻜﺮد ﺳﻴﺴﺘﻢ در ﻗﺎﻟﺐ دو ﻓﺎز اﺻﻠﻲ آﻣﻮزش و ﺗﺸﺨﻴﺺ ﺗﻮﺿﻴﺢ داده ﺷﺪه اﺳﺖ.

ﻓﺎز آﻣﻮزش، ﺷﻴﻮه اﺟﺮا در اﻳﻦ ﻓﺎز ﺑﺪﻳﻦ ﺻﻮرت اﺳﺖ ﻛﻪ اﺑﺘﺪا ﺣﺮوف ﺑﺮ اﺳﺎس ﺷﻜﻞ ﺑﺪﻧﻪ اﺻﻠﻲ آﻧﻬﺎ ﺑﻪ ﭼﻨﺪ دﺳﺘﻪ ﻣﺨﺘﻠﻒ ﺗﻘﺴﻴﻢﺑﻨﺪي ﻣﻲﺷﻮد ﺑﻪ ﻋﻨﻮان ﻧﻤﻮﻧﻪ ﺣﺮوف «ب»، «پ»، «ت» و «ث» ﺑﻪ ﺧﺎﻃﺮ ﻳﻜﺴﺎﻧﻲ ﺑﺪﻧﻪ اﺻﻠﻲ در ﻳﻚ دﺳﺘﻪ ﻗﺮار ﻣﻲﮔﻴﺮﻧﺪ، ﺳﭙﺲ ﻫﺮ ﻳﻚ از اﻳﻦ دﺳﺘﻪﻫﺎ ﺑﺎ اﺳﺘﻔﺎده از روش ﻣﺪل ﻣﺨﻔﻲ ﻣﺎرﻛﻮف و ﻳﻚ ﻣﺠﻤﻮﻋﻪاز ﻧﻤﻮﻧﻪﻫﺎ آﻣﺎده ﺷﺪه، ﺑﻪ ﺳﻴﺴﺘﻢ آﻣﻮزش داده ﻣﻲﺷﻮد و ﺳﻴﺴﺘﻢ ﭘﺎراﻣﺘﺮﻫﺎي ﻻزم ﺑﺮاي ﻣﺪلﺳﺎزي ﻫﺮﻳﻚ از اﻳﻦ دﺳﺘﻪﻫﺎ راذﺧﻴﺮه ﻣﻲﻛﻨﺪ.

در ﻓﺎز ﺗﺸﺨﻴﺺ اﺑﺘﺪا ﺑﺪﻧﻪ اﺻﻠﻲ داده ورودي ﺑﻪ ﻫﺮ ﻳﻚ از اﻳﻦ ﻣﺪلﻫﺎ داده ﻣﻲﺷﻮد ﺗﺎ ﻣﺸﺨﺺ ﺷﻮد ﺑﻴﺸﺘﺮﻳﻦ ﺗﻄﺎﺑﻖ ﺑﺎﻛﺪام دﺳﺘﻪ ﺑﺮﻗﺮار اﺳﺖ، ﺳﭙﺲ ﺑﺎ اﺳﺘﻔﺎده از ﺳﺎﻳﺮ ﻗﺴﻤﺖﻫﺎي ﺣﺮوف (رﻳﺰﺣﺮﻛﺎت) ﻣﺜﻞ ﻧﻘﻄﻪﻫﺎ، ﺳﺮﻛﺶﻫﺎ و ... در ﻗﺎﻟﺐ ﻳﻚ درﺧﺖ ﺗﺼﻤﻴﻢ دﻗﻴﻘﺎ ﻣﺸﺨﺺﻣﻲﺷﻮد ﻛﻪ ﺣﺮف ﻣﻮردﻧﻈﺮ ﻛﺪام ﻋﻀﻮ از اﻋﻀﺎيآن دﺳﺘﻪ ﻣﻲﺑﺎﺷﺪ.

ﻧﺘﺎﻳﺞ اﻳﻦ ﭘﮋوﻫﺶ ﺑﺮ اﺳﺎس ﻳﻚ دادهﻫﺎي ﭘﺎﻳﮕﺎه ﺑﺎ ﻋﻨﻮان Online-TMU    ﻧﺸﺎن ﻣﻲدﻫﺪ ﺗﺸﺨﻴﺺ ﺑﺪﻧﻪ اﺻﻠﻲ ﺑﺮ اﺳﺎس اﻳﻦ دﺳﺘﻪ ﺑﻨﺪي ﺗﺎ 93 درﺻﺪ درﺳﺖ ﺻﻮرت ﻣﻲﮔﻴﺮد. اﻣﺎ اﻳﻦ ﺗﺸﺨﻴﺺ ﺑﺮاي رﻳﺰ ﺣﺮﻛﺎت ﺑﻪ 80 درﺻﺪ ﻛﺎﻫﺶ ﻳﺎﻓﺘﻪ و ﻋﻠﺖ آن ﻧﻴﺰ ﻋﺪم اﻧﺤﺼﺎر در ﺷﻜﻞ آﻧﻬﺎﺳﺖ، از اﻳﻦ رو ﺑﺮاي ﺗﺸﺨﻴﺺ ﺣﺮوف ﻳﻚ ﮔﺮوه از ﻳﻜﺪﻳﮕﺮ، اوﻟﻮﻳﺖ در ﻣﺤﻞ رﻳﺰ ﺣﺮﻛﺎت و ﺗﻌﺪاد آﻧﻬﺎﺳﺖ و ﻧﻪﺗﺸﺨﻴﺺ ﺷﻜﻞ آﻧﻬﺎ. ﺑﻪ ﻋﻨﻮان ﻧﻤﻮﻧﻪ ﺑﺮاي ﺗﺸﺨﻴﺺ «ك» و «گ» از ﻳﻜﺪﻳﮕﺮ ﺗﻨﻬﺎ ﺗﻌﺪاد ﺣﺮﻛﺎت ﻗﻠﻢ ﻛﻪ در «ك» 2 و در «گ» 3 اﺳﺖ ﻣﻌﻴﺎر ﻗﺮار ﮔﺮﻓﺘﻪ.

 

بازشناسی کلمات دست نویس فارسی

 

 

ocr-www.iseee.ir.pdf [2.43 مگابایت] ( تعداد دانلود: 822)


بازگشت