به‌سازي و ارائه الگوريتم‌هاي جديد خطايابي املايي و دستوري زبان فارسي و پياده‌سازي نرم‌افزار مربوطه

  • پروژه: غلط‌یاب املایی وفا
  • نوع گزارش: گزارش فنی
  • کلمات کلیدی: خطاياب زبان فارسی، خطاياب نحوی، خطاياب لغوی و خطایابی معنایی
  • نویسندگان: محمد طاهر پيله‌ور، نوا احسان، مرتضی منتظری
  • خلاصه: هدف از انجام اين پروژه جمع آوري و بهينه سازي الگوريتم‌هاي تصحيح خودکار متون فارسي جهت تهيه يک سيستم تصحيح خودکار متون است. خطاهاي نوشتاري به سه دسته خطاهاي لغوي، نحوي (گرامري) و معنايي تقسيم مي‌شوند. منظور از خطاهاي لغوي آن دسته از خطاهاست که به دامنه کلمات محدود مي‌شود، و در صورتي که کلمه در لغتنامه موجود نباشد و يا بر اساس قواعد ساختواژي توجيه نشود، خطا محسوب مي‌گردد. خطا‌هاي نحوي (گرامري) نيز که در سطح جمله و ارتباط کلمات با يکديگر مطرحند، شامل خطاهايي چون عدم تطابق (مثلا بين فاعل و فعل)، عدم رعايت ترتيب بکارگيري کلمات (صفت قبل از موصوف) و بطورکلي هرگونه نوشتاري که با قواعد دستوري فارسي ناسازگار باشد. نهايتا خطاهاي معنايي به کاربرد نادرست کلمات درست مربوط مي‌شود. مثلا قيدي از اول جمله بر اساس يک خطاي لغوي به اسمي که در لغتنامه وجود دارد تبديل شود ("اکثر" به "اکبر") به اينگونه خطاها، خطاهاي real word نيز گفته مي‌شود.
نسخهتاریخ انتشارلینکدفعات دانلود
نهایی۲۵ تیر ۱۳۸۹دریافت سند۲

ارتباط با ما

  • نشانی: تهران، خیابان کارگر شمالی، روبروی سازمان انرژی اتمی، پژوهشگاه ارتباطات و فناوری اطلاعات
  • تلفن تماس: ۸۴۹۷۷۹۵۷
  • رایانامه: parsigan@itrc.ac.ir

خبرنامه

عضویت در خبرنامه پارسیگان جهت دریافت آخرین اطلاعات و جدیدترین فایل‌ها

درباره پارسیگان

پارسیگان مجموعه‌ای غنی از دادگان، کدها و مستندات خروجی پروژه‌های اجرا شده در طرح جویشگر است که به صورت عمومی در راستای سیاست‌های پژوهشگاه ارتباطات و فناوری اطلاعات و همچنین طرح جویشگر بومی در اختیار عموم قرار گرفته است.

تمامی حقوق متعلق به طرح جویشگر بومی می‌باشد