درخت‌بانک درسا

درخت‌بانک درسا

  • عنوان پروژه: تولید بانک درخت سازه‌ای فارسی به همراه نرم‌افزار تجزیه‌گر نحوی زبان فارسی
  • مجری: پردیس دانشکده‌های فنی دانشگاه تهران
    • تاریخ شروع: مهر ۱۳۹۵
    • تاریخ پایان: مهر ۱۳۹۶
  • وضعیت: خاتمه‌یافته
  • کلمات کلیدی: درخت‌بانک سازه‌ای، زبان فارسی، تجزیه‌گر، تجزیه نحوی سازه‌ای
  • خلاصه پروژه:
    ابزارهای فراوانی در زمینه پردازش زبان طبیعی نیازمند درخت‌بانک به عنوان داده آموزش هستند. دو نمونه از مشهورترین آن‌ها، موتورهای جستجو و ترجمه ماشینی است. درک نقش نحوی و رابطه بین کلمات هر جمله کمک کننده در نتایج خروجی است. وجود تجزيه‌گرِ تجزیه‌نحوی سازه‌ای مناسب، که بتواند سازه‌هاي نحوی یک متن ورودي فارسي را با دقت مناسب تشخیص دهد، مي‌تواند در این امر بسيار موثر باشد. به عنوان مثال در موتورهای جستجو می‌توان با در نظر گرفتن ضریب اهمیت برای کلمات با نقش موثرتر، نتایج بهتری به دست آورد. در ترجمه ماشینی نیز با به دست آوردن رابطه کلمات می‌توان کیفیت ترجمه را بهبود داد. هدف اصلي از این پروژه، تهیه يک تجزيه‌گر سازه‌ای زبان فارسي مبتني بر پيکره سازه‌ای در زبان فارسي است. براي اين منظور تهيه درخت‌بانک تجزیه نحوی سازه‌ای مهم‌ترين مرحله اين پروژه به شمار مي‌آيد. به عبارت دیگر، خروجی‌هاي این طرح را مي‌توان به دو بخش اصلي نرم‌افزار و دادگان تقسيم کرد، که اين دادگان می‌تواند به عنوان داده اولیه برای آموزش تجزیه‌گر آماری به کار برده شود.

ارتباط با ما

  • نشانی: تهران، خیابان کارگر شمالی، روبروی سازمان انرژی اتمی، پژوهشگاه ارتباطات و فناوری اطلاعات
  • تلفن تماس: ۸۴۹۷۷۹۵۷
  • رایانامه: parsigan@itrc.ac.ir

خبرنامه

عضویت در خبرنامه پارسیگان جهت دریافت آخرین اطلاعات و جدیدترین فایل‌ها

درباره پارسیگان

پارسیگان مجموعه‌ای غنی از دادگان، کدها و مستندات خروجی پروژه‌های اجرا شده در طرح جویشگر است که به صورت عمومی در راستای سیاست‌های پژوهشگاه ارتباطات و فناوری اطلاعات و همچنین طرح جویشگر بومی در اختیار عموم قرار گرفته است.

تمامی حقوق متعلق به طرح جویشگر بومی می‌باشد