درخت‌بانک سازه

درخت‌بانک سازه

  • عنوان پروژه: توليد بانک درختی سازه­اي فارسی به همراه نرم­افزار تجزيه­گر نحوي زبان فارسی
  • مجری: پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی
    • تاریخ شروع: مهر ۱۳۹۵
    • تاریخ پایان: مهر ۱۳۹۶
  • وضعیت: خاتمه‌یافته
  • کلمات کلیدی: درخت­بانک، پیکره درختی، تجزیه­گر آماری
  • خلاصه پروژه:
    در این گزارش مجموعه فعالیتهای انجام شده در پروژه تولید بانک درختی سازه ای در زبان فارسی به همراه تولید تجزیه­گر ارائه شده است. تعداد کل کلمات برچسب خورده در این پروژه برابر با 500 هزار کلمه بوده است. جملات این درخت­بانک از پیکره متنی زبان فارسی که دارای برچسب­های مقوله دستوری است انتخاب شده است و به روش نیمه­خودکار برچسب­دهی شده است. همچنین یک تجزیه­گر آماری بر روی این درخت­بانک آموزش داده شده است که در حالت ورودی با برچسب­های طلایی دقتی بیش از 80 درصد دارد. همچنین برای سهولت کار با این تجزیه­گر یک جعبه­ابزار پیش­پردازش نیز به همراه این درخت­بانک ارائه­شده است که عملیات واژه­بندی و برچسب­گذاری مقوله دستوری را بر روی جمله ورودی انجام می­دهد.
تولید یک پیکره بزرگ از جملات دارای نمودار درختی و آموزش یک تجزیه­گر بر روی این داده

ارتباط با ما

  • نشانی: تهران، خیابان کارگر شمالی، روبروی سازمان انرژی اتمی، پژوهشگاه ارتباطات و فناوری اطلاعات
  • تلفن تماس: ۸۴۹۷۷۹۵۷
  • رایانامه: parsigan@itrc.ac.ir

خبرنامه

عضویت در خبرنامه پارسیگان جهت دریافت آخرین اطلاعات و جدیدترین فایل‌ها

درباره پارسیگان

پارسیگان مجموعه‌ای غنی از دادگان، کدها و مستندات خروجی پروژه‌های اجرا شده در طرح جویشگر است که به صورت عمومی در راستای سیاست‌های پژوهشگاه ارتباطات و فناوری اطلاعات و همچنین طرح جویشگر بومی در اختیار عموم قرار گرفته است.

تمامی حقوق متعلق به طرح جویشگر بومی می‌باشد