درخت‌بانک درسا

  • پروژه: درخت‌بانک درسا
  • نوع گزارش: گزارش فنی
  • کلمات کلیدی: تجزیه‌گر سازه‌ای، بانک‌درخت سازه‌ای، پردازش زبان طبیعی، زبان فارسی، بانک‌درخت وابستگی
  • نویسندگان: محمد حسین دهقان، هشام فیلی، محمد ملاعباسی
  • خلاصه: در این گزارش مجموعه فعالیتهای انجام شده در پروژه تولید بانک درختی سازه ای در زبان فارسی به همراه تولید تجزیه­گر ارائه شده است. تعداد کل کلمات برچسب خورده در این پروژه برابر با 500 هزار کلمه بوده است. جملات این درخت­بانک از پیکره متنی زبان فارسی که دارای برچسب­های مقوله دستوری است انتخاب شده است و به روش نیمه­خودکار برچسب­دهی شده است. همچنین یک تجزیه­گر آماری بر روی این درخت­بانک آموزش داده شده است که در حالت ورودی با برچسب­های طلایی دقتی بیش از 80 درصد دارد. همچنین برای سهولت کار با این تجزیه­گر یک جعبه­ابزار پیش­پردازش نیز به همراه این درخت­بانک ارائه­شده است که عملیات واژه­بندی و برچسب­گذاری مقوله دستوری را بر روی جمله ورودی انجام می­دهد.
نسخهتاریخ انتشارلینکدفعات دانلود
۱۷ آذر ۱۳۹۶دریافت سند۸

ارتباط با ما

  • نشانی: تهران، خیابان کارگر شمالی، روبروی سازمان انرژی اتمی، پژوهشگاه ارتباطات و فناوری اطلاعات
  • تلفن تماس: ۸۴۹۷۷۹۵۷
  • رایانامه: parsigan@itrc.ac.ir

خبرنامه

عضویت در خبرنامه پارسیگان جهت دریافت آخرین اطلاعات و جدیدترین فایل‌ها

درباره پارسیگان

پارسیگان مجموعه‌ای غنی از دادگان، کدها و مستندات خروجی پروژه‌های اجرا شده در طرح جویشگر است که به صورت عمومی در راستای سیاست‌های پژوهشگاه ارتباطات و فناوری اطلاعات و همچنین طرح جویشگر بومی در اختیار عموم قرار گرفته است.

تمامی حقوق متعلق به طرح جویشگر بومی می‌باشد