گزارش فاز دوم پروژه تشخیص‌دهنده موجودیت‌های اسمی

  • پروژه: تشخیص موجودیت‌های اسمی در زبان فارسی
  • نوع گزارش: گزارش فنی
  • خلاصه: در این گزارش شرح فعالیت‌های فاز دوم پروژه «ابزارهای پردازش زبان فارسی (پژوهش و تحقیق در ابزارهای تشخیص‌دهنده موجودیت اسمی در زبان طبیعی و ارائه یک نمونه آزمایشگاهی برای زبان فارسی)» ارايه می‌شود. بخش عمده برچسب‌زنی مجموعه داده در این فاز انجام می‌شود. جهت بررسی کیفیت برچسب‌زنی حدود دو هزار جمله از مجموعه داده مجددا توسط یک برچسب‌زن برچسب‌زنی می‌شود. همچنین تکمیل مطالعات روش‌های برچسب‌زنی موجودیت‌های اسمی با در نظر گرفتن چالش‌های خاص زبان فارسی در این فاز انجام می‌شود. در فاز قبل یک برچسب‌زن موجودیت اسمی قانون‌محور تحویل گردید که بر اساس فهرست موجودیت‌ها و مجموعه‌ای از عبارات منظم بر روی رشته‌ها و توکن‌ها عمل می‌کرد. در این فاز برچسب موجودیت اسمی به یک مدل آماری اولیه نیز تجهیز می‌گردد و نتایج حاصل از کارایی آن ارائه می‌گردد.
در حال بارگزاری نسخه‌های قابل دانلود می‌باشد.

ارتباط با ما

  • نشانی: تهران، خیابان کارگر شمالی، روبروی سازمان انرژی اتمی، پژوهشگاه ارتباطات و فناوری اطلاعات
  • تلفن تماس: ۸۴۹۷۷۹۵۷
  • رایانامه: parsigan@itrc.ac.ir

خبرنامه

عضویت در خبرنامه پارسیگان جهت دریافت آخرین اطلاعات و جدیدترین فایل‌ها

درباره پارسیگان

پارسیگان مجموعه‌ای غنی از دادگان، کدها و مستندات خروجی پروژه‌های اجرا شده در طرح جویشگر است که به صورت عمومی در راستای سیاست‌های پژوهشگاه ارتباطات و فناوری اطلاعات و همچنین طرح جویشگر بومی در اختیار عموم قرار گرفته است.

تمامی حقوق متعلق به طرح جویشگر بومی می‌باشد