سامانه ترجمه‌ماشینی ترگمان

سامانه ترجمه‌ماشینی ترگمان

  • عنوان پروژه: ارتقای سامانه ترجمه ماشینی دوطرفه انگلیسی فارسی
  • مجری: شرکت‌های پردازش هوشمند ترگمان و ویرا افزار آدان
    • تاریخ شروع: اسفند ۱۳۸۵
    • تاریخ پایان: اسفند ۱۳۹۶
  • وضعیت: خاتمه‌یافته
  • کلمات کلیدی: ترجمه,ترجمه‌ماشینی
  • خلاصه پروژه:
    سامانه ترجمه‌ماشینی ترگمان اولین سامانه ترجمه‌ماشینی بومی مبتنی بر آمار بوده است که از سال ۱۳۸۹ در حال توسعه و سرویس‌دهی می‌باشد. در این پروژه مقرر است تا کیفیت این سامانه از طریق ترکیب سامانه با روش‌های مبتنی بر قاعده و یادگیری عمیق کیفیت ترجمه بالا رفته و در عین حال سرویس‌دهی سامانه نیز ارتقا یابد.

سامانه ترجمه‌ ماشینی دوزبانه ترگمان در سال ۱۳۹۰ به همت جمعی از پژوهشگران در آزمایشگاه پردازش زبان طبیعی و یادگیری ماشین دانشگاه صنعتی امیرکبیر تحت مدیریت جناب آقای دکتر شهرام خدیوی و با حمایت پژوهشگاه ارتباطات و فناوری اطلاعات (مرکز تحقیقات مخابرات ایران) ایجاد شد. این سامانه در ابتدا بر مبنای استفاده از ابزارهای متن‌باز موجود در حوزه ترجمه‌ماشینی آماری و توسعه الگوریتم‌ها و ابزارهای موردنیاز برای پردازش تخصصی زبان فارسی به‌عنوان یک طرح تحقیقاتی و پژوهشی مورد توسعه قرار گرفت. از دی‌ماه سال ۱۳۹۲ تا دی‌ماه ۱۳۹۴ این سامانه مورد بازنگری و بومی‌سازی قرار گرفته و موتور تورجمه‌ماشینی و تمامی ارکان سرویس‌دهی آن از نو مورد طراحی و پیاده‌سازی قرار گرفتند. موتور ترجمه بومی توسعه داده‌شده در این سامانه با معماری و طراحی مهندسی توانست در قیاس با برترین نرم‌افزارهای مشابه در این حوزه علاوه بر پایداری بسیار بالا، افزایش سرعتی معادل۲۷۰ درصد و کاهش مصرف منابع تا ۱۶ برابر را با حفظ دقت حتی در سطح جزییات،ارائه کند.

در این سامانه علاوه بر موتور ترجمه، مجمو‌عه‌ای از ابزارهای پردازش زبان اعم از پیش‌پردازش، پس‌پردازش، ریشه‌یاب کلمات، شناساگر موجودیت‌های اسمی، نویسه‌گردان و مدل زبانی نیز مورد توسعه قرار گرفته‌اند که در اغلب آنها رویکرد کلی طراحی و توسعه مستقل از زبان بوده است. ضمنا زیرساخت توسعه ترگمان به عنوان یک سکوی توسعه مستقل به نحوی مهندسی شده است که از کل یا اجزای آن بتوان در انواع پروژه‌های مرتبط یا غیرمرتبط با حوزه پردازش زبانی بهره‌برداری کرد.

از اسفندماه سال ۱۳۹۵ تاکنون و با حمایت مجدد پژوهشگاه ارتباطات و فناوری اطلاعات (مرکز تحقیقات مخابرات ایران) در قالب یکی از پروژه‌های طرح جویشگر بومی توسعه، نگهداری و ارتقای این سامانه بر عهده دو شرکت پردازش هوشمند ترگمان و ویرا افزار آدان به صورت مشارکت فنی و اجرایی می‌باشد.

در حال حاضر سامانه ترگمان از موتور ترجمه نورونی مشترک توسعه داده‌شده توسط دو شرکت پردازش هوشمند ترگمان و ویرا افزار آدان استفاده می‌کند و با استفاده از این موتور ترجمه که به صورت متن‌باز منتشر می‌شود کیفیت ترجمه‌ای بالاتر از تمامی موتورهای ترجمه موجود ارایه می‌نماید. سامانه ترگمان دارای امکانات متعددی است که از جمله انها می توان به موارد ذیل اشاره داشت:

  • امکان ترجمه خودکار متن همراه با شناسایی خودکار جهت ترجمه
  • امکان ترجمه صفحات وب به صورت پیشرفته
  • امکان ترجمه اسناد doc, docx, odt, PDF, txt به دو صورت برخط و غیربرخط
  • تلفظ کلمات و عبارات،
  • دیکشنری پیشرفته
  • خطایاب املایی

حامیان و مشارکت‌کنندگان در ترگمان

Targoman Intelligent Processing Pjc. itrc.ac.ir adans soft

ارتباط با ما

  • نشانی: تهران، خیابان کارگر شمالی، روبروی سازمان انرژی اتمی، پژوهشگاه ارتباطات و فناوری اطلاعات
  • تلفن تماس: ۸۴۹۷۷۹۵۷
  • رایانامه: parsigan@itrc.ac.ir

خبرنامه

عضویت در خبرنامه پارسیگان جهت دریافت آخرین اطلاعات و جدیدترین فایل‌ها

درباره پارسیگان

پارسیگان مجموعه‌ای غنی از دادگان، کدها و مستندات خروجی پروژه‌های اجرا شده در طرح جویشگر است که به صورت عمومی در راستای سیاست‌های پژوهشگاه ارتباطات و فناوری اطلاعات و همچنین طرح جویشگر بومی در اختیار عموم قرار گرفته است.

تمامی حقوق متعلق به طرح جویشگر بومی می‌باشد