پياده سازي موتور جستجوي فارسي با پوشش پانصد ميليون صفحه وب (خريد سرويس جستجو)

  • پروژه: توسعه جویشگر متنی پارسی جو
  • نوع گزارش: گزارش فنی
  • کلمات کلیدی: موتور جستجو ، خزشگر، نمايه‌سازي
  • نویسندگان: علي محمد زارع بيدكي، سجاد ظريف‌زاده، فاطمه کاوه يزدي
  • خلاصه: هدف از اين پروژه ارائه سرويس جستجوي فارسي با پوشش يک ميليارد صفحه و دو ميليون بازديد مي­باشد. با تلاش­هاي انجام گرفته توسط گروه پارسي­جو پوشش صفحات بيش از يک ميليارد و سيصد ميليون صفحه و آمار بازيد روزانه بيش از 670 هزار مي‌باشد. از اعم بخش هاي سيستم مي­توان خزشگر كارا با قدرت خزش دو ميليارد صفحه، سيستم پردازش توزيع شده با قدرت پردازش ميلياردها داده، بخش پردازش هوشمند پرس‌وجو و رتبه بندي اشاره نمود. همچنين بخش پردازش لاگ و مانيتورينگ پارسي جو كه در آن تمام بخش هاي سيستم لحظه به لحظه مونيتور مي­گردند. همچنين سامانه داراي جستجوي سفارشي براي وب سايت‌ها مي‌باشد. از کارهاي مهم انجام شده بهينه سازي بخش هاي مختلف سامانه مانند نمايه سازي و پردازش پرس‌وجو براي افزايش دقت و سرعت مي‌باشد. همچنين در بخش خزش مکانيزم اولويت‌بندي نوع صفحات اضافه گرديده است و خزشگر سايت‌هاي مهم از بقيه جدا گرديده است. بعلاوه دقت سامانه براي پرس‌وجوهاي اطلاعاتي با محوريت گوگل اندازه‌گيري شده است.
نسخهتاریخ انتشارلینکدفعات دانلود
۱۲۵ تیر ۱۳۹۵دریافت سند۲

ارتباط با ما

  • نشانی: تهران، خیابان کارگر شمالی، روبروی سازمان انرژی اتمی، پژوهشگاه ارتباطات و فناوری اطلاعات
  • تلفن تماس: ۸۴۹۷۷۹۵۷
  • رایانامه: parsigan@itrc.ac.ir

خبرنامه

عضویت در خبرنامه پارسیگان جهت دریافت آخرین اطلاعات و جدیدترین فایل‌ها

درباره پارسیگان

پارسیگان مجموعه‌ای غنی از دادگان، کدها و مستندات خروجی پروژه‌های اجرا شده در طرح جویشگر است که به صورت عمومی در راستای سیاست‌های پژوهشگاه ارتباطات و فناوری اطلاعات و همچنین طرح جویشگر بومی در اختیار عموم قرار گرفته است.

تمامی حقوق متعلق به طرح جویشگر بومی می‌باشد