موتور جستجوی یوز

موتور جستجوی یوز

  • عنوان پروژه: توسعه جويشگر متني
    • تاریخ شروع: مرداد ۱۳۹۵
    • تاریخ پایان: بهمن ۱۳۹۵
  • وضعیت: خاتمه‌یافته
  • کلمات کلیدی: جويشگر، جستجوي وب، رتبه‌بندي، خزشگر، شاخص‌گذار
  • خلاصه پروژه:
    امروزه فضاي مجازي جزء جدايي ناپذير زندگي انسان محسوب مي‌شود. بسياري از فعاليت‌هاي روزانه افراد از طريق ابزارها يا داده‌هاي موجود در فضاي مجازي انجام مي‌گيرد. از طرفي با توجه به حجم و تنوع اطلاعات و سرويس‌هاي موجود در فضاي مجازي، كاربران براي يافتن موارد مدنظر خود ناگزيرند از جستجوگرها استفاده نمايند. آمارها نشان مي‌دهند كه بيش از 80% كاربران وب، اطلاعات، سرويس‌ها و سايت‌هاي موردنياز خود را از طريق موتورهاي جستجو شناسايي مي‌كنند. وجود سه موتور جستجو (گوگل، بايدو و ياهو) درميان 5 سايت پر بازديد دنيا، اقبال كاربران به اين ابزار را به خوبي نشان مي‌دهد. موتورهاي جستجو، قادر هستند به سادگي رفتار كاربران در فضاي مجازي را كنترل كرده و جهت‌دهي نمايند. در اين ميان، جستجوهاي متني، بيشترين سهم جستجوهاي كاربران را به خود اختصاص داده‌اند. لذا بهره‌مندي از يك موتور جستجوي متني كه نيازهاي كاربران را در فضاي وب پوشش دهد، براي مسئولين هر جامعه يك نياز ضروري محسوب مي‌شود. چراكه مي‌توانند با استفاده از آن، علاوه‌بر مديريت رفتار و افكار كاربران خود در فضاي مجازي، از درز اطلاعات آن‌ها نيز جلوگيري نمايند. علاوه‌بر اين، درصورت ارائه سرويس با كيفيت، موتورهاي جستجو، بستر مناسبي براي كسب‌وكار تبليغات در فضاي وب و كسب درآمد نيز محسوب مي‌شوند.

موتورهاي جستجوگر ازجمله محبوب‌ترين و پُرمراجعه‌ترين سرويس‌هاي وب و فضاي مجازي مي‌باشند. در دنياي امروز، اين سامانه‌ها به نوعي هدايت‌گر كاربران به سايت‌هاي مختلف نيز محسوب مي‌شوند و مي‌توان گفت بيشتر ترافيك سايت‌ها از طريق موتورهاي جستجوگر به آن‌ها هدايت شده است. همچنين اين سامانه‌ها براي ارائه خدمات با كيفيت به كاربران نياز به رصد دائمي داده‌هاي وب و واكشي و نگهداري آن‌ها دارند، تا جايي كه امروزه جويشگرهاي مطرح دنيا قادرند تا تغييرات محتوايي سايت‌ها يا صفحات ايجاد شده در وب را در كمتر از ساعت شناسايي نمايند.

حجم اطلاعات و داده‌هاي موجود در اين سامانه‌ها و نيز ميزان مراجعه كاربران فضاي مجازي به آن‌ها، موجب شده تا اين سامانه‌ها از جنبه‌هاي مختلف مورد توجه نهادهاي حاكميتي، دولت‌ها، مراكز اقتصادي و حتي گروه‌هاي علمي و تخصصي قرار گيرند. امروزه بسياري از كشورها براي كنترل فعاليت‌هاي كاربران فضاي مجازي و نيز ايجاد قابليت اعمال حاكميت، دست به توليد موتورهاي جستجوي بومي زده‌اند و اين محصولات را تا تسخير سهم غالب بازارهاي بومي حمايت مي‌كنند. در ايران نيز اقداماتي در راستاي توليد و عملياتي سازي موتورهاي جستجوي وب انجام شده‌است. پروژه موتور جستجوي يوز يكي از نتايج اين اقدامات مي‌باشد. توسعه يوز از سال 88 با مطالعات امكان‌سنجي آغاز و براي اولين‌بار در سال 91 آماده بهره‌برداري شد و به‌وسيله وزير وقت ارتباطات افتتاح گرديد. سپس با پيشرفت‌ها و بهبودهايي، نسخه ديگر آن در سال 93 توسط وزير محترم ارتباطات رونمايي شد. اكنون نيز پس از پايان فاز اول قرارداد توسعه جويشگر متني، جويشگر يوز با پيشرفت‌هايي در حوزه‌هاي كيفيت رتبه‌بندي نتايج، سرعت و ظرفيت پاسخ‌گويي، پوشش وب موردنياز كاربران ايراني و اصلاحاتي در حوزه برندينگ و تجربه كاربري، آماده خدمت رساني به كاربران مي‌باشد. لازم به ذكر است كه در فصل سوم اين گزارش، در حين شرح اقدامات انجام‌شده در هريك از شاخص‌هاي قرارداد، ميزان بهبود و پيشرفت پروژه قبل و بعد از فاز اول با جزييات بيشتر آمده است. اما به‌طور كلي مي‌توان نتايج حاصل از اجراي فاز اول قرارداد را به شرح زير عنوان نمود:

  • بهبود كيفيت رتبه‌بندي نتايج از حدود 70% nDCG نسبت به گوگل به 85% براساس ارزيابي با پرسمان‌هاي داخلي و از حدود 55% به 65% براساس ارزيابي‌هاي مركز تحقيقات.
  • افزايش ميانگين سرعت پاسخ‌گويي از حدود 450 ميلي‌ثانيه به 211 ميلي‌ثانيه، بدون حساب تكرار در سخت‌افزار
  • افزايش ظرفيت پاسخ‌گويي كاربران همزمان از 3 كاربر به حدود 30 كاربر همزمان
  • اصلاح واسط كاربري وب روميزي و موبايل براساس طرح برندينگ و هويت بصري يوز
  • بهبود فرايند پوشش و به‌روزرساني گراف وب (افزايش تعداد سايت‌ها و آدرس‌ها و بهبود الگوريتم كشف صفحات جديد و ...)
  • ارائه خدمت جستجوي بومي‌شده به‌صورت سكو (كه قبل از فاز وجود نداشت)

اصلي‌ترين سرويس اين پروژه، جستجوي متني در فضاي وب موردنياز كاربران ايراني است. اما در كنار اين سرويس، سرويس‌هاي ديگري مانند تازه‌هاي خبري، رصد وبلاگ‌ها، خبرهاي ورزشي، ترجمه، تصاوير و تازه‌هاي روز و ... نيز توسط سامانه يوز به كاربران ارائه مي‌شود. در سرويس جستجو، سامانه قادر است تا در محدوده بيش از 5 ميليارد صفحه وب به بيش از 30 كاربر هم‌زمان پاسخ‌گو باشد. در سرويس خبرها، بيش از 500 سايت خبري در قالب دو سرويس خبري و ورزشي در دقيقه رصد شده و مهم‌ترين و داغ‌ترين اخبار آن‌ها به اطلاع كاربران مي‌رسد. همچنين در سرويس بلاگ، 12 سرويس دهنده محبوب وبلاگ فارسي و بيش از 2 ميليون بلاگ درحال رصد لحظه‌اي هستند كه داغ‌ترين و پربازديدترين مطالب آن‌ها با كم‌ترين ميزان تاخير در اختيار كاربران قرار مي‌گيرد.


ارتباط با ما

  • نشانی: تهران، خیابان کارگر شمالی، روبروی سازمان انرژی اتمی، پژوهشگاه ارتباطات و فناوری اطلاعات
  • تلفن تماس: ۸۴۹۷۷۹۵۷
  • رایانامه: parsigan@itrc.ac.ir

خبرنامه

عضویت در خبرنامه پارسیگان جهت دریافت آخرین اطلاعات و جدیدترین فایل‌ها

درباره پارسیگان

پارسیگان مجموعه‌ای غنی از دادگان، کدها و مستندات خروجی پروژه‌های اجرا شده در طرح جویشگر است که به صورت عمومی در راستای سیاست‌های پژوهشگاه ارتباطات و فناوری اطلاعات و همچنین طرح جویشگر بومی در اختیار عموم قرار گرفته است.

تمامی حقوق متعلق به طرح جویشگر بومی می‌باشد