دانلود پایان نامه
عملکرد نظام بازیابی متاثر از کیفیت زبان نمایه است. وجود نمایه سازی و جستجوی خوب نمی تواند زبان نمایه نامناسب را جبران کند به عبارت دیگر کاربران اطلاعات فقط به آن اندازه می توانند عمل نمایند که زبان نمایه مجاز می شمارد. ناتواناییهای زبان نمایه بر دو نوع است: 1-عدم توانایی به خاطر ویژگی در اصطلاحات 2-عدم توانایی به خاطر ابهام یا روابط کاذب بین اصطلاحات. (لانکاستر، 1379، ص179)
عمدتا زبان ها دو نوع هستند:
زبان های مهار شده
این زبان ها، حاوی اصطلاحاتی هستند که برای نمایه سازی مدارک انتخاب و پذیرفته شده اند، فهرست ها سر عنوان های موضوعی و اصطلاحنامه ها دو شیوه متفاوت زبان نمایه سازی مهار شده است. اصطلاحنامه پس از شرح زبان های آزاد توصیف می شود.
زبان های آزاد
در این نوع زبان ها محدودیتی ازنظر نوع واژه وجود ندارد، هر واژه یا اصطلاح می تواند بدون قید و شرط از زبان طبیعی گرفته شود، یعنی عینا از زبان مدرک نقل گردد و یا متناسب با موضوع مدرک تعیین شود. ازنمایه سازی به زبان طبیعی هم می توان در ساخت واژگان موضوع الکترونیکی و هم در تولید نمایه نامه های چاپی استفاده کرد. یکی از کاربردهای نمایه سازی به زبان طبیعی تولید نمایه هایی است که مبتنی بر واژه های عنوان می باشد. مانند: نمایه کوئیک، نمایه کووک و نمایه جایگشتی.(داورپناه،1381،ص33)
ب- نرم افزارهای نمایه سازی وب
بسته به اینکه در وب مورد نظر چه اطلاعاتی را می خواهیم نمایه سازی کنیم (اطلاعات می توانند یک سند، یک تمام متن، تصاویر و … باشند) نرم افزارهای گوناگونی برای نمایه سازی وب موجود می باشد:
نرم افزارهای نمایه سازی وب
Advanced Java Tree Menu
PHP Lightning Portal (PLP)
PHP Portal Builder (PPB)
ActMon Password Recovery XP
Internet Macros Web Test Recorder
نرم افزارهای نمایه سازی لینک ها
PHP Lightning Portal (PLP)
PHP Portal Builder (PPB)
Registry First Aid
IEManager
Advanced Java Tree Menu
نقش موتورهای جستجو در نمایه سازی وب
حجم انبوه اطلاعات وب و عدم نمایه سازی جامع، متخصصان این حوزه را برآن داشته تا با مدد از فن آوری افکار، موتورهای جستجو را بکار گیرند و راهکاری مناسب جهت نمایه سازی را فراهم آورند. از سوی دیگر برخی از وب سایت ها برای اطمینان از بازیابی بیشترین رتبه بندی های مرتبط، از اصطلاحات کلیدی استفاده می کنند، این در حالی است که تعدادی دیگر از نمایه سازی کور بهره می گیرند.
مشکل اصلی این نوع نمایه سازی اضافه بازیابی است که حجم زیاد اطلاعات نامرتبط را شامل می شود، لذا جهت افزایش جامعیت و مانعیت بازیابی، موتورهای جستجو به عنوان یک راهکار مطرح شدند. (دیگان، 1382، ص 161)
موتورهای جستجو، ابر موتورها و ابر داده ها در واقع ابزارهای کمکی برای نمایه سازی و ارائه اطلاعات مرتبط با موضوع مورد جستجو در اینترنت هستند. نمایه ها اساس کار موتورهای جستجو در رتبه بندی نتایج جستجو و ترکیب منطقی واژه ها (جستجوی بولی) برای بازیابی اطلاعات در اینترنت را تشکیل می دهد. اما بزرگ ترین موتورهای جستجو هم قادر به نمایه سازی وب نیستند. برخی از این موتورها نظام نمایه سازی تمام متن دارند و هر واژه موجود درمتن به جز واژه های فاقد بار اطلاعاتی مانند حروف اضافه، ربط و تعریف را نمایه می کند. برخی بخشی از منبع را نمایه می کنند.برخی دیگر، سرعنوانها، عناوین فرعی و فراپیوندها را همراه 20 خط ابتدای متن و 100 کلمه ای که از بسامد بالایی برخوردار است، نمایه می کنند. (داورپناه،1381،ص 84)