خط و خطا: بازتاب دشواری های نگارش کلمه دربازیابی اطلاعات بانک نشریات کشور (مگ ایران)

سال انتشار: 1395
محل انتشار: اولین کنفرانس بین المللی بازیابی تعاملی اطلاعات
کد COI اختصاصی: IIIRC01_018
زبان مقاله: فارسی
تعداد مشاهده: 459

نویسندگان

دکترای علم اطلاعات و دانش شناسی، دانشگاه خوارزمی

چکیده

خط فارسی و شیوه نگارش آن از قواعد خاصی پیروی می کند. ویژگی های منحصر بفرد این خط و چالش های مربوط به آن در بازیابی اطلاعات موتورهای جستجو و بانک های اطلاعاتی همواره دغدغه پژوهشگران حوزه بازیابی اطلاعات بوده است. در مقاله حاضر به چالش های مربوط به خط فارسی در بانک اطلاعات نشریات کشور (مگ ایران) پرداخته می شود. هدف از این پژوهش شناسایی مهمترین خطاهای نگارشی در عنوان مقاله های نشریات علمی- پژوهشی علوم انسانی به منظور ارایه راهکار برای بهینه سازی بازیابی اطلاعات این مقاله ها در موتورهای جستجو است. برای انجام پژوهش حاضر از 657 عنوان مجله در 18 موضوع علوم انسانی در بانک مورد بررسی، از نمونه گیری خوشه ای استفاده شد. در هر موضوع، برای انتخاب تعداد مجله های مورد نظر (فارسی) از شیوه انتساب متناسب استفاده شد. به این ترتیب به تعداد متناسب با هر دسته موضوعی، تعداد مشخصی مجله مورد بررسی قرار گرفت. در این مجله ها تنها عنوان های آخرین شماره بررسی شد. تحلیل عنوان های انتخابی مقاله ها به شیوه کیفی و با استفاده از روش تحلیل محتوا و انتخاب کلمه به عنوان واحد تحلیل انجام گرفت. معیار بررسی صحت واحدها، فرهنگ املایی خط فارسی و دستور خط فارسی بود که به عنوان معیار استاندارد از سوی فرهنگستان زبان و ادب فارسی به انتشار رسیده است. یافته های این بررسی نشان داد پربسامدترین اشتباهای رایج در عنوان مقاله های علمی- پژوهشی حوزه های علوم انسانی به دو دسته خطاهای مربوط به فاصله گذاری نادرست میان کلمه ها و عدم استفاده از الف همزه و واو همزه مربوط هستند. از میان حوزه های مورد بررسی، بیشترین خطا به مدیریت و ادبیات و زبان ها و کمترین خطا به ادیان و عرفان و علوم قرآن و حدیث اختصاص داشت. در پزوهش حاضر نشان داده شد که این اشتباه ها بر بازیابی مقاله ها در مگ ایران تاثیر منفی دارد و نتایج جستجو را تغییر می دهد. در پایان، راهکارهایی برای افزایش اثربخشی بازیابی اطلاعات مقاله های حوزه علوم انسانی در بانک های اطلاعاتی و موتورهای جستجو بر پایه شواهد مستخرج از تحلیل خطاهای نگارشی مقاله ها در پژوهش حاضر ارایه شده است.

کلیدواژه ها

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.