تدبر در قران مجید به کمک روشهای داده کاوی
- سال انتشار: 1389
- محل انتشار: چهارمین کنفرانس داده کاوی ایران
- کد COI اختصاصی: IDMC04_008
- زبان مقاله: فارسی
- تعداد مشاهده: 4379
نویسندگان
استادیار دانشکده راه اهن دانشگاه علم و صنعت
چکیده
تدبر در قران کریم همواره مورد توجه صاحبان خرد قرار داشته و دارد رشد علم و فناوری ابزارها و روشهای نوینی در خدمت انسان امروز قرار داده که حوزه قران پژوهش و تدبر قرانی نیز از ان بینصیب نبوده است چنانچه در حال حاضر ابزارهای سودمندی جهت جستجوی کلمات و عبارات قرانی در قالب نرم افزارهای قرانی توسعه داده شده است روشهای داده کاوی می تواند با استخراج بردار ویژگی ایات و سوره ها محاسبه شباهت ایات و فراوانی تکرار کلمات و ریشه ها و موقعیت مکانی آنها جستجوی موضوعی قاعده مند و بطور کلی پردازش زبان قران ابزارهای مناسبی جهت تصویر سازی و سازمان دهی متن قران مجید ارائه دهد. دراین مقاله پیکره متنی قران مجید در قالب تقریبا 8767ه9 کلمه به همراه برچسب شماره سوره، شماره ایه و ترتیب کلمه در آیه تهیه شد و با کد کردن هریک از حروف قران به یک عدد هر کلمه بصورت رشته ای با حداکثر 11 کاراکتر از اعداد درامد. با حذف موارد مشابه تعداد تقریبی کلمات به 13281 کلمه رسید. با محاسبه شباهت بین کلمات از روی فاصله همینگ، کلمات مشابه با پسوند مثل ضمائر متصل یا پیشوند ال تعریف متفاوت شناسایی شد و تعداد کلمات به 7872 رسید. سپس کلمات حرفی و ضمائر حذف شد و کلمات اسمی یا فعلی با فراوانی بیش از 200 بار تکرار شناسایی گردید و نمودار فراوانی تکرار آنها در سوره های قران مجید رسم شد و الگوی تکرار انها در سوره ها استخراج گردید.کلیدواژه ها
متن کاوی، ساختار کاوی، استخراج بردار ویژگی متن، پردازش زبان قران، تدبر در قران بکمک روشهای داده کاوی، شناسایی سازمان دهی کلمات قران مجید.اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.