در پردازش زبان طبیعی، ساده سازی متن عملیاتی است که با انجام تغییراتی در کلمات و ساختار زبانی، متن ورودی که از لحاظ خوانایی و فهم پذیری دشوار است، به متنی ساده با خوانایی بالا تبدیل می شود. متون فقهی فارسی و عربیعمدتا پیچیده هستند. لذا ابزارهای پردازش زبان روی این نوع از متون کارایی چندانی ندارند. برای رفع این مشکلنیاز به الگوریتم های ساده سازی متن داریم. اکثر الگوریتم های موجود در مرزهای دانش در زبان انگلیسی به صورت باناظر آموزش م یبینند. یکی از مشکلات عمده در آ نها فراهم کردن مجموعه دادگان طلایی است که تهیه آن زما نگیرو هزین هبر است. در حال حاضر چنین دادگانی برای زبان فارسی و عربی موجود نیست،
محل انتشار: نخستین همایش ملی هوش مصنوعی و علوم اسلامی
سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 311
نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IISC01_008
تاریخ نمایه سازی: 22 آذر 1400
چکیده مقاله:
تا کنون حجم بالایی از متون در شاخه های مختلف علم تولید شده و هر روز نیز به حجم آن افزودهمی شود بنابراین یافتن متون مرتبط و احیانا مشابه برای درک بهتر پیکره امری ضروری است. کشفاین ارتباط، در بعضی مواقع باعث شگفتی می گردد. برای استخراج ارتباط بین متن ها باید از ساختارهستی شناسانه متن اطلاع کافی داشت. از این رو موجودی تها کلید درک مفهوم متون هستند. بااستخراج موجودیت ها از پیکره و استخراج ارتباط میان آن ها می توان به ساختار هستی شناسانه هر متندست یافت. پایگاه های دانش همانند گراف دانش، شامل مخزن عظیمی از موجودیت ها، ارتباط بینآن ها و برچس بهای معنایی مناسب هستند که می توانند جهت استخراج موجودیت ها و روابط آن ها درپیکره متنی مورداستفاده قرار گیرند. سپس با بکارگیری این دانش و همچنین اطلاعات استخراج شدهاز پیکره برای هر متن زیرگرافی از موجودیت های مرتبط تشکیل می دهیم. حال برای کشف میزانارتباط بین دو متن ارتباط بین دو زیرگراف موجودیت آ نها را محاسبه می نماییم. برای محاسبه میزانمشابهت دو زیرگراف، ابتدا با اعمال الگوریتم قد مزنی تصادفی ارتباط زیرگراف را با موجودیت هایگراف دانش اصلی محاسبه و یک فضای برداری ذخیره می کنیم. میزان ارتباط بین دو زیرگراف ازمحاسبه زاویه بین این دو بردار به دست خواهد آمد.
نویسندگان
سیدمهدی حسنی
کارشناسی ارشد نرم افزار
بهروز مینایی بیدگلی
دانشیار، (دانشگاه علم وصنعت ایران) دکتری هوش مصنوعی
سیدمحمدباقر سجادی
دکتری کامپیوتر