شباهت سنجی لغوی در وب گاه های تخصصی فارسی به کمک سیستم نروفازی
- سال انتشار: 1395
- محل انتشار: دومین کنفرانس بین المللی وب پژوهی
- کد COI اختصاصی: IRANWEB02_051
- زبان مقاله: فارسی
- تعداد مشاهده: 1193
نویسندگان
دانشجوی دکتری مهندسی فناوری اطلاعات،دانشگاه تربیت مدرس
دانشیار مهندسی فناوری اطلاعات،دانشگاه تربیت مدرس
چکیده
تاکنون روش های مختلفی برای تشخیص شباهت دو متن ارائه شده که کارایی آنها به محتوای متن و منابع مورد استفاده برای مقایسه بین واژه های آنها محدود بوده و هیچگونه تطبیقی با داده مورد بررسی نداشته اند به طوری که نیاز به آموزش سنجه با توجه به متن مورد بررسی به خصوص در متون تخصصی فارسی احساس می گردد. در این مقاله روشی ارائه شده است که با توجه به کیفی و ناکامل بودن عوامل اثرگذار بر سنجش شباهت لغوی بین دو متن تخصصی و همچنین نیازمندی به آموزش سنجه، از استنتاج نروفازی که قابلیت یادگیری از داده آموزشی را دارد، استفاده می کند. این روش، جمله های موجود را به دو بخش عمومی و تخصصی تقسیم کرده و سپس با استفاده از سیستم استنتاج نروفازی و پس از یادگیری از طریق داده آموزش، میزان شباهت بین جمله ها را در دو بخش محاسبه و سپس با هم ترکیب کرده و در نهایت شباهت بین دو جمله ارزیابی می شود. روش مذکور بر روی بخش آزمون پیکره مقاله های حوزه یادگیری الکترونیکی (پیکره همیافت) مورد ارزیابی قرار گرفته که با دقت بیش از 82% امکان شناسایی زوج جمله ها مشابه را داراست.کلیدواژه ها
شباهت سنجی لغوی، روش نروفازی، سنجه شباهت سنجی یادگیر، متون تخصصی فارسی، پیکره همیافت، انفیسمقالات مرتبط جدید
- طبقه بندی صفحات وب برای بهینه سازی موتورهای جستجو با استفاده از مدل ترکیبی یادگیری عمیق
- تحول دیجیتال با قراردادهای هوشمند بر پایه فناوری بلاکچین
- تحلیل و شناسایی آسیبپذیریهای ناش ی از حملات شرایط رقابتی در برنامه های وب مدرن
- مروری بر الگوریتم بهینه سازی ازدحام ذرات و کاربردها
- بهینه سازی زمانبندی و ذخیره سازی نتایج وظایف در محیطهای مه-ابر با یادگیری تقویتی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.