خلاصه سازی اسناد کلان داده با استفاده از ویژگی های معنایی ماتریس فاکتورگیری نامنفی بر پایه پردازش موازی توزیع شده ی هادوپ

  • سال انتشار: 1396
  • محل انتشار: پنجمین کنفرانس بین المللی مهندسی برق و کامپیوتر با تاکید بر دانش بومی
  • کد COI اختصاصی: COMCONF05_695
  • زبان مقاله: فارسی
  • تعداد مشاهده: 478
دانلود فایل این مقاله

نویسندگان

امید یوسفیان هاشم آباد

گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران

عطاءالله ابطحی

استادیار گروه مدیریت، دانشکده مدیریت، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران

محمود البرزی

دانشیار گروه مدیریت ، دانشکده مدیریت، واحد علوم و تحقیقات تهران ، دانشگاه آزاد اسلامی، تهران، ایران

کاوه یوسفیان هاشم آباد

گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران

چکیده

در عصر مهبانگ داده و مهبانگ محتوا، خلاصه سازی متن امروزه به ابزار مهمی برای ارزیابی متن و تفسیر وفهم متن تبدیل شده است. و به همین دلیل، به ابزار بسیار مهمی در تصمیم سازیهای خرد و کلان فردی و اجتماعی و نیز تولید اطلاعات و دانش کاربردی و حتی تولید علم تبدیل شده ا ست. خلا صه سازی دستی متون بسیار بزرگ برای انسان کار دشواری است. روشهای سنتی خلاصه سازی اسناد محدود به سایز اسناد هستند و قادر به خلا صه سازی اسناد کلان داده بر روی ابر نیستند. این مقاله، یک متد خلا صه سازی کلان داده پی شنهاد میدهد که از ویژگیهای معنایی استخراج شده از ماتریس فاکتورگیری نامنفی با استفاده از پردازش موازی توزیع شده در هادوپ ا ستخراج شده ا ست. نتایج تجربی به دست آمده این پژوهش نشان میدهد که متد مذبور به خوبی میتواند سایز اسناد کلان داده را با استفاده از پردازش موازی توزیع شده ی هادوپ خلاصه کند و در مقایسه با متدهای خلاصه سازی تک گرهای از ضریب دقت و بازخوانی بهتری برخوردار است.

کلیدواژه ها

خلاصه سازی، کلان داده، هادوپ، ویژگیهای معنایی، ماتریس فاکتورگیری نامنفی، نگاشت کاهش

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.