رها حسن آبادی

بررسی کاربرد هوش مصنوعی مبتنی بر پردازش زبان طبیعی در تولید خودکار توضیحات محصول در تجارت الکترونیک: ارائه یک چارچوب مفهومی

29 اردیبهشت 1405 - خواندن 11 دقیقه - 150 بازدید

چکیده

معرفی مسئله: با توسعه روزافزون تجارت الکترونیک، نیاز به تولید محتوای متنی دقیق، جذاب و بهینه شده برای موتورهای جستجو (SEO) به شدت افزایش یافته است. تولید دستی توضیحات برای هزاران محصول، فرآیندی زمان بر، پرهزینه و مستعد خطای انسانی است.

هدف تحقیق: این پژوهش با هدف بررسی کاربرد مدل های زبانی بزرگ (LLMs) در تولید خودکار توضیحات محصول و ارائه یک چارچوب نظام مند برای یکپارچه سازی این فناوری در پلتفرم های فروشگاهی انجام شده است.

روش تحقیق: این پژوهش از نظر هدف، کاربردی و از نظر ماهیت، توصیفی-تحلیلی است. داده ها از طریق مطالعات کتابخانه ای و بررسی مقالات معتبر در حوزه پردازش زبان طبیعی (NLP) گردآوری شده است. همچنین برای ارزیابی کیفیت متون، از معیارهای ریاضی ارزیابی متن مانند BLEUBLEUBLEU و ROUGEROUGEROUGE در قالب یک چارچوب پیشنهادی مبتنی بر «انسان در حلقه» (Human-in-the-Loop) استفاده شده است.

نتایج کلی: یافته ها نشان می دهد که استفاده از هوش مصنوعی می تواند زمان تولید محتوا را تا ۸۰ درصد کاهش دهد. با این حال، به دلیل پدیده «توهم هوش مصنوعی» (AI Hallucination) و احتمال درج اطلاعات فنی نادرست، مدل پیشنهادی این پژوهش تاکید می کند که ترکیب تولید خودکار با نظارت انسانی، بهترین رویکرد برای حفظ دقت علمی و لحن برند است.

کلیدواژه ها: هوش مصنوعی، پردازش زبان طبیعی، تجارت الکترونیک، تولید خودکار متن، توضیحات محصول، مدل های زبانی بزرگ.

۱. مقدمه

اهمیت موضوع:

در عصر دیجیتال، توضیحات محصول به عنوان پل ارتباطی اصلی میان فروشنده و خریدار عمل می کند. کیفیت این متون نه تنها بر تصمیم گیری مصرف کننده تاثیر مستقیم دارد، بلکه عامل تعیین کننده ای در رتبه بندی صفحات وب در موتورهای جستجو بر اساس الگوریتم های TF−IDFTF-IDFTF−IDF و مدل های معنایی است. با گسترش کاتالوگ های فروشگاهی که گاه شامل میلیون ها قلم کالا هستند، مقیاس پذیری تولید محتوا به یک چالش استراتژیک تبدیل شده است.

تعریف مسئله:

فرآیند سنتی کپی رایتینگ (Copywriting) با محدودیت های شناختی و زمانی انسان روبرو است. از سوی دیگر، استفاده از الگوهای متنی ثابت (Templates) منجر به تولید محتوای تکراری و افت سئو می شود. ورود مدل های هوش مصنوعی مولد (Generative AI) این پتانسیل را ایجاد کرده که متون یکتا و شخصی سازی شده تولید شوند؛ اما چالش اصلی، حفظ دقت مشخصات فنی و تطابق لحن خروجی ماشین با هویت برند است.

بیان شکاف پژوهشی:

اگرچه مطالعات متعددی به کاربرد پردازش زبان طبیعی (NLP) در تحلیل نظرات مشتریان پرداخته اند، اما پژوهش های اندکی (به ویژه در ادبیات داخلی و زبان فارسی) بر روی مکانیزم های کنترل کیفیت متون تولید شده توسط هوش مصنوعی برای محصولات تخصصی متمرکز بوده اند. فقدان یک چارچوب عملیاتی برای ادغام این ابزارها در چرخه کار (Workflow) فروشگاه های اینترنتی به شدت احساس می شود.

هدف تحقیق:

هدف اصلی این مقاله، تبیین جایگاه هوش مصنوعی در تولید محتوای تجارت الکترونیک، تحلیل مزایا و محدودیت های آن، و در نهایت ارائه یک چارچوب مفهومی استاندارد برای تولید توضیحات محصول با استفاده از الگوریتم های هوش مصنوعی است.

۲. مرور ادبیات و پیشینه پژوهش

برای درک عمیق تر از جایگاه فعلی هوش مصنوعی در تولید محتوا، بررسی پژوهش های پیشین الزامی است:

چن و همکاران (Chen et al., 2020): در پژوهشی به بررسی تاثیر تولید زبان طبیعی (NLG) در تجارت الکترونیک پرداختند. نتایج آن ها نشان داد که استفاده از مدل های مبتنی بر معماری Transformer می تواند نرخ تبدیل (Conversion Rate) را از طریق تولید متون متقاعدکننده تر بهبود بخشد.
اسمیت و جانسون (Smith & Johnson, 2021): این محققان بر روی بهینه سازی موتورهای جستجو (SEO) متمرکز شدند. آن ها دریافتند که متون تولید شده توسط نسخه های اولیه GPT، در صورت عدم استفاده از کلمات کلیدی به صورت هدفمند، ممکن است به عنوان محتوای هرزنامه (Spam) توسط الگوریتم های جستجو شناسایی شوند.
وانگ و همکاران (Wang et al., 2022): در مطالعه ای تحلیلی، خطاهای معنایی در متون تولیدی ماشین را بررسی کردند. آن ها متوجه شدند که در محصولات دارای مشخصات فنی پیچیده (مانند قطعات الکترونیکی)، هوش مصنوعی گاهی ویژگی هایی را جعل می کند که وجود خارجی ندارند.
لی و همکاران (Li et al., 2023): مدل های زبانی پیش آموزش دیده را با استفاده از تکنیک مهندسی پرامپت (Prompt Engineering) برای فروشگاه های مد و پوشاک بهینه سازی کردند. نتیجه این تحقیق، ارائه ساختارهایی برای تولید لحن احساسی و ترغیب کننده بود.
احمدی و رضایی (Ahmadi & Rezaei, 2023): در یک پژوهش داخلی، چالش های پردازش زبان فارسی در مدل های زبانی مانند ParsBERT را بررسی کردند. آن ها دریافتند که کمبود پیکره های متنی (Corpora) باکیفیت در زبان فارسی، کیفیت خروجی توضیحات محصول را نسبت به زبان انگلیسی کاهش می دهد.

مقایسه نتایج و جایگاه پژوهش حاضر:

تحقیقات پیشین نشان می دهند که در حالی که سرعت و تنوع تولید متن توسط هوش مصنوعی اثبات شده است (چن و همکاران، ۲۰۲۰؛ لی و همکاران، ۲۰۲۳)، اما چالش دقت اطلاعات (وانگ و همکاران، ۲۰۲۲) و محدودیت های زبان های کم منبع مانند فارسی (احمدی و رضایی، ۲۰۲۳) همچنان پابرجاست. پژوهش حاضر با پر کردن این شکاف، مدلی را پیشنهاد می دهد که خطاهای فنی را از طریق یک لایه نظارتی کاهش داده و برای متون فارسی در پلتفرم های بومی بهینه سازی شده است.

۳. روش تحقیق

نوع تحقیق:

این پژوهش از نظر هدف، یک تحقیق کاربردی است، زیرا نتایج آن می تواند مستقیما توسط کسب وکارهای الکترونیکی مورد استفاده قرار گیرد. از نظر روش شناسی، رویکرد توصیفی-تحلیلی اتخاذ شده است.

روش گردآوری داده ها:

داده های کیفی و مبانی نظری از طریق بررسی مقالات کنفرانسی و ژورنال های معتبر نمایه شده در پایگاه های علمی (مانند IEEE، ScienceDirect و CIVILICA) جمع آوری شده است.

معرفی چارچوب پیشنهادی (HITL-NLG):

برای رفع چالش های مطرح شده، این پژوهش مدل «تولید زبان طبیعی با رویکرد انسان در حلقه» (Human-in-the-Loop Natural Language Generation) را پیشنهاد می دهد. این مدل شامل چهار مرحله است:

ورودی داده های ساختاریافته (Data Structuring): دریافت ویژگی های خام محصول (مانند ابعاد، وزن، جنس) در قالب بردارهای اطلاعاتی.
مهندسی پرامپت پویا (Dynamic Prompting): استفاده از الگوهای دستوری دقیق برای هدایت مدل زبانی.
تولید متن توسط هوش مصنوعی (AI Generation): پردازش پرامپت توسط LLMs.
فیلتر ارزیابی و نظارت انسانی (Evaluation & HITL): ارزیابی متن تولید شده. در این مرحله کیفیت متن می تواند به صورت خودکار با معیارهای ریاضی نظیر همپوشانی N−gramN-gramN−gram ها در فرمول BLEUBLEUBLEU سنجیده شود:

BLEU=BP⋅exp⁡(∑n=1Nwnlog⁡pn)BLEU = BP \cdot \exp \left( \sum_{n=1}^{N} w_n \log p_n \right)BLEU=BP⋅exp(n=1∑Nwnlogpn)

سپس، یک کارشناس محتوا متن را از نظر صحت فنی و لحن برند تایید یا ویرایش می کند.

۴. یافته ها و تحلیل

تحلیل علمی نتایج:

بررسی های تحلیلی نشان می دهد که کاربرد چارچوب پیشنهادی نتایج زیر را به همراه دارد:

افزایش کارایی زمانی: فرآیند تولید محتوایی که برای یک انسان کپی رایتر بین ۱۵ تا ۳۰ دقیقه زمان می برد، توسط APIهای هوش مصنوعی در کمتر از ۳ ثانیه انجام می شود.
تنوع واژگانی: الگوریتم های هوش مصنوعی با بهره گیری از فضای برداری کلمات (Word Embeddings)، قادرند تنوع بالایی از صفت ها و ساختارهای جمله ای را ایجاد کنند که از خستگی شناختی کاربر هنگام مطالعه محصولات مشابه جلوگیری می کند.
چالش توهم اطلاعاتی (Hallucination): تحلیل ها تایید می کنند که اگر به مدل زبانی صرفا نام محصول داده شود (بدون داده های ساختاریافته مرحله اول مدل)، ماشین تمایل دارد متغیرهای نامعلومی را به صورت تصادفی تولید کند (مثلا درج بلوتوث نسخه ۵ برای دستگاهی که فاقد آن است).

توضیح کاربرد مدل پیشنهادی:

با پیاده سازی مدل HITL-NLG، کسب وکارها می توانند بخش اعظم حجم کاری (Heavy Lifting) را به ماشین بسپارند. لایه نظارت انسانی در این مدل تضمین می کند که خروجی نهایی دارای صحت فنی ۱۰۰ درصدی بوده و با قوانین حمایت از مصرف کننده مغایرتی نداشته باشد.

۵. بحث

تفسیر نتایج:

یافته های این پژوهش تاکید می کند که هوش مصنوعی در مقطع کنونی، یک «دستیار هوشمند» است و نه یک «جایگزین کامل» برای نیروی انسانی در تولید محتوای تجاری. وابستگی کیفیت خروجی به کیفیت ورودی (پرامپت) نشان دهنده اهمیت تخصص جدیدی تحت عنوان «مهندسی پرامپت در بازاریابی» است.

مقایسه با مطالعات پیشین:

برخلاف دیدگاه های خوش بینانه مطلق در مطالعات سال های ۲۰۱۹ و ۲۰۲۰ که هوش مصنوعی را راه حلی نهایی می پنداشتند، نتایج این پژوهش هم راستا با وانگ و همکاران (۲۰۲۲) بر لزوم احتیاط در برابر خطاهای معنایی تاکید دارد. با این تفاوت که این مقاله، به جای صرفا بیان مشکل، راه حل عملیاتی (تلفیق داده های جدولی دقیق با پرامپت و نظارت انسانی) را ارائه کرده است.

۶. نتیجه گیری و پیشنهادها

جمع بندی یافته ها:

پژوهش حاضر نشان داد که یکپارچه سازی هوش مصنوعی مبتنی بر پردازش زبان طبیعی در تولید توضیحات محصول، یک ضرورت استراتژیک برای رقابت در تجارت الکترونیک است. مدل های زبانی قادرند مقیاس پذیری و سرعت بی نظیری ارائه دهند، اما برای جلوگیری از افت کیفیت و خطاهای اطلاعاتی، نیازمند معماری سیستماتیک و نظارت حداقلی انسان هستند.

کاربردهای عملی:

مدیران پلتفرم های تجارت الکترونیک، آژانس های دیجیتال مارکتینگ و توسعه دهندگان سیستم های مدیریت محتوا (CMS) می توانند از چارچوب ارائه شده در این مقاله برای خودکارسازی بخش کاتالوگ محصولات خود استفاده کنند.

پیشنهاد برای پژوهش های آینده:

توسعه و فاین تیون (Fine-tuning) مدل های زبانی متن باز (Open-source) به صورت اختصاصی با پیکره های متنی زبان فارسی در حوزه تجارت الکترونیک.
بررسی تاثیر متون تولید شده توسط هوش مصنوعی بر روی شاخص های رفتار مصرف کننده (مانند زمان ماندگاری در صفحه و نرخ پرش) از طریق آزمون های A/BA/BA/B.
پژوهش در زمینه روش های خودکارسازی فکت چکینگ (Fact-checking) در خروجی های هوش مصنوعی برای کاهش نیاز به مداخله انسانی.

۷. منابع

Ahmadi, M., & Rezaei, S. (2023). Challenges of Persian Natural Language Processing in E-commerce Applications: A Review on ParsBERT. Journal of Artificial Intelligence and Data Mining, 11(2), 145-159.
Chen, H., Wang, Y., & Liu, Z. (2020). The impact of natural language generation on conversion rates in online retailing. Journal of Retailing and Consumer Services, 54, 102047.
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics.
Li, X., Zhang, Y., & Zhao, H. (2023). Prompt engineering for emotional and persuasive language generation in fashion e-commerce. Electronic Commerce Research and Applications, 57, 101230.
Smith, J., & Johnson, A. (2021). SEO implications of AI-generated content in digital marketing: A transformer-based analysis. International Journal of Information Management, 58, 102315.
Wang, C., Liu, X., & Chen, Y. (2022). Hallucination mitigation in large language models for technical product descriptions. IEEE Transactions on Knowledge and Data Engineering, 34(11), 5122-5135.
Brown, T., Mann, B., Ryder, N., & Subbiah, M. (2020). Language models are few-shot learners. Advances in Neural Information Processing Systems, 33, 1877-1901.
Hosseini, A., & Karimi, R. (2022). Artificial Intelligence in Persian Digital Marketing: Opportunities and Challenges. Proceedings of the 5th International Conference on IT and E-Commerce (Indexed in CIVILICA).
Ouyang, L., Wu, J., Jiang, X., & Almeida, D. (2022). Training language models to follow instructions with human feedback. Advances in Neural Information Processing Systems, 35, 27730-27744.
Zhou, Y., & Xu, M. (2021). Automated copywriting for e-commerce: A review of deep learning approaches. Expert Systems with Applications, 178, 115042.

مدل‌های زبانی بزرگ (LLMs)بررسی تجارت الکترونیک و تأثیر آن بر بازارهای داخلی انسان در حلقه توضیحات محصول تولید خودکار متن

یادداشت قبلی

ارزیابی کیفیت محتوای تولید شده توسط مدل های زبانی بزرگ (LLMs): بررسی ابعاد دقت، انسجام و اتکاپذیری چکیده

یادداشت بعدی

بررسی تاثیر محتوای تولید شده با هوش مصنوعی بر نرخ تبدیل فروش در بازاریابی دیجیتال