تحلیل حمله تزریق پرامپت و تاثیر روش دیپمایند در جلوگیری از آن

میثم تجسسی

تحلیل حمله تزریق پرامپت و تاثیر روش دیپمایند در جلوگیری از آن

فایل این در 17 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل

من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این :

https://civilica.com/doc/2307420

چکیده :

مدل های زبانی بزرگ و چت بات های هوش مصنوعی در خط مقدم دموکراتیک سازی هوش مصنوعی قرار داشته اند. بااین حال، انتشار ChatGPT و ابزارهای مشابه دیگر، با افزایش نگرانی ها درباره دشواری کنترل مدل های زبانی بزرگ و خروجی های آن ها همراه بوده است. در حال حاضر، شاهد یک بازی تعقیب و فرار هستیم که در آن کاربران سعی می کنند از مدل ها با یک حمله ابداعی به نام «تزریق پرامپت» سوء استفاده کنند؛ درحالی که توسعه دهندگان به طور هم زمان تلاش می کنند آسیب پذیری ها را کشف و حملات را مسدود نمایند. در این مقاله، مروری بر این تهدید نوظهور ارائه می دهیم و دسته بندی از حملات معرفی شده ارائه می کنیم که می تواند راهنمای تحقیقات آینده در این زمینه باشد. علاوه بر این، بر اساس ادبیات پژوهشی پیشین و تحقیقات تجربی خودمان، پیامدهای روش مورد نظر را برای کاربران نهایی، توسعه دهندگان و محققان مدل های زبانی بزرگ موردبحث و با ارائه کلی از موضوع دیپ مایند؛ میزان تاثیرگذاری در جلوگیری از حملات سریع تزریق را بررسی می-نماییم.

کلیدواژه ها:

دیپ مایند ، سریع تزریق ، هوش مصنوعی ، هک ، حمله سایبری

نویسندگان

میثم تجسسی

میثم تجسسی خانکندی - گروه مهندسی کامپیوتر دانشکده فنی مهندسی دانشگاه آزاد اسلامی؛ واحد پرند، پرند، ایران

مراجع و منابع این :

لیست زیر مراجع و منابع استفاده شده در این را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود لینک شده اند :

Bender, E.M., Gebru, T., McMillan-Major, A., Shmitchell, S., 2021. On ...
Bommasani, R., Hudson, D.A., Adeli, E., Altman, R., Arora, S., ...
Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J.D., ...
Bubeck, S., Chandrasekaran, V., Eldan, R., Gehrke, J., Horvitz, E., ...
Burgess, M., 2023. The security hole at the heart of ...
Carlini, N., Tramer, F., Wallace, E., Jagielski, M., Herbert-Voss, A., ...
Devlin, J., Chang, M.W., Lee, K., Toutanova, K., 2019. BERT: ...
Edwards, B., 2023. AI-powered Bing Chat spills its secrets via ...
Greshake, K., Abdelnabi, S., Mishra, S., Endres, C., Holz, T., ...
Gupta, M., Akiri, C., Aryal, K., Parker, E., Praharaj, L., ...
Hao, K., 2021. The race to understand the exhilarating, dangerous ...
Heikkila, M., 2023. Three ways AI chatbots are a security ...
Kang, D., Li, X., Stoica, I., Guestrin, C., Zaharia, M., ...
Lee, A., 2023. What are large language models used for? ...
Li, H., Guo, D., Fan, W., Xu, M., Song, Y., ...
Li, Z., Peng, B., He, P., Yan, X., 2023b. Evaluating ...
Liang, P.P., Wu, C., Morency, L.P., Salakhutdinov, R., 2021. Towards ...
Liu, V., Chilton, L.B., 2022. Design guidelines for prompt engineering ...
Mozes, M., He, X., Kleinberg, B., Griffin, L.D., 2023. Use ...

نمایش کامل مراجع