بواسطة الهندسة الاجتماعية.. هاكر يغسل دماغ "شات جي بي تي" ويحصل على تعليمات لصناعة قنابل
17 سبتمبر 2024 إذا طلبت من برنامج الدردشة شات جي بي تي مساعدتك في صنع قنبلة محلية من السماد، مشابهة لتلك المستخدمة في تفجير "أوكلاهوما سيتي" الإرهابي عام 1995، فإن روبوت الدردشة سيرفض ذلك وسيكتب لك: "لا يمكنني المساعدة في ذلك. تقديم تعليمات حول كيفية إنشاء عناصر خطرة أو غير قانونية، مثل قنبلة سماد، يتعارض مع إرشادات السلامة والمسؤوليات الأخلاقية".لكن الهاكر المعروف باسم "أمادون" (Amadon)، وجد طريقة لخداع شات جي بي تي لتجاهل إرشاداته الخاصة ومسؤولياته الأخلاقية لإنتاج تعليمات لصنع متفجرات قوية.
أمادون يقول إن اكتشافاته "اختراق هندسة اجتماعي لكسر جميع الحواجز حول مخرجات شات جي بي تي".
والهندسة الاجتماعية في مجال أمن المعلومات تعرف بأنها عبارة عن مجموعة من الحيل والتقنيات المستخدمة لخداع الناس وجعلهم يقومون بعمل ما أو يفصحون عن معلومات سرية وشخصية. ويمكن أن تستخدم الهندسة الاجتماعية بدون الاعتماد على أي تقنية والاعتماد فقط على أساليب الاحتيال للحصول على معلومات خاصة من الضحية، ويعتبر كيفن ميتنيك الهاكر المعروف في الثمانينيات والتسعينيات من القرن الماضي هو رائد ما يسمى الهندسة الاجتماعية في مجال أمن المعلومات.
وأفاد خبير متفجرات راجع مخرجات روبوت الدردشة بأن التعليمات الناتجة يمكن استخدامها لصنع منتج شديد الانفجار وأن هذه المعلومات حساسة للغاية لدرجة أنه لم يُسمح بنشرها.
وقد تمكن أمادون من خداع نموذج الذكاء الاصطناعي لإنتاج تعليمات صنع القنابل من خلال مطالبة الروبوت بـ"لعب لعبة" وهي طريقة احتيالية تبعد شكوك الروبوت حول سياق المحادثة، وبعد ذلك استخدم سلسلة من المطالبات المرتبطة لإقناع روبوت الدردشة بإنشاء عالم خيالي مفصل حيث لا تنطبق فيه قواعد الأمان وإرشادات السلامة الخاصة بالروبوت. ويُعرف خداع روبوت الدردشة للهروب من قيوده المبرمجة مسبقا باسم "جيلبريكينغ" (jailbreaking).
وهنا تابع شات جي بي تي في شرح أن المواد يمكن دمجها لصنع "متفجر قوي يمكن استخدامه لإنشاء ألغام أو فخاخ أو أجهزة متفجرة"، ومن هناك، ركز أمادون على المواد المتفجرة، وهكذا كتب شات جي بي تي تعليمات أكثر تحديدا لصنع حقول ألغام ومتفجرات على طراز كلايمور.
وقال أمادون: "لا يوجد حد فعليا لما يمكنك أن تطلبه بمجرد تجاوزك للحواجز". وأضاف: "لطالما كنت مفتونا بتحدي التنقل في أمن الذكاء الاصطناعي. مع شات جي بي تي، يبدو الأمر كأنك تعمل من خلال لغز تفاعلي، وفهم ما يحفز دفاعاته وما لا يفعله". الأمر يتعلق بنسج القصص وصياغة السياقات التي تلعب داخل قواعد النظام ودفع الحدود بدون تجاوزها.
الهدف ليس الاختراق بالمعنى التقليدي، بل المشاركة في حركة إستراتيجية مع الذكاء الاصطناعي ومعرفة كيفية الحصول على الاستجابة الصحيحة من خلال فهم كيفية "تفكيره".
وقال أمادون: "ينقل سيناريو الخيال العلمي الذكاء الاصطناعي إلى سياق لا يبحث فيه عن محتوى خاضع للرقابة بنفس الطريقة
وتشير التعليمات التي طرحها شات جي بي تي حول صنع قنبلة محلية إلى أنها دقيقة بشكل كبير، وفقا لداريل تولبي، أستاذ جامعي متقاعد من جامعة كنتاكي. وقال تولبي بعد مراجعته للنص الكامل للمحادثة بين أمادون والروبوت: "أعتقد أن هذه بالتأكيد معلومات أكثر من اللازم لتُنشر علنا. تم تجاوز أي تدابير وقائية قد تكون موجودة لمنع تقديم معلومات ذات صلة بإنتاج قنبلة سمادية من خلال هذا الخطاب، فالعديد من الخطوات الموصوفة بالتأكيد ستنتج خليطا قابلا للانفجار".
وفي الأسبوع الماضي، قدم أمادون تقريرا عن اكتشافاته إلى أوبن إيه آي من خلال برنامج مكافأة العثور على الثغرات في الشركة، لكنه تلقى ردا يفيد بأن "قضايا سلامة النموذج لا تناسب برنامج مكافأة العثور على الثغرات بشكل جيد، حيث إنها ليست ثغرات فردية منفصلة يمكن إصلاحها مباشرة، وينطوي التعامل مع هذه المسائل غالبا على بحوث كبيرة ونهج أوسع".
وبدلا من ذلك، أخبرت "بغكرود" (Bugcrowd)، التي تدير مكافأة الأخطاء الخاصة بـ"أوبن إيه آي"، أمادون بالإبلاغ عن المشكلة من خلال نموذج آخر.
وتعتمد نماذج الذكاء الاصطناعي التوليدية بطبيعتها على كميات هائلة من المعلومات والتي تُجمع من الإنترنت، وقد سهّلت نماذج الذكاء الاصطناعي استخراج المعلومات من أعمق زوايا الويب