أعلن فريق من الباحثين من كوريا الجنوبية عن تطوير نموذج جديد للذكاء الاصطناعي يسمى “DarkBERT”، وهو اختصار لـ Dark Web Bidirectional Encoder Representations from Transformers. ويعتبر هذا النموذج مختلفًا عن النماذج الموجودة مثل “ChatGPT” و”Google Bard“، التي تم تدريبها على البيانات من الإنترنت المفتوح، المصدرة من مواقع وسائل التواصل الاجتماعي والمقالات والكتب، بينما تم تدريب “DarkBERT” حصريًا باستخدام بيانات من الإنترنت المظلم، المصدرة من مواقع ومنتديات تستخدمها المخترقون والمجرمون الإلكترونيون والمحتالون.
شاهد/ي: ChatGPT لديها الآن تطبيق iOS، مع إصدار أندرويد في الطريق
وقال الباحثون في بحثهم، الذي نشروه على موقع “arXiv1“، إن “DarkBERT” هو نموذج لغة كبير (LLM)، يستطيع توليد وفهم وتحسس وتكيف نصوص مختلفة بناءً على طلب بسيط، وأضافوا أن النموذج الجديد يستفيد من التنوع اللغوي والبنائي للإنترنت المظلم، الذي يحتوي على لغات وأكواد وأساليب خاصة به، كما أن “DarkBERT” يستخدم تقنية التشفير ثنائي الاتجاه (BERT)، التي تستطيع فهم سياق الكلمات في الجملة من الاتجاهين.
وأشار الباحثون إلى أن “DarkBERT” يهدف إلى تحسين أمن المعلومات في هذه الصناعة الحاسوبية الضخمة والغامضة، التي تشكل تحديًا كبيرًا للباحثين والخبراء، وقالوا إن النموذج الجديد يستطيع تصنيف المواقع والمحتوى في الإنترنت المظلم بدقة عالية، وكشف المعلومات غير المشروعة أو المضللة أو المؤذية، وكما يستطيع استخراج مؤشرات التعرض للاختراق (IOC)، التي تساعد على التصدي للتهديدات الإلكترونية.
ولفت الباحثون إلى أن “DarkBERT” يعتبر أول نموذج لغة مدرب على بيانات من الإنترنت المظلم فقط، وأول نموذج لغة مفتوح المصدر في هذا المجال. وأضافوا أنهم سيشاركون رقم التطبيق مفتوح المصدر، بحيث يستطيع باحثو آخرون استخدامه في مشاريعهم والاستفادة منه في أبحاثهم في هذا المجال.
وقالوا إن “DarkBERT” يمثل إنجازًا علميًا وتقنيًا في مجال الذكاء الاصطناعي، وأنه يفتح آفاقًا جديدة لفهم وتحليل الإنترنت المظلم ومكافحة الجريمة الإلكترونية، وختموا بالقول إنهم يأملون في أن يساهم “DarkBERT” في تعزيز الأمن السيبراني والرفاهية العامة، كما ذكروا أنهم سينشرون المزيد من التفاصيل عن “DarkBERT” في المؤتمرات والمجلات العلمية المستقبلية.
ويعتبر الإنترنت المظلم مصدرًا غنيًا بالبيانات الحساسة والسرية، التي يمكن أن تستخدم لأغراض خبيثة أو مفيدة. وقد أظهرت دراسات سابقة أن هناك اختلافات واضحة في اللغة المستخدمة في الإنترنت المظلم مقارنة بالإنترنت المفتوح، مما يجعل من الصعب تطبيق النماذج اللغوية التقليدية عليه. ولهذا السبب، قام الباحثون بتطوير “DarkBERT” كنموذج لغوي مخصص لهذا المجال، والذي يمكن أن يساعد في فهم وتحليل وحماية الإنترنت المظلم.