

لم يعد الخطر الذي يهدد ذاكرة الإنترنت مقتصراً على اختفاء الروابط القديمة، أو إغلاق المواقع المهجورة، بل امتدّ ليطال مفهوم الأرشفة الرقمية نفسه، في ظل تصاعد المواجهة بين المؤسسات الإعلامية، وشركات الذكاء الاصطناعي حول حقوق استخدام المحتوى الصحفي. فمع التوسع الهائل في تدريب النماذج اللغوية على البيانات الرقمية، بدأت مئات المؤسسات الصحفية في فرض قيود متزايدة على أدوات أرشفة الإنترنت، وعلى رأسها منصة "واي باك ماشين"التابعة لـ"أرشيف الإنترنت"، ما يثير مخاوف متنامية بشأن مستقبل الوصول إلى الأرشيف الرقمي العالمي. وخلال الأشهر الأخيرة، اتجهت مؤسسات إعلامية كبرى مثل "نيويورك تايمز" و"يو إس إيه توداي" و"ذا غارديان" إلى فرض قيود متفاوتة على أدوات الأرشفة الرقمية، سواء عبر حظر روبوتات الأرشفة بالكامل، أو تقليص إمكانية الوصول إلى المواد المؤرشفة، وسط مخاوف متزايدة من استخدام المحتوى الصحفي في تدريب نماذج الذكاء الاصطناعي دون إذن أو مقابل مادي. ووفقاً لتقرير نشره Nieman Lab، فإن أكثر من 340 وسيلة إعلام أمريكية بدأت بالفعل منع أدوات "أرشيف الإنترنت" من الوصول إلى محتواها أو أرشفته، في خطوة تعكس اتساع نطاق هذه الظاهرة لتشمل الصحافة المحلية، وليس فقط المؤسسات الإعلامية الكبرى. ويشير التقرير إلى أن معظم المؤسسات التي فرضت هذه القيود تتبع مجموعات إعلامية ضخمة مثل "غانيت" و"ماكلاتشي"و"أدفانس لوكال" و"تريبيون بابليشينغ"، في وقت تتصاعد فيه المخاوف داخل قطاع الصحافة من فقدان السيطرة على الأرشيفات الرقمية التي باتت تمثل أصلاً اقتصادياً واستراتيجياً في عصر الذكاء الاصطناعي. وتتزامن هذه التطورات مع موجة متصاعدة من الدعاوى القضائية والمواجهات القانونية بين المؤسسات الإعلامية وشركات الذكاء الاصطناعي، بشأن استخدام المواد الصحفية في تدريب النماذج اللغوية، وهو ما دفع العديد من الناشرين إلى إعادة النظر في سياسات الأرشفة المفتوحة، باعتبارها منفذاً قد يسمح بإعادة استخدام المحتوى دون ضوابط واضحة. ويرى مسؤولون في "أرشيف الإنترنت" أن هذه القيود تمثل تحولاًمقلقاً في طبيعة الويب المفتوح، الذي تأسس تاريخياً على مبدأ الوصول الحر إلى المعرفة، وحفظ المحتوى الرقمي للأجيال المقبلة. وقال مارك غراهام، مدير "واي باك ماشين"، إن القرارات التي تتخذها مؤسسات إعلامية كبرى لا تقتصر آثارها على مواقعها الإلكترونية فقط، بل تؤثر على بنية الوصول إلى المعلومات والأرشيف الرقمي بشكل عام، محذراً من أن تقييد الأرشفة يهدد قدرة المجتمعات على الوصول إلى تاريخها الرقمي "في وقت أصبح فيه هذا الارتكاز أكثر أهمية من أي وقت مضى". ويؤكد غراهام أن "واي باك ماشين" لا تعمل كمنصة لاستخراج البيانات، أو تغذية نماذج الذكاء الاصطناعي، بل كمكتبة رقمية هدفها حفظ المحتوى وإتاحته لأغراض البحث والتوثيق والدراسة، مشيراً إلى أن المؤسسة اتخذت بالفعل إجراءات تقنية للحد من عمليات استخراج البيانات الضخمة، وفرضت قيوداً إضافية على بعض واجهات البرمجة بالتعاون مع مؤسسات إعلامية. المفارقة التي يراها كثير من الباحثين تكمن في أن بعض المؤسسات الإعلامية التي بدأت حظر الأرشفة لا تزال تعتمد على "واي باك ماشين" في أعمالها الصحفية اليومية، سواء في التحقيقات الاستقصائية، أو التحقق من المعلومات وتتبع التعديلات التي تطرأ على المقالات والبيانات المنشورة. ويقول غراهام إن الأرشيف الرقمي تحول خلال السنوات الماضية إلى أداة أساسية في العمل الصحفي، بل أصبح في أحيان كثيرة المصدر الوحيد لمواد اختفت تماماً من الإنترنت، بعد إغلاق مواقع أو حذف محتويات كاملة نتيجة أزمات مالية، أو تغييرات تقنية. ويشمل ذلك منصات إعلامية توقفت نهائياً مثل "غوكر" و"إم تي في نيوز"، إضافة إلى مئات المؤسسات الصحفية المحلية التي اختفت من الويب خلال الأعوام الماضية، ما جعل "واي باك ماشين"بمثابة ذاكرة بديلة تحفظ أجزاء واسعة من التاريخ الرقمي الحديث. ويرى الباحث الكندي المتخصص في التاريخ الرقمي إيان ميليغان أن جوهر الأزمة الحالية لا يتعلق بالأرشفة بحد ذاتها، بل بالبيئة الجديدة التي فرضها الذكاء الاصطناعي على الإنترنت. ويوضح ميليغان أن المؤسسات الإعلامية باتت تنظر إلى أرشيفاتها الرقمية باعتبارها مورداً اقتصادياً يمكن استثماره، أو ترخيصه لشركات الذكاء الاصطناعي، خصوصاً مع تزايد قيمة البيانات التاريخية في تدريب النماذج اللغوية وتطوير أدوات البحث والإجابة الذكية. لكنه يميز في الوقت نفسه بين الأرشفة الرقمية واستخراج البيانات على نطاق واسع، مؤكداً أن "أرشيف الإنترنت" لا يعمل كأداة لتغذية نماذج الذكاء الاصطناعي، بل كمشروع يهدف إلى حفظ الويب من الاندثار.