حظرت العديد من المؤسسات الإعلامية، مثل نيويورك تايمز وسي إن إن ورويترز وهيئة الإذاعة الأسترالية، زاحف الويب GPTBot من OpenAI، مما يحد من قدرة الشركة على مواصلة الوصول إلى محتواها.
وتقف شركة OpenAI وراء روبوت الدردشة بالذكاء الاصطناعي ChatGPT، الذي يفحص زاحفه للويب صفحات الإلكترونية للمساعدة في تحسين نماذجه للذكاء الاصطناعي.
وحظرت صحيفة نيويورك تايمز GTBot من الوصول إلى موقعها، ووجدت صحيفة الغارديان أن المواقع الإخبارية الرئيسية الأخرى، من ذلك سي إن إن ورويترز وشيكاغو تريبيون وهيئة الإذاعة الأسترالية وكانبيرا تايمز ونيوكاسل هيرالد منعت أيضا زاحف الويب.
وتتطلب نماذج اللغة الكبيرة، مثل ChatGPT، كميات هائلة من المعلومات لتدريب أنظمتها والسماح لها بالإجابة على استفسارات المستخدمين بطرق تشبه أنماط اللغة البشرية، ولكن الشركات الواقفة وراءها غالبا ما تتكتم بشأن وجود مواد محمية بحقوق التأليف في مجموعاتها للبيانات.
ويظهر الحظر المفروض على GTBot في ملفات robots.txt الخاصة بالناشرين التي تخبر زاحف الويب بالصفحات المسموح له زيارتها.
وقالت OpenAI في تدوينة تتضمن تعليمات حول كيفية منع زاحفها للويب: “يساعد السماح بوصول GPTBot إلى موقعك في زيادة دقة نماذج الذكاء الاصطناعي وتحسين قدراتها العامة وسلامتها”.
وبحسب صحيفة الغارديان، فإن المؤسسات الإعلامية المذكورة سابقا حظرت في شهر أغسطس زاحف الويب المملوك لشركة OpenAI. كما حظرت بعض المؤسسات الإعلامية CCBot، وهو زاحف الويب لمستودع بيانات الويب المفتوح Common Crawl الذي تستخدمه أيضا مشاريع الذكاء الاصطناعي.
وأكدت سي إن إن لصحيفة الغارديان أنها حظرت مؤخرا GTBot عبر عناوينها، ولكنها لم تعلق على ما إذا كانت تخطط لاتخاذ المزيد من الإجراءات بشأن استخدام محتواها في أنظمة الذكاء الاصطناعي.
وقال متحدث باسم رويترز: “تراجع رويترز بانتظام شروط وأحكام ملف robots.txt والموقع، وبالنظر إلى أن الملكية الفكرية هي شريان الحياة لنشاطنا، فمن الضروري أن نحمي حقوقنا للتأليف”.
وحدثت صحيفة نيويورك تايمز مؤخرا شروط الخدمة لجعل الحظر المفروض على جمع محتواها لتدريب الذكاء الاصطناعي وتطويره واضحا بشكل أكبر، وذلك وفقا لمتحدث رسمي.
وتدرس المؤسسات الإعلامية العالمية إمكانية استخدامها للذكاء الاصطناعي كجزء من جمع الأخبار، وكيفية التعامل مع محتواها الذي تجمعه الشركات المطورة لأنظمة الذكاء الاصطناعي من أجل تدريب المجموعات.
ووقعت المؤسسات الإعلامية، مثل وكالة فرانس برس، في أوائل شهر أغسطس رسالة مفتوحة تدعو إلى تنظيم الذكاء الاصطناعي، وتطالب بالشفافية بشأن تركيبة جميع مجموعات التدريب المستخدمة لإنشاء نماذج الذكاء الاصطناعي والحصول على موافقة سابقة بشأن استخدام المواد المحمية بحقوق التأليف.
وحظرت مجموعة من مواقع الويب الرئيسية، مثل أمازون وكورا وشاترستوك وويكي هاو، زاحف الويب GTBot، وذلك وفقا لأبحاث OriginalityAI، وهي شركة تتحقق من وجود محتوى الذكاء الاصطناعي.