OpenAI درّبت نموذج GPT-4 على محتوى يوتيوب ومخاوف قانونية لهذه السياسات

أكدت صحيفة نيويورك تايمز الأمريكية أن شركة OpenAI قامت بتدريب نموذجها الذكاء الاصطناعي GPT-4 باستخدام محتوى يوتيوب. وأشارت الصحيفة إلى أن الشركة كانت بحاجة ماسة إلى بيانات التدريب، وقامت بتطوير نموذج النسخ الصوتي Whisper لتحويل الصوت في مقاطع الفيديو على يوتيوب إلى نص، ثم استخدمت هذه النصوص في تدريب نموذج GPT-4، والذي يُعتبر واحدًا من أبرز نماذجها التكنولوجيا في الوقت الحالي.

وتثير هذه الآلية مخاوف قانونية، حيث تندرج ضمن المجال الرمادي لقوانين حقوق الطبع والنشر للذكاء الاصطناعي، ولكن الشركة ترى ذلك كـ”استخدامٍ عادل”.

استخدام محتوى يوتيوب

وأفادت الصحيفة أن رئيس OpenAI، جريج بروكمان، شخصيًا شارك في جمع مقاطع الفيديو المستخدمة في التدريب.

وقالت المتحدثة باسم OpenAI، ليندساي هيلد، لموقع The Verge التقني إن الشركة تستخدم “مصادر متعددة بما في ذلك البيانات العامة والشراكات للبيانات غير العامة”.

وفي عام 2021، دربت الشركة نماذجها على مجموعة متنوعة من مصادر البيانات، بما في ذلك مقاطع الفيديو والبودكاست والكتب الصوتية على يوتيوب.

وأشار تقرير الصحيفة إلى أن بعض الأشخاص في جوجل كانوا على علم بنشاط OpenAI، لكنهم لم يتخذوا إجراءًا؛ لأن جوجل نفسها كانت تستخدم مقاطع الفيديو في يوتيوب لتدريب نماذجها الخاصة للذكاء الاصطناعي.

وأكدت جوجل للصحيفة أنها تقوم بذلك فقط بالتعاون مع منشئي المحتوى الذين يوافقون على ذلك.

وفي تطور آخر ، حذر الرئيس التنفيذي ليوتيوب شركة OpenAI من تدريب نموذجها الجديد على تحويل النص إلى فيديو بناءً على مقاطع الفيديو المنشورة على المنصة.

البورصة تغلق على ارتفاع 1.25% في ختام تداولات الأسبوع