تحقیقات اخیر نشان میدهد که اپل مدلهای هوش مصنوعی خود را از ویدیوهای YouTube بدون مجوز آموزش داده است، شامل ویدیوهای MKBHD
پیش از این، OpenAI، Meta و Google به دلیل رونویسی ویدیوهای YouTube برای آموزش مدل های هوش مصنوعی، نقض حق نسخه برداری سازندگان محتوا. اکنون، به نظر میرسد گزارش جدیدی منتشر شده است که نشان میدهد اپل در آموزش مدلهای LLM خود از طریق رونوشتهایی از محتوای ویدیویی بدون رضایت سازندگان ویدیو، از جمله برخی از منتقدان مشهور فناوری، راههای دیگر غولهای فناوری را دنبال میکند.
Apple پس از استفاده از ویدیوهای YouTube از سازندگان محتوا بدون رضایت آنها و نقض حق نسخه برداری سازنده در آب داغ است
اخیراً، غولهای فناوری از ویدیوهای YouTube برای آموزش مدلهای هوش مصنوعی بدون رضایت سازندگان استفاده میکنند که نگرانیهای زیادی را برانگیخته است. اکنون، اپل، همراه با دیگر شرکتهای بزرگ، به دلیل نقض حق نسخهبرداری سازندگان با استفاده از محتوای آنها بدون اجازه آنها، در میانه مناقشه قرار گرفته است.
Wired گزارش داد که اشخاص ثالث ویدیوها را به عنوان فایل های زیرنویس دانلود کرده اند و سپس از آنها برای آموزش استفاده می شود. مدل های LLM این ادعا ادعا کرد که بیش از 170000 ویدیو استفاده شده است که شامل محتوایی از یوتیوبرهای معروف است، از جمله MKBHD، Jimmy Kimmel، PewDiePie، و MrBeast، در میان بسیاری از تولیدکنندگان محتوا.
این گزارش نشان میدهد که این شرکتهای بزرگ هوش مصنوعی علیرغم اینکه این تکنیک استخراج مواد قوانین YouTube را در مورد برنامههای مستقل ویدیوهایشان و دسترسی خودکار بدون اجازه را نقض میکند، از محتوا برای فرآیند آموزشی خود استفاده میکنند.
تحقیق توسط Proof News نشان داد که برخی از ثروتمندترین شرکت های هوش مصنوعی در جهان از مطالب هزاران ویدیوی YouTube برای آموزش هوش مصنوعی استفاده کرده اند. شرکتها علیرغم قوانین یوتیوب علیه برداشت مواد از پلتفرم بدون اجازه، این کار را انجام دادند. تحقیقات ما نشان داد که زیرنویسهای 173536 ویدیوی YouTube، که از بیش از 48000 کانال استخراج شدهاند، توسط شرکتهای سنگین وزن سیلیکون ولی، از جمله Anthropic، Nvidia، Apple، و Salesforce استفاده شده است.
اگرچه عمل رونویسی ویدیوها توسط اپل انجام نشد، اما یک آژانس غیرانتفاعی به نام EleutherAI از آن برای اهداف آموزشی، آموزش توسعه دهندگان و برای خدمت به اهداف آکادمیک دیگری استفاده کرد. این شرکت همچنان به دلیل استفاده از مجموعه داده بدون رضایت با مناقشه مواجه شد.
مجموعهها بهطور آشکار برای دانشگاهیان و توسعهدهندگان در دسترس هستند، اما غولهای فناوری از آنها برای آموزش مدلهای برجسته خود استفاده کردهاند. گفته می شود که اپل از جمع آوری داده ها، یعنی Pile، توسط شخص ثالث برای آموزش OpenELM استفاده می کند که در آوریل راه اندازی شد.
چنین وضعیتی سؤالاتی را در مورد رضایت و عملکردهای هوش مصنوعی اخلاقی ایجاد می کند که در صورت عدم رعایت احتیاط، پیامدهای آن می تواند چند وجهی باشد. ما هنوز نظر اپل در مورد نگرانی های جاری را نشنیده ایم.