هوش مصنوعی به موسیقی با صداهای «باب اسفنجی» و هنرمند مخفی به نام گلرب خزش می کند.


در ابتدا، ویدیوهای یوتیوب شبیه صحنه‌هایی از کارتون معروف «باب اسفنجی شلوار مربعی» نیکلودئون هستند.

باب اسفنجی، شخصیت زرد رنگ شاد، بیرون از خانه آناناسی شکل خود ظاهر می شود، در حالی که آقای کرابس، رئیس بداخلاق باب اسفنجی، در رستوران Krusty Krab است که او اداره می کند. اما بر خلاف نمایش، شخصیت‌های ویدیوها آهنگ‌های شادی درباره زندگی در شهر زیر آب بیکینی باتم نمی‌خوانند. در عوض، آنها در مورد مواد مخدر و اسلحه رپ می کنند.

مغز متفکر پشت رپ هنرمندی به نام گلرب است. موسیقی آنها که میلیون ها بار در Spotify و YouTube پخش شده است، به نظر می رسد از هوش مصنوعی برای تکرار صدای شخصیت های نمادین استفاده می کند.

از آنجایی که ابزارهای هوش مصنوعی به سرعت در حال تکامل هستند، برای هنرمندانی مانند گلورب آسان‌تر شده است که با استفاده از هوش مصنوعی مولد موسیقی بسازند – و در نوع خود موفق شوند. با این حال، کارشناسانی که بر هوش مصنوعی و موسیقی تمرکز می‌کنند، می‌گویند که پرسش‌های مربوط به کپی رایت و مالکیت همچنان با ظهور عصر جدیدی از فناوری در صنعت موسیقی مطرح است.

جاش آنتونوچیو، دانشیار و مدیر این آهنگ، گفت: «می‌دانید که این فرصت‌های بسیار بیشتری را برای کسی باز می‌کند که اساساً نسخه‌ای از یک آهنگ تخیلی داشته باشد، زیرا آنها هنرمند را دوست دارند.» دانشکده هنر و مطالعات رسانه در کالج ارتباطات اسکریپس دانشگاه اوهایو.

آهنگ های الهام گرفته شده از باب اسفنجی، گلورب را – که هویت خود را ناشناس نگه می دارد – به یک حس آنلاین تبدیل کرده است. در اسپاتیفای، گلورب به طور متوسط ​​کمتر از یک میلیون شنونده در ماه دارد – محبوب ترین آهنگ آنها، “The Bottom 2” بیش از 11 میلیون استریم جمع آوری کرده است. موزیک ویدیوهای این هنرمند که مدل‌های شخصیت‌های این نمایش را به نمایش می‌گذارند نیز میلیون‌ها بازدید در یوتیوب داشته است.

باب اسفنجی در موزیک ویدیوی گلرب ظاهر می شود "یوجین."
یک مدل شخصیت باب اسفنجی در موزیک ویدیوی گلرب به نام یوجین، انیمیشن ThrillDaWill ظاهر می شود.Glorb / ThrillDaWill از طریق YouTube

گلرب، که از مصاحبه خودداری کرد، به طور عمومی به نیکلودئون وابسته نیست. سخنگوی شبکه متعلق به پارامونت بلافاصله به درخواست اظهار نظر پاسخ نداد. نمایندگان یوتیوب و اسپاتیفای نیز بلافاصله به درخواست‌ها برای اظهار نظر پاسخ ندادند.

تریسی چان، مدیر عامل Splash، یک شرکت موسیقی مولد هوش مصنوعی، گفت: صنعت موسیقی می تواند شاهد هجوم هنرمندانی باشد که از نوعی هوش مصنوعی استفاده می کنند، به ویژه با ادامه پیشرفت فناوری. در حال حاضر، برنامه‌های موسیقی مولد هوش مصنوعی مانند Suno، که به کاربران اجازه می‌دهد پیام‌ها را وارد کرده و آهنگ‌ها را بر اساس پیشنهادات متنی تولید کنند، به عنوان ChatGPT موسیقی مورد استقبال قرار گرفته‌اند.

“من فکر می کنم مهم است که ما به عنوان یک صنعت بفهمیم که چگونه هر دو را چگونه انجام دهیم … چگونه تعادل ایجاد می کنیم که ما محتوای بیشتر و بیشتری تولید می کنیم، که در نهایت خوب است، اما همچنین به نوعی به افرادی که هستند، پاداش می دهیم. چان گفت، به نوعی منبع منبع است.

Glorb اولین کسی نیست که از این فناوری برای ایجاد موسیقی اصلی استفاده می کند. در برخی موارد، هنرمندان بزرگ با بازنمایی های هوش مصنوعی از کارهای خود درگیر شده اند.

در ماه ژوئن، پل مک‌کارتنی اعلام کرد که گروه بیتلز آخرین آلبوم خود را با نام «اکنون و سپس» منتشر خواهد کرد که از فناوری هوش مصنوعی برای استخراج صدای جان لنون فقید استفاده می‌کند. خواننده گریمز، قهرمان هوش مصنوعی، elf.tech را منتشر کرد، پلتفرمی که هنرمندان می‌توانند بر روی آن از تکرار هوش مصنوعی صدای گریمز در موسیقی خود استفاده کنند. شرایط قرارداد شامل این است که گریمز بخشی از حق امتیاز به دست آمده از هر موسیقی که شامل نسخه هوش مصنوعی صدای او باشد را دریافت می کند.

اما در موارد دیگر، موسیقی تولید شده توسط هوش مصنوعی با استفاده از آثار هنرمندان، نگرانی‌هایی را از جانب کسانی در صنعت موسیقی ایجاد کرده است.

در آوریل 2023، هنرمندی به نام Ghostwriter برای آهنگ «قلب در آستین من» که از تکرار صدای رپر دریک و خواننده The Weeknd با هوش مصنوعی استفاده می‌کرد، در فضای مجازی پخش شد. این آهنگ به سرعت از چندین پلتفرم از جمله یوتیوب حذف شد، جایی که پیامی به این شرح بود: «این ویدیو به دلیل ادعای حق چاپ توسط گروه موسیقی یونیورسال دیگر در دسترس نیست.»

اندکی قبل از انتشار آنلاین آهنگ Ghostwriter، UMG (که هیچ ارتباطی با NBCUniversal، شرکت مادر NBC News ندارد) از سرویس‌های استریم خواسته بود تا برنامه‌های هوش مصنوعی را از استفاده از موسیقی دارای حق چاپ آن برای آموزش خود منع کنند.

“ما یک مسئولیت اخلاقی و تجاری در قبال هنرمندان خود داریم که برای جلوگیری از استفاده غیرمجاز از موسیقی آنها و جلوگیری از ورود پلتفرم ها به محتوایی که حقوق هنرمندان و سایر سازندگان را نقض می کند” تلاش کنیم. سه شرکت بزرگ موسیقی جهانی، در بیانیه ای به فایننشال تایمز گفتند. ما انتظار داریم که شرکای پلتفرم ما بخواهند از استفاده از خدماتشان به گونه‌ای که به هنرمندان آسیب می‌زند جلوگیری کنند.»

چان گفت، بخشی از مشکل از این واقعیت ناشی می شود که پلتفرم های پخش موسیقی ابزارهای کمی برای تشخیص و ردیابی میزان موسیقی هوش مصنوعی در برنامه های خود دارند.

یک فرهنگ ریمیکس مولد افراطی وجود دارد که ما تازه شروع به ورود به آن کرده ایم.

– جاش آنتونوچیو، مدیر دانشکده هنر و مطالعات رسانه در کالج ارتباطات اسکریپس دانشگاه اوهایو

او موسیقی سنتی ایجاد شده را با اثر انگشت مقایسه کرد – پلتفرم‌های استریم می‌توانند آهنگ‌های دیگر را با اثر انگشت مقایسه کنند و وقتی آهنگی را پیدا کردند که با آن مطابقت دارد، می‌توانند آپلود را ارزیابی کنند و در صورت لزوم آن را حذف کنند. موسیقی تولید شده توسط هوش مصنوعی آن اثر انگشت فرضی را ندارد. بنابراین، ردیابی و حذف آن بسیار دشوارتر است.

چان گفت، از آنجایی که فناوری محدودی برای ردیابی موسیقی هوش مصنوعی آپلود شده در پلتفرم‌های مختلف وجود دارد، سخت است که بدانیم چه مقدار از آن در خارج از کشور وجود دارد.

شما باید باور کنید که وجود دارد، اما باز هم، آیا به مصرف انبوه می رسد؟ احتمالاً هنوز نه.» «چون زمانی که به نوعی به فرهنگ ضربه زد، به اصطلاح، اینجاست که به نظرم بسیاری از دارندگان حقوق مانند برچسب‌ها و مواردی از این دست هستند. [will] علیه آن پلتفرم ها اقدام کنید و از آنها بخواهید آن را از بین ببرند.»

قانونگذاران در حال بررسی چگونگی تنظیم صداهای تولید شده توسط هوش مصنوعی در موسیقی هستند.

ماه گذشته، فرماندار تنسی، بیل لی، قانون تضمین شباهت صدا و تصویر را امضا کرد که به عنوان “قانون ELVIS” نیز شناخته می شود. قانونی که ادعا می کند اولین در نوع خود است، «بسازید[s] دفتر لی در بیانیه‌ای خبری در ژانویه اعلام کرد که بر اساس قانون موجود ایالتی که با افزودن «صدا» به قلمروی که از آن محافظت می‌کند، در برابر استفاده غیرمجاز از شباهت کسی محافظت می‌کند.

بسیاری در صنعت، از جمله آکادمی ضبط و مدیر عامل گروه موسیقی وارنر، رابرت کینکل، قانون را ستود.

Antonuccio، دانشیار دانشگاه اوهایو، گفت که موجی از موسیقی الهام گرفته از فناوری باید صنعت و مصرف کنندگان را هم هیجان زده و هم بترساند.

آنتونوچیو گفت، حتی اگر قوانین بیشتری معرفی شوند، تلاش برای مهار سونامی محتوایی که از صداهای مولد هوش مصنوعی استفاده می کند تقریبا غیرممکن خواهد بود.

او گفت: “فرهنگ ریمیکس مولد افراطی وجود دارد که ما تازه شروع به ورود به آن کرده ایم.” و من فکر می‌کنم بخش‌های هیجان‌انگیزی از آن وجود دارد، اما صادقانه بگویم، فکر می‌کنم چیزهای زیادی وجود دارد که باید همه ما را در این مورد نگران کند.»