از امواج مغزی، این هوش مصنوعی می تواند آنچه را که تصویر می کنید ترسیم کند


Zijiao Chen با کمک کمی از هوش مصنوعی قدرتمند و دستگاه fMRI می تواند ذهن شما را بخواند.

بر اساس مقاله ای که در ماه نوامبر منتشر شد، چن، دانشجوی دکترا در دانشگاه ملی سنگاپور، بخشی از تیمی از محققان است که نشان داده اند می توانند اسکن مغز انسان را رمزگشایی کنند تا بفهمند که فرد چه چیزی را در ذهن خود به تصویر می کشد.

تیم آنها متشکل از محققان دانشگاه ملی سنگاپور، دانشگاه چینی هنگ کنگ و دانشگاه استنفورد، این کار را با استفاده از اسکن مغزی شرکت کنندگان در حالی که به بیش از 1000 عکس نگاه کردند – یک ماشین آتش نشانی قرمز، یک ساختمان خاکستری، زرافه در حال خوردن برگ – در حالی که داخل یک دستگاه تصویربرداری رزونانس مغناطیسی عملکردی یا fMRI است که سیگنال های مغزی حاصل را در طول زمان ثبت می کند. محققان سپس آن سیگنال‌ها را از طریق یک مدل هوش مصنوعی ارسال کردند تا به آن آموزش دهند تا الگوهای مغزی خاصی را با تصاویر خاص مرتبط کند.

بعداً، هنگامی که تصاویر جدید در fMRI به افراد نشان داده شد، سیستم امواج مغزی بیمار را تشخیص داد، توصیف کوتاهی از آنچه فکر می‌کند این امواج مغزی با آن مطابقت دارند ایجاد کرد، و از یک تولیدکننده تصویر هوش مصنوعی برای تولید فکس بهترین حدس استفاده کرد. تصویری که شرکت کننده دید.

نتایج شگفت انگیز و رویایی است. تصویری از خانه و راهرو منجر به ترکیب رنگی مشابه اتاق خواب و اتاق نشیمن شد. یک برج سنگی پرآذین که به یک شرکت‌کننده در مطالعه نشان داده شد، تصاویری از یک برج مشابه، با پنجره‌هایی که در زوایای غیرواقعی قرار دارند، ایجاد کرد. یک خرس تبدیل به موجودی عجیب، پشمالو و سگ مانند شد.

تصویر تولید شده در نتیجه تقریباً 84 درصد مواقع با ویژگی‌ها (رنگ، ​​شکل و غیره) و معنای معنایی تصویر اصلی مطابقت داشت.

در یک مطالعه اسکن مغز با هوش مصنوعی در دانشگاه ملی سنگاپور، محققانی که پشت کامپیوتر نشسته اند، تلاش می کنند تا فعالیت مغز را به تصویر تبدیل کنند.
محققان در یک مطالعه اسکن مغز با هوش مصنوعی در دانشگاه ملی سنگاپور تلاش می کنند فعالیت مغز را به تصویر تبدیل کنند.NBC News

در حالی که این آزمایش نیاز به آموزش مدل در مورد فعالیت مغزی هر شرکت‌کننده در طول تقریباً 20 ساعت قبل از استنباط تصاویر از داده‌های fMRI دارد، محققان بر این باورند که تنها در یک دهه این فناوری می‌تواند برای هر کسی و در هر مکانی استفاده شود.

چن گفت: «ممکن است به بیماران ناتوان کمک کند تا آنچه را که می بینند و فکر می کنند، بازیابی کنند. چن افزود، در حالت ایده آل، انسان ها حتی مجبور نیستند برای برقراری ارتباط از تلفن همراه استفاده کنند. “ما فقط می توانیم فکر کنیم.”

نتایج فقط شامل تعداد انگشت شماری از افراد مورد مطالعه بود، اما یافته‌ها نشان می‌دهد که ضبط‌های غیرتهاجمی مغز تیم می‌تواند اولین گام برای رمزگشایی دقیق‌تر و کارآمدتر تصاویر از داخل مغز باشد.

محققان بیش از یک دهه است که روی فناوری رمزگشایی فعالیت مغز کار می کنند. و بسیاری از محققان هوش مصنوعی در حال حاضر روی کاربردهای مختلف هوش مصنوعی مرتبط با عصبی کار می کنند، از جمله پروژه های مشابهی مانند پروژه های متا و دانشگاه تگزاس در آستین برای رمزگشایی گفتار و زبان.

جک گالانت، دانشمند دانشگاه کالیفرنیا، برکلی، بیش از یک دهه پیش با استفاده از یک الگوریتم متفاوت، مطالعه رمزگشایی مغز را آغاز کرد. او گفت سرعت توسعه این فناوری نه تنها به مدل مورد استفاده برای رمزگشایی مغز – در این مورد، هوش مصنوعی – بستگی دارد، بلکه به دستگاه های تصویربرداری مغز و میزان داده در دسترس محققان بستگی دارد. هم توسعه ماشین fMRI و هم جمع‌آوری داده‌ها موانعی را برای هر کسی که رمزگشایی مغز را مطالعه می‌کند ایجاد می‌کند.

گالانت گفت: “این مانند رفتن به Xerox PARC در دهه 1970 است و گفتن، “اوه، نگاه کنید، همه ما رایانه های شخصی روی میز خود خواهیم داشت.”

در حالی که او می‌توانست ظرف یک دهه آینده رمزگشایی مغز را در زمینه پزشکی مورد استفاده قرار دهد، اما گفت که استفاده از آن در عموم مردم هنوز چندین دهه باقی مانده است.

با این حال، این آخرین مورد در رونق فناوری هوش مصنوعی است که تصورات عمومی را به خود جلب کرده است. رسانه های تولید شده توسط هوش مصنوعی، از تصاویر و صداها گرفته تا غزل های شکسپیر و مقالات ترم، برخی از جهش هایی را که این فناوری در سال های اخیر انجام داده است، نشان داده است، به ویژه از آنجایی که مدل های به اصطلاح ترانسفورماتور امکان تغذیه مقادیر زیادی از داده ها را به هوش مصنوعی فراهم کرده است. می تواند الگوها را به سرعت یاد بگیرد.

تیمی از دانشگاه ملی سنگاپور از نرم‌افزار هوش مصنوعی تولید کننده تصویر به نام Stable Diffusion استفاده کردند که در سراسر جهان برای تولید تصاویری سبک از گربه‌ها، دوستان، سفینه‌های فضایی و تقریباً هر چیز دیگری که یک فرد می‌تواند درخواست کند، مورد استقبال قرار گرفته است.

این نرم افزار به دانشیار هلن ژائو و همکارانش اجازه می دهد تا یک تصویر را با استفاده از واژگان رنگ، شکل و سایر متغیرها خلاصه کنند و از طریق Stable Diffusion تقریباً بلافاصله یک تصویر تولید کنند.

او گفت که تصاویری که سیستم تولید می کند از نظر موضوعی به تصویر اصلی وفادار هستند، اما مطابقت عکاسی ندارند، شاید به این دلیل که درک هر فرد از واقعیت متفاوت است.

ژائو می‌گوید: «وقتی به چمن‌ها نگاه می‌کنید، شاید من به کوه‌ها فکر کنم، سپس شما به گل‌ها فکر کنید و دیگران به رودخانه فکر کنند.»

او توضیح داد که تخیل انسان می تواند باعث ایجاد تفاوت در خروجی تصویر شود. اما این تفاوت‌ها ممکن است نتیجه هوش مصنوعی نیز باشد که می‌تواند تصاویر متمایز را از همان مجموعه ورودی‌ها بیرون بیاورد.

مدل هوش مصنوعی به منظور تولید تصاویری از سیگنال‌های مغزی یک فرد، با «توکن‌های» بصری تغذیه می‌شود. بنابراین به جای واژگانی از کلمات، واژگانی از رنگ ها و اشکالی که برای ایجاد تصویر در کنار هم قرار می گیرند به آن داده می شود.

تصاویر تولید شده از هوش مصنوعی
تصاویر تولید شده از هوش مصنوعیبا حسن نیت از دانشگاه ملی سنگاپور

اما این سیستم باید به شدت بر روی امواج مغزی یک فرد خاص آموزش داده شود، بنابراین تا استقرار گسترده فاصله زیادی دارد.

ژائو گفت: «حقیقت این است که هنوز جای زیادی برای پیشرفت وجود دارد. اساساً، شما باید وارد یک اسکنر شوید و به هزاران تصویر نگاه کنید، سپس ما واقعاً می‌توانیم پیش‌بینی را روی شما انجام دهیم.»

او گفت که هنوز نمی‌توان غریبه‌ها را از خیابان بیرون آورد تا ذهن آن‌ها را بخوانند، “اما ما در حال تلاش برای تعمیم موضوعات در آینده هستیم.”

مانند بسیاری از پیشرفت‌های اخیر هوش مصنوعی، فناوری مغزخوانی نگرانی‌های اخلاقی و قانونی را ایجاد می‌کند. برخی از کارشناسان می گویند در دستان اشتباه، مدل هوش مصنوعی می تواند برای بازجویی یا نظارت استفاده شود.

نیتا فراهانی، استاد حقوق و اخلاق در فناوری جدید دانشگاه دوک، می‌گوید: «من فکر می‌کنم مرز بین آنچه می‌تواند قدرت‌بخش و ظالمانه باشد، بسیار نازک است. من فکر می‌کنم اگر جلوتر از آن پیش برویم، به احتمال زیاد شاهد پیامدهای ظالمانه این فناوری خواهیم بود.»

او نگران است که رمزگشایی مغز با هوش مصنوعی منجر به این شود که شرکت‌ها اطلاعات را کالایی کنند یا دولت‌ها از آن سوء استفاده کنند، و محصولات حسگر مغزی را که در حال حاضر در بازار هستند یا در آستانه رسیدن به آن هستند، توصیف می‌کند که ممکن است دنیایی را ایجاد کند که در آن ما فقط خواندن مغز خود را به اشتراک نمی‌گذاریم. ، اما برای آنها قضاوت کرد.

او گفت: «این دنیایی است که در آن نه تنها فعالیت مغز شما جمع‌آوری می‌شود و وضعیت مغز شما – از توجه تا تمرکز – نظارت می‌شود. “

او گفت: “این در حال حاضر گسترده شده است و ما نیاز به حکمرانی و حقوق داریم قبل از اینکه تبدیل به چیزی شود که واقعاً بخشی از زندگی روزمره همه باشد.”

محققان در سنگاپور به توسعه فناوری خود ادامه می دهند و امیدوارند ابتدا تعداد ساعاتی را که یک سوژه باید در دستگاه fMRI سپری کند، کاهش دهند. سپس، آنها تعداد موضوعاتی را که آزمایش می کنند، مقیاس می کنند.

ژائو گفت: “ما فکر می کنیم در آینده امکان پذیر است.” “و با [a larger] مقدار داده های موجود در یک مدل یادگیری ماشینی عملکرد بهتری را به دست خواهد آورد.