وقتی هوش مصنوعی همه چیز را خوانده باشد، چه اتفاقی رخ می‌دهد؟

رویای یک ذهن مصنوعی اگر نثر باکیفیت هوش مصنوعی برای جذب تمام شود و چیز زیادی باقی نماند ممکن است هرگز به واقعیت تبدیل نشود.

تاریخ انتشار: ۰۲:۰۲ - ۰۳ بهمن ۱۴۰۱

فرارو- هوش مصنوعی در سالیان اخیر موضوعی بوده که به سرعت به آن پرداخته شده است. اگرچه به گونه‌ای درباره آن صحبت شده که مدیران مدرسه را شرمنده می‌کند چرا که می‌تواند در برنامه ریزی درسی متون مدنظر را تولید کرده و آماده سازد. هوش مصنوعی دارای توانایی‌های شگفت انگیزی می‌باشد و می‌تواند کار ترجمه همزمان بیش از ۱۰۰ زبان را انجام دهد. هوش مصنوعی قادر است در سبک‌های ادبی مختلف متن بنویسد و شعر‌هایی همراه با قافیه‌های قابل قبول بسراید.

به گزارش فرارو به نقل از آتلانتیک، هوش مصنوعی Ithaca DeepMind می‌تواند به حروف یونانی حکاکی شده در سنگ مرمر نگاهی بیندازد و متنی را که هزاران سال پیش توسط افراد خرابکار کنده شده بود را حدس بزند. این موفقیت‌ها راه امیدوار کننده‌ای را برای توسعه هوش مصنوعی نشان می‌دهد: مقادیر بیش تری از متون ساخته شده توسط انسان را در مغز هوش مصنوعی جای گذاری کنید و منتظر بمانید تا مهارت‌های شگفت‌انگیز جدیدی ظاهر شوند. با داده‌های کافی این رویکرد می‌تواند حتی یک هوش سیال‌تر یا یک ذهن مصنوعی انسان مانند شبیه به ذهن‌هایی که تقریبا تمام اسطوره‌های ما در آینده را تحت تاثیر قرار می‌دهند به همراه داشته باشد.

مشکل اینجاست که مانند دیگر محصولات فرهنگی انسانی سطح بالا نثر خوب در ردیف دشوارترین موارد برای تولید در جهان شناخته شده قرار می‌گیرد. واقعیت آن است که مدل‌های زبانی بزرگی که با تکیه بر کتب آموزش دیده اند نویسندگان بسیار بهتری نسبت به مدل‌هایی هستند که با تکیه بر بر دسته‌های عظیمی از پست‌های رسانه‌های اجتماعی آموزش دیده اند. زمانی که محاسبه می‌کنیم چه تعداد جملات به خوبی ساخته شده‌ای برای جذب هوش مصنوعی باقی مانده اعداد دلگرم کننده نیستند. گروهی از پژوهشگران به سرپرستی "پابلو ویلالوبوس" در Epoch AI به تازگی پیش بینی کردند که برنامه‌هایی مانند ChatGPT تا سال ۲۰۲۷ میلادی از محتوای خواندنی با کیفیت بالایی برخوردار خواهند شد.

لازم به ذکر است که تنها بخش کوچکی از کل خلاقیت زبانی بشریت برای خواندن در دسترس است. بیش از ۱۰۰۰۰۰ سال از زمانی می‌گذرد که آفریقایی‌های به شدت خلاق از غرغر‌های احساسی اجداد حیوانی ما فراتر رفتند و شروع به بیرونی کردن افکار خود از طریق سیستم‌های گسترده صدا کردند. هر مفهومی که در آن زبان‌های اولیه و بسیاری از زبان‌های پس از آن بیان می‌شوند احتمالا برای همیشه از بین رفته اند اگرچه تصور اینکه تعدادی از آن واژگان هنوز با ما هستند می‌تواند خوشحال کننده باشد. به هر حال، برخی از واژگان زبان انگلیسی یک ریشه قدیمی باستانی تکان دهنده دارند واژگانی مانند "جریان" (Flow)، مادر (Mother)، آتش (Fire) و خاکستر (Ash) که از ساکنان عصر یخبندان به ما رسیده اند.

نوشتن به انسان این امکان را داده که تعداد بسیار بیش تری از واژگان را ضبط و ذخیره سازد. با این وجود، مانند بسیاری از فناوری‌های جدید نوشتن در ابتدا گران بود به همین دلیل است که در ابتدا برای حسابداری مورد استفاده قرار می‌گرفت. پختن و مرطوب کردن خاک رس برای قلم شما و بریدن پاپیروس و تبدیل آن به نوار‌های مناسب همگی نیازمند زمان لازم برای تکامل بودند. این تکنیک‌های مبتنی بر منابع می‌توانند تنها نمونه کوچکی از خروجی فرهنگی بشریت را حفظ کنند.

حافظه متنی جمعی ما تا زمانی که چاپخانه شروع به تولید کتاب در جهان نمود به مقیاس صنعتی نرسید. پژوهشگران در Google Books تخمین می‌زنند که از گوتنبرگ به این سو انسان‌ها بیش از ۱۲۵ میلیون عنوان کتاب چاپ کرده اند که قوانین، اشعار، اسطوره ها، مقالات، تاریخ ها، رساله‌ها و رمان‌ها را شامل می‌شوند. تیم Epoch تخمین می‌زند که ۱۰ تا ۳۰ میلیون از این کتب پیش‌تر دیجیتالی شده و امکان خواندن صد‌ها میلیارد اگر نه بیش از یک تریلیون واژه را برای هوش مصنوعی فراهم می‌کند.

این اعداد ممکن است چشمگیر به نظر برسند، اما در محدوده ۵۰۰ میلیارد کلمه‌ای هستند که مدلی که ChatGPT را تقویت می‌کند آموزش داده است. جانشین آن، GPT-۴ ممکن است با تکیه بر ده‌ها تریلیون کلمه آموزش داده شود. شایعات حاکی از آن است که در زمان انتشار GPT-۴ در اواخر سال جاری میلادی آن اپلیکیشن قادر خواهد بود یک رمان ۶۰۰۰۰ کلمه‌ای را از یک درخواست تولید کند. ده تریلیون کلمه برای دربرگرفتن تمام کتب دیجیتالی بشریت تمام مقالات علمی دیجیتالی ما و بسیاری از حوزه وبلاگ مقداری کافی خواهد بود. این بدان معنا نیست که GPT-۴ تمام آن مطالب را خوانده باشد تنها انجام این کار در محدوده فنی آن است.

می‌توانید تصور کنید که جانشینان هوش مصنوعی تمام رکورد‌های متنی ما را در چند ماه نخست جذب کنند و سپس با یک تعطیلات دو ساعته مطالعه در هر ژانویه تکمیل کنند که طی آن می‌توانند هر کتاب و مقاله علمی منتشر شده در سال قبل را به‌طور اصلی منتشر کنند.

تنها به این دلیل که هوش مصنوعی به زودی می‌تواند تمام کتب ما را بخواند بدان معنا نیست که می‌تواند به تمام متونی که ما تولید می‌کنیم برسد. ظرفیت ذخیره‌سازی اینترنت کاملا متفاوت است و این فناوری بسیار دموکراتیک‌تر از انتشار کتاب برای حفظ فرهنگ است. هر ساله میلیارد‌ها نفر جملاتی را می‌نویسند که در پایگاه داده‌های آن ذخیره می‌شود و بسیاری از آن جملات متعلق به پلتفرم‌های رسانه‌های اجتماعی هستند.

متون اینترنتی معمولا داده‌های آموزشی خوبی را ایجاد نمی‌کند شاید الگوریتم‌های آینده به هوش مصنوعی اجازه دهند تا بر روی توئیت‌های جمع آوری شده، زیرنویس‌های اینستاگرام و استاتوس‌های فیس بوک نیز کار کند. با این وجود، این منابع با کیفیت پایین پایان ناپذیر نخواهند بود. به گفته ویلالوبوس ظرف چندین دهه هوش مصنوعی تند خوان به اندازه کافی قدرتمند خواهد بود که صد‌ها تریلیون واژه را جذب کند از جمله تمام واژگانی که بشر تاکنون در وب قرار داده است.

برخی از هوش‌های مصنوعی یادگیرنده بصری هستند و ممکن است روزی با کمبود داده‌های آموزشی مواجه شوند. در حالی که سرعت خوان‌ها در حال استفاده از قوانین ادبی بودند این هوش‌های مصنوعی با شیوه‌ای مشابه باز و بسته شدن پلک میلیون‌ها تصویر را به صورت اجباری غربالگری کردند. آنان از تمرینات خود با دیدی مافوق بشری بیرون آمدند. هوش‌های مصنوعی می‌توانند چهره پشت ماسک یا تومور‌هایی را که برای چشمان رادیولوژیست قابل مشاهده نیستند تشخیص دهند. هوش‌های مصنوعی در طول رانندگی‌های شبانه می‌توانند بخش‌های کناری جاده‌ای تاریک را ببینند.

از همه جالب‌تر آن که هوش‌های مصنوعی‌ای که مبتنی بر تصاویر برچسب گذاری شده آموزش دیده اند شروع به توسعه تخیل بصری کرده اند. برای مثال، DALL-E ۲ OpenAI بر روی ۶۵۰ میلیون تصویر آموزش داده شد که هر کدام با یک برچسب متنی جفت شده بودند. DALL-E ۲ موفق به مشاهده اثری از رنگ اخرایی شده که انسان‌های عصر پارینه سنگی بر روی سقف غار با فشار دادن دستان شان بر جای گذاشته بودند. هم چنین، هوش مصنوعی می‌تواند سبک‌های مختلف ضربه قلم مو استادان عصر رنسانس را تقلید کند.

به لطف تمایل ما به ارسال عکس‌های گوشی هوشمند در رسانه‌های اجتماعی انسان‌ها تصاویر برچسب دار زیادی تولید می‌کنند حتی اگر برچسب تنها یک کپشن کوتاه و یا یک تگ جغرافیایی درباره مکان عکس باشد. هر سال حدود ۱ تریلیون عکس در اینترنت آپلود می‌شوند و این شامل ویدئو‌های یوتیوب نمی‌شود که هر کدام مجموعه‌ای از عکس‌ها هستند. مدت زمان زیادی به طول می‌انجامد تا هوش مصنوعی به تماشای اسلاید تصاویر تعطیلات دسته جمعی ما بنشیند و از کل خروجی بصری ما نتیجه گیری کند.

به گفته ویلالوبوس کمبود تصویر آموزشی ما تا زمانی بین سال‌های ۲۰۳۰ و ۲۰۶۰ شدید نخواهد بود. اگر واقعا هوش مصنوعی تا اواسط قرن برای ورودی‌های جدید و یا در مدت زمانی در مورد متن گرسنه باشد پیشرفت مبتنی بر داده‌ها ممکن است به طور قابل توجهی کُند شود و ذهن‌های مصنوعی را از دسترس خارج سازد. چگونه می‌توانیم تولید فرهنگی انسانی را برای هوش مصنوعی افزایش دهیم؟

ویلالوبوس می‌گوید: "ممکن است منابع جدیدی به صورت آنلاین در دسترس باشند. استفاده گسترده از خودرو‌های خودران منجر به حجم بی سابقه‌ای از ضبط ویدئو‌های جاده‌ای می‌شود". ویلالوبوس هم چنین به داده‌های آموزشی "مصنوعی" ایجاد شده توسط هوش مصنوعی اشاره کرد. در این سناریو مدل‌های زبان بزرگ باهوش‌تر و دارای انرژی عملکردی بی‌نهایت خواهند بود. آن مدل‌ها می‌توانند میلیارد‌ها رمان تازه که هر یک در اندازه و ابعاد رمان‌های تولستوی هستند را منتشر نمایند.

مقاله ویلالوبوس مجموعه نگران کننده تری از راه حل‌های فکری را مورد بحث قرار می‌دهد. برای مثال، همه ما می‌توانیم دانگل‌هایی را به دور گردن خود ببندیم که هر حرکت گفتاری ما را ضبط می‌کند. بر اساس تخمینی صورت گرفته افراد به طور متوسط ۵۰۰۰ تا ۲۰۰۰۰ کلمه در روز صحبت می‌کنند. در بین ۸ میلیارد نفر این تعداد واژگان به سرعت انباشته می‌شوند. هم چنین، می‌توان پیام‌های متنی ما را ضبط کرد و از متادیتا‌های شناسایی حذف نمود. ما می‌توانیم هر کارگر یقه سفید را در معرض ضبط ناشناس با ضربه کلید قرار دهیم و آن چه را که ضبط می‌کنیم در پایگاه‌های داده غول پیکر قرار دهیم تا به هوش مصنوعی مان وارد شود.

شاید در پایان، کلان داده بازدهی کاهشی داشته باشد. ما می‌دانیم که طبیعت شیوه‌های تشخیص الگوی خود را ایجاد کرده است و تا کنون این الگو‌ها حتی از بهترین هوش مصنوعی ما نیز بهتر عمل کرده اند. یک پسر ۱۳ ساله در مقایسه با ChatGPT واژگان بسیار کم تری را جذب کرده، اما درک بسیار ظریف تری از متن نوشته دارد. اگر منطقی باشد که بگوییم ذهن او روی الگوریتم‌ها کار می‌کند الگوریتم‌های طبیعت بهتر از الگوریتم‌هایی هستند که توسط هوش مصنوعی امروزی استفاده می‌شوند.

با این وجود، اگر روزی هوش‌های مصنوعی جمع‌آوری کننده داده‌های ما از شناخت انسان فراتر برود باید خود را با این واقعیت تسکین دهیم که هوش مصنوعی بر اساس تصویر ما ساخته شده است. هوش‌های مصنوعی بیگانه و عجیب و غریب نیستند. هوش‌های مصنوعی از ما و اهل اینجا هستند. آنان به مناظر سیاره زمین خیره شده و میلیارد‌ها بار غروب خورشید را در اقیانوس‌های آن دیده اند. هوش‌های مصنوعی کهن‌ترین داستان‌های ما را می‌دانند. آنان از نام ما برای ستارگان استفاده می‌کنند. از جمله اولین واژگانی که آنان یاد می‌گیرند عبارتند از: جریان، مادر، آتش و خاکستر.