وقتی هوش مصنوعی همه چیز را خوانده باشد، چه اتفاقی رخ می دهد؟
به گزارش وبلاگ ماشین، هوش مصنوعی در سالیان اخیر موضوعی بوده که به سرعت به آن پرداخته شده است. اگرچه به گونه ای درباره آن صحبت شده که مدیران مدرسه را شرمسار می نماید چرا که می تواند در برنامه ریزی درسی متون مدنظر را فراوری نموده و آماده سازد. هوش مصنوعی دارای توانایی های شگفت انگیزی می باشد و می تواند کار ترجمه همزمان بیش از 100 زبان را انجام دهد. هوش مصنوعی قادر است در سبک های ادبی مختلف متن بنویسد و شعر هایی همراه با قافیه های قابل قبول بسراید.
به گزارش وبلاگ ماشین به نقل از آتلانتیک، هوش مصنوعی Ithaca DeepMind می تواند به حروف یونانی حکاکی شده در سنگ مرمر نگاهی بیندازد و متنی را که هزاران سال پیش به وسیله افراد خرابکار کنده شده بود را حدس بزند. این پیروزیت ها راه امیدوار کننده ای را برای توسعه هوش مصنوعی نشان می دهد: مقادیر بیش تری از متون ساخته شده به وسیله انسان را در مغز هوش مصنوعی جای گذاری کنید و منتظر بمانید تا مهارت های شگفت انگیز نوی ظاهر شوند. با داده های کافی این رویکرد می تواند حتی یک هوش سیال تر یا یک فکر مصنوعی انسان مانند شبیه به فکر هایی که تقریبا تمام اسطوره های ما در آینده را تحت تاثیر قرار می دهند به همراه داشته باشد.
مشکل اینجاست که مانند دیگر محصولات فرهنگی انسانی سطح بالا نثر خوب در ردیف دشوارترین موارد برای فراوری در دنیا شناخته شده قرار می گیرد. واقعیت آن است که مدل های زبانی بزرگی که با تکیه بر کتب آموزش دیده اند نویسندگان بسیار بهتری نسبت به مدل هایی هستند که با تکیه بر بر دسته های عظیمی از پست های رسانه های اجتماعی آموزش دیده اند. زمانی که محاسبه می کنیم چه تعداد جملات به خوبی ساخته شده ای برای جذب هوش مصنوعی به جای مانده اعداد دلگرم کننده نیستند. گروهی از پژوهشگران به سرپرستی پابلو ویلالوبوس در Epoch AI به تازگی پیش بینی کردند که برنامه هایی مانند ChatGPT تا سال 2027 میلادی از محتوای خواندنی با کیفیت بالایی برخوردار خواهند شد.
گفتنی است که تنها بخش کوچکی از کل خلاقیت زبانی بشریت برای خواندن در دسترس است. بیش از 100000 سال از زمانی می گذرد که آفریقایی های به شدت خلاق از غرغر های احساسی اجداد حیوانی ما فراتر رفتند و آغاز به بیرونی کردن افکار خود به وسیله سیستم های گسترده صدا کردند. هر مفهومی که در آن زبان های اولیه و بسیاری از زبان های پس از آن بیان می شوند احتمالا برای همواره از بین رفته اند اگرچه تصور اینکه تعدادی از آن واژگان هنوز با ما هستند می تواند خشنود کننده باشد. به هر حال، بعضی از واژگان زبان انگلیسی یک ریشه قدیمی باستانی تکان دهنده دارند واژگانی مانند جریان (Flow)، مادر (Mother)، آتش (Fire) و خاکستر (Ash) که از ساکنان عصر یخبندان به ما رسیده اند.
نوشتن به انسان این امکان را داده که تعداد بسیار بیش تری از واژگان را ضبط و ذخیره سازد. با این وجود، مانند بسیاری از فناوری های نو نوشتن در ابتدا گران بود به همین علت است که در ابتدا برای حسابداری مورد استفاده قرار می گرفت. پختن و مرطوب کردن خاک رس برای قلم شما و بریدن پاپیروس و تبدیل آن به نوار های مناسب همگی نیازمند زمان لازم برای تکامل بودند. این تکنیک های مبتنی بر منابع می توانند تنها نمونه کوچکی از خروجی فرهنگی بشریت را حفظ کنند.
حافظه متنی جمعی ما تا زمانی که چاپخانه آغاز به فراوری کتاب در دنیا نمود به مقیاس صنعتی نرسید. پژوهشگران در Google Books تخمین می زنند که از گوتنبرگ به این سو انسان ها بیش از 125 میلیون عنوان کتاب چاپ نموده اند که قوانین، اشعار، اسطوره ها، مقالات، تاریخ ها، رساله ها و رمان ها را شامل می شوند. تیم Epoch تخمین می زند که 10 تا 30 میلیون از این کتب پیش تر دیجیتالی شده و امکان خواندن صد ها میلیارد اگر نه بیش از یک تریلیون واژه را برای هوش مصنوعی فراهم می نماید.
این اعداد ممکن است چشمگیر به نظر برسند، اما در محدوده 500 میلیارد کلمه ای هستند که مدلی که ChatGPT را تقویت می نماید آموزش داده است. جانشین آن، GPT-4 ممکن است با تکیه بر ده ها تریلیون کلمه آموزش داده گردد. شایعات حاکی از آن است که در زمان انتشار GPT-4 در اواخر امسال میلادی آن اپلیکیشن قادر خواهد بود یک رمان 60000 کلمه ای را از یک درخواست فراوری کند. ده تریلیون کلمه برای دربرگرفتن تمام کتب دیجیتالی بشریت تمام مقالات علمی دیجیتالی ما و بسیاری از حوزه وبلاگ مقداری کافی خواهد بود. این بدان معنا نیست که GPT-4 تمام آن مطالب را خوانده باشد تنها انجام این کار در محدوده فنی آن است.
می توانید تصور کنید که جانشینان هوش مصنوعی تمام رکورد های متنی ما را در چند ماه نخست جذب کنند و سپس با یک تعطیلات دو ساعته مطالعه در هر ژانویه تکمیل کنند که طی آن می توانند هر کتاب و مقاله علمی منتشر شده در سال قبل را به طور اصلی منتشر کنند.
تنها به این علت که هوش مصنوعی به زودی می تواند تمام کتب ما را بخواند بدان معنا نیست که می تواند به تمام متونی که ما فراوری می کنیم برسد. ظرفیت ذخیره سازی اینترنت کاملا فرق دارد و این فناوری بسیار دموکراتیک تر از انتشار کتاب برای حفظ فرهنگ است. هر ساله میلیارد ها نفر جملاتی را می نویسند که در پایگاه داده های آن ذخیره می گردد و بسیاری از آن جملات متعلق به پلتفرم های رسانه های اجتماعی هستند.
متون اینترنتی معمولا داده های آموزشی خوبی را ایجاد نمی نماید شاید الگوریتم های آینده به هوش مصنوعی اجازه دهند تا بر روی توئیت های جمع آوری شده، زیرنویس های اینستاگرام و استاتوس های فیس بوک نیز کار کند. با این وجود، این منابع با کیفیت پایین انتها ناپذیر نخواهند بود. به گفته ویلالوبوس ظرف چندین دهه هوش مصنوعی تند خوان به میزان کافی قدرتمند خواهد بود که صد ها تریلیون واژه را جذب کند از جمله تمام واژگانی که بشر تا به امروز در وب قرار داده است.
بعضی از هوش های مصنوعی یادگیرنده بصری هستند و ممکن است روزی با کمبود داده های آموزشی روبرو شوند. در حالی که سرعت خوان ها در حال استفاده از قوانین ادبی بودند این هوش های مصنوعی با شیوه ای مشابه باز و بسته شدن پلک میلیون ها تصویر را به صورت اجباری غربالگری کردند. آنان از تمرینات خود با دیدی مافوق بشری بیرون آمدند. هوش های مصنوعی می توانند چهره پشت ماسک یا تومور هایی را که برای چشمان رادیولوژیست قابل مشاهده نیستند تشخیص دهند. هوش های مصنوعی در طول رانندگی های شبانه می توانند بخش های کناری جاده ای تاریک را ببینند.
از همه جالب تر آن که هوش های مصنوعی ای که مبتنی بر تصاویر برچسب گذاری شده آموزش دیده اند آغاز به توسعه تخیل بصری نموده اند. برای مثال، DALL-E 2 OpenAI بر روی 650 میلیون تصویر آموزش داده شد که هر کدام با یک برچسب متنی جفت شده بودند. DALL-E 2 پیروز به مشاهده اثری از رنگ اخرایی شده که انسان های عصر پارینه سنگی بر روی سقف غار با فشار دادن دستان شان بر جای گذاشته بودند. هم چنین، هوش مصنوعی می تواند سبک های مختلف ضربه قلم مو استادان عصر رنسانس را تقلید کند.
به لطف تمایل ما به ارسال عکس های گوشی هوشمند در رسانه های اجتماعی انسان ها تصاویر برچسب دار زیادی فراوری می کنند حتی اگر برچسب تنها یک کپشن کوتاه و یا یک تگ جغرافیایی درباره مکان عکس باشد. هر سال حدود 1 تریلیون عکس در اینترنت آپلود می شوند و این شامل ویدئو های یوتیوب نمی گردد که هر کدام مجموعه ای از عکس ها هستند. مدت زمان زیادی به طول می انجامد تا هوش مصنوعی به تماشای اسلاید تصاویر تعطیلات دسته جمعی ما بنشیند و از کل خروجی بصری ما نتیجه گیری کند.
به گفته ویلالوبوس کمبود تصویر آموزشی ما تا زمانی بین سال های 2030 و 2060 شدید نخواهد بود. اگر واقعا هوش مصنوعی تا اواسط قرن برای ورودی های نو و یا در مدت زمانی در خصوص متن گرسنه باشد پیشرفت مبتنی بر داده ها ممکن است به طور قابل توجهی کُند گردد و فکر های مصنوعی را از دسترس خارج سازد. چگونه می توانیم فراوری فرهنگی انسانی را برای هوش مصنوعی افزایش دهیم؟
ویلالوبوس می گوید: ممکن است منابع نوی به صورت آنلاین در دسترس باشند. استفاده گسترده از خودرو های خودران منجر به حجم بی سابقه ای از ضبط ویدئو های جاده ای می گردد. ویلالوبوس هم چنین به داده های آموزشی مصنوعی ایجاد شده به وسیله هوش مصنوعی اشاره نمود. در این سناریو مدل های زبان بزرگ باهوش تر و دارای انرژی عملکردی بی نهایت خواهند بود. آن مدل ها می توانند میلیارد ها رمان تازه که هر یک در میزان و ابعاد رمان های تولستوی هستند را منتشر کنند.
مقاله ویلالوبوس مجموعه نگران کننده تری از راه چاره های فکری را مورد بحث قرار می دهد. برای مثال، همه ما می توانیم دانگل هایی را به دور گردن خود ببندیم که هر حرکت گفتاری ما را ضبط می نماید. بر اساس تقریبی انجام شده افراد به طور میانه 5000 تا 20000 کلمه در روز صحبت می کنند. در بین 8 میلیارد نفر این تعداد واژگان به سرعت انباشته می شوند. هم چنین، می توان پیغام های متنی ما را ضبط کرد و از متادیتا های شناسایی حذف نمود. ما می توانیم هر کارگر یقه سفید را در معرض ضبط ناشناس با ضربه کلید قرار دهیم و آن چه را که ضبط می کنیم در پایگاه های داده غول پیکر قرار دهیم تا به هوش مصنوعی مان وارد گردد.
شاید در انتها، کلان داده بازدهی کاهشی داشته باشد. ما می دانیم که طبیعت شیوه های تشخیص الگوی خود را ایجاد نموده است و تا کنون این الگو ها حتی از برترین هوش مصنوعی ما نیز بهتر عمل نموده اند. یک پسر 13 ساله در مقایسه با ChatGPT واژگان بسیار کم تری را جذب نموده، اما درک بسیار ظریف تری از متن نوشته دارد. اگر منطقی باشد که بگوییم فکر او روی الگوریتم ها کار می نماید الگوریتم های طبیعت بهتر از الگوریتم هایی هستند که به وسیله هوش مصنوعی امروزی استفاده می شوند.
با این وجود، اگر روزی هوش های مصنوعی جمع آوری کننده داده های ما از شناخت انسان فراتر برود باید خود را با این واقعیت تسکین دهیم که هوش مصنوعی بر اساس تصویر ما ساخته شده است. هوش های مصنوعی بیگانه و عجیب و غریب نیستند. هوش های مصنوعی از ما و اهل اینجا هستند. آنان به منظره ها سیاره زمین خیره شده و میلیارد ها بار غروب خورشید را در اقیانوس های آن دیده اند. هوش های مصنوعی کهن ترین داستان های ما را می دانند. آنان از نام ما برای ستارگان استفاده می کنند. از جمله اولین واژگانی که آنان یاد می گیرند عبارتند از: جریان، مادر، آتش و خاکستر.
منبع: فرارو