ایراد بزرگی که ژاپنیها در هوش مصنوعی مشهور پیدا کردند
برخی از محققان ژاپنی احساس میکنند که سیستمهای هوش مصنوعی آموزش دیده بر اساس زبانهای خارجی غیر ژاپنی نمیتوانند پیچیدگیهای زبان و فرهنگ ژاپنی را درک کنند، بنابراین اکنون میخواهند نسخهای از چت جیپیتی مخصوص ژاپن را توسعه دهند.
خبرگزاری ایسنا: برخی از محققان ژاپنی احساس میکنند که سیستمهای هوش مصنوعی آموزش دیده بر اساس زبانهای خارجی غیر ژاپنی نمیتوانند پیچیدگیهای زبان و فرهنگ ژاپنی را درک کنند، بنابراین اکنون میخواهند نسخهای از چت جیپیتی مخصوص ژاپن را توسعه دهند.

ژاپن در حال ساخت نسخههای خود از چت جیپیتی (ChatGPT) است. این ربات هوش مصنوعی که توسط شرکت آمریکایی OpenAI ساخته شده است پس از رونمایی در کمتر از یک سال قبل، به طور جهانی مورد توجه قرار گرفت.
دولت ژاپن و شرکتهای بزرگ فناوری مانند NEC، فوجیتسو و سافتبانک صدها میلیون دلار برای ایجاد سیستمهای هوش مصنوعی صرف میکنند که بر اساس همان فناوری زیربنایی معروف به مدلهای زبانی بزرگ کار میکنند، اما به جای ترجمه نسخه انگلیسی از زبان ژاپنی استفاده میکنند.
کیسوکه ساکاگوچی (Keisuke Sakaguchi)، محقق دانشگاه توهوکو در ژاپن که متخصص پردازش زبان طبیعی است، میگوید: مدلهای زبانی بزرگ عمومی فعلی، مانند جیپیتی، در زبان انگلیسی برتری دارند، اما اغلب در زبان ژاپنی به دلیل تفاوت در سیستم الفبا، دادههای محدود و سایر عوامل دچار کاستی هستند.
تعصب زبان انگلیسی
مدلهای زبانی بزرگ به طور معمول از حجم عظیمی از دادهها و منابع در دسترس عموم برای یادگیری الگوهای گفتار و نثر طبیعی استفاده میکنند. آنها آموزش میبینند که کلمه بعدی را بر اساس کلمات قبلی در یک متن پیشبینی کنند. اکثریت قریب به اتفاق متنی که مدل قبلی چت جیپیتی یعنی جیپیتی -۳ (GPT-۳)، براساس آن آموزش داده شده بود، به زبان انگلیسی بود.
توانایی قابل توجه چت جیپیتی در برقراری مکالمات مشابه انسان، هم محققان را خوشحال و هم نگران کرده است. برخی آن را یک ابزار بالقوه برای صرفه جویی در نیروی کار میدانند در حالی که دیگران نگران هستند که از آن برای ساخت مقالات یا دادههای علمی استفاده شود.
در ژاپن، این نگرانی وجود دارد که سیستمهای هوش مصنوعی آموزشدیده بر روی مجموعههای داده به زبانهای دیگر نتوانند پیچیدگیهای زبان و فرهنگ ژاپن را درک کنند. ساختار جملات در زبان ژاپنی کاملا متفاوت از انگلیسی است. بنابراین چت جیپیتی باید یک درخواست ژاپنی را به انگلیسی ترجمه کند، پاسخ را بیابد و سپس پاسخ را به ژاپنی ترجمه کند.
در حالی که زبان انگلیسی تنها ۲۶ حرف دارد، زبان ژاپنی نوشتاری متشکل از دو مجموعه ۴۸ حرفی اصلی، به علاوه ۲۱۳۶ نویسه چینی یا کانجی است که به طور منظم استفاده میشود. اکثر کانجیها دو یا چند تلفظ دارند و ۵۰ هزار کانجی دیگر وجود دارد که به ندرت استفاده میشود. با توجه به این پیچیدگی، جای تعجب نیست که چت جیپیتی نتواند با این زبان دست و پنجه نرم کند.
ساکاگوچی میگوید در زبان ژاپنی، چت جیپیتی گاهی اوقات نویسههای بسیار کمیابی تولید میکند که اکثر مردم هرگز آنها را ندیدهاند و در نتیجه کلمات ناشناخته عجیب و غریب بهوجود میآید.
هنجارهای فرهنگی
برای اینکه یک مدل زبانی بزرگ مفید و حتی از نظر تجاری قابل دوام باشد، باید فرهنگ و همچنین زبان را به طور دقیق منعکس کند. برای مثال، اگر از چت جیپیتی خواسته شود که یک ایمیل درخواست شغل به زبان ژاپنی بنویسد، ممکن است عبارات استاندارد ادبی را حذف کند و نتیجه آن مانند ترجمهای واضح از انگلیسی به نظر برسد.
برای سنجش میزان حساسیت مدلهای زبانی بزرگ نسبت به فرهنگ ژاپنی، گروهی از محققان راکودا (Rakuda) را راه اندازی کردند. راکودا رتبه بندی است که نشان میدهد مدلهای زبانی بزرگ تا چه اندازه میتوانند به سوالات باز در مورد موضوعات ژاپنی پاسخ دهند.
سم پاساگلیا (Sam Passaglia)، بنیانگذار راکودا و همکارانش، از چت جیپیتی خواستند که روان بودن و تناسب فرهنگی پاسخها را با درخواستهای استاندارد مقایسه کند.
پاساگلیا، فیزیکدان دانشگاه توکیو که مدلهای زبان ژاپنی را مطالعه میکند، میگوید: مسلما مدلهای زبانی بزرگ ژاپنی بهبود زیادی مییابند، اما در حال حاضر آنها بسیار عقبتر از جیپیتی -۴ هستند. او میگوید، اصولا دلیلی وجود ندارد که یک مدل زبانی بزرگ ژاپنی نتواند در آینده برابر با جیپیتی-۴ باشد یا از آن پیشی بگیرد. این از نظر فنی قابل حل است، اما مشکل منابع وجود دارد.
یکی از تلاشها برای ایجاد یک مدل زبانی بزرگ ژاپنی استفاده از ابررایانه ژاپنی فوگاکو (Fugaku) است. فوگاکو که یکی از سریعترینهای جهان است عمدتا مدل زبانی را بر اساس ورودی ژاپنی آموزش میدهد.
با حمایت موسسه فناوری توکیو، دانشگاه توهوکو، فوجیتسو و گروه مراکز تحقیقاتی ریکن (RIKEN) با بودجه دولتی، انتظار میرود مدل زبانی حاصل در سال آینده منتشر شود.
این مدل زبانی بزرگ برخلاف جیپیتی-۴ و سایر مدلهای اختصاصی، به سایر مدلهای زبانی منبع باز ملحق میشود تا کد خود را در دسترس همه کاربران قرار دهد. به گفته ساکاگوچی، که در این پروژه مشارکت دارد، محققان امیدوارند دستکم ۳۰ میلیارد پارامتر به آن بدهد که بر خروجی آن تأثیر میگذارد و میتوانند به عنوان معیاری برای اندازه آن عمل کند.
با این حال، مدل زبانی فوگاکو ممکن است توسط یک مدل حتی بزرگتر جانشین شود.
وزارت آموزش، فرهنگ، ورزش، علم و فناوری ژاپن بودجه ایجاد یک برنامه هوش مصنوعی ژاپنی را که مطابق با نیازهای علمی است، تامین میکند که با یادگیری از تحقیقات منتشر شده، فرضیههای علمی ایجاد کند و به شناسایی اهداف برای تحقیقات سرعت بخشد. این مدل میتواند با ۱۰۰ میلیارد پارامتر شروع به کار کند که کمی بیش از نیمی از اندازه جیپیتی-۳ است و به مرور زمان گسترش مییابد.
ماکوتو تایجی (Makoto Taiji)، معاون مرکز تحقیقات دینامیک بیوسیستم ریکن، در مورد این پروژه میگوید: امیدواریم چرخه تحقیقات علمی را به طور چشمگیری سرعت بخشیم و فضای جستجو را گسترش دهیم. توسعه مدل زبانی بزرگ دستکم ۳۰ میلیارد ین (۲۰۴ میلیون دلار آمریکا) هزینه خواهد داشت و انتظار میرود در سال ۲۰۳۱ به صورت عمومی منتشر شود.
گسترش قابلیتها
دیگر شرکتهای ژاپنی در حال تجاری سازی یا برنامهریزی برای تجاریسازی فناوریهای مدلهای زبانی بزرگ خود هستند.
سازنده ابر رایانه NEC در ماه مه استفاده از هوش مصنوعی مولد خود را بر اساس زبان ژاپنی آغاز کرد و ادعا میکند که این مدل زبانی زمان مورد نیاز برای ایجاد گزارشهای داخلی را ۵۰ درصد و کد منبع نرم افزار داخلی را ۸۰ درصد کاهش میدهد. در ماه ژوئیه، این شرکت شروع به ارائه خدمات هوش مصنوعی با قابلیت شخصیسازی به مشتریان کرد.
ماسافومی اویامادا (Masafumi Oyamada)، محقق اصلی در آزمایشگاههای علوم داده NEC، میگوید که میتوان از آن در طیف وسیعی از صنایع مانند صنایع مالی، حملونقل و تدارکات، توزیع و ساخت استفاده کرد. او اضافه میکند که محققان میتوانند آن را برای نوشتن کد، کمک به نوشتن و ویرایش مقالات و بررسی مقالات منتشر شده موجود استفاده کنند.
در همین حال، شرکت مخابراتی ژاپنی سافتبانک (SoftBank)، حدود ۲۰ میلیارد ین روی هوش مصنوعی مولد آموزش داده شده بر روی متون ژاپنی سرمایه گذاری کرده و قصد دارد سال آینده مدل زبانی بزرگ خود را راهاندازی کند. سافت بانک که ۴۰ میلیون مشتری دارد و با مایکروسافت سرمایه گذار شرکت OpenAI نیز شراکت دارد، میگوید که قصد دارد به شرکتها کمک کند تا کسب و کار خود را دیجیتالی کنند و بهرهوری خود را افزایش دهند. سافت بانک انتظار دارد که مدل زبانی بزرگ آنها توسط دانشگاهها، موسسات تحقیقاتی و سایر سازمانها مورد استفاده قرار گیرد.
در همین حال، محققان ژاپنی امیدوارند که یک چتبات هوش مصنوعی دقیق، موثر و ساخت ژاپن بتواند به سرعت بخشیدن به علم و پر کردن شکاف بین ژاپن و سایر نقاط جهان کمک کند.
تبلیغات متنی
-
ترامپ شبانه درباره توافق با ایران سخنرانی کرد
-
گلزن پرسپولیس، تنها نامزد مایکل برای بوندسلیگا!
-
تصویری از ملاقات وینیسیوس و کیم کارداشیان در پاریس!
-
بگذارید هنرمندان از درد مردم حرف بزنند
-
عکس توجهبرانگیز از وضعیت هماکنون آسمان ایران
-
فال روزانه چهارشنبه ۱۵ بهمن ۱۴۰۴ | فال امروز| Daily Omen
-
دعوت رسمی نتانیاهو از آذربایجان خبرساز شد
-
تصاویر تست پروازی بالگردهای Mi-۲۸ در غرب تهران
-
ستاره پرسپولیسی یاغی شد!
-
دانشمندان راز بازگشت جوانی را کشف کردند
-
توضیحات مهم وزارت خارجه درباره محل مذاکره با آمریکا
-
روسیه برای یکسره شدن توافق ایران و آمریکا بسته پیشنهادی داد
-
آخرین وضعیت بازیگر وضعیت سفید در بیمارستان
-
تصویر بارش شدید و سیلآسای باران در شمال تهران
-
تراکتور، سپاهان و استقلال له میشوند!
-
ترامپ شبانه درباره توافق با ایران سخنرانی کرد
-
عکس توجهبرانگیز از وضعیت هماکنون آسمان ایران
-
تصاویر تست پروازی بالگردهای Mi-۲۸ در غرب تهران
-
روسیه برای یکسره شدن توافق ایران و آمریکا بسته پیشنهادی داد
-
ارتباط ایران با پهپاد ارسالی بر فراز ناو آمریکا قطع شد
-
گزارشی از احتمال انتقال پیام رهبر انقلاب به پوتین توسط لاریجانی
-
مالزی نفتکشهای توقیفی منتسب به ایران را آزاد کرد
-
سکوت هادی چوپان درباره وقایع اخیر شکست
-
نتانیاهو پیش از آغاز مذاکرات، درباره ایران به آمریکا هشدار داد
-
پیغام کاخ سفید درباره مذاکرات بعد از تنش ساعات پیش
-
ایران با کشور همسایه وارد یک معامله عجیب شد
-
یک روایت از علت درخواست ایران برای تغییر محل مذاکره
-
پیغام تلخ علی نصیریان به مردم در تولد ۹۱ سالگیاش
-
علی شمخانی خبر داد: جنگ حتمی است
-
ناو هواپیمابر آمریکا مدعی سرنگونی یک پهپاد ایرانی شد
-
اعزام پهپادهای سپاه برای تعقیب آبراهام لینکلن
-
استعفای وکیل شاکی پرونده «پژمان جمشیدی»
-
ساعدینیا بازداشت و تمام اموال وی مصادره شد
-
پدیده دنیای مداحان در شبکه سه رونمایی شد
-
طراحی پوستر سفر کاریِ سعید جلیلی جلبتوجه کرد
-
زمان دیدار ویتکاف و عراقچی در استانبول مشخص شد
-
تصمیم جدید درباره حقوق کارکنان دولت در سال ۱۴۰۵
-
نیروهای ویژه آمریکا در دیگو گارسیا مستقر شدند
-
حامد بهداد و بهنوش طباطبایی دعوت جشنواره را پس فرستادند
-
حجت اشرفزاده همکاری با صداوسیما را متوقف کرد
-
تصاویری از آتشسوزی گسترده در غرب تهران
-
الناز شاکردوست از سینما خداحافظی کرد
-
مقام روسی: پیامهای آمریکا به ایران، اولتیماتوم هستند
-
هدف احتمالی ترامپ از «محاصره دریایی ایران» فاش شد
-
واکنش تند پدیده استقلال به برنامه شبکه افق
بانک اطلاعات مشاغل تهران و کرج
-
سالن های آرایش و زیبایی
-
پزشکان پوست و مو
-
آموزشگاه آشپزی در تهران
-
گالری پوشاک
-
اخذ ویزا
-
کاشت ناخن
-
محصولات پزشکی
-
تدریس خصوصی
-
مزون و شوی لباس
-
اعزام دانشجو
-
خدمات آرایشی و زیبایی
-
خدمات درمانی
-
مدارس
-
طلا و جواهر و زیورآلات
-
صرافی
-
محصولات آرایش و زیبایی
-
خدمات حیوانات خانگی
-
مهد کودک
-
مبلمان
-
سیسمونی و نوزاد
-
مراکز درمانی
-
پت شاپ
-
رستوران و تهیه غذا
-
تعمیرات مبل در تهران
-
خدمات تفریح و سرگرمی
-
پزشکان متخصص
-
باشگاه های ورزشی
-
فست فودهای تهران
-
سرویس خواب
-
موبایل
-
دکتر زنان در تهران
-
فروشگاه ها و لوازم ورزشی
-
کافی شاپ و سفره خانه
-
دکوراسیون داخلی
-
لوازم خانگی
-
دندانپزشکان
-
آموزشگاه ها
-
صنایع غذایی
-
تزیینات داخلی
-
خدمات منزل
-
دندانپزشکی کودک
-
آموزشگاه زبان در تهران
-
تشریفات و موسسه پذیرایی
-
خدمات ساختمان
-
فروش و خدمات خودرو
-
پزشکان زیبایی و لاغری
-
آموزشگاه موسیقی
-
خدمات مجالس
-
قالیشویی در تهران
-
سایر خدمات
-
جراحی بینی و زیبایی
-
آموزشگاه هنری
-
آتلیه عکاسی
-
آژانس مسافرتی و هتل
ارسال نظر