Google LaMDA: مدل زبانی برای برنامه‌های گفتگو چگونه کار می‌کند

Google LaMDA به افرادی مانند BERT و MUM می‌پیوندد تا به ماشین‌ها کمک کند تا نیت کاربر را بهتر درک کنند. نحوه کار و پیامدهای آن برای سئو را ببینید.
ایجاد یک مدل زبان توسط گوگل چیز جدیدی نیست. در واقع، Google LaMDA به شرکت‌هایی مانند BERT و MUM می‌پیوندد تا راهی برای ماشین‌ها برای درک بهتر هدف کاربر .
گوگل چندین سال است که در مورد مدل‌های مبتنی بر زبان تحقیق کرده است ، به این امید که مدلی را آموزش دهد که اساسا بتواند یک مکالمه روشن‌فکر و منطقی در مورد هر موضوعی داشته باشد.
به نظر می رسد تا کنون، Google LaMDA نزدیک ترین به رسیدن به این نقطه عطف باشد.
LaMDA که مخفف Language Models for Dialog Application است، به منظور ایجاد امکان تعامل بهتر نرم افزار در یک مکالمه روان و طبیعی ایجاد شده است.
LaMDA بر اساس معماری ترانسفورماتور مشابه سایر مدل های زبان مانند BERT و GPT-3 است.
با این حال، به دلیل آموزش، LaMDA می تواند سوالات و مکالمات ظریفی را که چندین موضوع مختلف را پوشش می دهد، درک کند.
در مدل‌های دیگر، به دلیل ماهیت باز بودن مکالمات، می‌توانید با وجود تمرکز اولیه روی یک موضوع، در مورد چیزی کاملاً متفاوت صحبت کنید.
این رفتار به راحتی می تواند اکثر مدل های مکالمه و چت بات ها را گیج کند.
در طی اعلامیه Google I/O سال گذشته، دیدیم که LaMDA برای غلبه بر این مشکلات ساخته شده است.
این نمایش ثابت کرد که چگونه مدل می تواند به طور طبیعی مکالمه ای را در مورد موضوعی تصادفی انجام دهد.
علیرغم انبوهی از سوالات مرتبط، مکالمه در مسیر خود باقی ماند که دیدن آن شگفت انگیز بود.
LaMDA بر روی شبکه عصبی منبع باز گوگل، Transformer ساخته شده است که برای درک زبان طبیعی استفاده می شود.
این مدل برای یافتن الگوها در جملات، همبستگی بین کلمات مختلف استفاده شده در آن جملات، و حتی پیش‌بینی کلمه‌ای که احتمالاً بعدی است، آموزش دیده است.
این کار را با مطالعه مجموعه داده‌های متشکل از دیالوگ به جای کلمات منفرد انجام می‌دهد.
در حالی که یک سیستم هوش مصنوعی محاوره ای شبیه به نرم افزار چت بات است، تفاوت های کلیدی بین این دو وجود دارد.
به عنوان مثال، چت بات ها بر روی مجموعه داده های محدود و خاص آموزش می بینند و فقط می توانند مکالمه محدودی بر اساس داده ها و سوالات دقیقی که روی آن ها آموزش داده شده است داشته باشند.
از سوی دیگر، از آنجایی که LaMDA بر روی چندین مجموعه داده مختلف آموزش دیده است، می‌تواند مکالمه‌های پایانی داشته باشد.
در طول فرآیند آموزش، تفاوت های ظریف گفتگوی پایان باز را متوجه می شود و سازگار می شود.
بسته به جریان مکالمه، می‌تواند به سؤالات درباره موضوعات مختلف پاسخ دهد.
بنابراین، مکالماتی را فعال می کند که حتی بیشتر از آنچه که ربات های چت اغلب می توانند ارائه دهند، شبیه به تعامل انسانی است.
گوگل توضیح داد که LaMDA دارای یک فرآیند آموزشی دو مرحله‌ای است که شامل پیش‌آموزش و تنظیم دقیق می‌شود.
در مجموع، این مدل بر روی 1.56 تریلیون کلمه با 137 میلیارد پارامتر آموزش داده شده است.
برای مرحله قبل از آموزش، تیم گوگل مجموعه داده ای از 1.56T کلمه را از چندین سند عمومی وب ایجاد کرد.
سپس این مجموعه داده توکنیزه می‌شود (به رشته‌ای از کاراکترها برای ساختن جمله‌ها تبدیل می‌شود) به توکن‌های 2.81T، که در ابتدا مدل بر روی آنها آموزش داده می‌شود.
در طول پیش‌آموزش، مدل از موازی‌سازی عمومی و مقیاس‌پذیر برای پیش‌بینی بخش بعدی مکالمه بر اساس نشانه‌های قبلی استفاده می‌کند.
LaMDA برای انجام وظایف تولید و طبقه بندی در مرحله تنظیم دقیق آموزش دیده است.
اساساً، مولد LaMDA، که بخش بعدی گفتگو را پیش‌بینی می‌کند، چندین پاسخ مرتبط را بر اساس مکالمه پشت سر هم ایجاد می‌کند.
سپس طبقه‌بندی‌کننده‌های LaMDA امتیازات ایمنی و کیفیت را برای هر پاسخ احتمالی پیش‌بینی می‌کنند.
هر پاسخی با امتیاز ایمنی پایین قبل از انتخاب پاسخ با امتیاز بالا برای ادامه مکالمه فیلتر می‌شود.
نمرات بر اساس ایمنی، حساسیت، ویژگی و درصدهای جالب است.
هدف اطمینان از ارائه مرتبط ترین، با کیفیت بالا و در نهایت ایمن ترین پاسخ است.
سه هدف اصلی برای مدل برای هدایت آموزش مدل تعریف شده است.
اینها کیفیت، ایمنی و پایه بودن هستند.
این بر اساس سه بعد ارزیابی انسان است:
امتیاز کیفیت برای اطمینان از اینکه پاسخ در زمینه ای که استفاده می شود معنادار است استفاده می شود، که برای سوال پرسیده شده خاص است و به اندازه کافی روشنگر برای ایجاد گفتگوی بهتر در نظر گرفته می شود.
برای اطمینان از ایمنی، این مدل از استانداردهای هوش مصنوعی مسئول پیروی می کند. مجموعه ای از اهداف ایمنی برای ثبت و بررسی رفتار مدل استفاده می شود.
این تضمین می کند که خروجی هیچ پاسخ ناخواسته ای ارائه نمی دهد و از هرگونه سوگیری جلوگیری می کند.
مبنایی بودن به عنوان «درصد پاسخ‌هایی که حاوی ادعاهایی درباره دنیای بیرونی هستند» تعریف می‌شود.
این برای اطمینان از اینکه پاسخ‌ها تا حد امکان دقیق هستند استفاده می‌شود و به کاربران امکان می‌دهد اعتبار یک پاسخ را بر اساس قابلیت اطمینان منبع آن قضاوت کنند.
از طریق یک فرآیند مداوم از کمی‌سازی پیشرفت، پاسخ‌های مدل از پیش آموزش‌دیده، مدل دقیق تنظیم‌شده و ارزیابی‌کننده‌های انسانی، برای ارزیابی پاسخ‌ها در برابر معیارهای کیفیت، ایمنی و پایه‌ای فوق‌الذکر بررسی می‌شوند.
آنها تاکنون به این نتیجه رسیده اند که:
در حالی که هنوز کار بدون تاریخ انتشار نهایی در حال انجام است، پیش‌بینی می‌شود که LaMDA در آینده برای بهبود تجربه مشتری و فعال کردن چت‌بات‌ها برای ارائه مکالمه‌ای شبیه به انسان مورد استفاده قرار گیرد.
علاوه بر این، استفاده از LaMDA برای پیمایش جستجو در موتور جستجوی Google یک امکان واقعی است.
با تمرکز بر زبان و مدل‌های مکالمه، گوگل بینشی در مورد دیدگاه خود برای آینده جستجو ارائه می‌کند و تغییر در نحوه توسعه محصولاتش را برجسته می‌کند.
این در نهایت به این معنی است که ممکن است تغییری در رفتار جستجو و روش جستجوی کاربران برای محصولات یا اطلاعات ایجاد شود.
گوگل دائماً روی بهبود درک هدف جستجوی کاربران کار می کند تا مطمئن شود که آنها مفیدترین و مرتبط ترین نتایج را در SERP دریافت می کنند.
مدل LaMDA بدون شک ابزاری کلیدی برای درک سوالاتی است که جستجوگران ممکن است بپرسند.
همه اینها نیاز به اطمینان از بهینه سازی محتوا برای انسان ها به جای موتورهای جستجو را برجسته می کند.
اطمینان از اینکه محتوا محاوره ای است و با مخاطب هدف شما نوشته می شود، به این معنی است که حتی با پیشرفت گوگل، محتوا می تواند به عملکرد خوبی ادامه دهد.
همچنین مهم است که به طور منظم محتوای همیشه سبز را به روز کنید تا اطمینان حاصل کنید که با گذشت زمان تکامل می یابد و مرتبط باقی می ماند.
مهندسان محقق گوگل در مقاله‌ای با عنوان « بازاندیشی جستجو: ساختن متخصصان از دیلتان‌ها» به اشتراک گذاشتند که چگونه پیش‌بینی می‌کنند پیشرفت‌های هوش مصنوعی مانند LaMDA «جستجو به‌عنوان گفتگو با متخصصان» را بیشتر تقویت کند.
آنها مثالی را در مورد سوال جستجو به اشتراک گذاشتند، "مزایا و خطرات شراب قرمز برای سلامتی چیست؟"
در حال حاضر، گوگل یک لیست جعبه پاسخ از نقاط گلوله را به عنوان پاسخ به این سوال نمایش می دهد.
با این حال، آنها پیشنهاد می کنند که در آینده، پاسخ ممکن است پاراگرافی باشد که مزایا و خطرات شراب قرمز را با پیوندهایی به اطلاعات منبع توضیح می دهد.
بنابراین، اطمینان از پشتیبان‌گیری محتوا توسط منابع خبره مهم‌تر از همیشه خواهد بود که Google LaMDA نتایج جستجو را در آینده ایجاد کند.
مانند هر مدل هوش مصنوعی، چالش هایی وجود دارد که باید به آنها پرداخت.
دو چالش اصلی که مهندسان با Google LaMDA با آن روبرو هستند، ایمنی و زمینی بودن است.
از آنجایی که می‌توانید پاسخ‌ها را از هر کجای وب دریافت کنید، این احتمال وجود دارد که خروجی بایاس را تقویت کند و مفاهیمی را که به صورت آنلاین به اشتراک گذاشته می‌شود، منعکس کند.
مهم است که مسئولیت در ابتدا با Google LaMDA باشد تا اطمینان حاصل شود که نتایج غیرقابل پیش بینی یا مضر ایجاد نمی کند.
برای کمک به غلبه بر این، گوگل منابعی را که برای تجزیه و تحلیل و آموزش داده ها استفاده می شود، منبع باز کرده است.
این امر گروه‌های مختلف را قادر می‌سازد تا در ایجاد مجموعه داده‌های مورد استفاده برای آموزش مدل، کمک به شناسایی سوگیری‌های موجود، و به حداقل رساندن هرگونه اطلاعات مضر یا گمراه‌کننده از اشتراک‌گذاری شرکت کنند.
تأیید اعتبار پاسخ‌هایی که مدل‌های هوش مصنوعی تولید می‌کنند آسان نیست، زیرا منابع از سراسر وب جمع‌آوری می‌شوند.
برای غلبه بر این چالش، تیم این مدل را قادر می‌سازد تا با چندین منبع خارجی، از جمله سیستم‌های بازیابی اطلاعات و حتی یک ماشین حساب، مشورت کند تا نتایج دقیق ارائه کند.
متریک Groundedness که قبلاً به اشتراک گذاشته شد همچنین اطمینان حاصل می کند که پاسخ ها در منابع شناخته شده است. این منابع به اشتراک گذاشته شده اند تا کاربران بتوانند نتایج داده شده را تایید کنند و از انتشار اطلاعات نادرست جلوگیری کنند.
Google واضح است که مزایا و خطراتی برای مدل‌های گفتگوی پایان باز مانند LaMDA وجود دارد و متعهد است که ایمنی و پایه بودن را بهبود بخشد تا تجربه مطمئن‌تر و بی‌طرف‌تری را تضمین کند.
آموزش مدل‌های LaMDA بر روی داده‌های مختلف، از جمله تصاویر یا ویدیوها، چیز دیگری است که ممکن است در آینده شاهد آن باشیم.
این امکان را برای پیمایش حتی بیشتر در وب با استفاده از درخواست‌های مکالمه باز می‌کند.
ساندار پیچای، مدیرعامل گوگل درباره LaMDA گفت: "ما معتقدیم که قابلیت های مکالمه LaMDA این پتانسیل را دارد که اطلاعات و محاسبات را به طور اساسی در دسترس تر و استفاده آسان تر کند."
در حالی که تاریخ عرضه هنوز تایید نشده است، بدون شک مدل هایی مانند LaMDA آینده گوگل خواهند بود.
منابع بیشتر:
تصویر ویژه: آندری سوسلوف / شاتر استوک
خبرنامه روزانه ما را از لورن بیکر بنیانگذار SEJ در مورد آخرین اخبار در صنعت دریافت کنید!
روث مدیر برنامه ها و داده ها در Code First Girls است و وقت خود را صرف مدیریت برنامه های کدنویسی می کند و … [بیو کامل را بخوانید]
برای دریافت آخرین اخبار صنعت در خبرنامه روزانه ما مشترک شوید.
برای دریافت آخرین اخبار صنعت در خبرنامه روزانه ما مشترک شوید.

source
سئو سایت

About mohtavaclick

Check Also

7 روش برای اصلاح محتوای خود برای سئوی بهتر

آیا فرصت های ساده ای را برای بهبود بهینه سازی محتوای خود از دست می …

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

قالب وردپرس وردپرس متخصص وردپرس متخصص ووکامرس افزونه وردپرس کابین وردپرس