الگوريتم برت (Google BERT) چيست؟

۶۳ بازديد

گوگل برت درك موتور جستجو از زبان انسان‌ها را افزايش مي‌دهد. در واقع برت براي رفع نياز جستجوگران ساخته شده است. هر كسي موقع سرچ مطلب مورد نظر خود، با زبان خودش موضوع را عنوان مي‌كند و گوگل با كمك اين الگوريتم تطابق بين عبارت درخواست شده‌ي كاربر و محتوايي كه واقعا نياز دارد را ايجاد مي‌كند.

BERT مخفف عبارت Representations Encoder Bidirectional from Transformers است.

“برت يك شبكه عصبي اينترنتي است كه باعث مي‌شود گوگل بافت كلمات را بشناسد و زبان سرچ كاربران را به درستي تحليل كند.“

 

شبكه عصبي يا Neural networks چيست؟ 

شبكه‌ي عصبي مجموعه‌اي از دستورات و كدهايي است كه براي تشخيص الگوهاي سرچ و زبان طراحي شده‌اند. دسته‌بندي محتواي تصاوير، تشخيص دست‌خط و حتي پيش‌بيني ترندهاي بازارهاي مالي، برنامه‌هاي رايج در دنياي واقعي براي شبكه‌هاي عصبي هستند. البته برنامه‌هاي كاربردي سرچ مثل مدل‌هاي كليكي در گروه شبكه عصبي قرار نمي‌گيرند.

 

NLP چيست؟ 

الگوريتم برت، مدلي از پردازش زبان طبيعي NLP است. NLP يكي از حوزه‌اي هوش مصنوعي است كه هنگام مطالعات تعاملات انساني و زبان‌هاي محاسباتي با زبان‌شناسي همگرا مي‌شود. هدف آن هم از بين بردن شكاف‌هاي بين يك زبان با زباني ديگر است تا تمام افراد بتوانند با هم ارتباط برقرار كنند. اين سيستم از زمان كار آلن تورينگ در دهه 1950 ميلادي براي مدت زيادي وجود داشته است.

اما در دهه 1980 بود كه دست‌نوشته‌هاي مدل‌هاي NLP وارد حوزه كاري هوش مصنوعي شدند. از آن زمان، كامپيوترها حجم زيادي از داده‌ها را پردازش مي‌كنند كه همين آناليز داده، باعث برپا شدن يك انقلاب بزرگ در روابط انساني و ماشين‌ها شده است.

شايد در زندگي روزمره خود متوجه آن نباشيم، اما بيان كلامي ما بسيار پيچيده و متنوع است. زبان‌ها، قواعد، روابط معنايي، عاميانه‌ها، نقل‌قول‌ها، اختصارات و اشتباهات روزانه آنقدر زياد است كه حتي در برخي موارد خود ما انسان‌ها هم يكديگر را درك نمي‌كنيم.

در اين شرايط قطعا كار كامپيوترها سخت‌تر مي‌شود، چون عملا زبان ما ساختاري ندارد كه آن‌ها بتوانند كلمات و عبارات ما را درك كنند. بنابراين نياز دارند تا از سيستم‌هايي براي درك آن كمك بگيرند. يكي از اين سيستم‌ها كه كارآيي فوق‌العاده‌اي هم دارد، NLP است كه از تكنيك‌هايي مثل تفكيك مطالب نامربوط در متن، تصحيح غلط‌هاي املايي، كاهش كلمات ريشه‌اي يا مصدرها استفاده مي‌كند.

از طريق اين هوش مصنوعي مي‌توانيم محتوا را ساختار، بخش‌بندي و دسته‌بندي كنيم تا بفهميم چطور بخش‌هاي مختلف با هم ارتباط دارند. سپس پاسخي را به زبان طبيعي براي تعامل با كاربر توليد مي‌كند كه تا حد زيادي جواب كاربر را شرح مي‌دهد.

NLPاي مثل الگوريتم برت به شما اجازه مي‌دهد كه مثلا به دستگاه هوشمندي مثل الكسا بگوييد: ((الكسا! موسيقي همه‌ي اون روزا گذشت رضا صادقي رو پخش كن.)) و الكسا هم همان موسيقي را براي شما پخش كند.

NLP در حال حاضر در منابع متعددي مثل تعامل با چت بات‌ها، ترجمه خودكار متن‌ها، تجزيه و تحليل احساسات در نظارت بر سوشال مديا و حتي سيستم سرچ گوگل استفاده مي‌شود.

 

نحوه عملكرد الگوريتم برت 

يكي از تفاوت‌هاي بزرگ گوگل با ساير سيستم‌هاي پردازش زبان، ويژگي دو طرفه بودن آن است. بقيه سيستم‌ها فقط يك طرفه هستند. يعني فقط مي‌توانند كلمات را با كمك عباراتي كه در سمت چپ يا راست آن‌ها در متن قرار دارند، توصيف كنند.

گوگل برت در هر دو قطب كار مي‌كند: متن سمت راست و چپ كلمه را تجزيه و تحليل مي‌كند. همين مسئله باعث مي‌شود درك بسيار عميق‌تري از روابط بين اصطلاحات و جملات به وجود بيايد.

تفاوت بعدي اين است كه Google BERT با بررسي يك مجموعه متن كوچك، يك مدل زبان را مي‌سازد.

اما مدل‌هاي ديگر براي اين كار نياز به مقادير زيادي داده براي آموزش يادگيري ربات‌ها دارد. رويكرد دو قطبي برت به شما كمك مي‌كند با داده‌هاي بسيار كمتر و دقت بيشتر الگوريتم و سيستم را به راه بياندازيد.

بنابراين زماني كه مدل الگوريتم برت نظر در يك مجموعه متني منبع، مثل ويكي پديا آموزش داده شد، از طريق ” fine tuning” به كار مي‌افتد.

در اين مرحله، برت با توجه ورودي‌ها و خروجي‌هاي الگوريتم، به سمت فرآيند پيدا كردن محتواي مناسب مي‌رود.

 

“الگوريتم برت در بسياري از برنامه‌ها قابل استفاده است، پس كاربرد آن به طور گسترده در سيستم موتورهاي جستجو تعريف مي‌شود.”

تا كنون نظري ثبت نشده است
ارسال نظر آزاد است، اما اگر قبلا در مونوبلاگ ثبت نام کرده اید می توانید ابتدا وارد شوید.