گوگل برت درك موتور جستجو از زبان انسانها را افزايش ميدهد. در واقع برت براي رفع نياز جستجوگران ساخته شده است. هر كسي موقع سرچ مطلب مورد نظر خود، با زبان خودش موضوع را عنوان ميكند و گوگل با كمك اين الگوريتم تطابق بين عبارت درخواست شدهي كاربر و محتوايي كه واقعا نياز دارد را ايجاد ميكند.
BERT مخفف عبارت Representations Encoder Bidirectional from Transformers است.
“برت يك شبكه عصبي اينترنتي است كه باعث ميشود گوگل بافت كلمات را بشناسد و زبان سرچ كاربران را به درستي تحليل كند.“
شبكه عصبي يا Neural networks چيست؟
شبكهي عصبي مجموعهاي از دستورات و كدهايي است كه براي تشخيص الگوهاي سرچ و زبان طراحي شدهاند. دستهبندي محتواي تصاوير، تشخيص دستخط و حتي پيشبيني ترندهاي بازارهاي مالي، برنامههاي رايج در دنياي واقعي براي شبكههاي عصبي هستند. البته برنامههاي كاربردي سرچ مثل مدلهاي كليكي در گروه شبكه عصبي قرار نميگيرند.
NLP چيست؟
الگوريتم برت، مدلي از پردازش زبان طبيعي NLP است. NLP يكي از حوزهاي هوش مصنوعي است كه هنگام مطالعات تعاملات انساني و زبانهاي محاسباتي با زبانشناسي همگرا ميشود. هدف آن هم از بين بردن شكافهاي بين يك زبان با زباني ديگر است تا تمام افراد بتوانند با هم ارتباط برقرار كنند. اين سيستم از زمان كار آلن تورينگ در دهه 1950 ميلادي براي مدت زيادي وجود داشته است.
اما در دهه 1980 بود كه دستنوشتههاي مدلهاي NLP وارد حوزه كاري هوش مصنوعي شدند. از آن زمان، كامپيوترها حجم زيادي از دادهها را پردازش ميكنند كه همين آناليز داده، باعث برپا شدن يك انقلاب بزرگ در روابط انساني و ماشينها شده است.
شايد در زندگي روزمره خود متوجه آن نباشيم، اما بيان كلامي ما بسيار پيچيده و متنوع است. زبانها، قواعد، روابط معنايي، عاميانهها، نقلقولها، اختصارات و اشتباهات روزانه آنقدر زياد است كه حتي در برخي موارد خود ما انسانها هم يكديگر را درك نميكنيم.
در اين شرايط قطعا كار كامپيوترها سختتر ميشود، چون عملا زبان ما ساختاري ندارد كه آنها بتوانند كلمات و عبارات ما را درك كنند. بنابراين نياز دارند تا از سيستمهايي براي درك آن كمك بگيرند. يكي از اين سيستمها كه كارآيي فوقالعادهاي هم دارد، NLP است كه از تكنيكهايي مثل تفكيك مطالب نامربوط در متن، تصحيح غلطهاي املايي، كاهش كلمات ريشهاي يا مصدرها استفاده ميكند.
از طريق اين هوش مصنوعي ميتوانيم محتوا را ساختار، بخشبندي و دستهبندي كنيم تا بفهميم چطور بخشهاي مختلف با هم ارتباط دارند. سپس پاسخي را به زبان طبيعي براي تعامل با كاربر توليد ميكند كه تا حد زيادي جواب كاربر را شرح ميدهد.
NLPاي مثل الگوريتم برت به شما اجازه ميدهد كه مثلا به دستگاه هوشمندي مثل الكسا بگوييد: ((الكسا! موسيقي همهي اون روزا گذشت رضا صادقي رو پخش كن.)) و الكسا هم همان موسيقي را براي شما پخش كند.
NLP در حال حاضر در منابع متعددي مثل تعامل با چت باتها، ترجمه خودكار متنها، تجزيه و تحليل احساسات در نظارت بر سوشال مديا و حتي سيستم سرچ گوگل استفاده ميشود.
نحوه عملكرد الگوريتم برت
يكي از تفاوتهاي بزرگ گوگل با ساير سيستمهاي پردازش زبان، ويژگي دو طرفه بودن آن است. بقيه سيستمها فقط يك طرفه هستند. يعني فقط ميتوانند كلمات را با كمك عباراتي كه در سمت چپ يا راست آنها در متن قرار دارند، توصيف كنند.
گوگل برت در هر دو قطب كار ميكند: متن سمت راست و چپ كلمه را تجزيه و تحليل ميكند. همين مسئله باعث ميشود درك بسيار عميقتري از روابط بين اصطلاحات و جملات به وجود بيايد.
تفاوت بعدي اين است كه Google BERT با بررسي يك مجموعه متن كوچك، يك مدل زبان را ميسازد.
اما مدلهاي ديگر براي اين كار نياز به مقادير زيادي داده براي آموزش يادگيري رباتها دارد. رويكرد دو قطبي برت به شما كمك ميكند با دادههاي بسيار كمتر و دقت بيشتر الگوريتم و سيستم را به راه بياندازيد.
بنابراين زماني كه مدل الگوريتم برت نظر در يك مجموعه متني منبع، مثل ويكي پديا آموزش داده شد، از طريق ” fine tuning” به كار ميافتد.
در اين مرحله، برت با توجه وروديها و خروجيهاي الگوريتم، به سمت فرآيند پيدا كردن محتواي مناسب ميرود.
“الگوريتم برت در بسياري از برنامهها قابل استفاده است، پس كاربرد آن به طور گسترده در سيستم موتورهاي جستجو تعريف ميشود.”