بررسي فناوري نوين گوگل در عرصه جستجوي وب گراف دانش، مغز متفكر جستجوگر گوگل

 

مخزني از اطلاعات كه به آن لقب گراف دانش (Knowledge Graph) داده‌اند در حال اضافه كردن مفاهيم و جزئيات سودمند به جدولي از لينك‌هاست كه به گوگل سرويس مي‌دهد. از اين فناوري مي‌توان براي جستجو درباره افراد خاص، اماكن يا همه آن چيزهايي كه شما به‌دنبال آن هستيد، استفاده كرد. گراف دانش در حال حاضر آماده ارائه خدمات در برخي محصولات گوگل است و مي‌تواند به منظور جمع‌آوري اطلاعات براي تمامي شركت‌هاي نرم‌افزاري مورد استفاده قرار گيرد.ششيدر تاكور (Shashidar Thakur)، سرپرست فناوري گراف دانش در تيم جستجوي گوگل گفت: «در حال حاضر جستجوها، بيشتر براساس كلمات و عبارات است و نه معناي دقيق آنها و اين پروژه براي تغيير همين روش است.»گراف دانش به عنوان يك پايگاه داده بزرگ مي‌تواند به نرم‌افزارهاي گوگل اجازه‌ مرتبط كردن مطالب و مفاهيم مربوط به افراد، اماكن و موضوعات ديگر را با هم بدهد. گوگل پروژه گراف دانش را سال 2010، هنگامي آغاز كرد كه شركت Metaweb را كه يك پايگاه اطلاعات جامع بود، خريداري كرد. در آن زمان منابع اين پايگاه داده شامل 12 ميليون مدخل بود اما امروزه بيش از 500 ميليون مدخل با بيش از 5‌/‌3 ميليارد لينك بين آنها وجود دارد.يك ذخيره‌ساز دانش در هر جاي جهان بايد به افراد براي پيدا كردن موضوع مورد نظرشان كمك كند. تاكور گفته است: گراف دانش در حال حاضر به يوتيوب متصل است تا ويدئوها را به ترتيب عناوين‌شان مرتب كند و فيلم‌هاي جديد را بر اساس آنچه كاربران مي‌خواهند ببينند به آنها پيشنهاد دهد. تاكور افزود: همچنين مي‌توان از گراف دانش جهت مرتبط كردن و معرفي مقالات خبري براساس موضوعات خاصي كه در اين گزارش‌هاي خبري مطرح شده استفاده كرد. به گفته وي،گراف دانش يك منبع بسيار جامع است؛ حقايقي كه ما مي‌توانيم به آن مراجعه كنيم.وقتي در حالت عادي افراد در گوگل جستجو مي‌كنند، نتايج به‌دست آمده براساس الگوريتمي خواهد بود كه به‌جاي توجه به معاني اطلاعاتي كه در قسمت جستجو نوشته مي‌شود، بر الفاظ توجه دارد. الگوريتم كنوني گوگل براي پاسخ به يك درخواست جستجو ابتدا به جستجوهاي قبلي مراجعه مي‌كند تا تصميم بگيرد كدام كلمه در عبارت پرسش شده، مي‌تواند مهم‌تر باشد (براساس اين‌كه هر كدام چند بار در جستجوهاي قبلي مورد استفاده جستجوگران قرار گرفته‌ است). در مرحله بعدي، نرم‌افزار به فهرستي از صفحات وب شناخته شده كه شامل اطلاعات مربوط به عبارات مورد نظر است و به صورت شاخص(index) برگردان شده‌ است، دسترسي مي‌يابد. در نهايت، يك محاسبه ديگر براي مرتب كردن نتايج و نمايش آن به جستجوگر صورت مي‌گيرد. اگر شانس ياري كند، فرد مي‌تواند اطلاعات مورد نظرش را در يكي از اين صفحات وب پيدا كند.رويكرد جديد گوگل اين است كه آنچه افراد درباره آن پرسش كرده‌اند، در سطح بالاتري تفسير و به اطلاعات مربوط به صورت مستقيم دسترسي پيدا كند، كه همه اين موارد با استفاده از گراف دانش ممكن خواهد بود.با اين حال، هنوز از دانسته‌هاي مربوط به جستجوهاي پيشين براي تعيين اين نكته كه كدام اطلاعات مناسب هستند استفاده مي‌شود. براي مثال، افراد اغلب كلمه «بازيگران» را براي جستجوي نمايش تلويزيوني وارد مي‌كنند، بنابراين معمولا بازيگراني توسط گراف دانش فهرست مي‌شوند كه فيلم آنها بيشتر مورد توجه جستجوگران بوده‌ است.تاكور مي‌گويد: اين يك فرآيند يادگيري است. سوالاتي كه افراد مطرح مي‌كنند به ما مي‌گويد آنها به چه چيزهايي علاقه‌مندند. همچنين اين امر به گوگل در كشف لينك‌هاي جديد ميان مفاهيم مختلف در گراف دانش كمك مي‌كند. تعداد مدخل‌ها و تعداد لينك‌هاي بين آنها در گراف دانش در حال افزايش است؛ اين نكته‌اي است كه تاكور به آن اشاره كرده است، بدون آن‌كه از سرعت اين افزايش نام ببرد.تاكور نگفت كه گراف دانش در آينده در كجا مورد استفاده قرار مي‌گيرد، اما به نظر مي‌رسد اين فناوري در بسياري از محصولات گوگل ارائه شود. پيشگامان وب مانند تيم برنز ـ لي (Tim Berners-Lee) بحث مفصلي درخصوص ايده «وب معنايي» انجام داد. وب معنايي جايي است كه نرم‌افزار مي‌تواند معناي اطلاعات آنلاين را پردازش كند و به نظر مي‌رسد گراف دانش گام مهمي براي رسيدن به اين هدف است.بــا اين حـــــال، كينگــــــزلي آيدن (Kingsley Idehen)، نيانگذار شركت فناوري معنايي OpenLink Software، مي‌گويد: گراف دانش واقعا به پيشرفت وب معنايي كمك چنداني نمي‌كند؛ زيرا با اين‌كه براي گردآوري‌ اين گراف از داده‌هاي باز مانند ويكي پديا و فري‌بيس (Freebase) استفاده شده است، اين گراف يك دسترسي آزاد نيست. آيدن افزود: اگر گوگل گراف دانش خود را براي استفاده ديگران باز كند، آن‌گاه وب به طور سراسري بسيار دقيق‌تر خواهد شد.

او مي‌گويد: آنها بعمد راه حل را به صورت بسته منتشر كرده‌اند. اين را با منبع دانش شخصي فيس‌بوك كه به عنوان يك گراف بازشناخته مي‌شود، مقايسه كنيد؛ يك منبع عمومي كه مي‌توان براي دسترسي به اطلاعات موسيقي، فيلم، دسته‌بندي‌ها و... از آن استفاده كرد. آيدن مي‌گويد: در واقع چنين راه‌حل‌هاي بازي- open solutions - به تحول وب به سوي يك فضاي داده‌اي عمومي ياري مي‌كند.سخنگوي گوگل اشاره‌اي به بازكردن منابع گراف دانش نكرد، اما گفت كه برخي از آنچه در اين گراف وجود دارد براي مردم و نرم‌افزارها در فري‌بيس(Freebase) به صورت رايگان قابل دسترسي است. فري‌بيس سايتي است كه توسط شركت Metaweb قبل از خريداري شدن توسط گوگل ساخته شده است. البته بايد گفت فري‌بيس ساده‌تر از گراف دانش است. همچنين گوگل يكي از تامين‌كنندگان اصلي طرح ويكي‌ديتا ـ‌كه پايه‌ و اساس ويكي‌پدياست ـ از نظر مالي است. ويكي‌ديتا درصدد ساخت يك منبع از دسترسي اتوماتيك دانش است كه مي‌تواند بسيار گسترده باشد، اگر مانند ويكي‌پديا فعال شود.به گوگل برگرديم تاكور مي‌گويد اولويت او در حال حاضر، پيدا كردن راه‌هايي براي استفاده از گراف دانش براي پاسخ دادن به سوالات پيچيده‌تر است؛ بسياري از اين سوالات، ساده‌تر از رقابت با موتور دانش ولفرم آلفا* است. همچنين تاكور گفت: در حال حاضر ما در حال پاسخگويي به سوالاتي درباره موجوديت‌ها(entity) هستيم، اما پرسش‌هاي سخت‌تري هم مانند سوال درباره آتشفشان‌هاي منفجر شده در قرن هجدهم يا فيلم‌هايي كه براساس كتاب‌ها ساخته شده‌ است، وجود دارد.

***

همه اين تلاش‌ها براي ارتقاي كيفيت و سهولت دسترسي كاربران به وب است. تلاش‌هايي كه براي ديدن نتايجش بايد به آينده چشم دوخت.

منبع: www.technologyreview.com

 

پانوشت:

*‌ ولفرم آلفا (Wolfram Alpha): يك موتور محاسباتي دانش است كه توسط ولفرم ريسرچ ايجاد شده ‌است. اين مرورگر برخلاف ديگر مرورگر كه معمولا گزيده‌اي از وب را در اختيار شما مي‌گذارد، اطلاعات را پردازش مي‌كند و سپس در اختيار كاربر قرار مي‌دهد.





تاريخ : چهار شنبه 21 تير 1391برچسب:, | | نویسنده : مقدم |