پرش به محتوا

وب معنایی

از ویکی‌پدیا، دانشنامهٔ آزاد
کدهای استفاده شده در وبسایت

وب معنایی یک جنبش مشترک است که توسط w3c رهبری می‌شود که فرمت‌های رایج داده را روی شبکه گسترده جهانی ترویج می‌کند. با تشویق به گنجاندن محتوای معنایی در صفحات وب، وب معنایی به تبدیل شدن وب حاضر مشتمل بر اسناد ساختار نایافته به یک «وبی از داده‌ها» کمک می‌کند. این در چارچوب شرح منابع (RDF) از w3c ساخته می‌شود.

بنابر w3c، «وب معنایی یک چارچوب مشترک فراهم می‌آورد که اجازه می‌دهد داده‌ها به اشتراک گذاشته شوند و در سراسر مرزهای کاربردی، اقتصادی و اجتماعی دوباره استفاده شوند.»

این واژه توسط تیم برنرزلی، مخترع وب گسترده جهانی و گرداننده w3c، ابداع شد که هم‌اکنون بر توسعه استانداردهای مطرح شده وب معنایی نظارت دارد. او وب معنایی را این گونه معنی کرد که «تارنمایی از داده که می‌تواند مستقیم و غیر مستقیم توسط ماشین مورد پردازش قرار بگیرد.» درحالی که منتقدان پرسش‌هایی دربارهٔ امکان‌پذیر بودن آن دارند، طرفداران استدلال می‌کنند که برنامه‌های کاربردی در صنعت، زیست‌شناسی و تحقیقات علوم انسانی، در حال حاضر، اعتبار مفهوم اصلی را ثابت کرده‌است.

تعریف

[ویرایش]

ساده‌ترین تعریف برای وب معنایی این است که محتوا و اسناد وب دارای ساختار شوند و این ساختار برای جستجوگرهای اطلاعات قابل درک باشد به‌طور مثال اگر شما در مورد نحوهٔ پخت یک غذا سرچ کردید به‌جای اینکه مرورگر چندین لینک از صفحات مختلف به شما نشان بدهد، مستقیماً دستور پخت آن غذا را باتوجه به اطلاعاتی که از شما به‌دست آورده‌است نمایش دهد. وب معنایی را می‌شود فضایی جهانی از جنس محاسبات هوشمند ماشینی تصوّر کرد که در آن تمامی کتاب‌ها، کتاب‌خانه‌ها، دانشها، دانش‌نامه‌ها و دانشگاه‌ها یا پایگاه‌های دانش (Knowledge bases) به صورتی معنی‌گرا و با توانایی درک مفهومی همدیگر در کنار هم قرار خواهند گرفت. آقای Tim Berners-Lee آینده وب را به صورتی بیان کرده که برخلاف وب کنونی فقط توسط انسان‌ها قابل فهم نباشد بلکه توسط ماشین‌ها نیز قابل درک و پردازش است. در زیر سه تعریف مختلف از وب معنایی ارائه شده‌است:

  • پروژه‌ای با هدف ایجاد رسانه‌ای جهانی برای رد و بدل کردن اطلاعات به صورتی که برای کامپیوتر قابل فهم و پردازش باشد.
  • وب معنایی، شبکه‌ای از اطلاعات در مقیاس جهانی است به نحوی که پردازش آن‌ها توسط ماشین‌ها به سادگی امکان‌پذیر است.
  • وب معنایی شامل داده‌های هوشمند وب است که توسط ماشین‌ها قابل پردازش است.

هر چند نزدیکی به تحقّقّ ایجاد چنان فضایی محتاج پیشرفت‌هایی جدید و کلّی‌نگرانه در بسیاری از زمینه‌های مهندسی، ریاضی، هوش مصنوعی، و به ویژه در زبان‌شناسی، فلسفه، و بسیاری از معارف دیگر انسانی خواهد بود، گام‌های اوّلیّه در این سمت برداشته شده‌است.

نیاز کنونی دنیای IT به وب معنایی

[ویرایش]

در حقیقت نیاز کنونی دنیای IT را با دو مثال می‌توانیم مشخص کنیم مثال اول: شما می‌توانید در سایت گوگل لغت شبکه را جستجو کنید جوابی که گوگل به شما می‌دهد به ترتیب شامل مواردی مثل شبکه هتل‌های ایران شرکت خدمات میزبانی سایت، شبکه کارمندان ایرانی کانادایی شبکه مدرسه سازمان بورس اوراق بهادار و … است که در این جستجو از ۱۷۸٬۰۰۰٬۰۰۰ پاسخ گوگل، بیشتر آن‌ها به درد شما نمی‌خورد از سوی دیگر مواردی که ذکر کردم همگی از جمله مواردی هستند که در صفحه اول پاسخ جستجو دیده می‌شود. مثال دوم: من به دنبال شرکتی می‌گردم که خدمات میزبانی سایت ارائه کند پس در گوگل جستجو می‌کنم خدمات میزبانی سایت و ۲۳۶۰۰۰۰۰ پاسخ دریافت می‌کنم که به‌طور قطع زمان ندارم همه آن‌ها را چک کنم از سوی دیگر می‌دانم که می‌خواهم سرور دارای SQL server باشم نیازمند پشتیبانی ۲۴ ساعته هستم پس این بار جستجو می‌کنم خدمات میزبانی سایت سرور کانادا ارزان پشتیبانی ۲۴ ساعته SQL server و گوگل جوابی ندارد حال اگر من بخواهم علاوه بر موارد فوق میزبان سایت امکان پشتیبانی از پنج زیر دامنه حجم انتقال اطلاعات بیشتر از بیست گیگابایت ارائه تعداد نامحدود آدرس ایمیل و … را داشته باشد چگونه می‌توانم جواب خود را پیدا کنم؟ در حقیقت نیاز دنیای IT اول، دسته‌بندی درست اطلاعات و دوم همگن کردن اطلاعات مربوط به هم و ارائه درست این اطلاعات به کاربر بر اساس نیاز او است.

تاریخچه

[ویرایش]

مفهوم مدل شبکه معنایی در اوایل دهه شصت توسط دانشمند شناختی Allan M.Collins، زبان‌شناس M. Ross Quillian و روان‌شناس Elizabeth F.Loftus در نشریات مختلف به عنوان یک فرم برای نمایش دادن دانش ساخت یافته معنایی، ابداع شد. قراردادن ابردادهٔ قابل خواندن توسط ماشین دربارهٔ صفحات و چگونگی ارتباط آن‌ها با یکدیگر، فعال کردن عامل‌های خودکارشده برای دسترسی هوشمندانه تر وب و انجام وظایف از طرف کاربران موجب گسترش یافتن شبکهٔ صفحات وب ابرپیوند شده گردید که پیش از آن تنها توسط انسان قابل خواندن بود.

خیلی از فناوری‌هایی که توسط w3c مطرح شده‌است قبل از این که زیر چتر w3c قرار بگیرند، وجود داشته‌اند. این‌ها در زمینه‌های مختلف استفاده شده‌ است، به خصوص برخورد با اطلاعاتی است که شامل یک دامنه محدود و تعریف شده‌است، و جایی که داده به اشتراک گذاشته شده یک نیاز مشترک است، مانند تحقیقات علمی یا داده‌های تبدیل شده مابین کسب و کارها. به علاوه، فناوری‌هایی با هدف مشترک، مانند microformatها، ظهور کرده‌اند.

هدف

[ویرایش]

اصلی‌ترین هدف وب معنایی قادر ساختن کاربران برای پیدا کردن، اشتراک گذاشتن و راحت‌تر ترکیب کردن اطلاعات جهت تکامل بخشیدن وب حاضر است. انسان‌ها توانایی استفاده از وب را برای پیش بردن وظایفی مانند پیدا کردن معادل ایرلندی کلمه «پوشه»، رزرو کردن یک کتاب از کتابخانه و جستجو برای پایین‌ترین قیمت یک DVD را دارند. به هرحال، ماشین‌ها نمی‌توانند تمام این وظایف را بدون دستورالعمل انسان انجام دهند، چرا که صفحات وب طوری طراحی شده‌اند که توسط مردم خوانده شود، نه ماشین‌ها. وب معنایی یک چشم‌انداز از اطلاعات است که می‌تواند به آسانی توسط ماشین تفسیر شود، بنابرین ماشین‌ها می‌توانند بسیاری از کارهای خسته‌کننده شامل پیدا کردن، ترکیب کردن و اقدام بر اساس اطلاعات بر روی وب را انجام دهند. وب معنایی، همان‌طور که در ابتدا پیش‌بینی می‌شد، سیستمی است که ماشین‌ها را به کار می‌اندازد که «بفهمند» و به درخواست‌های پیچیده انسان براساس معنای آن‌ها پاسخ دهند. چنین «فهمیدن» مستلزم آن است که منابع اطلاعاتی مربوطِ به‌طور معنایی ساختار یافته شوند، یک کار چالش‌برانگیز. تیم برنز لی در ابتدا چشم‌انداز وب معنایی را این گونه توصیف کرد:

من رؤیایی دارم برای وب که در آن کامپیوترها توانایی تحلیل تمام داده‌های روی وب، مثل محتوا، پیوندها و تراکنش‌های بین مردم و کامپیوترها را دارند. یک وب معنایی، که این امر را ممکن می‌سازد، فعلاً در حال ظهور است، اما زمانی که کامل شود، روال‌های روزانه تجارت، بروکراسی و زندگی روزمره ما توسط گفتگوی بین ماشین‌ها انجام می‌شود. عامل‌های هوشمند بین مردم برای دوره‌ای که نهایتاً این امر محقق شود تبلیغ می‌کنند.

وب معنایی به عنوان یک جمع‌کننده بین تمام محتوی مختلف، سیستم‌ها و برنامه‌های کاربردی اطلاعاتی در نظر گرفته شده‌است. برنامه‌های کاربردی در زمینه نشر، وبلاگ‌نویسی و خیلی سطوح دیگر وجود دارد.

معمولاً واژه‌های معناشناسی، ابرداده، هستی‌شناسی و وب معنایی متناقض استفاده می‌شوند. به‌طور خاص، این واژه‌ها به عنوان کلمات فنی هر روز توسط محققین و پزشکان، جهت پوشش یک گستره وسیعی از زمینه‌های مختلف فناوری، مفاهیم و سطوح برنامه‌های کاربردی استفاده می‌شوند. به علاوه، با توجه به وضعیت فعلی، نسبت به فعال کردن فناوری‌هایی که برای تحقق وب معنایی پیش‌بینی می‌شد، سردرگمی وجود دارد. در یک مقاله که توسط Greber,Barnard, Van der Merwe ارائه شد، چشم‌انداز وب معنایی جدول‌بندی شده و خلاصه‌ای از واژگان و فناوری‌های راه انداز ارائه شده‌است. مدل معماری مطرح شده توسط تیم برنزلی به عنوان مبنایی که مدل وضعیت فناوری‌های حال حاضر و در حال ظهور را ارائه می‌کند، استفاده می‌شود.

محدودیت‌های HTML

[ویرایش]

بسیاری از فایل‌های روی یک کامپیوتر معمولی را می‌توان آزادانه به اسناد قابل خواندن توسط انسان و داده‌های قابل خواندن برای ماشین تقسیم کرد. اسناد مثل پیام نامه‌ها، گزارش‌ها و بروشورها توسط انسان خوانده می‌شود. داده، مثل تقویم، دفترچه آدرس، لیست پخش و صفحات گسترده از یک برنامه کاربردی برای نمایش، جستجو و ترکیب در حالات مختلف استفاده می‌کنند.

در حال حاضر، تارنمای گسترده جهانی عمدتاً بر مبنای اسنادی است که با HTML نوشته شده‌است، یک استاندارد نشانه‌گذاری که برای کدینگ مجموعه‌ای از متن در خلال عناصر چند رسانه‌ای مانند تصاویر و فرم‌های تعاملی استفاده شده‌است. تگ‌های ابر داده روشی را فراهم می‌آورد که هر کامپیوتر می‌تواند محتوی صفحات وب را دسته‌بندی کند. برای مثال:

<meta name="keywords" content="computing, computer studies, computer">
<meta name="description" content="Cheap widgets for sale">
<meta name="author" content="John Doe">

با HTML و ابزاری برای نمایش خروجی آن (مثل مرورگرهای وب) هرکسی می‌تواند صفحه‌ای برای لیست کردن مواردی برای فروش، بسازد و نمایش دهد. HTML این صفحه کاتالوگ می‌تواند اظهاراتی از قبیل "عنوان این سند سوپرمارکت ویجت است" را به ما بدهد، اما این ظرفیت در HTML نیست که واضح اظهار کند که مثلاً کالا شماره X586172 یک Acme Gizmo است با قیمت خرده فروشی €۱۹۹، یا این که یک کالای برای مصرف‌کننده است. بلکه، HTML می‌تواند تنها بگوید که محدوده متن "X586172" چیزی است که باید نزدیک Acme" Gizmo" و "€۱۹۹" قرار می‌گیرد. هیچ راهی وجود ندارد که بگوید "این یک کاتالوگ است" یا حتی تصدیق کردن این که "Acme Gizmo" بخشی از عنوان است یا "€۱۹۹" یک قیمت است. همچنین هیچ راهی وجود ندارد که توصیف کند این تکه‌های از اطلاعات کنار هم قرار گرفته‌اند تا یک مورد را جدا از موارد دیگری که احتمالاً در صفحه قرار دارند، توصیف کند.

HTML معنایی اشاره به عمل HTML سنتی در قصد نشانه گذاری‌ها دارد به جای این که مستقیماً جزئیات چینش را مشخص کند. برای مثال کاربرد <em> برای نشان دادن «تأکید» است، بیشتر از <i> که ایتالیک شدن را مشخص می‌کند. جزئیات چینش در ترکیب با CSSها در سمت مرورگر است. اما این عمل برای مشخص کردن معانی عناصر مثل موارد فروش و قیمت ناکارآمد است.

Microformatها تلاش‌های غیررسمی گسترش تگ‌های HTML را برای ایجاد نشانه‌گذاری معنایی قابل خواندن برای ماشین دربارهٔ عناصری مثل فروشگاه‌های خرده فروشی و موارد برای فروش را نشان می‌دهد.

راهکارهای وب معنایی

[ویرایش]

وب معنایی راه کارهای اضافه تری دارد که شامل نشر زبان‌هایی که مختص داده طراحی شده‌اند، مثل چهارچوب شرح منابع(RDF)، زبان هستی‌شناسی وب(OWL) و زبان نشانه‌گذاری توسعه پذیر(XML)، می‌شود. HTML اسناد و پیوندهای بین آن‌ها را توصیف می‌کند. RDF,OWL وXML، با تضاد، می‌توانند اشیا دلخواه را از قبیل مردم، دیدارها یا قطعات هواپیما توصیف کنند.

این فناوری‌ها به منظور فراهم آوردن شرحی که محتوی اسناد وب را تکمیل یا جایگزین کند، ترکیب شده‌اند. بنابرین، محتوی ممکن است به عنوان داده‌های توصیفی ذخیره شده در پایگاه داده‌های قابل دسترس وب، یا نشانه‌گذاری در بین اسناد بروز کند (خصوصاً، در HTML توسعه پذیر(XHTML) با XML پراکنده، یا اغلب مواقع خالص در XML، با چینش یا). توضیحات قابل خواندن برای ماشین، مدیران محتوی را به کار می‌اندازند تا معنی به محتوی اضافه کنند که توصیف کند ساختار دانشی که ما دربارهٔ محتوی داریم. در همین راستا، یک ماشین می‌تواند خودش دانش را، به جای متن، با استفاده از پردازشی شبیه به استنتاج و استقرا انسان پردازش کند، در نتیجه نتایج معنی دار بیشتری به دست می‌آورد و به کامپیوترها برای اجرا خودکار جمع‌آوری اطلاعات و پژوهش کمک می‌کند.

یک مثال از یک تگ که می‌تواند در یک صفحه وب غیر معنایی استفاده شود:

<item>cat</item>

همین اطلاعات در یک صفحه وب معنایی ممکن است به این شکل باشد:

<item rdf:about="http://dbpedia.org/resource/Cat">Cat</item>

تیم برنز لی شبکه حاصل از داده‌های پیوند داده شده را، در تضاد با تارنمای گسترده جهانی بر پایه HTML، نمودار عظیم جهانی می‌نامد. برنز لی فرض کرد که اگر گذشته اسناد به اشتراک گذاشته می‌شدند، در آینده داده‌ها به اشتراک گذاشته می‌شوند. جواب او به این سؤال که "چگونه؟"، سه دستورالعمل به همراه داشت. اول، یک URL باید به داده اشاره داشته باشد. دوم، هرکسی که به URL دسترسی پیدا کرد باید داده را برگرداند. سوم، روابط در داده باید به URLهای اضافی به همراه داده اشاره داشته باشد.

وب ۳

[ویرایش]

تیم برنز لی وب معنایی را جزئی از وب ۳ توصیف کرد.

مردم همواره می‌پرسند که وب ۳ چیست؟ من فکر می‌کنم شاید وقتی شما یک پوشش از گرافیک‌های برداری مقیاس پذیر (همه چیز ناهوار و شناور به صورت مبهم) در وب۲ دارید و دسترسی به یک وب معنایی که جمع‌کننده حجم زیادی از داده داشته باشید، شما به یک منبع داده باور نکردنی دسترسی خواهید داشت . . .

تیم برنز لی ۲۰۰۶

"وب معنایی" گاهی هم‌معنی "وب۳" به کار می‌رود، در حالی که هر کدام معانی متفاوتی دارند.

مثال‌ها

[ویرایش]

وقتی ما دربارهٔ وب معنایی حرف می‌زنیم، ما دربارهٔ بسیاری از «چگونه» هایی صحبت می‌کنیم که معمولاً دور از فهم اند چراکه مردم نسبت به مفاهیم مورد نیاز زبان‌شناسی بی‌توجه‌اند. بنابرین، ما ترجیح می‌دهیم چگونگی ظهور وب معنایی در آینده را تصور کنیم.

ابر-ویکی

[ویرایش]

سایت‌های از نوع ویکی روبه رشدند. مدیران آن‌ها و عناصر آن‌ها می‌تواند بسیار متنوع باشد. این ویکی‌ها بسیار بسیار تخصصی شده‌اند. اما بسیاری از ویکی‌ها موتورهای جستجو را از لحاظ شاخص‌گذاری آن‌ها محدود می‌کنند زیرا این موتورهای جستجو کارآمدی ویکی‌ها را کاهش می‌دهد و صفحاتی که منسوخ شده‌اند را نگه می‌دارند، به بیانی، خارج از ویکی (به روزرسانی دائم). ابر موتورهای جستجو قصد دارند نتایج به‌دست آمده از درخواست‌های انحصاری از هرکدام از این ویکی‌ها را جمع کنند. ویکی سوله‌ای از داده دردسترس برای همفکری توسط مردم و ماشین‌ها شده‌است.

چالش‌ها

[ویرایش]

برخی از چالش‌های وب معنایی شامل وسعت، ابهام، تردید، تناقض و فریب. سیستم‌های استدلال‌کننده خودکار مجبور خواهد بود با تمام این مسائل مقابله کند به جای این که وعده وب معنایی را ارئه دهد.

  • وسعت: تارنمای گسترده جهانی شامل میلیاردها صفحه شده‌است. SNOMED CT هستی‌شناسی واژه‌شناسی پزشکی به تنهایی شامل ۳۷۰٬۰۰۰ نام کلاس است و فناوری موجود هنوز قادر نبوده‌است که واژهای تکراری از جهت معنا را ازبین ببرد. هر سیستم استدلال‌کننده خودکاری مجبور است با ورودی‌های واقعاً بزرگ مقابله کند.
  • ابهام: وجوه مبهمی مانند «جوان» و «بلند» وجود دارد. این ناشی می‌شود از ابهام درخواست کاربران، از وجوه ارائه شده توسط گردآورندگان محتوی، از انطباق واژه‌های درخواست با واژه‌های گردآورندگان و از تلاش برای ترکیب مبانی دانش‌های مختلف با وجوه مشترک ولی جنبه‌های متفاوت. منطق فازی رایج‌ترین تکنیک برای مقابله با ابهام است.
  • عدم قطعیت: وجوه دقیقی با ارزش‌های مشکوک وجود دارد. برای مثال، یک بیمار ممکن است مجموعه‌ای از علائم را که هرکدام متناظر با تشخیص مشخص و احتمال متفاوت باشد، را ارائه کند. روش‌های استدلال احتمالاتی به‌طور کلی کار برای رسیدگی به عدم قطعیت است.
  • تناقض: تناقضات منطقی ای وجود دارد که به ناچار در طول توسعه هستی‌شناسی بزرگ، و زمانی که هستی‌شناسی‌ها از منابع جدا با هم ترکیب شده‌اند، به وجود خواهد آمد. استدلال استقرایی یا قیاسی با شکست روبروست وقتی با تناقض مواجه است، زیرا «هر چیزی به دنبال یک تناقض» است. استدلال فسخ کردنی و استدلال paraconsistent، دو روش است که می‌تواند برای مقابله با تناقض به کار رود.
  • فریب: زمانی رخ می‌دهد که تهیه‌کننده اطلاعات عمداً مصرف‌کننده اطلاعات را گمراه کند. تکنیک‌های رمز نگاری در حال حاضر برای کاهش این تهدید مورد استفاده قرار می‌گیرند.

این لیست چالش‌ها بیش از این که کامل باشد، روشنگر است و روی چالش‌های لایه‌های «منطق وحدت» و «برهان» از وب معنایی، تمرکز دارد. گزارش آخر گروه رشد برای استدلال عدم قطعیت W3C، تمام این مشکلات را تحت عنوان «عدم قطعیت» جمع کرد. خیلی از تکنیک‌های ذکر شده در اینجا الحاقاتی نیاز خواهند داشت به زبان هستی‌شناسی وب مثلاً برای حاشیه‌نویسی احتمالات شرطی. این منطقه از پژوهش فعال است.

استانداردها

[ویرایش]

استانداردسازی وب معنایی در وب۳ تحت پوشش W3C می‌باشد.

اجزا

[ویرایش]

واژه «وب معنایی» معمولاً استفاده می‌شود برای اشاره به فرمت‌ها و فناوری‌هایی که آن را به کار می‌اندازند. جمع‌آوری، ساختاربندی و بازیابی داده‌های پیوندشده با فناوری‌ها یی که یک توضیح رسمی از وجوه، واژه‌ها و روابط در خلال یک دامنه دانش داده شده فراهم می‌آورد. این فناوری‌ها طبق استانداردهای W3C مشخص شده‌اند و شامل این موارد می‌شود:

  • چارچوب تشریح منابع (RDF) یک روش عمومی برای توصیف اطلاعات
  • شمای RDF (RDFS)
  • سیستم سازمانی دانش ساده (SKOS)
  • SPARQL یک زبان پرس و جوی RDF
  • نشان گذاری3 (N3)، طراحی شده با توانایی خواندن انسان در ذهن
  • N-Triples، فرمتی برای ذخیره کردن و انتقال داده
  • لاک‌پشت[سه تایی] (زبان RDF سه مختصر و مفید)
  • زبان هستی‌شناسی وب(OWL)، یک خانواده از زبان‌های ارائه دانش

پشته وب معنایی روشنگر معماری وب معنایی است. توابع و روابط اجزا می‌تواند به صورت زیر خلاصه شود:

  • XML یک گرامر عنصری برای ساختار محتوی داخل اسناد فراهم می‌آورد.XML در حال حاضر یکی از اجزا لازم فناوری‌های وب معنایی در خیلی از موارد نیست، به عنوان جایگزین گرانرهای موجود، از قبیل لاک‌پشت. لاک‌پشت یک استاندارد بالفعل است اما از طریق یک فرایند استاندارد رسمی نبوده‌است.
  • شمای XML یک زبان برای فراهم آوردن و محدود کردن ساختار و محتوی عناصری است که در اسناد XML وجود دارند.
  • RDF یک زبان ساده برای توصیف مدل‌های داده‌است که به اشیا ("منابع") و روابطشان اشاره دارد. یک مدل برپایه RDFمی‌تواند در گرامرهای مختلفی ارائه شود، مثل RDF/XML,N3، لاک‌پشت و RDFa. RDF یک استاندارد پایه‌ای از وب معنایی است.
  • شما RDF, RDF را توسعه داده‌است و یک لغت برای توصیف ویژگی‌ها و کلاس‌های منابع بر پایه RDF، با معانی برای تعمیم سلسله مراتب از خواص و طبقات است.
  • OWL لغات بیشتری برای توصیف ویژگی‌ها و کلاس‌ها اضافه می‌کند: از بین آن‌ها، روابط بین کلاس ها(disjointness), cardinality(برای مثال "دقیقاً یک")، برابری، نوع‌سازی غنی تر از ویژگی‌ها، مشخصات ویژگی‌ها و شمارش کلاس‌ها.
  • SPARQL یک پروتکل و زبان کوئری از مبانی وب معنایی است.

وضعیت فعلی استانداردسازی

[ویرایش]

استانداردسازی‌های در حال پیشرفت فعلی شامل:

  • قانون فرمت تبادل(RIF) به عنوان لایه‌ای از پشته وب معنایی.

لایه‌هایی که‌هایی که هنوز به‌طور کامل بیرون نیامده‌اند شامل:

  • لایه‌های منطق وحدت و مدرک تحت تحقیقات فعال هستند.

مقصود بالابردن قابلیت استفاده و فایده وب است و ارتباط تنگاتنگ آن با منابع از طریق:

  • سرورهایی سیستم‌های داده‌ای موجود را با استفاده از RDF و SPARQL نشان می‌دهند. خیلی تبدیل‌کننده‌ها به RDF از برنامه‌های کاربردی مختلف وجود دارد. پایگاه داده‌های رابطه‌ای یک منبع مهم هستند. سرور وب معنایی بدون تأثیرگذاری بر عملکرد سیستم موجود به آن پیوست می‌شود.
  • اسناد «نشانه گداری شده» با اطلاعات معنایی (یک توسعه از تگ <meta>در HTML در صفحات وب امروزی برای تأمین اطلاعات موتورهای جستجوی وب، با استفاده از وب خزنده، به کاربرده می‌شود). این می‌تواند اطلاعات قابل فهم برای ماشین دربارهٔ محتوی اسناد قابل فهم برای انسان باشد (از قبیل تولیدکننده، عنوان، توضیحات اسناد) یا می‌تواند صرفاً ابرداده نمایش دهنده مجموعه‌ای از حقایق باشد (از قبیل منابع و خدمات در هر کجای سایت‌ها). (توجه کنید که هرچیزی که بتواند با شناسه منبع یکنواخت شناسایی (URI) شود، می‌تواند توصیف شود، بنابرین وب معنایی می‌تواند دربارهٔ حیوانات، مردم، اماکن، ایده‌ها استدلال کند) نشانه‌گذاری معنایی معمولاً خودکار، تا به صورت دستی، تولید می‌شود.
  • واژگان ابرداده رایج (هستی‌شناسی‌ها) و نگاشت بین واژگان که به خالقان اسناد اجازه می‌دهد بدانند که چگونه اسنادشان را نشانه‌گذاری کنند، بنابرین عامل‌ها می‌توانند اطلاعات در ابرداده تأمین شده را استفاده کنند (بنابرین مؤلف درمقام 'مؤلف صفحه' با مؤلف در مقام مؤلف کتابی که موضوع مرور یک کتاب است، اشتباه گرفته نمی‌شود)
  • عامل‌های خودکارشده برای اجرای وظایف برای کاربران وب معنایی با استفاده از این داده
  • خدمات برپایه وب (معمولاً با عامل‌های خودشان) برای تأمین اطلاعات مخصوص عامل‌ها (برای مثال یک خدمت مورد اعتماد که یک عامل بتواند دربارهٔ تاریخچه خدمات ضعیف یا هرزه نگاری برخی فروشگاه‌های برخط بپرسد)

واکنش‌های شکاک

[ویرایش]

امکان‌سنجی عملی

[ویرایش]

منتقدان شدنی بودن تحقق کامل یا جزئی وب معنایی را می‌پرسند. بحران Cory Doctorow ("ابرچرند") از دورنمای رفتار انسان و ارجحیت‌های شخصی هست. برای مثال، مردم ممکن است برای گمراه کردن موتورهای وب معنایی که فرض را بر صحت ابرداده می‌گذارند، ابرداده جعلی به صفحات وب وارد کنند. این پدیده در ابرتگ‌ها شناخته شده بود که الگوریتم رتبه‌بندی آلتاویستا را با بالابردن رتبه صفحات وب به‌خصوص فریب می‌داد: موتور شاخص‌گذاری گوگل خصوصاً به دنبال چنین تلاش‌هایی برای دست کاری است. Peter Gärdenfors و Timo Honkela اشاره می‌کنند که فناوری‌های وب معنایی برپایه منطق، تنها یکسری از پدیده‌های مربوط به هستی‌شناسی را پوشش می‌دهند.

جایی که فناوری‌های وب معنایی درجه پذیرش عملی بالاتری پیدا کرد، تمایل بیشتری به بودن آن در هسته جوامع تخصصی و سازمان‌های برای پروژه‌های درون سازمانی است. محدودیت‌ها به سوی پذیرش عملی، در دامنه‌ها و حوزه‌های محدود تر از چالش کمتری نسبت به عامه مردم و تارنمای گسترده جهانی دارد.

پتانسیل یک ایده در حال پیشرفت سریع

[ویرایش]

مقاله ابتکاری Scientific American در سال ۲۰۰۱ توسط برنزلی تکامل مورد انتظار از وب موجود به وب معنایی را توصیف کرد. یک تکامل کامل چنان‌که توسط برنزلی توصیف شد فعلاً در حال اتفاق افتادن است. در ۲۰۰۶ برنزلی و همکارانش اظهار داشتند که: "این ایده ساده، به هر حال، تا حد زیادی تحقق نیافته باقی مانده‌است. " در حالی که ایده هنوز در حال ساخت است، به نظر می‌رسد به سرعت در حال تکامل است و الهام بخش بسیاری بوده‌است. بین ۲۰۰۷–۲۰۱۰ بسیاری محققان پتانسیل اجتماعی وب معنایی را در کسب و کار و بخش سلامت و برای شبکه‌سازی اجتماعی، بررسی کرده‌اند. آن‌ها همچنین مرز تکامل دموکراسی را بررسی کرده‌اند: چگونه یک جامعه خواست مشترکش را به یک شیوه دموکراتیک از طریق وب معنایی فرم می‌دهد.

سانسور و حفظ حریم خصوصی

[ویرایش]

اشتیاق دربارهٔ وب معنایی می‌تواند با نگرانی‌ها در مورد سانسور و حفظ حریم خصوصی تعدیل شود. برای مثال، فناوری‌های تحلیل متن حالا می‌توانند با استفاده از کلمات دیگر به راحتی کنار گذاشته شود، مثلاً استعاره‌ها، یا با استفاده از تصاویر به جای متن. یک اجرا حرفه‌ای از وب معنایی کنترل بر روی مشاهد و آفرینش اطلاعات آنلاین را برای دولت‌ها بسیار آسان‌تر می‌کند؛ چرا که فهمیدن این اطلاعات برای یک ماشین مسدودکننده محتوی خودکار، راحت‌تر است. به علاوه، این مسئله مطرح شده‌است که با استفاده از فایل‌های FOAF و ابرداده منطقه جغرافیایی، کمتر کسی حاضر به فاش شدن نامش در نگارش یک مقاله در یک وبلاگ شخصی خواهد شد. برخی از این نگرانی‌ها درخطاب به پروژه «وب آگاه سیاسی» بودند و یک عنوان فعال تحقیق و توسعه‌ای هستند.

دوبرابر شدن فرمت‌های خروجی

[ویرایش]

انتقاد دیگر به وب معنایی این است که زمان بیشتری صرف ساخت و انتشار محتوی می‌شود، چرا که برای یک تکه از داده به دو فرمت نیاز است: یکی برای نمایش انسان و یکی برای ماشین‌ها. به هرحال، بسیاری از برنامه‌های کاربردی در حال توسعه وب، در حال پرداختن به این موضوع از طریق ایجاد یک فرمت قابل خواندن برای ماشین پس از انتشار داده یا درخواست ماشین برای پنین داده هستند. توسعه microformatها واکنشی دیگر به این نوع از انتقاد است. یکی دیگر از استدلال‌ها در دفاع از امکان‌سنجی وب معنایی، احتمالاً قیمت در حال سقوط وظایف هوش انسانی در بازار کار دیجیتال، مثلAmazon Mechanical Turk است.

مشخصات از قبیل eRDF و RDFa، به داده‌های دلخواه RDF اجازه می‌دهد در صفحات HTML تعبیه بشوند. مکانیزم GRDDL (گردآوری توصیفات منابع از روی گویش‌های زبانی) به ماده موجود (شامل ریز قالب‌ها یا Micro-formats) اجازه می‌دهد به‌طور خودکار به عنوان RDF تفسیر شوند؛ بنابرین ناشران تنها نیاز به استفاده از یک فرمت، مثل HTML، را دارند.

پروژه‌ها

[ویرایش]

این بخش بعضی از پروژه‌ها و ابزار بسیاری را که جهت ایجاد راه حل‌های وب معنایی وجود دارد لیست می‌کند:

DBpedia

[ویرایش]

DBpedia یک تلاش برای برای انتشار داده ساختاریافته‌استخراج شده از ویکی‌پدیا است: داده در RDF منتشر شده و برای استفاده در وب تحت لیسانس مستندسازی آزاد GNU قابل دسترس می‌شود، بنابرین به عامل‌های وب معنایی اجازه می‌دهد استنتاج و query گرفتن پیشرفته بر روی مجموعه داده مشتق شده از ویکی‌پدیا را فراهم بیاورند و استفاده مجدد و توسعه در دیگر منابع داده را تسهیل کنند.

یک واژه پرطرفدار در وب معنایی دوستِ دوست است که از RDF برای توصیف روابط مردم با دیگر مردم در «چیزهای» اطراف آن‌ها، استفاده می‌کند.FOAF به عامل‌های هوشمند، برای درک هزاران ارتباطی که مردم با یکدیگر دارند، مشاغل آن‌ها و موارد مهم در زندگی آنها، مجوز می‌دهد؛ ارتباطاتی که ممکن است در موتورهای جستجوی سنتی برشمرده بشود یا نشود؛ زیرا ارتباطات از لحاظ تعداد بسیار گسترده‌است و تفسیر انسان از این اطلاعات ممکن است بهترین راه برای تحلیل آن‌ها نباشد.

FOAF یک مثال از چگونگی تلاش وب معنایی برای استفاده از ارتباطات در زمینه اجتماعی است.

پروژه جوامع آنلاین معنایی پیوسته (SIOC، «شاک» تلفظ می‌شود) یک واژگان از اصطلاحات و روابط را که فضاهای داده وب را مدل می‌کند، فراهم می‌آورد. مثال‌هایی از این نوع فضاهای داده شامل: تالارهای گفتگو، بلاگ‌ها، پست‌های بلاگ/خبرخوان‌ها، لیست‌های پستی، به اشتراک‌گذاری بوک مارک‌ها و گالری عکس‌ها، می‌شود.

NextBIO

[ویرایش]

یک پایگاه داده تقویت‌کننده علوم زیستی بالا تجربی داده‌های تگ شده و با استفاده از هستی‌شناسی پزشکی مرتبط شده‌اند. NextBio با استفاده از یک رابط موتور جستجو قابل دسترسی است. محققان می‌توانند یافته‌های خود را برای الحاق به پایگاه داده کمک کنند. پایگاه داده در حال حاضر از توضیحات داده پروتئین و ژن و توالی داده‌های محوری پشتیبانی می‌کند و به‌طور پیوسته در حال گسترش برای حمایت از انواع دیگر داده‌های بیولوژیکی است.

جستارهای وابسته

[ویرایش]

پیوند به بیرون

[ویرایش]

منابع

[ویرایش]

جستارهای وابسته

[ویرایش]
pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy