15 بهمن 1393

گُرگُر و پارسی‌جو: نگاهی به چرایی و چگونگی موتورهای جستجوی ملی

15 بهمن 1393

خودنویس-آرش کمانگیر :حقیقت این است که نمی‌توان راه نشت خواسته‌های شهروندان را به وب کاملا مسدود کرد و به همین دلیل، به یک «موتور جستجوی ملی» نیاز است تا وانمود کند که در وب، دست بالا با گفتمان مساعد است.

یکی از معاونین وزیر ارتباطات به ایسنا گفته‌است که بیش از ۱۷۰ میلیارد تومان برای حمایت از موتورهای جستجوی ملی پیش‌بینی شده‌است. او ادامه داده است که موتورهای جستجوی «گُرگُر» و «پارسی‌جو» به‌زودی در دهه‌ی فجر رونمایی خواهند شد. «فجر»، «یاحق» و «سلام» اسامی دیگری برای موتورهای جستجوی ملی‌ای هستند که به یک روایت تعداد آن‌ها به پانزده عدد می‌رسد.

موتورهای جستجو در کنار شبکه‌های اجتماعی، یکی از ستون‌های اصلی وب هستند و انگیزه‌ها و روش‌های ساخت موتورهای جستجوی ملی را می‌توان از دیدگاه‌های مختلف بررسی کرد. در نگاه اول، یک موتور جستجو، در اساس خود، ساخته‌ی پیچیده‌ای نیست و می‌توان کلیات کارکرد آن را در چند جمله توصیف کرد. یک موتور جستجو با مرور لینک‌های موجود در صفحات وب و کشف ارتباطات آن‌ها تلاش می‌کند مرتبط‌‌ترین صفحه‌ها به یک موضوع خاص را پیدا کند و در جواب کاربر، فهرست کند. به این دلیل، برپا کردن محیطی که بتوان با اغماض بسیار زیاد، نام موتور جستجو روی آن گذاشت، برای یک گروه متوسط که منابع قابل توجهی دارد، کار ممکنی است. و نکته‌ی اساسی همین «اغماض» است. ساختن محیطی که بتواند در پاسخ به یک کلمه‌ی کلیدی، فهرستی از مطالب مرتبط را بیاورد، کار ممکنی است، اما سوال مهم این است که آیا این محیط قادر خواهد بود بطور هم‌زمان از پس چند ده میلیون جستجو برآید؟ آیا الگوریتم مورد استفاده توسط این محیط برای ارزش‌گذاری صفحات مختلف، قادر خواهد بود منابع مهم‌تر را کشف کند؟ آیا بازی دادن این الگوریتم برای کسانی که می‌خواهند وب‌سایت‌های نامربوط اما با مقاصد تجاری‌شان به بالای فهرست منتقل شوند، ممکن خواهد بود؟ این محیط چه حجمی از مطالب وب را مرور خواهد کرد؟

این‌ها سوالاتی هستند که زمانی که درباره‌ی یک موتور جستجو حرف زده می‌شود باید به آن‌ها جواب داده شود. برای مثال، پارسی‌جو ۲۰۰ میلیون صفحه‌ی وب را پوشش داده است. در مقایسه، گوگل در سال ۲۰۰۰ یک میلیارد صفحه را پوشش داده بود. این عدد در سال ۲۰۰۸ به یک تریلیون رسید. واضح است که موتور جستجویی مانند گوگل باید زبان‌های متعددی را در بانک‌های اطلاعاتی خود وارد کند، اما هم‌چنان این اعداد نشان می‌دهند که «موتور جستجو» لزوما اصطلاح بامعنی‌ای نیست و تنها زمانی دقیقا می‌دانیم موضوع گفتگو چیست که برای سوالات بالا جواب‌هایی وجود داشته باشد. اغلب «موتورهای جستجوی ملی» این سوال‌ها را بی‌جواب می‌گذارند.

اما فارغ از این‌که گُرگُر و پارسی‌جو حقیقتا چقدر «موتور جستجو» هستند، سوال مهم این است که چرا ساختار ارتباطی ایران به‌دنبال سرمایه‌گذاری روی این سرویس اینترنتی است. موتور جستجو چه اهمیتی دارد و «ملی» بودن آن چه حاصلی دارد که سرمایه‌گذاری ۱۷۰ میلیارد تومانی را توجیه می‌کند؟

سادگی انتشار در وب، از یک‌سو آن را دموکراتیزه کرده است. حالا هرکسی می‌تواند با صرف وقت اندکی یک وب‌سایت راه بیاندازد و یا، حتی ساده‌تر، در حسابی در یک شبکه‌ی اجتماعی مطلبی را منتشر کند. همین سهولت، در چرخشی جالب توجه، اتفاقا موقعیتی منحصر به‌فرد برای یابندگان اطلاعات در وب ایجاد کرده است. موتورهای جستجو، و نظایر آن‌ها در شبکه‌های اجتماعی، حالا در موقعیتی قرار گرفته‌اند که شباهت‌هایی به Keymaker در ماتریکس دارد. آن‌ها بدون این‌که از ما در قبال خدمات‌شان پرداخت واضحی طلب کنند، جواب‌های سوال‌های ما را می‌دهند. می‌خواهی بدانی سریال تلویزیونی Black Mirror کی ساخته‌شده است، چه موضوعی دارد، و واکنش کاربران به آن چه بوده است؟ جست‌وجویی در گوگل در کم‌تر از نیم ثانیه این اطلاعات را بیرون می‌آورد: «سریال انگلیسی، با مضمون تعلیق و مایه‌های تکنولوژی و آینده». کسانی که این مجموعه را دیده‌اند چه می‌گویند؟ جستجویی در توییتر انبوهی از واکنش‌ها را فهرست می‌کند. از این نظر، اتفاق، بی‌شباهت به مدل اقتصادی فیس‌بوک نیست: این شبکه‌ی اجتماعی چنان انتشار مطلب را ساده کرده‌است که هزاران تکه مطلب در هر لحظه در آن وارد می‌شوند. اغلب این مطالب در این طوفان، شانسی برای دیده‌شدن ندارند، مگر این‌که ما از فیس‌بوک بخواهیم که محتوای ما را به چشم‌های بیشتری برساند. و البته فیس‌بوک در ازای این خدمت، از ما پرداخت مالی طلب می‌کند.

ترافیک بالای محتوا در وب، پیداکردن مطالبی درباره‌ی یک موضوع خاص را بدون استفاده از موتورهای جستجو عملا غیرممکن می‌کند. حتی اگر به مطلبی دسترسی داشته باشیم که، برای مثال، درباره‌ی گورستان خاوران توضیح می‌دهد، بدون استفاده از یک موتور جستجو و مطالعه درباره‌ی پیشینه‌ی این مکان هرگز نخواهیم توانست تصویری با حداقلی از شمول را به‌دست بیاوریم. دقیقا به همین دلیل، نظارت کامل بر وب، بدون حضور «موتور جستجوی ملی» ممکن نیست. این موتور جستجو در الگوریتم‌هایش ملاحظات ساختار سیاسی و فرهنگی را لحاظ خواهد کرد.

برای مثال، موتور جستجوی ملی تشخیص می‌دهد که مهم‌ترین موضوعات مرتبط با «میرحسین موسوی» دو اشاره‌ به ویکیپدیا و سپس مطلبی با این عنوان است: «شهید آیت، میرحسین موسوی و فراماسونری - وعده صادق». در این مطلب می‌خوانیم «یکی از اساتید تاریخ معاصر ایران می گفت میرحسین موسوی فراماسون است و سند ماسونی او را دیده است.» مطلب بعدی از وبلاگی با عنوان «زندگی زیبای رهبری» انتخاب شده است. یا در پاسخ به کلیدواژه‌ی «فمینیسم» فهرستی ساخته می‌شود که در بالای آن «فمینیسم اسلامی» و «فمينيست و جايگاه زن در اسلام - شهید آوینی» قرار دارند. با جستجو درباره‌ی «آزادی بیان» هم در بالای فهرست به این پاسخ‌ها برمی‌خوریم: «پاپ فرانسیس: آزادی بیان به معنای توهین به ادیان نیست – فارس‌نیوز» و «یک فعال دانشجویی: مفهوم آزادی بیان با توهین کردن به مقدسات تفاوت دارد».

فیلترینگ و کاهش عمدی سرعت، تلاش‌هایی برنامه‌ریزی شده برای جلوگیری از تولید و مصرف آزاد محتوا در فضای وب هستند. در کنار این دو، آزار فعالین وب و افراد دیگری که در این فضا از خطوط ممنوعه می‌گذرند، روش ساختار حاکم برای از بین بردن فرصت‌های ممکن شده از طریق اینترنت است. ضلع سوم این مثلث زیاده‌طلبانه، ایجاد تفسیری مساعد از محتویاتی است که به هر روشی به وب راه پیدا می‌کند. حقیقت این است که نمی‌توان راه نشت خواسته‌های شهروندان را به وب کاملا مسدود کرد و به همین دلیل، به یک «موتور جستجوی ملی» نیاز است تا وانمود کند که در وب، دست ِ بالا با گفتمان مساعد است. چنین موتور جستجویی البته در پاسخ به کلیدواژه‌ی «سکس» جواب می‌دهد «برای پرس‌وجوی "سکس" نتیجه‌ای یافت نشد.» در جواب «آزادی» هم، مطالبی درباره‌ی «مجموعه‌ی ورزشی آزادی» فهرست می‌شود.

  • Version imprimable de cet article Version imprimable
  • envoyer l'article par mail envoyer par mail
  • رزیتا لطفی رئیس بی‌بی‌سی فارسی شد

    22 دی 1394
    بی بی سی فارسی رزیتا لطفی، سردبیر خبر تلویزیون و رادیوی بی‌بی‌سی فارسی به عنوان رئیس جدید بخش فارسی بی‌بی‌سی انتخاب شده است و به زودی جای صادق صبا را می‌گیرد. خانم لطفی از سردبیرانی بود که در سال ۲۰۰۹ در راه اندازی شبکه تلویزیونی بی‌بی‌سی فارسی نقش داشت. او از روز بیست و پنجم ژانویه مسئولیت بخش فارسی را به عهده خواهد گرفت و جایگزین صادق صبا می‌شود که پس از بیش از بیست و پنج سال فعالیت در بی‌بی‌سی تصمیم گرفته از سمت خود کناره‌گیری کند و در پی چالش‌های دیگری برود. آقای صبا گفت: "ترک کردن سازمانی که از صمیم قلب به اهدافش اعتقاد دارم کار آسانی نیست، ولی وقت (...)
  • فریدون صدیقی روزنامه نگاری برای تمامی فصول، نوشته ای از مینو بدیعی

    22 دی 1394
    مینو بدیعی، روزنامه نگاری که سالها در روزنامه های مختلف قلم زده است، در یک پست فیس بوکی به ذکر ویژگی های فریدون صدیقی روزنامه نگار قدیمی پرداخته است. به گزارش خبرنگاران ایران، متن کامل این یادداشت فیس بوکی به شرح زیراست: فریدون صدیقی روزنامه نگاری برای تمامی فصول ساعت 5و 20 دقیقه بامداد است و حسی گنگ مرا از خواب پرانده تا از روزنامه نگار ، انسانی شریف ، مردی لایق و شرافتمند و صاحب روحی بزرگ و...همچون فریدون صدیقی بنویسم . این حرفها درمورد او اغراق نیست زیرا سالهای طولانی با او همکار بوده ام واز نزدیک دقایق روح او را لمس کرده ام . من حتی گاهی به این انسان (...)
  • هک شدن رمز آیفون در کمتر از ۱۷ ساعت

    9 دی 1394
    وب سایت الف :شرکت اپل همواره ادعا کرده است که آیفون یکی از قوی‌ترین و بهترین سیستم‌های ایمنی در جهان را دارد. ولی گزارش‌های جدی نشان می‌دهد که سیستم امنیتی این گوشی هوشمند هم به راحتی هک می‌شود. یک شهروند آمریکایی این هفته به دادگاه نیویورک شکایت کرد و در پرونده قضایی خود توضیح داد گوشی هوشمند‌ آیفون به راحتی هک می‌شود و اطلاعات او را به خطر می‌اندازد. او درخواست کرد که اپل می‌بایست هرچه سریع‌تر اقداماتی را در این زمینه انجام دهد. «دیوید بایوئر» پس از طرح این پرونده قضایی روشی را برای هک کردن آیفون بیان کرد که تا قبل از آن هیچ کس مطلع نبود. او گفت دستگاهی (...)