Photography

جوجل و مكافحة المحتوى غير المرغوب فيه

تسعى مواقع المحتوى العشوائي للوصول إلى رأس نتائج البحث من خلال أساليب مثل تكرار الكلمات الرئيسية عدة مرات وشراء الروابط التي تتجاوز آلية PageRank للتصنيف والترتيب أو وضع نص غير مرئي على الشاشة. وهذا أمر سيء بالنسبة للبحث نظرًا لأنه يتم إخفاء مواقع الويب ذات الصلة، وكذلك بالنسبة لمالكي مواقع الويب القانونية نظرًا لأنه يكون من الصعب العثور على مواقعهم. والخبر السار هو أن خوارزميات Google يمكنها الكشف عن الغالبية العظمى من المحتوى العشوائي وتخفيضه تلقائيًا. وبالنسبة للبقية، فلدينا فِرَق تتولى مراجعة المواقع يدويًا.

التعرّف على المحتوى العشوائي

تبدو مواقع المحتوى غير المرغوب فيه بجميع الأشكال والأحجام. تتضمن بعض المواقع محتوى مسيئًا غامضًا تم إنشاؤه تلقائيًا ويتعذر على أي شخص فهمه. بالطبع، فإننا نرى أيضًا المواقع التي تستخدم أساليب بارعة في المحتوى العشوائي. لذا، تحقق من هذه الأمثلة الواردة بشأن "المحتوى العشوائي المحض"، وتلك هي المواقع التي تستخدم أكثر الأساليب الهجومية في المحتوى العشوائي. وهذه هي مجموعة من لقطات الشاشة المباشرة للمحتوى العشوائي الذي حددناه يدويًا وتم استبعاده مؤخرًا من الظهور في نتائج البحث.
*لقد أزلنا بعض المحتويات الإباحية والبرامج الضارة من هذا العرض التجريبي، لكن على خلاف ذلك هذه مجموعة لم تتم تصفيتها من الأمثلة الإنجليزية الجديدة لعمليات إزالة "المحتوى العشوائي المحض".

أنواع المحتوى العشوائي

بالإضافة إلى المحتوى غير المرغوب فيه الموضح أعلاه، فيما يلي بعض الأنواع الأخرى من المحتوى العشوائي التي تم الكشف عنها وتم اتخاذ إجراء بصددها.

إخفاء الهوية و/أو عمليات إعادة التوجيه غير المشروعة

يبدو أنّ الموقع مخفي (يعرض محتوى مختلفًا للمستخدمين عمّا يظهر لمحركات البحث) أو يعيد توجيه المستخدمين إلى صفحة مختلفة عمّا رأته Google.

موقع مخترق

ربما اخترقت جهة أخرى بعض الصفحات على هذا الموقع لعرض محتوى أو روابط غير مرغوب فيها. ويتعيّن على مالكي مواقع ويب اتخاذ إجراء فوري لتنظيف مواقعهم وإصلاح أي ثغرات أمنية.

نص مخفي و/أو حشو الكلمات الرئيسية

قد تشتمل بعض صفحاتك على نص مخفي و/أو حشو بالكلمات الرئيسية.

النطاقات المتوقفة

النطاقات المتوقفة عبارة عن مواقع للعنصر النائب تتضمن محتوى فريدًا إلى حد ما، ولذا لا تتضمنه Google عادةً في نتائج البحث.

المحتوى العشوائي المحض

يبدو أن الموقع يستخدم أساليب مزعجة غير مرغوب فيها مثل الكلام الغامض المُنشأ تلقائيًا و/أو عرض محتوى مختلف و/أو رفض المحتوى من مواقع ويب أخرى و/أو الانتهاكات المتكررة أو الصارخة لإرشادات مشرفي المواقع لدى Google.

مزودو خدمة DNS الديناميكية وخدمات الاستضافة المجانية

موقع الويب هذا مُستضاف من قِبل خدمة استضافة مجانية أو موفّر نظام أسماء نطاقات ديناميكي يحتوي على قدر كبير من المحتوى غير المرغوب فيه.

محتوى سيء ذو قيمة ضئيلة أو بدون قيمة

يبدو أن الموقع يتألف من صفحات منخفضة الجودة أو سطحية لا تقدم للمستخدمين أية قيمة (مثل الصفحات التابعة ذات المحتوى السيئ أو صفحات إعادة التوجيه أو المواقع النمطية ذات القالب الواحد أو المحتوى المُنشأ تلقائيًا أو المحتوى المنسوخ).

روابط غير طبيعية من أحد المواقع

اكتشفت Google نمطًا من الروابط الزائفة أو الخادعة أو الاحتيالية غير الطبيعية الصادرة على هذا الموقع. قد يكون ذلك نتيجة بيع روابط تتجاوز نظام ترتيب الصفحات أو بسبب المشاركة في أنظمة الروابط.

روابط غير طبيعية إلى أحد المواقع

اكتشفت Google نمطًا من الروابط الزائفة أو الخادعة أو الاحتيالية غير الطبيعية التي توجّه إلى موقع الويب هذا. قد يكون ذلك نتيجة شراء روابط تتجاوز نظام ترتيب الصفحات أو بسبب المشاركة في أنظمة الروابط.

محتوى عشوائي من إنشاء المستخدمين

يبدو أن الموقع يشتمل على محتوى غير مرغوب فيه أنشأه المستخدم. وقد يظهر المحتوى المنطوي على المشكلة على صفحات المنتديات أو صفحات دفاتر الضيوف أو ملفات المستخدمين الشخصية.

اتخاذ الإجراء

على الرغم من أن الخوارزميات لدينا تعالج الغالبية العظمى من المحتوى غير المرغوب فيه، فإننا نعالج أنواع المحتوى العشوائي الأخرى يدويًا لمنعه من التأثير في جودة النتائج. يعرض هذا الرسم البياني عدد النطاقات التي تأثرت بالإجراء اليدوي على مدار الوقت وتم تقسيمه حسب الأنواع المختلفة للبريد العشوائي. وقد تبدو الأعداد كبيرة خارج السياق، ولكن الويب مكان كبير حقًا. وأظهرت لقطة الشاشة الأخيرة للفهرس لدينا أنه قد تم يدويًا وضع علامة على 0.22٪ تقريبًا من النطاقات لإزالتها.

الإجراء اليدوي حسب الشهر

محتوى غير مرغوب فيه تمامًاقديمموقع ويب تم اختراقهروابط غير طبيعية من موقعك الإلكترونيمحتوى تم إنشاؤه تلقائيًا ومساحات لانهائيةالإخفاء و/أو عمليات إعادة التوجيه المضللةمحتوى رديء بقيمة مضافة ضئيلة أو بدونروابط غير طبيعية إلى موقعك الإلكترونينطاقات مستضافةمحتوى غير مرغوب فيه أنشأه مستخدمنص مخفي و/أو حشو بالكلمات الرئيسيةمضيفات خالية من المحتوى غير المرغوب فيهوموفرو نظام أسماء النطاقات الديناميكي8/200411/20042/20055/20058/200511/20052/20065/20068/200611/20062/20075/20078/200711/20072/20085/20088/200811/20082/20095/20098/200911/20092/20105/20108/201011/20102/20115/20118/201111/20112/20120150000300000450000600000

الأهداف الرئيسية لمكافحة المحتوى العشوائي اليدوية

شباط (فبراير) 2005

لقد طورنا من فريق مكافحة المحتوى العشوائي اليدوي لدينا ليمتد ليشمل حيدر أباد في الهند.

آذار (مارس) 2005

لقد طورنا من فريق مكافحة المحتوى العشوائي اليدوي لدينا ليمتد ليشمل دبلن في أيرلندا.

نيسان (أبريل) 2006

لقد طورنا من فريق مكافحة المحتوى العشوائي اليدوي لدينا ليمتد ليشمل طوكيو في اليابان.

حزيران (يونيو) 2006

لقد طورنا من فريق مكافحة المحتوى العشوائي اليدوي لدينا ليمتد ليشمل بكين في الصين.

تشرين الأول (أكتوبر) 2007 - القديمة

في خريف عام 2007، قمنا بتغيير نظام التصنيف لدينا للحفاظ على البيانات في تنسيق أكثر تنظيمًا استنادًا إلى نوع انتهاك المحتوى العشوائي على الويب (مما أتاح لنا إنشاء هذا المخطط). والإجراءات التي يتعذر تصنيفها بصورة مناسبة في النظام الجديد تكون ضمن فئة "القديمة". كنا لا نزال نتخذ إجراءات بشأن أنواع المحتوى العشوائي مثل الروابط التابعة الضعيفة وإخفاء الهوية قبل هذا الوقت، ولكن التصنيف حسب نوع البريد العشوائي ليس متاحًا بسهولة للبيانات القديمة.

تشرين الأول (أكتوبر) 2009 - روابط غير طبيعية من موقعك

أتاحت لنا التحسينات الواردة في أنظمتنا خفض عدد الإجراءات المتخذة بشأن المواقع التي تحتوي على روابط خارجية غير طبيعية.

تشرين الثاني (نوفمبر) 2009 - المواقع المخترقة

ولاحظنا زيادة المواقع المخترقة، كما عززنا من جهودنا لمنعها من التأثير في نتائج البحث.

شباط (فبراير) 2011 - مزودو خدمة DNS الديناميكية والمضيف المجاني غير المرغوب فيه

كما عززنا من تطبيق سياسة لاتخاذ إجراءات بشأن مزودي خدمة DNS الديناميكية وخدمات الاستضافة المجانية عند خرق عدد كبير من مواقعهم أو صفحاتهم لإرشادات مشرفي المواقع لدينا. وهذا يتيح لنا حماية المستخدمين من رؤية المحتوى غير المرغوب فيه، عندما يكون اتخاذ إجراء بشأن الحسابات الفردية غير المرغوب فيها غير عملي.

تشرين الأول (أكتوبر) 2011 - إخفاء الهوية و/أو عمليات إعادة التوجيه غير المشروعة

وأجرينا تغييرًا في نظام التصنيف لدينا حتى تم وصف غالبية إجراءات إخفاء الهوية أو عمليات إعادة التوجيه غير المشروعة بأنها "المحتوى العشوائي المحض". أما الإجراءات المتعلقة بالانتهاكات الأقل سوءًا، فلا يزال يتم وصفها كل على حدة.

تشرين الأول (أكتوبر) 2011 - النطاقات المتوقفة

لقد قللنا جهودنا بصدد تحديد النطاقات المتوقفة يدويًا نتيجةً للتحسينات الواردة في الكشف الحسابي لدينا عن هذه المواقع.

نيسان (أبريل) 2012

وبدأنا تحديث الخوارزمية الذي يحمل الاسم الرمزي "Penguin أ>}"، مما أدى إلى تقليل تصنيفات المواقع التي تستخدم أساليب المحتوى العشوائي على الويب.

إشعار مالكي مواقع الويب

عندما نتخذ إجراءً يدويًا بشأن موقع ويب، فإننا نحاول تنبيه مالك الموقع لمساعدته في معالجة هذه المشكلات. ونريد من مالكي مواقع الويب أن يحصلوا على المعلومات التي تمكنهم من جعل مواقعهم تظهر في صورة جيدة. ولذلك استثمرنا على مدار الوقت الكثير من الموارد في اتصالات مشرفي المواقع ومتابعتهم عن بُعد. يوضح الرسم البياني التالي عدد إشعارات المحتوى العشوائي المرسلة إلى مالكي المواقع عبر أدوات مشرفي المواقع.

الرسائل حسب الشهر

11/20061/20073/20075/20077/20079/200711/20071/20083/20085/20087/20089/200811/20081/20093/20095/20097/20099/200911/20091/20103/20105/20107/20109/201011/20101/20113/20115/20117/20119/201111/20111/20123/20120150000300000450000600000

سِجل اتصالات مشرفي المواقع

أيار (مايو) 2007

كنا نرسل الإشعارات عبر البريد الإلكتروني فقط، وفي عام 2007 أبلغ مشرفو المواقع عن تلقي إشعارات وهمية بشأن انتهاكات إرشادات مشرفي المواقع. وأوقفنا مؤقتًا إشعاراتنا استجابةً لهذا الحدث بينما كنا نعمل على نظام إشعار جديد.

تموز (يوليو) 2007

مع انطلاق ميزة مركز الرسائل في أدوات مشرفي المواقع، تم استئناف إرسال الإشعارات في تموز (يوليو) 2007 بعد إيقاف الإشعارات مؤقتًا في أيار (مايو) بسبب انتحال البريد الإلكتروني.

آذار (مارس) 2010

بدأنا استخدام نظام الإشعارات الجديد الذي أتاح لنا إرسال الرسائل بشكل أكثر سهولة إلى مركز الرسائل في أدوات مشرفي المواقع عندما عثرنا على المحتوى العشوائي. وكانت الفئة الأولى من المحتوى العشوائي المستخدمة لهذا النظام الجديد تتمثل فيالمواقع المخترقة.

تموز (يوليو) 2010

أدى إصلاح الأخطاء في نظام إشعارات المواقع المخترقة إلى خفض عدد الرسائل التي أرسلناها إلى المواقع المخترقة.

‏‫تشرين الثاني (نوفمبر) 2010‬

لقد قمنا بترقية نظام الإشعارات لدينا. ومن خلال هذا التحديث، عملنا على إصلاح الأخطاء المتعلقة بإشعارات المواقع المخترقة وبدأنا تجربة إرسال الرسائل للفئات الإضافية للبريد العشوائي مثل الروابط غير الطبيعية من أحد المواقع.

شباط (فبراير) وآذار (مارس) 2011

لقد عملنا على توسيع دائرة الإشعارات لتشمل الأنواع الإضافية من الروابط غير الطبيعية إلى أي موقع.

حزيران (يونيو) 2011

قمنا بزيادة عدد اللغات التي نرسل بها العديد من رسائلنا.

أيلول (سبتمبر) 2011

أجرينا تغييرًا في نظام التصنيف لدينا المتعلق بالمحتوى العشوائي. لم يتم إرسال رسائل بعض فئات المحتوى العشوائي، بينما أنشأنا رسائل جديدة وترجمناها لكي تناسب الفئات الجديدة.

تشرين الثاني (نوفمبر) 2011

أدى إصلاح الأخطاء في نظام إشعارات المواقع المخترقة إلى خفض عدد الرسائل التي أرسلناها إلى المواقع المخترقة.

كانون الأول (ديسمبر) 2011

وعملنا على توسيع فئات المحتوى العشوائي التي نرسل الإشعارات بشأنها لتشمل المحتوى العشوائي المحض والمحتوى الضعيف.

شباط (فبراير) 2012

تم إصلاح الخطأ الذي يؤثر في إشعارات المواقع التي تم اختراقها لدينا.

الاستماع إلى التعليقات

لا تدوم الإجراءات اليدوية إلى الأبد. عندما ينظِّف أحد ملاك مواقع ويب موقعه لإزالة المحتوى غير المرغوب فيه، يمكنه أن يطلب منا مراجعة الموقع مرة أخرى عن طريق إرسال طلب بالمراجعة وإعادة الفحص. ونتولى نحن معالجة {٠‏/}جميع{‏1/} طلبات المراجعة وإعادة الفحص التي نتلقاها ونتواصل على مدار العملية لإطلاع ملاك المواقع على مجريات الأمور.
واستنادًا إلى الحالات السابقة، فإن معظم المواقع التي أرسلت طلبات بالمراجعة وإعادة الفحص لم تتأثر في الواقع بأي إجراء غير مرغوب فيه تم تنفيذه يدويًا. فهذه المواقع كانت تمر غالبًا بفترات التدفق والانحسار الطبيعية في حركة المرور عبر الإنترنت أو تتعرّض لتغيير خوارزمي أو ربما لمشكلة تقنية تحول دون دخول Google إلى محتوى الموقع. يوضح هذا الرسم البياني حجم طلبات المراجعة وإعادة الفحص الأسبوعية منذ عام ٢٠٠٦.

طلبات المراجعة وإعادة الفحص طبقًا للأسبوع

الأسبوع 18:2006الأسبوع 28:2006الأسبوع 38:2006الأسبوع 48:2006الأسبوع 4:2007الأسبوع 14:2007الأسبوع 24:2007الأسبوع 34:2007الأسبوع 44:2007الأسبوع 1:2008الأسبوع 11:2008الأسبوع 21:2008الأسبوع 31:2008الأسبوع 41:2008الأسبوع 51:2008الأسبوع 8:2009الأسبوع 18:2009الأسبوع 28:2009الأسبوع 38:2009الأسبوع 48:2009الأسبوع 5:2010الأسبوع 15:2010الأسبوع 25:2010الأسبوع 35:2010الأسبوع 45:2010الأسبوع 2:2011الأسبوع 12:2011الأسبوع 22:2011الأسبوع 32:2011الأسبوع 42:2011الأسبوع 52:2011الأسبوع 9:2012الأسبوع 19:2012الأسبوع 29:2012الأسبوع 39:2012030006000900012000

ملاحظات جديرة بالذكر حول طلبات المراجعة وإعادة الفحص

كانون الأول (ديسمبر) 2006

حدث خطأ منعنا من تخزين طلبات المراجعة وإعادة الفحص بشكل سليم لمدة أسبوع تقريبًا. في ٢٥ كانون الأول (ديسمبر) (أعياد الميلاد)، أرسلنا طلبات نيابةً عن المواقع المتضررة بهذا الخطأ، مما أحدث طفرة بسيطة في نهاية العام.

أيار (مايو)/حزيران (يونيو) 2007

تلقى العديد من مشرفي المواقع إبلاغات زائفة عن انتهاكات لإرشادات مشرفي المواقع، مما أدى إلى إرسال عدد غير عادي من طلبات المراجعة وإعادة الفحص.

كانون الأول (ديسمبر) 2007

يرسل مشرفو المواقع عددًا أقل من طلبات المراجعة وإعادة الفحص كل عام خلال عطلات أواخر كانون (ديسمبر).

نيسان (أبريل) 2009

حزيران (يونيو) 2009

بدأنا في إرسال ردود على طلبات المراجعة وإعادة الفحص لإعلام مشرفي المواقع بأن طلباتهم تمت معالجتها.

تشرين الأول (أكتوبر) 2010

أجرينا ترقية لنظام الإبلاغات لدينا وبدأنا في إرسال المزيد من الرسائل.

نيسان (أبريل) 2011

روّجنا لخوارزمية Panda دوليًا. في الماضي، كانت المواقع غالبًا ما ترسل طلبات المراجعة وإعادة الفحص عندما ترى تغييرات في حركة المرور لا ترجع في الواقع إلى إجراء يدوي.

نيسان (أبريل) - أيلول (سبتمبر) 2011

بدأنا في إرسال طلبات المراجعة وإعادة الفحص بالإضافة إلى المزيد من المعلومات حول النتائج التي أسفرت عنها هذه الطلبات.

حزيران (يونيو) 2012

بدأنا في إرسال رسائل حول مجموعة أوسع من مشكلات انتهاكات الويب. ونرسل الآن إبلاغات بجميع الإجراءات اليدوية التي يتخذها فريق انتهاكات الويب، التي قد تؤثر بشكل مباشر على تصنيف المواقع في نتائج بحث الويب.
جوجل و مكافحة المحتوى غير المرغوب فيه جوجل و مكافحة المحتوى غير المرغوب فيه Reviewed by Ossama Hashim on March 02, 2013 Rating: 5

No comments:

Powered by Blogger.