البيانات الضخمة والعمالة الخفية

ترجمة مقال “Big Data’s Hidden Labor” بقلم:Evan Malmgren ، المنشور على موقع Jacobin.

من يملك بياناتك؟ اعتدنا على التنازل عن هذا السؤال في اتفاقيات شروط الخدمة التي لا نقرأها، لكنه أصبح بشكل متزايد مسألة تتعلق بكسب العيش. تُدير شركات الشحن مثل شركة يو بي إس وأمازون عمالها بأسلوب دقيق بواسطة شبكات مراقبة متقدمة، في حين تعتمد المتاجر الدولية وسلاسل الوجبات السريعة على خوارزميات كفاءة مُعقَّدة تُغذِّيها البيانات لوضع جداول العمل. وتستخلص تقنيات “المزارع الذكية” الخاصة بشركة مونسناتو رؤى قيّمة من المزارعين المستقلين على نطاق واسع، في حين قد يُسهم سائقو أوبر في تطوير بدائلهم ذاتية القيادة عن طريق بناء قواعد بيانات قيادة غير مسبوقة في الحجم والتفصيل.

لطالما جمع الرأسماليون بيانات مربحة من عمالهم دون تعويض، لكن مؤخرًا فقط أدى انتشار التقنيات الذكية المتصلة بالشبكة – “إنترنت الأشياء” – إلى توسيع نطاق هذا النوع من المراقبة إلى ما وراء مكان العمل، مضيفًا بُعدًا من خلق القيمة غير المدفوعة من حياتنا الشخصية. تُنشئ متاجر التجزئة الرقمية ملفات تعريف لنا لتقديم توصيات مُوجّهة؛ وتتعلم خدمات البث أذواقنا للتنبؤ بالمحتوى الذي سنستمتع به؛ وتتتبع تطبيقات اللياقة البدنية السعرات الحرارية وخطواتنا لمساعدتنا على اتخاذ قرارات “أكثر صحة”. وقريبًا، قد تتمكن نظارات الواقع الافتراضي حتى من تتبع حركات العين الدقيقة والنشاط التلقائي لشبكية العين.

عادةً ما تغذي هذه التقنيات معلوماتنا الشخصية مرة أخرى إلى الشركات الخاصة، حيث تحقق الرؤى حول عادات التسوق واهتماماتنا ووظائف أجسامنا أرباحًا هائلة. لا يمكن للبيانات الضخمة أن توجد دون مساهمتنا، ولولا تعاوننا الواسع النطاق لما نما سوق تحليلات البيانات ليصبح صناعة تبلغ قيمتها 130 مليار دولار. وبنفس الطريقة التي تضيف بها عملية جمع البيانات السلبية طبقات جديدة من العمل غير المرئي إلى يوم “المزارع الذكي”، فهي أيضًا تحوّل أوقات فراغنا تدريجيًا إلى عمل إنتاجي.

تسييج المشاعات

عندما بدأت خوارزمية” PageRank” من جوجل في تصفح الويب في عام 1996، كان لاري بيج وسيرجي برين قد بدأوا عن غير قصد عملية من شأنها أن تقلب منظومة المعلومات رأسًا على عقب. بواسطة ترتيب الكم الهائل المتزايد من روابط الإنترنت وفقًا لكثافة الروابط وإحصائيات تفاعل المستخدمين، طوّر طالبا الدكتوراه في جامعة ستانفورد خوارزمية نجحت في الاستعانة بعملائها – مستخدمي الخدمة المجانية – لإدارة محرك البحث. يقوم المستخدمون بتحسين الخوارزمية ببساطة بواسطة عمليات البحث، مما يجذب المزيد من المستهلكين إلى المنتج المطوّر، وبدوره يولد قاعدة أكبر لتحسين المحرك بشكل أكبر.

يُعد هذا المثال شكلًا مثاليًا لدورة “فضيلة” كما يتصورها الاقتصاديون الكلاسيكيون الجدد، وهو أيضًا من أوائل الأمثلة الواضحة على البيانات الضخمة التي يقودها المستهلك. كان هذا النموذج مبتكرًا لأنه دمج عملية الإنتاج الضخم – إنشاء بيانات مفيدة – في فعل الاستهلاك الجماعي، مما أدى في النهاية إلى دفع منافسي البحث مثل ألتا فيستا وهوت بوت وويب كراولر (بالإضافة إلى بوابات الويب المزدحمة مثل إم إس إن و إيه أو إل ولايكوس) إلى الاندثار بفضل هذا العمل الخفي.

قلة يعرفون أنه في أواخر عام 2001، كانت جوجل تدرس بهدوء التحول عن هذه “الدورة الفاضلة”، واختبرت نظام تصويت من شأنه أن يسمح للمستخدمين بالتأثير بشكل شفاف على ترتيب نتائج البحث الخاصة بهم. أطلقت دانا تود، المؤسس المشارك لـ SiteLab، على هذا النهج الأكثر انخراطًا اسم “وعي المُستخدِم”، لكن الميزة الشفافة لم تصل أبدًا إلى السوق. فقد اكتشفت جوجل أن جمع البيانات الجماعي يعمل بأفضل بطريقة عندما يكون مستترًا وغير مباشر.

يكشف التبادل النشط والمباشر – كما هو الحال مع استبيان أو استطلاع خدمة العملاء، على سبيل المثال – عن العمل المطلوب لتغذية خوارزمية سحرية. وبدلًا من اختيار جمع البيانات بشكل نشط، كثّفت جوجل جمع البيانات السلبي الخاص بها، مُوسّعة نطاقها ليشمل التحركات في الفضاء المادي (خرائط جوجل) والمستقبل المُتوقّع (تقويم جوجل) ومقاييس استخدام الإنترنت اليومي (جوجل كروم). تمثل هذه المجموعات المتراكمة من البيانات امتدادًا لما تصفه صفحة الخصوصية الخاصة بالشركة بـ”الأشياء التي تُشكل هويتك”.

سرعان ما أصبحت هذه التبادلات الخفية جزءًا أساسيًا ليس فقط في نموذج أعمال جوجل، ولكن أيضًا في نموذج أمازون. وبدأت أمازون عملاق الإنترنت للبيع بالتجزئة في تحقيق الدخل من بيانات المستخدم الشخصية في نفس الوقت تقريبًا مع جوجل، إذ اعتمدت أمازون على مجموعة واسعة من تواريخ الشراء الفردية لتغذية الخوارزميات التي أنشأت فهارس تُشابِه بين المنتجات وأدوات لتوصيف المستهلكين منذ عام 2003. وسرعان ما رسّخت أمازون مكانتها كرائد في الإعلانات المستهدفة عبر الإنترنت، مستفيدة من البيانات الوصفية كنظام توصيات مُعقّد. بدا الأمر وكأن أمازون قد نجحت في أتمتة وظيفة موظف مبيعات، لكنها في الواقع حمّلت العملاء أنفسهم مسؤولية القيام بعمل هذا الموظف داخل عملية الاستهلاك ذاتها.

للوهلة الأولى، قد يبدو أن هذا النموذج يتماشى تمامًا مع مقولة الناقدة السينمائية أنيت ميشلسون في عام 1979، التي ذكرت: “في عصر الإعلانات التلفزيونية، أنت هو المنتج النهائي الذي يُقدَّم بكميات كبيرة إلى المعلن.” لكن اقتصاد البيانات على الإنترنت أثبت أنه أكثر تعقيدًا بعض الشيء. فقد بدأت شركتا جوجل وأمازون في تبني بيانات المستهلكين في الوقت الذي كانت فيه عمالقة الإنترنت المبكرة الأخرى تكافح لتحقيق الربح من شعبيتها. في ذلك الوقت، كان المعلنون حذرين من الاستثمار في الإنترنت، الذي لم يكن يتمتع بجمهور أسير كما هو الحال في التلفزيون، وأظهر معدلات عائد ضعيفة في تحويل الاهتمامات إلى أرباح. وتجاوزت جوجل وأمازون هذه المشكلة من خلال تحويل أسواقهما العالمية إلى قوة عاملة. اعتمدت جوجل على مُدخلات المستخدمين لبناء منتج مهيمن، في حين حوّلت أمازون عملاءها إلى فريق تسويق ضخم مخصص لكل فرد. وقد حولت الشركتان بيانات المستخدمين إلى سلعة ذات قيمة بحد ذاتها.

وعلى ذلك، ومع تعديل على مقولة ميشلسون، يمكن القول إنه في عصر الاتصالات الرقمية، أصبحت بياناتك — وليس أنت شخصيًا — هي المنتج الذي يُقدَّم بكميات كبيرة. فبواسطة إعادة توظيف تفاعل المستهلكين وتحويله إلى سلع وخدمات ملموسة، أثبتت أمازون وجوجل أن البيانات الشخصية التي تُجمع مجانًا يمكن أن تتحول إلى أرباح. وليس من قبيل الصدفة أن هاتين الشركتين تمكنتا من تجاوز انهيار فقاعة الدوت كوم بسهولة، أو أن نماذجهما أصبحت تقريبًا هي المعيار الذي يُعرّف الجيل التالي من الإنترنت، أو ما يُعرف بـ”إنترنت 2.0.”

ومن بين شركات الإنترنت الحديثة التي استفادت من انتشار الهواتف الذكية بعد انهيار فقاعة الدوت كوم، تبرز فيسبوك بشكل لافت. فمنذ البداية، صُمّم موقع التواصل الاجتماعي الذي أطلقه مارك زوكربيرج كقاعدة بيانات للمستخدمين بهدف تحقيق الربح. وقد مرت المنصة بعدة تغييرات في التصميم قبل أن تستقر على شكلها الحالي، الذي يُشجِّع المستخدمين على الكشف عن أكبر قدر ممكن من المعلومات الشخصية. مع كل مرة نملأ فيها خانات الموقع أو نُكمِل نماذجه أو نشارك في فضائه المليء بالإعجابات والمنشورات والتفاعلات، تقوم الخوارزميات بفرز بياناتنا وتحليلها باستخدام تحليلات تنبؤية لاستنباط ميولنا السياسية ومستويات دخلنا ومصالحنا الشخصية الخفية.

وتُعبّأ هذه الملفات التفصيلية وتُباع للمعلنين بالجملة، دون أي تعويض للمستهلكين/المنتجين الذين تمنح جهودهم هذه البيانات قيمتها. بإيرادات سنوية تجاوزت 27 مليار دولار بنهاية عام 2016، تضخّمت فيسبوك لتصبح واحدة من أكبر شركات الإنترنت في العالم، ولم يتفوق عليها سوى أمازون وجوجل، اللتان بلغت إيراداتهما في عام 2016 نحو 136 و90 مليار دولار على التوالي.

هذه الشركات أنشأت صناعة قائمة على تجميع وتسويق البيانات الوصفية الشاملة: سلاسل مترابطة من التفاصيل الدقيقة التي تزداد قيمتها كلما ازدادت تعقيدًا. وقد أوضح إدوارد سنودن بفعالية قوة هذه البيانات في بث مباشر عام 2015:

“البيانات الوصفية تشبه إلى حد كبير ما يقوم به المحقق الخاص عندما يتعقب شخصًا ما.

قد لا يكون قريبًا بما يكفي لالتقاط كل كلمة تقولها في محادثة هامسة أثناء جلوسه خلفك في مقهى، لكنه سيعرف أين كنت ومن التقيت ومتى حصل ذلك وكيف غادرت وأين ذهبت.

وعندما تجمع هذه المعلومات معًا، ستتمكن من سرد القصة الكاملة لحياة شخص ما.”

فيسبوك لا يقتصر على معرفة حالتك العاطفية، والأشياء التي تنقر “أعجبني” عليها، وأماكن التقاط صور ملفك الشخصي — بل يربط هذه المعلومات بكل نشاط تقوم به عبر أي تطبيق خارجي تستخدمه من خلال تسجيل دخول فيسبوك، أو أي صفحة ويب تزورها عبره. هذا يسمح لهم بربط تمريراتك على “تيندر” بمعاملاتك على “فينمو”، ورحلاتك عبر “أوبر” بمتابعيك على “إنستغرام”، وطلباتك من “سيملس” بمصادرك الإخبارية المفضلة وطريقة وصولك إليها. وبالمثل، إذا كان تطبيق “خرائط جوجل” مثبتًا على هاتفك الذكي، يمكن لجوجل معالجة جميع تحركاتك إلى جانب سجل بحثك واشتراكاتك في النشرات الإخبارية وفيديوهاتك المفضلة على يوتيوب، وكل ما تقوم به على أي صفحة ويب تحتوي على زر +جوجل.

من المستحيل عمليًا استخراج أنماط مفيدة من هذا الكم الهائل من البيانات العشوائية دون وجود بنية تحتية مادية واسعة. ولهذا السبب، غالبًا ما يُشار إلى البيانات الضخمة بأنها “النفط الحديث”: فهي لا تملك أي قيمة في حالتها الخام، لكنها تصبح ثروة هائلة بعد معالجتها بالشكل الصحيح

لإعطاء فكرة عن حجم استثمار رأس المال في استخراج هذه الثروة البياناتية: تستأجر “تويتر” نحو خُمس مركز بيانات تبلغ مساحته 990 ألف قدم مربع في أتلانتا، حيث تخزن أكثر من 500 بيتابايت من البيانات، وتعالج وتخزن مؤقتًا وتحلل أكثر من نصف مليون تغريدة يوميًا. أما فيسبوك، فلديها سبعة مراكز بيانات تتراوح مساحتها من 160 ألف إلى 487 ألف قدم مربع، وصرحت الشركة بأنها امتلكت في نهاية عام 2015 معدات شبكات تزيد قيمتها على 3.6 مليار دولار. من جهتها، تنفق جوجل أكثر من 5 مليارات دولار في كل ربع سنة على 16 مركز بيانات ضخم موزع على أربع قارات ويضم أكثر من مليون خادوم. هذه العوائق الكبيرة أمام دخول السوق تجعل من الصعب على الشركات الجديدة منافسة عمالقة البيانات الحاليين، وبالتالي تعجز هذه الشركات عن تحقيق أرباح مماثلة من تفاعل المستخدمين مع الخدمات المجانية. ونتيجة لذلك، تتمتع مجموعة صغيرة من عمالقة التكنولوجيا بسيطرة احتكارية شبه كاملة على بياناتنا الوصفية الجماعية.

ومع أن هذا التركيز المحدود للملكية قد يثير القلق، إلا أن معالجة كميات هائلة من المعلومات الشخصية قد أفضت بالفعل إلى بعض الفوائد للأفراد والمجتمع بشكل عام. على سبيل المثال، تعطي جوجل الأولوية للأخبار التي أجدها بالفعل مثيرة للاهتمام، وترسل “تيكتماستر” إشعارات مخصصة بالأحداث بناءً على الفنانين الذين أتابعهم على “ساوند كلاود”، كما ألاحظ دائمًا المنشورات الممولة التي تعلن عن تخفيضات الأعياد من قبل بعض المجلات الاشتراكية. وعلى مستوى أوسع، تسهم البيانات الضخمة في مساعدة مخططي المدن على تصميم مدن أكثر ذكاءً، والعاملين في الرعاية الصحية على التنبؤ بالأوبئة وعلاج الأمراض، والمهندسين على التعرف على المشكلات الجديدة أو حتى التنبؤ بها لإيجاد حلول لها.

ومع ذلك، يجب ألا ننسى أن تطورات البيانات الضخمة تعتمد في النهاية علينا نحن — الذين نخلق هذه البيانات — وليس على مراكز المعالجة الضخمة وحدها. كان متوسط قيمة المستخدم العادي لفيسبوك حوالي 15 دولارًا سنويًا في بداية عام 2016، بينما بلغ هذا الرقم بالنسبة لجوجل حوالي 33 دولارًا. قد تبدو هذه الأرقام صغيرة، لكنها تصبح ضخمة عند ضربها في عدد المستخدمين الكبير، وستستمر في النمو مع تحسن قدرة شركات التحليل وتقنيات التعلم الآلي على معالجة المعلومات الخام وتحويلها إلى رؤى مربحة.

من الطبيعي أن يتوقع أي شخص تعويضًا مقابل المشاركة في دراسة سريرية أو الجلوس في لجنة استبيان لاختبار منتج. لكن مع تقديمنا لهذا النوع من البيانات عن بُعد، فإن الفرق الوحيد هو زيادة الشعور بالاغتراب. نحن لا نتوقع الحصول على أجر مقابل بياناتنا ببساطة لأن إنتاجها لا يُعتبر “عملًا.”

البحث عن بدائل

يجب أن يُفهم العمل — وتُقدَّر مكافأته — بناءً على القيمة التي يخلقها، وليس بناءً على درجة الإلزام أو الإكراه. قد يكون الناس مستعدين للانخراط في أنشطة تُنتج قيمة من اختيارهم، لكن هذا لا يعني أنه ينبغي السماح لهذه الثروة الجديدة بالتجمع في أيدي مجموعة صغيرة نسبيًا من المطورين والمديرين التنفيذيين في شركات التكنولوجيا. إذا لم نعترف بأن البيانات الضخمة هي مشروع يخص المجتمع بأسره، فإننا نخاطر بإهدار إنجاز تقني مذهل: القدرة على تحويل وقت الفراغ إلى منفعة مادية.

هذا التقدم لا يشير بالضرورة إلى أننا نسير نحو مجتمع ما بعد العمل، بل نحو مجتمع يصبح فيه العمل متداخلًا على نحو متزايد مع أنشطة طوعية أو حتى ممتعة. هذا الدمج بين العمل واللعب يمثل جوهر الرؤية الطوباوية لماركس، كما ورد في نقد برنامج غوتا”، حيث يصبح العمل ليس مجرد وسيلة للحياة، بل يصبح الرغبة الأساسية في الحياة.”

تصوّر الاشتراكيون الطوباويون، مثل تشارلز فورييه، مجتمعًا مستقبليًا يتحول فيه العمل الإنتاجي إلى متعة شخصية وتحقيق للإبداع، بل وقد يتجاوز ذلك إلى حدود البذخ المفرط. ورغم أننا قد لا نتمكن من التخلص تمامًا من كدح الحياة بين الحين والآخر، أو أن نصل إلى نموذج يُشبه الفالانستير” (المجتمع التعاوني المثالي الذي تخيله فورييه)، إلا أن هذا لا يعني استحالة تحقيق هذه الرؤية بشكل محدود أو جزئي.

إذا استطعنا المطالبة بحقوق ملكية البيانات الشخصية، يمكننا أن نتخيل مستقبلًا تُرفع فيه الأجور لتعويض المعلومات التي يتم جمعها من العمل الحالي، ويُقصَّر فيه يوم العمل بفضل القيمة المضافة المستخلصة من وقت الفراغ. لقد أصبحت البيانات الضخمة بالفعل عنصرًا إنتاجيًا في العديد من جوانب الاستهلاك، وفي الكثير مما نقوم به بشكل يومي. وإذا أردنا تحقيق الإمكانات الاجتماعية الكاملة للبيانات الضخمة، فإن المهمة السياسية الأساسية تكمن في المطالبة بالاعتراف بالعمل الخفي الذي يُساهم في بنائها.