بيت المميزات يريد هؤلاء المدافعون التأكد من عدم اختفاء بياناتنا

يريد هؤلاء المدافعون التأكد من عدم اختفاء بياناتنا

جدول المحتويات:

فيديو: من زينو نهار اليوم ØµØ Ø¹ÙŠØ¯ÙƒÙ… انشر الفيديو Øتى يراه كل Ø§Ù„Ø (شهر نوفمبر 2024)

فيديو: من زينو نهار اليوم ØµØ Ø¹ÙŠØ¯ÙƒÙ… انشر الفيديو Øتى يراه كل Ø§Ù„Ø (شهر نوفمبر 2024)
Anonim

في أواخر شهر مايو من هذا العام ، أي بعد خمسة أشهر بالضبط من تنصيب الرئيس الأمريكي الخامس والأربعين ، احتفلت مجموعة من الأشخاص المهتمين بموقف الإدارة الجديدة تجاه العلم وتغير المناخ بالذكرى السنوية الخاصة بها.

ليس بعيدًا عن حرم جامعة شمال تكساس ، في السهول الشمالية من دالاس ، التقى عشرات من الأفراد في Data Rescue Denton لتحديد وتنزيل نسخ من المناخ الفيدرالي ومجموعات البيانات البيئية. حظيت هذه التجمعات على غرار الهاكاثون باهتمام كبير في الأيام التي سبقت الافتتاح مباشرة ؛ كان دنتون هو الحدث رقم 50 منذ يناير.

التنظيم في البداية خشية أن الإدارة الجديدة قد تمحو أو تحجب المناخ والبيانات البيئية الأخرى ، ويبدو أن أسوأ مخاوف رجال الإنقاذ أصبحت حقيقة عندما كان أحد الإجراءات الأولى لترامب البيت الأبيض لحذف صفحات تغير المناخ من موقعه على شبكة الإنترنت. بعد ذلك ، استجابت وزارة الزراعة الأمريكية ، بعد إزالة تقارير فحص رعاية الحيوان من موقعها على الإنترنت ، لطلب قانون حرية المعلومات الجغرافية الوطني الذي يحتوي على 1،771 صفحة من المواد المنقوصة بالكامل.

يمكن لأي شخص الوصول إلى أكثر من 153000 مجموعة بيانات اتحادية من خلال بوابة البيانات المفتوحة للحكومة المركزية على data.gov. ولكن هذا ليس سوى جزء صغير من البيانات الموجودة في سديم البيروقراطية الحكومية ، ولا يهم أي جزء أصغر موجود على الخادم.

وقال جيم جاكوبس ، أمين مكتبة معلومات الحكومة الفيدرالية في مكتبة جامعة ستانفورد: "يمكن الوصول إلى شبكة الإنترنت في حوالي 20 في المائة من المعلومات الحكومية". "هذا جزء كبير إلى حد ما من الأشياء غير المتاحة. على الرغم من أن الوكالات لديها الويكي وأنظمة إدارة المحتوى الخاصة بها ، فإن المرة الوحيدة التي تكتشف فيها بعض هذه المعلومات هي إذا قام شخص ما بتفويضها."

بالتأكيد ، تم بالفعل الحصول على قدر كبير من المعلومات وتوجد الآن على خوادم غير حكومية. بين أحداث Data Refuge ومشروعات مثل الزحف نهاية نهاية عام 2016 ، تمت أرشفة أكثر من 200 تيرابايت من المواقع والبيانات الحكومية. لكن منظمي الإنقاذ بدأوا يدركون أن الجهود المتقطعة لإنشاء نسخ كاملة من تيرابايت من البيانات العلمية للوكالة الحكومية لا يمكن إدامتها بشكل واقعي على المدى الطويل - سيكون الأمر أشبه بإنقاذ التايتانيك كشتبان.

لذا على الرغم من أن Data Rescue Denton انتهى به المطاف كواحد من الأحداث المنظمة النهائية من نوعها ، إلا أن الجهد الجماعي قد حفز مجتمعًا أكبر على العمل في تضافر نحو جعل المزيد من البيانات الحكومية قابلة للاكتشاف والفهم وقابلية الاستخدام ، كما كتب جاكوبس في منشور بالمدونة.

تبحث في المكتبات

في جامعة بنسلفانيا ، بيثاني ويجين هي مديرة برنامج بن في العلوم الإنسانية البيئية ، حيث كانت مركزية في حركة ملجأ البيانات ، المنشئ لأحداث إنقاذ البيانات. وقالت إن التركيز قد تحول الآن ، نحو الاستفادة من الأطر الوطنية للجهود الطويلة الأجل بدلاً من الحلقات الدورية المحلية.

وقال ويجين ، "لقد أدركنا المهارات التي كانت ناشئة في أماكن مختلفة تقوم بأحداث بيانات الإنقاذ ، وهو أمر يمكن زيادته" ، لا سيما عبر المكتبات البحثية. "لكن كل هذه الجهود كانت تحدث قبل إطلاقنا. لقد كانت قوة Data Refuge تتمثل في تعميق تلك الروابط ، وتحفيز المشروعات البطيئة الحركة ، وتسليط الضوء على مدى أهميتها."

وقد ساعدت Wiggin مؤخرًا في قيادة Libraries + Network ، وهي شراكة ناشئة من مكتبات البحوث ومنظمات المكتبات ومجموعات البيانات المفتوحة التي تم حفزها لتوسيع دور المكتبات التقليدي في الحفاظ على الوصول إلى المعلومات. من بين المشاركين مكتبة أبحاث جامعة ستانفورد ، ومكتبة كاليفورنيا الرقمية ، ومؤسسة موزيلا ، بمشاركة وتعاون من كيانات واسعة مثل الأرشيف الوطني وكبار مسؤولي البيانات في العديد من المكاتب الفيدرالية.

أحد المشاريع ، على سبيل المثال ، هو LOCKSS ("الكثير من النسخ تحافظ على سلامة الأشياء") والتي كان جاكوبس ينسقها منذ عدة سنوات. يعتمد على نفس مبدأ شبكة المكتبات التي يبلغ عمرها 200 عام والمعروفة باسم برنامج مكتبة الإيداع الفيدرالي ؛ هذه المكتبات هي مستودعات رسمية للمنشورات من قبل مكتب الطباعة التابع للحكومة الأمريكية (GPO).

LOCKSS ، على النقيض من ذلك ، هو نسخة رقمية خاصة من هذا النظام ، والتي تتكون حتى الآن من 36 مكتبة تحصد المنشورات من GPO بالتعاون معها. إنه نموذج لكيفية حماية المعلومات الرقمية من الحذف أو العبث من خلال تشتت مادي واسع.

وقال جاكوبس: "لا يمكنك ضمان الحفظ ما لم تكن لديك السيطرة على المحتوى". "جزء من ما جعل المكتبات الوديعة مهمة ومفيدة على مدى المائتي عام الماضية هو أنه لا يمكن لأي شخص في الحكومة تحرير وثيقة دون الذهاب إلى 1500 مكتبة وقول" نعم ، قم بتغيير هذه الصفحة هنا ".

يستخدم البرنامج LOCKSS فحص ذاكرة التخزين المؤقت للمحتوى على مستوى البت ومقارنته بالمحتوى الذي تحتفظ به المكتبات الأخرى ، والذي قال جاكوبس إنه يساعد على ضمان الحفاظ على المدى الطويل من خلال إصلاح الملفات المتدهورة.

جون تشوداكي ، متعاون آخر مع Libraries + Network ، هو مدير إدارة المكتبة الرقمية في كاليفورنيا ، وهي منشأة معلومات افتراضية تخدم جميع الجامعات العشرة بنظام جامعة كاليفورنيا. من خلال العمل مع مطور Code for Science and Society Max Ogden و Philip Ashlock ، كبير المهندسين في data.gov ، يقول Chodacki إن تركيزهما كان على استخدام data.gov كشارع ذو اتجاهين.

لقد أوضحوا أولاً أن عملية إنقاذ البيانات نفسها يمكن أن تكون أكثر فاعلية بكثير من خلال جمع نسخة من data.gov بنفسها ووضعها على موقع خارجي ، datamirror.org ، مع مراقبة النصوص التي تبحث عن التحديثات. بعد ذلك ، بدأ Chodacki والمتعاونون أيضًا في النظر فيما إذا كانت مجموعات البيانات والبيانات الوصفية المساهمة في المرآة يمكن أن تغذي سير عمل data.gov الحالي للوكالات من خلال صفحات كعب الروتين.

وفقًا لأمر أوباما التنفيذي لعام 2013 الذي فرض نشر البيانات المقروءة آليًا على data.gov ، ستظل الوكالات مسؤولة عن إنشاء السجلات المسردة في تلك البوابة ؛ فكرة Chodacki و Ogden هي أن الاستعانة بمصادر خارجية لمجموعات البيانات المقترحة تساعد ببساطة على نشر عبء العمل.

وقال تشوداكي "لسنا بحاجة لتكرار النظام البيئي بأكمله." "لقد تعاملت الحكومة الفيدرالية وهذه الوكالات مع البيانات لفترة أطول مما كان جديرًا بالحديث عن البيانات الضخمة ، بطريقة أكثر قوة من أي شخص آخر."

شراكه بين القطاع العام والخاص

تعتبر مسألة التكلفة مسألة واضحة عندما يتعلق الأمر بكيفية قيام الوكالات بتحديد مجموعات البيانات الأكثر أهمية بالنسبة للجمهور ، ثم نشر روابط إلى البيانات الوصفية أو مجموعات البيانات الفعلية من خلال البوابة الحكومية. يقدر تقرير مكتب ميزانية الكونجرس (CBO) لمشروع قانون قانون بيانات الحكومة المفتوحة حاليًا في مجلس الشيوخ - والذي من شأنه تدوين الأمر التنفيذي لأوباما ليصبح قانونًا - أن تنفيذه بالكامل سيكلف مليوني دولار بين عامي 2018 و 2021.

من حيث المال الحكومي ، لا يمثل هذا في الأساس أي زيادات حقيقية في الإنفاق ، كما خلص البنك المركزي.

ومع ذلك ، فإن الكفاءة هي سؤال مختلف ، وهو ما جربه إد كيرنز من الإدارة الوطنية للمحيطات والغلاف الجوي مع شركاء من القطاع الخاص بما في ذلك خدمات الويب من أمازون وغوغل. وقال كيرنز ، كبير مسؤولي البيانات في NOAA ، إن زيادة توافر واستخدام بيانات NOAA يعد هدفًا رئيسيًا لمشروع البيانات الضخمة.

تحدد الشركات مجموعات البيانات التي تريدها ، وتقوم NOAA بنقلها دون أي تكلفة إضافية إلى الجمهور. قال كيرنز إن أي شيء لديه NOAA مطروح على الطاولة ، لكن هدف الشراكة لمدة خمس سنوات لا يتمثل في إخراج جميع بيانات NOAA على السحابة - مجرد قطع استراتيجية.

يوفر استضافة مجموعات البيانات هذه على الخدمات السحابية للشركات الخاصة العديد من المزايا للوصول إلى FTP على نمط الثمانينات والذي لا يزال معيارًا لنقل مجموعات البيانات الكبيرة من الوكالات الفيدرالية. للبدء ، تميل مجموعات بيانات NOAA إلى أن تكون واسعة - حيث تقوم الوكالة بمراقبة محيطات الأرض والغلاف الجوي والشمس والطقس - وأحيانًا تتطلب أسابيع أو أشهر للتوصيل العام.

أحد الأمثلة على ذلك هو أرشيف رادار دوبلر NEXRAD من المستوى الثاني عالي الدقة للوكالة. وفقًا لدراسة نشرت في شهر مايو من قبل الجمعية الأمريكية للأرصاد الجوية ، فإن نقل أرشيف NEXRAD بالكامل البالغ تيرابايت 270 تيرابايت إلى عميل واحد في أكتوبر 2015 قد يستغرق 540 يومًا بتكلفة 203،310 دولار. لم تكن نسخة كاملة من الأرشيف متاحة للتحليل الخارجي قبل أن تعمل NOAA مع Amazon و Google لوضع واحدة على السحابة.

لقد حققت التجربة أيضًا بعض النتائج المبكرة المثيرة للاهتمام مع زيادة الاستخدام. تتلقى صفحات الويب الخاصة بالطقس والتنبؤ في NOAA بالفعل بعضًا من أعلى مستويات الحركة بين المواقع الحكومية ، ولكن بعد أن قامت Google مؤخرًا بدمج مجموعة بيانات واحدة عن المناخ والطقس ، حول حجم أزعج ، في قاعدة بيانات BigQuery الخاصة بها ، أبلغت الشركة عن تقديم 1.2 بيتابايت من مجموعة البيانات هذه من 1 يناير إلى 30 أبريل - أكثر بكثير من أي وقت مضى تم الوصول إليه في إطار زمني مماثل من خوادم NOAA.

وقال كيرنز "تمكنت Google من فتحه أمام جمهور جديد بالكامل".

انها ليست مجرد المطر ودرجات الحرارة الموسمية. تتضمن مجموعات البيانات المتاحة الآن من خلال شركاء البيانات الكبيرة معلومات مصايد الأسماك والطقس البحري وكتالوج يستضيفه IBM الذي يسرد مجموعات البيانات الحالية والمتوقعة والتاريخية والجغرافية المكانية من مراكز NOAA. يمكن أن تتضمن مجموعات البيانات المستقبلية معلومات عن النظم الإيكولوجية وعلم جينيات مصايد الأسماك.

ولكن من خلال التصميم ، تسمح الشراكة للمتعاونين باختيار ما يريدون أكثر ، والذي ينطوي على خطر عدم رؤية مجموعات البيانات الغامضة ، وإن كانت ذات القيمة العالية المحتملة ، في ضوء النهار. يقول كيرنز إنه من السابق لأوانه تحديد ما يمكن تحديده في نهاية المطاف على أنه قيم.

وأضاف "حجم ومدى ما يمكن فعله بهذه البيانات مذهل لنا." "لا يمكننا تخيل جميع الاستخدامات الممكنة."

على نطاق أصغر ، عملت مدينة فيلادلفيا أيضًا مع كيان خاص من أجل نشر مجموعات البيانات التي قال الجمهور إنها ستجدها مفيدة للغاية. على الرغم من أن حجم المدينة يمنحها القدرة على المناورة التشغيلية اليومية أكثر من الكيان الفيدرالي ، إلا أن نموذج Philly يمثل طريقة واحدة لوضع استراتيجيات لإصدارات مجموعات البيانات التي لم يتم نشرها بعد.

تعاونت Azavea ، وهي شركة برمجيات مقرها Philly متخصصة في تصوير البيانات ، مع كبير مسؤولي المعلومات في المدينة ، Tim Wisniewski ، لوضع قائمة بمجموعات البيانات غير المنشورة التي قد لا يكون لها مصلحة في استخدامها. استخدم كل من Wisniewski و Azavea كتالوج البيانات التعريفية للمدينة عبر الإنترنت ومدخلات من إدارات المدينة لتطوير القائمة. ثم قام Azavea وشركاء آخرون بالتسوق إلى القائمة غير الربحية لفيلادلفيا وأطلقوا OpenDataVote ، مسابقة للجمهور للتصويت على المشاريع التي طرحتها تلك المنظمات غير الربحية لكيفية استخدامهم لمجموعات البيانات المفضلة لديهم.

وكان أحد الفائزين حديثًا اقتراحًا تقدمت به مؤسسة MicroSociety التعليمية غير الربحية لاستخدام بيانات المدينة عن الجهات المانحة لمقاطعة فيلادلفيا التعليمية لقياس تأثير البرامج غير الهادفة للربح في المدارس.

وقال ويسنيفسكي: "يمكننا أن نقول إن هذه المدينة غير الربحية مهتمة بمجموعة بيانات معينة لأنها يمكن أن تفعل شيئًا معها ، وأن هذا العدد الكبير من الناس صوتوا لدعمهم". "إنه يتيح لنا الذهاب إلى الإدارات مع حالة استخدام قوية في متناول اليد بدلاً من قول ، مهلا ، إصدار هذه البيانات لمجرد".

البيانات القديمة والجديدة

ولكن ماذا يحدث حتى عندما يكون هناك قدر كبير من الوصول إلى البيانات الموجودة بالفعل ، عندما تعني السياسات الجديدة وتوجيهات التمويل أن البيانات نفسها لم تعد يتم إنشاؤها بعد الآن؟ هذا هو مصدر قلق حقيقي ، كما قالت آن دونكين ، التي عملت ككبير موظفي المعلومات في وكالة حماية البيئة في عهد الرئيس أوباما وترأس الآن تكنولوجيا المعلومات في مقاطعة سانتا كلارا بولاية كاليفورنيا.

وقال دانكن: "الناس قلقون بشأن البيانات القديمة ، لكن أكثر ما يقلقني هو أن البيانات الجديدة لا يتم توفيرها بنفس المعدل كما كان من قبل ، أو عدم توليدها على الإطلاق".

في تحليل واحد للميزانية الفيدرالية المقترحة لعام 2018 من قبل مجلة Science ، ستحقق العديد من الوكالات الحكومية تخفيضات كبيرة في ميزانيات البحوث الخاصة بها إذا تم تمرير الميزانية على النحو المقترح. إن التخفيض بنسبة 22٪ تقريبًا في المعاهد الوطنية للصحة سيؤدي إلى دفع مبالغ إلى الجامعات البحثية ؛ من شأن طلب ميزانية ناسا إلغاء مبادرات رصد انبعاثات غازات الدفيئة وبرامج علوم الأرض الأخرى. برامج المناخ في NOAA يمكن أيضا أن تكون مغلقة مع مستويات مماثلة من التخفيضات.

خلال فترة ولايتها ، كانت وكالة حماية البيئة تعمل من أجل جعل مجموعتها من البيانات في أداة ليستخدمها أي شخص لفهم صحة محيطه وكيفية التعامل معه. يوم سيء الهواء؟ لا تذهب للخارج دفق الطريق ملوثة؟ تبقي الاطفال بعيدا.

وأضاف دانكن "توقعي هو أن يتحرك إلى الوراء". "قد أكون مخطئًا ، ولكن إذا كنت تقول إننا لن نوفر البيانات ، فإن الاستنتاج المنطقي هو مجموعات البيانات التي قد تساعد أفراد الجمهور أيضًا لن تكون متاحة أو لم يتم إنشاؤها في المقام الأول."

تعمل Data Refuge's Wiggin على مشروع لسرد القصص يتعلق بهذه المسألة وتأمل أن يحفز المزيد من الناس للمطالبة بالإصدارات المستمرة للبيانات ، وخلق دعم كبير لمواصلة برامج جمع البيانات الحالية في جميع أنحاء الحكومة الفيدرالية. ستعرض قصص "ثلاث قصص في مدينتنا" التأثير الفدرالي الخفي للبيانات الفيدرالية في أماكن غير متوقعة ، بدءًا من فيلادلفيا أولاً ، ثم في أماكن أخرى في جميع أنحاء البلاد.

وقال ويجن "إن جزءًا مهمًا من حركة ملجأ البيانات ، ونحن ننتقل إلى المرحلة التالية ، هو مساعدة الناس على فهم مدى انتشار البيانات المنتجة على المستوى الفدرالي في حياتهم". "سواء أسميتها المناخ أو الصحة أو السلامة العامة ، فإنها لا تزال بيانات فدرالية. إنها في المجتمعات ، في دار البلدية ، في جهود الشرطة ، في الجيش. نحن بحاجة إلى أن نتذكر مدى أهمية تلك البيانات."

مصادر:

  • بوابة مجموعة بيانات EPA البيئية: بوابة بيانات وكالة حماية البيئة.
  • البيانات المفتوحة @ وزارة الطاقة: بوابة البيانات المفتوحة لوزارة الطاقة.
  • بوابة بيانات خدمة البحوث الاقتصادية لوزارة الزراعة الأمريكية
  • موارد البيانات الضخمة في NOAA: ارتباطات بصفحات النظام الأساسي لشركاء البيانات الكبيرة التي تستضيف البيانات التي تم إنشاؤها بواسطة NOAA.
  • جامعة شمال تكساس: مقبرة سايبر: أرشيف للمواقع الحكومية البالية أو القديمة أو المغلقة.
  • مشروع أرشفة مبادرة البيانات البيئية والحوكمة: الأدوات والرموز والتطبيقات المتعلقة باكتشاف البيانات الحكومية وحفظها.
  • أرشيف الإنترنت آلة Wayback
  • أرشيف الإنترنت: كيفية حفظ الصفحات في آلة Wayback: ست طرق لترشيح الصفحات للأرشفة.
  • مكتبة كاليفورنيا الرقمية: أرشيف الويب الخاص بنهاية المدة: مجموعة من مواقع حكومة الولايات المتحدة المحفوظة من زحف نهاية المدة ، من عام 2008 إلى الوقت الحاضر.
  • FreeGovInfo.info: محتوى واسع النطاق يحتوي على معلومات حول بوابات البيانات على مستوى الولاية والمستوى الاتحادي ، وأرشيفات الأخبار التي تتناول قضايا البيانات المفتوحة.
  • مرآة المناخ: مجموعة من مجموعات بيانات المناخ المتطوعين.

ظهرت هذه القصة لأول مرة في PC Magazine Digital Edition. اشترك اليوم للحصول على المزيد من القصص الإخبارية الأصلية والأخبار والمراجعات وكيفية المشاركة!

يريد هؤلاء المدافعون التأكد من عدم اختفاء بياناتنا