باز کردن داده؛ قسمت اول: چگونه داده را باز کنیم؟

  • ۱۷ مرداد ۱۳۹۷
  • 16
  • بدون دیدگاه
  • نویسنده: شفافیت برای ایران
  • لینک کوتاه:

بخش حاضر هسته اصلی کتاب راهنمای داده باز به شمار می‌رود. در این بخش توصیه‌های ملموس و مشروح پیرامون چگونگی بازکردن داده توسط دارندگان داده ارائه می‌شود. ما به مسائل اصلی می‌پردازیم، اما دشواری‌ها را نیز در نظر می‌گیریم. در […]

باز کردن داده؛ قسمت اول: چگونه داده را باز کنیم؟

بخش حاضر هسته اصلی کتاب راهنمای داده باز به شمار می‌رود. در این بخش توصیه‌های ملموس و مشروح پیرامون چگونگی بازکردن داده توسط دارندگان داده ارائه می‌شود. ما به مسائل اصلی می‌پردازیم، اما دشواری‌ها را نیز در نظر می‌گیریم. در پایان، مسائل ظریف‌تری که امکان دارد بوجود بیایند را مورد بحث و بررسی قرار می‌دهیم.

توصیه ما پیروی از سه قانون مهم هنگام باز کردن داده است:

  • ساده و به دور از پیچیدگی عمل کنید. با داده کوچک، ساده و سریع شروع کنید. لزومی ندارد که همه مجموعه داده‌ها همین حالا باز شوند. آغازِ کار با بازکردن تنها یک مجموعه داده، یا حتی بخشی از یک مجموعه داده بزرگ، مناسب است – البته هرچه مجموعه داده‌های بیشتری را باز کنید، بهتر است.

به خاطر داشته باشید که منظور از داده باز، نوآوری است. حرکت در سریع‌ترین حالت ممکن خوب است زیرا نشان می‌دهد شما قادر به ایجاد حرکت و یادگیری از تجربه هستید. نوآوری همانقدر که درباره موفقیت است درمورد شکست نیز هست و هر مجموعه داده‌ای مفید نیست.

  • از ابتدای فرآیند و در طول انجام آن همواره با مخاطبین مشارکت کنید. با کاربران و کاربران مجدد حقیقی و بالقوه داده، چه شهروند باشند، شرکت باشند و یا توسعه‌دهنده، در اولین زمان ممکن و همواره مشارکت کنید. از این طریق اطمینان حاصل می‌شود که نسخه بعدی خدمت شما بیشترین تناسب را خواهد داشت.

لازم است به خاطر داشته باشید که بخش زیادی از داده مستقیما به دست کاربر نهایی نمی‌رسد، بلکه از طریق «واسطه‌های اطلاعاتی» منتقل می‌شود. اینها افرادی هستند که داده را دریافت کرده و آنرا برای ارئه تغییر می‌دهند یا تلفیق مجدد (ریمیکس) می‌کنند. برای مثال، اغلب ما یک مجموعه داده بزرگ از مختصات GPS را نمی‌خواهیم و نیاز نداریم، داشتن یک نقشه را ترجیح می‌دهیم. بنابراین ابتدا با واسطه‌های اطلاعات مشارکت کنید. آنها مواد را بازاستفاده و بازهدف‌گذاری می‌کنند.

  • ترس‌های متداول و سوءتفاهم‌ها را مورد بررسی قرار دهید. اهمیت این عمل زمانی مشخص می‌شود که با و یا درون سازمان‌های بزرگ نظیر دولت کار می‌کنید. هنگام باز کردن داده، با سوالات و ترس‌های زیادی روبرو خواهید شد. مهم است که (الف) مهم‌ترین سوالات و ترس‌ها را شناسایی کنید و (ب) در سریع‌ترین زمان ممکن به آنها رسیدگی کنید.

برای باز کردن داده چهار مرحله مهم وجود دارند، که هرکدام به تفضیل در ادامه خواهد آمد. ترتیب آنها کاملا تقریبی است. بسیاری از مراحل را می‌توان به صورت همزمان انجام داد.

  1. مجموعه‌(های) داده خود را انتخاب کنید. مجموعه‌(های) داده‌ای که قصد دارید باز شود را انتخاب کنید. به خاطر داشته باشید که می‌توانید (و ممکن است لازم باشد) در صورت رویارویی با مشکلاتی در مراحل بعدی، به این مرحله بازگردید.

  1. از یک مجوز باز استفاده کنید.

    1. حقوق مالکیت معنوی موجود در داده را مشخص کنید.

    2. از یک مجوز «باز» مناسب استفاده کنید که تمامی این حقوق را تصدیق کرده و از تعریف بازبودن حمایت می‌کند، این تعریف در بخش مربوط به «داده باز چیست» توصیف شد.

    3. خوب دقت کنید: اگر قادر به انجام این کار نیستید، به مرحله 1 بروید و یک مجموعه داده دیگر را امتحان کنید.

  1. داده را در دسترس قرار دهید: در حجم بالا و یک فرمت مفید. حتی ممکن است متمایل باشید راه‌های دیگرِ در دسترس قرار دادن داده نظیر API را بررسی کنید.

  1. داده را قابل‌کشف کنید: آن را روی وبسایت قرار دهید و شاید یک کاتالوگ مرکزی تنظیم کنید تا مجموعه داده‌های باز شما را فهرست کند.

مجموعه‌(های) داده را انتخاب کنید.

مرحله نخست انتخاب مجموعه(های) داده‌ایی است که قصد باز کردن آنها را دارید. البته به خاطر داشته باشید که تمام فرآیند بازکردن داده قابلیت تکرارشوندگی دارد و در صورت رویارویی با مشکلات در مراحل بعدی، می‌توانید به این مرحله بازگردید.

اگر از قبل و به طور دقیق می‌دانید قصد باز کردن چه مجموعه(های) داده‌ای را دارید، می‌توانید مستقیما به بخش بعدی بروید. با این وجود، در بسیاری موارد، بخصوص در مورد سازمان‌های بزرگ، انتخاب اینکه روی کدام مجموعه داده تمرکز شود، یک چالش محسوب می‌شود. در این مورد شخص چگونه باید ادامه دهد؟

ایجاد این فهرست باید یک فرآیند سریع باشد که تعیین می‌کند برای شروع کدام مجموعه‌‌های داده را می‌توان باز کرد. در مراحل بعدی زمان بررسی جزءبه‌جزء اینکه هر مجموعه داده مناسب هست یا خیر وجود دارد.

لزومی ندارد که فهرست جامعی از مجموعه‌های داده خود ایجاد کنید. مهمترین نکته‌ای که باید در ذهن داشته باشید این است که آیا اصلا امکان انتشار این مجموعه داده (چه به صورت باز چه به هر شکل دیگری) وجود دارد یا خیر

پرسش از جامعه

توصیه ما این است که در وهله نخست از جامعه پرسش کنید. اینها همان اشخاصی هستند که به داده دسترسی خواهند یافت و از آن استفاده خواهند کرد، و احتمالا درک خوبی دارند از اینکه کدام داده ارزشمند است.

  1. فهرست کوتاهی از مجموعه داده‌های بالقوه آماده کنید که خواهان بازخورد درباره آنها هستید. لزومی ندارد این فهرست مطابق با انتظارات شما باشد، نیت اصلی این است که نسبت به تقاضای داده درک بهتری به‌دست آورید. این عمل را می‌توان براساس کاتالوگ‌های داده باز در دیگر کشورها انجام داد.

  1. درخواست ارائه نظر بدهید.

  1. درخواست خود را در یک صفحه‌وب تبلیغ کنید. اطمینان حاصل کنید که می‌توان از طریق URL به تقاضا دسترسی پیدا کرد. به این طریق، زمانی که از طریق رسانه‌های اجتماعی به اشتراک گذاشته می‌شود، به‌راحتی می‌توان به تقاضا دست یافت.

  1. راه‌های آسان برای پاسخ‌دهی فراهم کنید. از گزینه نیاز به ثبت‌نام اجتناب کنید زیرا تعداد پاسخ‌ها را کاهش می‌دهد.

  1. تقاضا را در فهرست‌های پستی مرتبط، اتاق‌های گفتگو و بین اشخاص دست به دست کنید و آنها را به صفحه‌وب اصلی ارجاع دهید.

  1. یک رویداد مشاوره برگزار کنید. اطمینان حاصل کنید که آن را در زمان مناسبی برگزار می‌کنید طوری که عموم صاحبان کسب‌و‌کار، مهیاکنندگان داده و مقامات رسمی بتوانند در آن شرکت کنند.

  1. از یک سیاست‌مدار درخواست کنید تا از طرف موسسه شما سخنرانی کند. بسیار محتمل است که داده باز به‌عنوان بخشی از یک سیاست وسیع‌تر برای افزایش دسترسی به اطلاعات دولتی قرارگیرد.

مبنای هزینه (مبنای قیمت تمام شده)

موسسات چه مقدار پول صرف گردآوری و نگهداری داده‌های خود می‌کنند؟ اگر آنها پول هنگفتی صرف یک مجموعه داده خاص می‌کنند، به احتمال زیاد دیگران دوست دارند به آن دسترسی داشته باشند.

این استدلال در رابطه با نگرانی نسبت به سواری دادن مجانی تا حدودی درست است. سوالی که لازم است به آن پاسخ دهید این است که «چرا باید دیگران به صورت رایگان به اطلاعاتی دست یابند که بسیار گران است؟». پاسخ این است که هزینه توسط بخش خصوصی بلعیده می‌شود تا عملیات خاصی اجرا شود. هزینه ارسال داده، پس از گردآوری، به یک شخص ثالث تقریبا موضوع مهمی نیست. بنابراین، نباید هزینه‌ای به آنها داد.

سهولت انتشار

گاهی اوقات به جای اینکه تصمیم‌ بگیریم کدام داده ارزشمندتر است، خوب است نگاهی بیاندازیم به اینکه کدام داده راحت‌تر در دست عموم قرار می‌گیرد. انتشارهای کوچک و آسان می‌تواند به عنوان یک کاتالیزور برای تغییرات رفتاری بزرگ‌تر درون سازمانها عمل کند.

با این وجود در مورد این رویکرد مراقب باشید. شاید در نمونه‌ای این انتشارهای کوچک دارای چنان ارزش کمی باشد که چیزی از آنها بدست نیاید. اگر این اتفاق روی دهد، ممکن است اعتقاد به کل پروژه تضعیف ‌شود.

همکاران خود را مشاهده کنید

داده باز یک جنبش رو به رشد است. احتمالا افراد زیادی در منطقه شما حضور دارند که از آنچه در سایر مناطق می‌گذرد، مطلع هستند. فهرستی تنظیم کنید از شالوده آنچه که آن موسسات در حال انجام آن هستند.

از یک مجوز باز استفاده کنید (باز بودن قانونی)

در بسیاری از حوزه‌های قضایی، حقوق مالکیت معنوی در داده وجود دارند که مانع استفاده، بازاستفاده و بازتوزیع داده بدون مجوز مشخص توسط اشخاص ثالث می‌شود. حتی در جاهایی که وجود حقوق غیرقطعی است، استفاده از مجوز صرفا به خاطر شفافیت اهمیت دارد. بنابراین، اگر قصد دارید داده خود را در دسترس قرار دهید، باید یک مجوز روی آن بگذارید و اگر بخواهید داده‌تان باز باشد اهمیت مجوز بیشتر هم می‌شود.

از چه مجوزهایی می‌توانید استفاده کنید؟ توصیه ما این است که برای داده «باز» از یکی از مجوزهایی استفاده کنید که با تعریف باز سازگار و برای داده مناسب باشد. این فهرست (همراه با دستورالعمل استفاده) را می‌توانید در آدرس زیر پیدا کنید:

یک دستورالعمل کوتاه یک صفحه‌ای در مورد استفاده از مجوز داده باز را می‌توان در سایت Open Data Commons به آدرس زیر یافت:

داده را در دسترس قرار دهید (بازبودن فنی)

لازم است داده باز به لحاظ فنی و همچنین قانونی باز باشد. به طور خاص، لازم است داده به صورت حجیم در یک فرمت قابل خواندن توسط ماشین در دسترس باشد.

در دسترس

داده باید تنها براساس هزینه منطقی بازتولید، ترجیحا به صورت دانلود رایگان از طریق اینترنت قیمت‌گذاری شود. این مدل قیمت‌گذاری به این دلیل به‌دست آمد که موسسه شما زمانی که داده را برای استفاده ارائه می‌کند، نباید متحمل هیچ هزینه‌ای شود.

به صورت حجیم

داده باید به صورت یک مجموعه کامل در دسترس باشد. چنانچه شما دارای دفتر ثبتی هستید که تحت مقررات گردآوری شده است، تمام دفتر ثبت باید برای دانلود در دسترس باشد. یک API وب یا سرویس مشابه می‌تواند بسیار مفید باشد، اما هرگز جایگزینی برای دسترسی حجیم محسوب نمی‌شود.

در یک فرمت باز و قابل خواندن توسط ماشین

بازاستفاده از داده تحت کنترل بخش خصوصی نباید تابع محدودیت‌های حق‌ امتیاز باشد. از آن مهم‌تر، اطمینان از اینکه فرمت‌های قابل خواندن توسط ماشین ارائه می‌دهید، حداکثر بازاستفاده را میسر می‌کند. برای نمایش این موضوع، به آمارهای منتشر شده در اسناد PDF (فرمت سند قابل‌حمل) دقت کنید که اغلب برای پرینت با کفیت بالا مورد استفاده قرار می‌گیرد. درحالیکه این آمار قابل خواندن توسط انسان هستند، استفاده از آنها برای کامپیوتر بسیار دشوار است. این مسئله توانایی دیگران در بازاستفاده از آن داده را به شدت محدود می‌کند.

در اینجا به تعدادی سیاست اشاره می‌کنیم که بسیار مفید خواهند بود:

  • ساده و به دور از پیچیدگی باشید.

  • سریع حرکت کنید

  • عمل‌گرا باشید

به طور خاص انتشار داده خام همین حالا بهتر از داده کامل بعد از شش ماه است.

راه‌های مختلفی برای در دسترس قرار دادن داده وجود دارند. در عصر اینترنت، طبیعی‌ترین روش، انتشار به صورت آنلاین است. در این مدل گوناگونی‌های زیادی وجود دارند. در ساده‌ترین حالت، موسسات داده‌های خود را از طریق وبسایت‌های خود در دسترس قرار می‌دهند و یک کاتالوگ مرکزی بازدیدکنندگان را به منبع مناسب هدایت می‌کند. با این وجود، گزینه‌های دیگری هم وجود دارند.

زمانی که اتصال محدود یا سایز داده بسیار بزرگ باشد، توزیع از طریق دیگر فرمت‌ها ضرورت می‌یابد. این بخش همچنین به راه‌های دیگری می‌پردازد که می‌توان از آنها برای پایین نگه‌داشتن قیمت‌ها استفاده کرد.

روش‌های آنلاین

از طریق وبسایت فعلی شما

تامین فایل‌هایی جهت دانلود از صفحات‌ وب، سیستمی است تیم محتوای وبسایت شما با آن آشناتر است. همانطور که شما در حال حاضر دسترسی به اسناد بحث را فراهم می‌کنید، انتشار فایل‌های داده از این طریق نیز بسیار مطلوب است.

یکی از مشکلات این رویکرد این است که برای یک شخص بیرونی یافتن اطلاعاتِ بروزرسانی شده بسیار دشوار است. این ویژگی باری روی دوش افرادی می‌گذارد که با استفاده از داده شما ابزارهایی تولید می‌کنند.

از طریق سایت‌های شخص ثالث

منابع بسیاری تبدیل به مراکز داده در زمینه‌های خاص شده‌اند. برای مثال، هدف از طراحی pachube.com، برقراری ارتباط بین افراد دارای حسگر با اشخاصی است که تمایل به دریافت داده از آنها دارند. سایت‌هایی چون Infochimps.com و Talis.com به موسسات بخش خصوصی اجازه می‌دهند تا مقادیر عظیم داده را به صورت رایگان ذخیره کنند.

سایت‌های شخص ثالث هم ممکن است بسیار مفید باشند. دلیل اصلی این است که آنها از قبل جمعی از افراد علاقمند و دیگر مجموعه‌های داده را گرد هم آورده‌اند. وقتی که داده شما بخشی از این پلتفرم‌ها باشد، نوعی بهره مرکب مثبت ایجاد می‌شود.

پلتفرم‌های داده در مقیاس گسترده از قبل زیرساخت‌هایی را فراهم کرده‌اند که از تقاضا حمایت می‌کنند. آنها غالبا تحلیل‌گران و اطلاعات مصرف را ارائه می‌دهند. برای سازمان‌های بخش خصوصی، این پلتفرم‌ها غالبا رایگان هستند.

این پلتفر‌م‌ها دو بها دارند. نخستین بها، عدم وابستگی است. لازم است موسسه شما قادر باشد کنترل امور را تسلیم دیگران کند. این موضوع اغلب به لحاظ سیاسی، قانونی، یا عملیاتی دشوار است. بهای دوم بازبودن است. اطمینان حاصل کنید که پلتفرم داده شما برای همه افراد قابل دسترسی باشد. توسعه‌دهندگان نرم افزار و دانشمندان از سیستم‌های عملیاتی زیادی استفاده می‌کنند، از تلفن‌های هوشمند تا ابرکامپیوترها. همگی باید قادر باشند به داده دسترسی پیدا کنند.

از طریق سرورهای FTP

روشی که نسبت به باقی روش‌ها اندکی قدیمی‌تر است، تامین دسترسی به فایل‌ها از طریق پروتکل انتقال فایل (FTP) است. این روش درصورتی مفید است که مخاطب شما فنی باشد، نظیر توسعه‌دهندگان نرم افزار و دانشمندان. سیستم FTP به جای HTTP کار می‌کند، اما به طور خاص برای پشتیبانی از انتقال فایل‌ طراحی شده است.

FTP دیگر چندان مورد استقبال قرار نمی‌گیرد. در کنار فراهم نمودن یک وبسایت، دسترسی از طریق سرورFTP بسیار شبیه به فولدرهای روی کامپیوتر است. بنابراین، گرچه برای هدف ما مناسب است، ظرفیت بسیار کمی برای شرکت‌های توسعه وب وجود دارد که از قبل سفارشی‌کردن آن، بتوانند هزینه‌ای دریافت کنند.

به عنوان تورنت

BitTorrent سیستمی است که به همراه نقض حق چاپ انحصاری برای سیاستگذاران شناخته شده است. BitTorrent از فایل‌هایی استفاده می‌کند که تورنت نامیده می‌شوند، و با تقسیم هزینه توزیع فایل‌ها بین تمامی افرادی که به آن فایل‌ها دسترسی پیدا می‌کنند، عمل می‌کند. به جای اینکه سرورها دارای بار اضافی شوند، همراه با افزایش تقاضا، موجودی نیز افزایش پیدا می‌کند. به همین دلیل است که این سیستم برای به اشتراک‌گذاری فیلم بسیار موفق است. یک روش فوق‌العاده کارآمد برای توزیع حجم بسیار بالای داده است.

به عنوان یک رابط برنامه‌نویسی کاربردی (API)

داده را می‌توان از طریق رابط برنامه‌نویسی کاربردی منتشر کرد. این رابط‌ها بسیار محبوب شده اند. به جای ارائه همه داده به صورت حجیم در یک فایل بزرگ، رابط‌ها به برنامه‌نویسان اجازه می‌د‌هند مقدار مشخصی داده انتخاب کنند. APIها معمولا به یک مجموعه داده متصل هستند که در زمان واقعی بروزرسانی می‌شود. به این معنا که در دسترس قرار دادن اطلاعات از طریق API به ما اطمینان می‌دهد که به روز است.

انتشار داده خام به میزان حجیم باید دغدغه اصلی همه ابتکارات داده باز باشد. تامین یک API، هزینه‌هایی دارد:

  1. قیمت: آنها نیازمند توسعه و نگهداری به مراتب بیشتر نسبت به ارائه فایل‌ها هستند.

  1. انتظارات: به منظور پرورش جمعی از استفاده‌کنندگان پشت سیستم، مهم است که قطعیت را تامین کنیم. زمانی که مشکلاتی بوجود می‌آیند، از شما انتظار می‌رود هزینه تعمیر آنها را متقبل شوید.

دسترسی به داده حجیم موارد زیر را پدید می‌آورند:

  • هیچ وابستگی به ارائه‌دهنده اصلی داده وجود ندارد، به این معنا که اگر دگرگونی در ساختار روی دهد یا چرخه بودجه شرایط را تغییر دهد، داده همچنان در دسترس است.

  • هر شخص دیگری می‌تواند یک نسخه از آن بدست بیاورد و آن را بازتوزیع کند. این عمل هزینه توزیع از موسسه منبع را کاهش می‌دهد و وابستگی به فرد یا بخش خاص را از بین می‌برد.

  • دیگران می‌توانند خدمات خود را با استفاده از داده توسعه دهند، زیرا اطمینان دارند که داده از آنها گرفته نخواهد شد.

ارائه داده در مقیاس حجیم به دیگران اجازه می‌دهد که داده را فراتر از اهداف اصلی آن مورد استفاده قرار دهند. برای مثال، اجازه می‌دهد داده به فرمت جدید تغییر کند، به دیگر منابع متصل شود، یا در چندین مکان آرشیو و صورت‌برداری شود. درحالیکه ممکن است جدیدترین نسخه داده از طریق API در دسترس قرار گیرد، داده خام باید به صورت حجیم در بازه‌های منظم در دسترس قرار گیرد.

برای مثال، مرکز خدمات آماری یورواستات یک قابلیت دانلود حجیم دارد که بیش از 4000 فایل داده را در خود جای داده است. دو بار در روز به روزرسانی می‌شود، داده را در فرمت TSV (مقادیر با تب از یکدیگر جدا می‌شوند) ارائه می‌دهد، و حاوی اسنادی درباه قابلیت دانلود و همچنین فایل‌های داده است.

یک نمونه دیگر، کاتالوگ داده کلمبیا است که علاوه بر تامین داده به صورت زنده، امکان دانلود داده در فرمت‌های CSV و XLS را فراهم می‌کند.

داده را قابل‌ کشف کنید

داده باز بدون مصرف‌کننده معنا ندارد. باید اطمینان حاصل کنید که افراد می‌توانند مواد منبع را یافت کنند. این بخش رویکردهای مختلف را بررسی می‌کند.

یکی از مهم‌ترین نکات، تامین یک فضای خنثی است که بتواند بر سیاست‌های درون‌موسسه‌ای و چرخه‌های آتی بودجه فائق آید. مرزهای حوزه‌های قضایی، چه از نظر بخشی چه جغرافیایی، می‌تواند همکاری را دشوار کند. با این وجود، مزایای قابل‌توجهی در تلفیق نیروها وجود دارد. هرچقدر کشف داده برای یک فرد بیرونی ساده‌تر باشد، ابزارهای مفید و جدید با سرعت بیشتری تولید خواهند شد.

ابزارهای موجود

تعدادی ابزار هستند که روی وب به صورت زنده موجود هستند و به طور خاص برای قابل کشف شدن داده طراحی شده‌اند.

یکی از برجسته‌ترین آن‌ها DataHub است که یک کاتالوگ و محل ذخیره‌سازی داده برای مجموعه‌های داده از سرتاسر جهان به شمار می‌رود. سایت به اشخاص و سازمان‌ها این امکان را می‌دهد که مواد را منتشر کنند و به استفاده‌کنندگان داده امکان می‌دهد مواد مورد نیاز خود را بیابند.

علاوه بر این، چندین کاتالوگ تخصصی برای بخش‌ها و مکان‌های مختلف وجود دارند. بسیاری از اجتماعات علمی اغلب به دلیل لزوم نشر داده، یک سیستم کاتالوگ را برای رشته‌های خود ایجاد کرده‌اند.

برای دولت

از ابتدا روش معمول آن بوده‌ است که یک وزارتخانه پیشرو کاتالوگی برای داده‌های دولتی ایجاد کند. هنگام ایجاد یک کاتالوگ، سعی کنید برخی ساختارها را ایجاد کنید که به ادارات زیادی اجازه می‌دهد به آسانی اطلاعات خودشان را در جریان نگه دارند.

در برابر فشار برای ساخت نرم‌افزار برای پشتیبانی از کاتالوگ در برابر آسیب مقاومت کنید. راه‌حل‌های نرم‌افزاری باز و رایگانی وجود دارند (نظیر CKAN) که از قبل توسط بسیاری دولت‌ها به کار گرفته شده‌اند. از این رو، سرمایه‌گذاری روی یک پلتفرم دیگر ضروری نیست.

موارد اندکی در اغلب کاتالوگ‌های داده باز وجود ندارند. برنامه شما می‌تواند موارد زیر را در نظر بگیرد:

  • ایجاد مسیری برای اینکه به بخش‌های دولتی و خصوصی اجازه دهیم داده خود را اضافه کنند. در نظر گرفتن کاتالوگ به عنوان کاتالوگ منطقه، به جای کاتالوگ دولت منطقه‌ای ارزشمند است.

  • تسهیل بهبود داده توسط صدور مجوز برای مشتقات مجموعه‌های داده که به صورت کاتالوگ درآیند. برای مثال، شخصی ممکن است آدرس‌ها را ژئوکد کند و ممکن است بخواهد آن نتایج را با همه به اشتراک بگذارد. اگر تنها نسخ تکی مجموعه‌های داده را ارائه کنید، این بهبودها مخفی باقی می‌مانند.

  • در مورد ظاهرشدن داده خود در جاهای دیگر صبور باشید. به عبارت دیگر، احتمال دارد محتوای شما برای جوامع علاقمند تکثیر شود. اگر شما داده نظارت سطح رودخانه را در دسترس داشته باشید، ممکن است داده شما در کاتالوگی برای هیدرولوژیست‌ها ظاهر شود.

  • اطمینان حاصل کنید که دسترسی منصفانه است. سعی کنید از ایجاد دسترسی محرمانه برای مقامات یا محققان اجتناب کنید زیرا این عمل همکاری و مشارکت جامعه را تضعیف می‌کند.

برای جامعه شهروندی

تمایل به ایجاد کاتالوگ‌های مکمل برای دادهای غیررسمی داشته باشید.

بسیار بعید است که دولت‌ها با منابع غیررسمی و غیرمعتبر همکاری کنند. مقامات همواره هزینه زیادی متحمل شده‌اند تا مطمئن شوند شرم‌ساری سیاسی یا آسیب‌های دیگری بخاطر سوءاستفاده از داده یا اعتماد بیش از اندازه به داده وجود نخواهد داشت.

بعلاوه، دولت‌ها اغلب تمایلی به حمایت از فعالیت‌هایی ندارند که اطلاعات آنها را با اطلاعات کسب و کارها مخلوط ‌کند. دولت‌ها به حق در مورد انگیزه‌های سود شکاک هستند. بنابراین، یک کاتالوگ مستقل برای گروه‌های جامعه، کسب و کارها و دیگران ضروری به نظر می‌رسد.

شما می‌توانید متن اصلی این نوشته را از اینجا مطالعه کنید.