یکی از معتبرترین اسناد پایه‌ی داده باز، منشور بین‌المللی داده باز، Open Data Charter، است. هر داده‌ای که از اصول ۶گانه‌ی این منشور پیروی کند، باز محسوب می‌شود. در ادامه خلاصه‌ای از این اصول به همراه مثال ارائه می‌شود.

حوزه شفافیت
داده باز
Open Data Scope
موضوع
قانون، راهنما Law, Documents Subject
جغرافیا
بین‌الملل International
Geography
نوع مطلب
متن Text Type
زبان فارسی(ترجمه) Farsi(Translated) Language
منتشر کننده
شفافیت برای ایران Open Data Charter
Publisher

اصل اول: باز بودن داده به‌صورت پیشفرض

حکومت‌ها و دولت‌ها، شهرداری‌ها و.. وظیفه دارند داده‌های خود را به‌صورت رایگان در اختیار عموم قرار دهند. «پیش‌فرض بودن» یعنی زمانی که داده تولید می‌شود، آن داده باز است. ضمن آن‌که حریم خصوصی داده‌ها هم باید رعایت شود.

مثال: شما یک محقق یا شهروند کنجکاو هستید که نیاز به داده‌های آموزش و پرورش شهر خود دارید.

آموزش و پروش موظف است داده‌هایی مثل تعداد دانش‌آموزان به تفکیک مقطع، جنسیت، نوع مدرسه و... را زمانی که تولید می‌شوند(یعنی آمارگیری تمام شده است) و حتی درخواستی نیست منتشر کند، یعنی نیازی به تایید و اجازه‌ی ریاست، حراست و... ندارد. درعین حال نباید داده‌های فوق مشخصات هویتی دانش‌آموزان را افشا کند.

اصل دوم: به هنگام و جامع بودن

داده‌ها بدون تاخیر و تغییر منتشر شده و باکیفیت و جامع باشند. ضمن آن‌که باید از کاربران داده‌ها مشورت گرفت.

مثال: در ادامه مثال قبل، می‌خواهید بدانید توزیع و تعداد جمعیت دانش‌آموزان کلاس اولی چگونه است.

آموزش و پرورش باید داده‌های دانش‌آموزان را در ابتدای هر فصل آموزشی(بازگشایی مدارس) یا انتهای آن منتشر کند. داده‌های فوق نباید قدیمی باشند و به‌نوعی به‌روزرسانی داده‌های قبلی هستند. یعنی وقتی داده‌ها کنار هم قرار می‌دهید، مثلا یک روند ۱۰ساله از جمعیت کلاس‌ اولی‌ها دارید.

در داخل داده‌ها هم نباید توضیح یا نموداری باشد و در هر زمان اگر نظری داشتید، باید بدون مشکلی پیشنهاد یا انتقاد خود را با مسئولین جمع‌آوری داده در میان بگذارید.

اصل سوم: قابلیت دسترسی و استفاده

تا وقتی داده‌های باز منتشر نشوند و به دست شهروندان نرسند هیچ ارزشی ندارند. مزایای این امر تصمیم‌گیری بهتر و تعامل بین مسئولین و شهروندان است. این دسترسی باید در یک پورتال واحد انجام شود تا تمام داده‌ها در یک جا قرار بگیرند و اصطلاحا جزیره جزیره نباشند.

از همه مهم‌تر، داده‌ها باید در فرمت‌های مختلف(CSV, XLS, TXT) منتشر شده تا کاربران مشکلی برای ویرایش داده‌ها نداشته باشند. ضمنا، استفاده از داده‌ها نیازی به کسب اجازه، مجوز، احراز هویت کاربر و.. ندارد.

مثال: برای تحقیق خود، نیاز به آمار جمعیت، ثبت ازدواج و طلاق و تعداد دانش‌آموزان ابتدایی دارید.

آیا برای به دست آوردن این داده‌ها باید به آموزش و پرورش و سازمان ثبت احوال شهر خود مراجعه کنید؟ از ریاست و بازرسی کسب اجازه کنید؟ یا سایت‌های هرکدام را جداگانه زیر و رو کنید؟ خیر!

اصل انتشار داده باز این است که هر دو سازمان، داده‌های خود را در یک پورتال واحد مثلا Data.gov.ir به تفکیک موضوع و.. ثبت کنند و شما هم نیازی ندارید هویت خود را فاش نمایید. داده‌های موجود در پورتال  می‌تواند PDF باشد اما اولویت با فایل‌های متنی و صفحه گسترده(اکسل و..) است و اگر داده‌ای PDF بود، فایل متنی یا اکسل آن هم باید وجود داشته باشد. اگر برای دسترسی به داده یا فرمت آن مشکلی پیش آمد، حق اعتراض دارید.(اصل دوم)

اصل چهارم: قابلیت قیاس و هم‌کنش‌پذیری

داده‌ها نباید کلی بوده و باید به قسمت‌های کوچک‌تر مثل تقسیمات جغرافیایی، زمانی و.. تقسیم شوند. به‌طور معمول داده‌ها توضیحاتی دارند که باید توضیح داده شوند. داده‌ها باید در فرمت‌هایی مثل CSV منتشر شوند که قابلیت ماشین‌خوان بودن را داشته باشند.

مثال: می‌خواهید داده‌های آموزش و پرورش را از پورتال دریافت کنید.

داده‌ها باید به تفکیک سال‌ ارائه شده باشند، مثلا از سال ۸۰ تا ۹۰ غلط است. مختصات مکانی مدارس هم باید در داخل داده‌ها موجود باشند، مثلا وقتی می‌خواهید در گوگل ارث مکان مدارس را ببینید، تنها کافی است طول و عرض جغرافیایی آن را وارد نمایید. اما چرا نباید در گوگل ارث با اسم، یک مدرسه را پیدا کرد؟ چون مدارس زیادی با نام‌های مشابه وجود دارند.

شاید داده‌ای نیاز به توضیح داشته باشد، این توضیح نباید در داخل فایل باشد، بلکه در صفحه‌ی دریافت فایل جداگانه نوشته شود. چرا؟ به این دلیل که وقتی قرار است داده‌ها ماشین‌خوان شوند و API داده شود، توضیحات فوق می‌تواند ایجاد خطا کند.

اصل پنجم: برای حکمرانی بهتر و مشارکت شهروندان

بهترین راه برای جلوگیری از فساد در دولت‌ها و حکومت‌ها نظارت شهروندان است. پیش‌نیاز این کار انتشار داده‌هاست که باعث شفافیت می‌شود. ضمن آن‌که انتشار داده‌ها باعث تعامل شهروندان و مسئولین شده که می‌تواند بهبود عملکرد دولت‌ها را در پی داشته باشد، چرا که شهروندان مشکلات را مشاهده کرده و می‌توانند راه‌حل یا ایده‌‌ی بهتری ارائه دهند(خرد و تصمیمات جمعی).

مثال: معمولا مدارس دولتی به دلایل گوناگون از اولیا شهریه می‌گیرند با این‌که این‌کار غیرقانونی است.

وقتی مدارس موظف شوند داده‌های خود را منتشر کنند، داده‌های مخارج و تعمیرات مدرسه را هم باید ارائه دهند. با انتشار داده‌های مالی می‌توان فهمید آیا فسادی در مدرسه وجود دارد یا خیر و چرا بودجه‌های دولتی کفاف خرج مدارس را نمی‌دهد.

یا مثلا آموزش و پرورش می‌خواهد مدرسه‌ی جدیدی را بسازد، آیا این کار ضروری است؟ موقعیت مکانی آن مناسب است؟ و موارد دیگر که وقتی شهروندان اجازه بیان نظرات خود را داشته باشند و بتوانند در فرآیند تصمیم‌سازی مشارکت کنند، می‌توان از خرج‌های بیهوده و اتلاف وقت جلوگیری کرده و تصمیمات بهتری اتحاذ کرد.

اصل ششم: برای توسعه و نوآوری فراگیر

زمانی که داده‌ها منتشر می‌شوند شهروندان می‌توانند آن‌‌ها را مشاهده و برسی کنند. اگر مشکلی بود برای آن راه‌حل بدهند، راه‌حل‌های موجود را نقد کرده و برای چالش‌های فعلی در هر سطحی بتوانند ایده‌ای مطرح کنند. وقتی داده‌ها در دسترس همه باشد، کارآفرینان می‌توانند از داده‌ها ارزش افزوده ایجاد کنند.

روزنامه‌نگاری داده و تحقیقی می‌تواند با بررسی داده‌ها فسادها را کشف و افشا کند. مصورسازی‌ داده‌ها آن‌ها را معنی‌دار کرده و الگوهای پنهان را آشکار می‌کند. می‌توان داده‌ها را ترکیب کرده و به فهم جدیدی رسید. و خیلی کارها و اقدامات دیگر که پیش‌نیاز آن‌ها انتشار داده‌ها به صورت باز است.

در صورت علاقه می‌توانید متن جامع و اصلی «منشور داده باز» را در اینجا مطالعه فرمایید.

گراف زیر، خلاصه‌ای از مطالب بالا و اصول داده باز منشور است.