OpenData ทำไม? อะไร? เพื่อใคร?

เนื่องจากช่วงนี้มีเรื่อง OpenData มาวนเวียน ซึ่งเรื่องพวกนี้ไม่ได้มีอะไรใหม่มากนัก หลายคนก็พยายามบอกว่ามันดีอย่างโน้นอย่างนี้ มีประโยชน์โน่นนี่ ถ้านักคอมพิวเตอร์หรือนักสถิติก็มักจะมอง Data ที่ว่านี้เป็น raw data ขนาดใหญ่ คนที่เป็นนักวิชาการก็อยากจะอยากได้ visualize data ออกมาเป็นกราฟ ปรับแต่งข้อมูลได้ ต่างคนต่างมีความต้องการต่างกัน ดังนั้นเราควรมามองย้อนกลับไปว่า OpenData อะไร? ทำไม? ให้ใคร? มากกว่า
ถ้าถามว่า OpenData คืออะไร? ก็ตามขื่อคือ การเปิดเผยข้อมูลโดยที่ข้อมูลนั้นสามารถเข้าถึงได้อย่างเสรี ปราศจากปัญหาในเรื่อง copyright, patents หรือการควบคุมอื่นๆ ถ้าเป็นเจ้าของข้อมูลก็ต้องถามว่า ข้อมูลอะไรที่สามารถเปิดเผยได้ ภายใต้เงื่อนไขเหล่านี้ อาจจะต้องทำ data classification ทั้งนี้ต้องทำตาม policy, rules & regulations ซึ่งต้องเอามาดูประกอบด้วยว่าข้อมูลใดสามารถเปิดเผยได้จริงๆ
เปิดทำไม? ก็ต้องดูว่าคนที่ได้ข้อมูลไปสามารถเอาไปทำอะไรได้บ้าง ประโยชน์ที่จะเกิดขึ้นคืออะไร อันนี้ขึ้นอยู่กับข้อมูล รูปแบบข้อมูลและกลุ่มผู้ใช้ข้อมูล เช่น คนทั่วไป, นักพัฒนา, นักวิจัย ซึ่งใช้ข้อมูลแตกต่างกัน ยกตัวอย่างเช่น หากคุณให้ข้อมูลในรูปแบบ csv ขนาด 10GB กับคนทั่วไป เขาก็คงไม่รู้จะเอาไปทำอะไร หากมีการวิเคราะห์ข้อมูลออกมาแล้ว คนทั่วไปจะเข้าใจได้่ง่ายขึ้น นักพัฒนาไม่สนใจข้อมูล csv ขนาด 10GB แต่ถ้าสามารถเรียกใช้ผ่าน API ได้ก็จะเหมาะสมกว่า

การแลกเปลี่ยนข้อมูลแบบ machine 2 machine รูปแบบข้อมูลและช่องทางการเข้าถึงข้อมูลยิ่งอยู่ในรูปแบบเฉพาะ เพราะข้อมูลจะต้องอยู่ในรูปแบบ machine readable ซึ่งดีกว่าข้อมูล csv ขนาด 10GB อย่างแน่นอน ทั้งนี้ขึ้นอยู่กับว่า ใครจะเป็นผู้ใช้ข้อมูลของคุณ ซึ่งโดยส่วนใหญ่การเปิดเผยข้อมูลจะใช้ 2 วิธีหลักๆ คือ ข้อมูลดิบเป็นไฟล์ archive เช่น csv, xml, json และข้อมูลที่เรียกผ่าน REST API หรือ Web Service ส่วนใหญ่จะมีรูปแบบ json และ xml เพื่อให้สะดวกในการใช้งานและการแลกเปลี่ยนข้อมูล
เรื่อง License ของข้อมูลก็จำเป็นเช่นกัน ข้อมูลที่อย่างมีเจ้าของและเข้าของก็ต้องให้สิทธิการเข้าถึงข้อมูล การเอาข้อมูลไปใช้ รวมไปถึงการเปลี่ยนแปลงแก้ไข ดังนั้น เจ้าของข้อมูลต้องกำหนด License ข้อมูลที่เผยแพร่ไว้เช่นกัน สำหรับ License ของข้อมูล คุณอาจจะเลือกใช้ OpenData Commons หรือ Creative Commons Data ก็ได้
วิธีการแผยแพร่ข้อมูลอาจทำผ่าน repository, web service ขึ้นอยู่กับว่าจะให้ข้อมูลกับใคร ใครเป็นผู้ใช้ข้อมูลนั้น เช่น ผู้ใช้ทั่วไป นักพัฒนา เป็นต้น มีโครงการ opendata portal หลายโครงการที่น่าสนใจ ซึ่งเก็บข้อมูลเฉพาะทาง เช่น ข้อมูลการใช้จ่ายภาครัฐ ในโครงการ OpenSpending, ข้อมูลเพื่อการพัฒนาประเทศในกลุ่มลุ่มแม่น้ำโขง, โครงการ Data Portal อย่าง CKAN, โครงการที่เป็นที่สนใจมากคงเป็นข้อมูลการใช้เงินของ US Goverment ที่เผยแพร่บน GitHub เป็นต้น