Data Terstruktur, Semi-Struktur, dan Tidak Terstruktur?
Seperti yang kita tahu, Big data memiliki beberapa karateristik, salah satunya adalah variety (Variasi). Variety merupakan permasalahan yang disebabkan karena adanya keberagaman data, baik itu dari format filenya, maupun struktur isi data tersebut. Data yang diproduksi/dihasilkan kini tidak hanya dalam bentuk data terstruktur, ada yang dalam data semi-terstruktur, dan tidak terstruktur. Apa bedanya?
Data terstruktur merupakan data yang yang dapat diproses, disimpan, dan diambil dalam format tetap. Normalnya kita mengenal sebagai data terstruktur yang ada dalam excel atau spreadsheet. Sebagai contoh, data penjualan pada suatu perusahaan
Data Tidak Terstruktur merupakan data yang tidak memiliki bentuk atau struktur khusus . Contohnya adalah data yang berformat foto/gambar, video, atau suara.
Sementara, Data Semi-Terstruktur merupakan bentuk data yang berisi format yang disebutkan di atas, yaitu data terstruktur dan tidak terstruktur. Lebih tepatnya, Data Semi-Terstruktur merujuk pada data yang belum diklasifikasikan di bawah repositori tertentu (database), namun mengandung informasi penting yang memisahkan elemen individu dalam data. Contohnya, data dalam bentuk file .json atau .xml.