Data Terstruktur, Semi-Struktur, dan Tidak Terstruktur?

Muhammad Apriandito
2 min readAug 11, 2019

--

Big Data Characteristics

Seperti yang kita tahu, Big data memiliki beberapa karateristik, salah satunya adalah variety (Variasi). Variety merupakan permasalahan yang disebabkan karena adanya keberagaman data, baik itu dari format filenya, maupun struktur isi data tersebut. Data yang diproduksi/dihasilkan kini tidak hanya dalam bentuk data terstruktur, ada yang dalam data semi-terstruktur, dan tidak terstruktur. Apa bedanya?

Data terstruktur merupakan data yang yang dapat diproses, disimpan, dan diambil dalam format tetap. Normalnya kita mengenal sebagai data terstruktur yang ada dalam excel atau spreadsheet. Sebagai contoh, data penjualan pada suatu perusahaan

Contoh data terstruktur

Data Tidak Terstruktur merupakan data yang tidak memiliki bentuk atau struktur khusus . Contohnya adalah data yang berformat foto/gambar, video, atau suara.

Foto merupakan contoh data tidak terstruktur. Sumber: https://pixabay.com

Sementara, Data Semi-Terstruktur merupakan bentuk data yang berisi format yang disebutkan di atas, yaitu data terstruktur dan tidak terstruktur. Lebih tepatnya, Data Semi-Terstruktur merujuk pada data yang belum diklasifikasikan di bawah repositori tertentu (database), namun mengandung informasi penting yang memisahkan elemen individu dalam data. Contohnya, data dalam bentuk file .json atau .xml.

Data hasil crawling twitter dalam format .json. Sumber: https://www.researchgate.net/figure/An-example-tweet-in-JSON-format_fig1_262766974

--

--