Kumpulan data

Berbagai plot dari kumpulan data multivariat kumpulan data bunga Iris yang diperkenalkan oleh Ronald Fisher (1936).[1]

Kumpulan data adalah sebuah koleksi data. Dalam kasus data tabular, kumpulan data sesuai dengan satu atau lebih tabel basis data, di mana setiap kolom dari sebuah tabel mewakili suatu variabel, dan setiap baris sesuai dengan rekaman tertentu dari kumpulan data yang dimaksud. Kumpulan data mencantumkan nilai untuk setiap variabel, misalnya tinggi dan berat suatu objek, untuk setiap anggota dalam kumpulan data tersebut. Kumpulan data juga dapat berupa koleksi dokumen atau berkas.[2]

Dalam disiplin open data, sebuah kumpulan data merupakan satuan yang digunakan untuk mengukur jumlah informasi yang dirilis dalam repositori data terbuka publik. Portal data.europa.eu Eropa menghimpun lebih dari satu juta kumpulan data.[3]

Sifat

Beberapa karakteristik mendefinisikan struktur dan sifat suatu kumpulan data. Hal ini mencakup jumlah dan jenis atribut atau variabel, serta berbagai ukuran statistik yang berlaku untuknya, seperti simpangan baku dan kurtosis.[4]

Referensi

  1. ^ Fisher, R.A. (1963). "The Use of Multiple Measurements in Taxonomic Problems" (PDF). Annals of Eugenics. 7 (2): 179–188. doi:10.1111/j.1469-1809.1936.tb02137.x. hdl:2440/15227. Diarsipkan dari asli (PDF) tanggal 2011-09-28. Diakses tanggal 2007-05-22.
  2. ^ Snijders, C.; Matzat, U.; Reips, U.-D. (2012). "'Big Data': Big gaps of knowledge in the field of Internet". International Journal of Internet Science. 7: 1–5. Diarsipkan dari asli tanggal 23 November 2019. Diakses tanggal 2017-02-10.
  3. ^ "European open data portal". European open data portal. European Commission. Diakses tanggal 2025-10-05.
  4. ^ Jan M. Żytkow, Jan Rauch (2000). Principles of data mining and knowledge discovery. Springer. ISBN 978-3-540-66490-1.

Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.