Pengorekan data


Pengorekan data atau dapat disebut dengan data scrapping adalah teknik otomatisasi yang digunakkan untuk mengekstrak dan pengolahan data dari sebuah website, databse, aplikasi enterprise atau sistem legacy yang disimpan pada sebuah file dalam format tabular atau spreadsheet, selain itu teknik ini juga cukup mudah digunakkan karena dapat memberikan informasi yang dapat dibaca secara nyata.[1][2]

Cara kerja data scrapping

cara yang digunakkan untuk memperoleh data dari web dapat menggunakan tools, yang mempunyai tahapan yang pertama adalah proses request ke web dengan command GET untuk mengekstrak data, selanjutnya adalah parse di mana data spesifik yang dihasilkan dari tools data scrapping, kemudian informasi yang telah didapat akan ditampilkan pada display.[1][2]

Jenis data scrapping

data scrapping memiliki dua jenis yang berbeda yaitu web scrapping dan screenscrapping. web scrapping adalah cara yang digunakan untuk pengekstrakan data secara spesifik yang diambil dari sebuah website dengan menggunakan pengaksesan pada source code, source code yanng dapat digunakan seperti HTML, CSS dan javascript ataupun penggunaan API yang disediakan oleh pemilik website itu sendiri. sedangkan screen scrapping adalah tipe pengekstrakan data dengan menggunakan metode analisis visual interfances yang terdapat pada web dan dapat dilihat secara langsung.[1][2]

Referensi

  1. ^ a b c "Kompas.id". kompas.id. Diakses tanggal 2022-12-13.
  2. ^ a b c [butuh rujukan]

Bahan bacaan terkait

  • Hemenway, Kevin and Calishain, Tara. Spidering Hacks. Cambridge, Massachusetts: O'Reilly, 2003. ISBN 0-596-00577-6.

Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.