File CSV Kini Bisa Diindeks oleh Google
21 September 2023
Google baru saja memperbarui dokumentasi Pusat Pencarian bahwa sekarang mereka sudah bisa mengindeks file .csv.
Gambar: Lokalogy
Pembaruan dokumentasi Google ini bisa menjadi pekerjaan tambahan jika Anda tidak ingin file .csv Anda diindeks. Itu berarti Anda harus mengecek crawlability situs Anda dengan mengupdate file robots.txt.
Apa Itu CSV?
Comma Separated Value (CSV) adalah file teks yang menyimpan data dalam format tabular yang dapat ditampilkan sebagai lembar kerja.
File CSV berisi data dalam bentuk teks biasa, yang berarti file CSV tidak mengandung elemen gaya seperti font, juga tidak mengandung gambar atau tautan aktif.
File ini berguna untuk melakukan hal-hal seperti mengunggah daftar URL untuk di indeks ke perangkat lunak seperti Screaming Frog.
Namun, mereka juga berguna untuk mengorganisir data.
Pengindeksan File CSV
Kemampuan Google untuk mengindeks file CSV adalah fungsi baru karena pencarian "filetype" di Google untuk file CSV saat ini tidak belum menghasilkan file CSV.
Contoh:
filetype:csv site:.gov
filetype:csv site:.edu
filetype:csv site:.com
Google Tidak Langsung Menggunakan File CSV
Hal yang menarik tentang pengindeksan file CSV oleh Google adalah tampilan pencarian Dataset Google sudah menggunakan file CSV tetapi tampaknya hanya ketika dijelaskan dengan data terstruktur.
Dokumentasi data terstruktur Dataset di dokumentasi Pengembang Google lama (dapat dilihat di Archive.org) menyatakan bahwa file CSV adalah standar yang dapat diterima untuk muncul dalam fitur pencarian dataset.
Penggunaan data tabular sebagai tampilan pencarian sudah ada sejak tahun 2018, ketika Google mengumumkan bahwa mereka akan menampilkan jenis data tersebut dalam pencarian ketika data tersebut disertai dengan data terstruktur.
Menurut dokumentasi aslinya:
"Dataset lebih mudah ditemukan ketika Anda memberikan informasi pendukung seperti nama, deskripsi, pembuat, dan format distribusi yang disediakan sebagai data terstruktur...
Berikut beberapa contoh dari apa yang dapat memenuhi syarat sebagai dataset:
- Tabel atau file CSV dengan beberapa data
- Kumpulan tabel terorganisir
- File dalam format proprietary yang berisi data
- Kumpulan file yang secara bersama-sama membentuk suatu dataset bermakna
- Objek terstruktur dengan data dalam format lain yang mungkin ingin Anda muat ke dalam alat khusus untuk pengolahan
- Gambar yang menangkap data
- File yang berkaitan dengan pembelajaran mesin
- Apa pun yang terlihat seperti dataset bagi Anda"
Google memperbarui dokumentasi di atas pada tahun 2022 dan mengarahkannya ke Dokumentasi Pusat Pencarian baru.
Dokumentasi yang diperbarui menjelaskan bahwa Google bergantung pada data terstruktur untuk menggunakan file CSV dalam tampilan pencarian dataset mereka.
Namun apakah perubahan ini akan berarti bahwa Google akhirnya akan mengindeks file CSV dan menggunakannya dalam hasil pencarian (selain data tabular yang ditunjukkan dalam data terstruktur)?
Inilah yang dijelaskan oleh dokumentasi saat ini:
"Dataset lebih mudah ditemukan ketika Anda memberikan informasi pendukung seperti nama, deskripsi, pembuat, dan format distribusi dalam bentuk data terstruktur.
Pendekatan Google terhadap penemuan dataset menggunakan schema.org dan standar metadata lainnya yang dapat ditambahkan ke halaman yang menggambarkan dataset...
Berikut beberapa contoh dari apa yang dapat memenuhi syarat sebagai dataset:
Tabel atau file CSV dengan beberapa data..."
Pengindeksan CSV oleh Google Terkait dengan Update Algoritma Agustus 2023?
Definisi pembaruan algoritma inti adalah ketika Google melakukan perubahan "signifikan" dan "luas" pada algoritma inti mereka.
Mungkin kebetulan bahwa pengindeksan file CSV dan pembaruan algoritma inti terjadi hampir bersamaan.
Sumber: SEJ