Apa yang dimaksud Meta Charset UTF-8 ?

Meta tag adalah 'data tentang data', dimana tag ini ditujukan bukan kepada user, tetapi kepada web browser atau kepada 'robot program' seperti mesin pencari (search engine). Charset UTF-8 merupakan meta tag yang paling sering digunakan dalam HTML5, penulisannya adalah sebagai berikut:

UTF-8 atau universal charset set , atau yang pada umumnya disebut sebagai Charset adalah sekumpulan dari beberapa jenis pengkodean karakter baik huruf, angka, ataupun symbol. Untuk saat ini pengkodean UTF-8 telah menjadi standarisasi untuk pengkodean dalam sistem operasi, bahasa pemrograman, API, dan software. Walaupun bersifat opsional, hampir setiap halaman HTML5 menggunakan meta tag ini. Akan tetapi, apa sebenarnya maksud dari charset=”UTF-8″ini ?

Karakter set paling sederhana dan juga paling awal digunakan adalah karakter set ASCII, (dalam HTML ditulis sebagai charset=”us-ascii”). Karakter set ini terbatas pada huruf latin (a-z, A-Z) dan beberapa karakter lain seperti angka, spasi, tab, dll dengan total hanya 128 karakter. Walaupun sepenuhnya opsional, penulisan meta tag charset sangat dianjurkan. Jika kita tidak menuliskan charset, web browser akan mencoba 'menebak' karakter yang digunakan (biasanya web browser modern akan menggunakan utf-8 sebagai karakter default). Jika halaman web dijalankan dari web server seperti Apache, web server juga akan menambahkan http-header yang berisi karakter set.

Namun perlu menjadi catatan bahwa jika kita tidak menulis meta tag charset, proses web browser 'menebak' karakter set ini bisa menjadi masalah. Pada tahun 2005 terdapat sebuah bug pada Internet Explorer yang dinamakan Google XSS. Hal ini terjadi karena situs google tidak menuliskan karakter set sehingga bisa digunakan untuk menyisipkan kode javascript. Oleh karena itu, sebaiknya kita selalu menambahkan meta tag charset pada setiap halaman HTML.

 

referensi