На веб-страницах могут использоваться различные кодировки. Например, ASCII, Latin-1, Windows 1252 или Unicode. За последние 18 месяцев резко увеличилась популярность последней. Сегодня она используется примерно на половине страниц в Интернете.
Такие данные приводятся в блоге Google. Они основаны на индексе веб-страниц, создаваемым поисковиком. Unicode хорош тем, что, в отличие от других специализированных кодировок, он может представлять любые алфавиты: латинский, кириллицу, арабский или восточные иероглифы.
Unicode поддерживается и продвигается Google. В последней версии кодировки 5.2 присутствуют не только современные, но и мертвые языки. Были добавлены более 6600 знаков, включая египетские иероглифы. Не исключено, что в будущем Unicode станет единым мировым стандартом.