Набор символов (англ. character set) — определённая таблица кодировки конечного множества знаков. Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько байтов. Нередко вместо термина набор символов неправильно употребляют термин кодовая страница, означающий на самом деле частный случай набора символов с однобайтным кодированием. В таких случаях термины «кодировка» и «набор символов» являются синонимами.
В настоящее время в основном используются кодировки двух типов: совместимые с ASCII и совместимые с EBCDIC, с подавляющим преобладанием первых. Представление UTF-8 Юникода совместимо с ASCII. Кодировки на базе EBCDIC (например, ДКОИ-8) используются только на некоторых мэйнфреймах.
Первоначально в каждой операционной системе использовался один набор символов. Теперь используемые наборы символов стандартизованы, зависят от типа операционной системы лишь по традиции и устанавливаются согласно локали.
Русские кодировки:
- KOI8-R
- Windows-1251(cp1251)
- ISO 8859-5
- CP866 (DOS)
В настоящее время существуют универсальные многобайтовые кодировки, включающие в себя символы практически всех стран мира. Одна из таких - UTF-8, именно она используется для отображения текста на этом сайте и других сайтах, изготовленных нами. Блягодаря выбору этой кодировки мы можем публиковать тексты на разных языках.
