Под системой кодирования понимается комплекс норм обозначения информации с помощью кода.
Кодирование представляет собой перевод того или иного вида информации в код (условное обозначение) с целью оптимизации обработки данных.
Под текстовой информацией понимается сочетание различных знаков или символов (буквенных, цифровых или других), посредством которых выражаются или отображаются информационные объекты – данные на разнообразных носителях (бумага, электронный вид и т. д.).
Для разработчиков программного обеспечения кодирование текстовой информации является одной из важнейших задач. Эта задача облегчится, если каждую букву алфавита, цифру или знак препинания сопоставить с двоичными числами. Чтобы решить эту задачу, хватит и одного байта информации, с применением которого можно закодировать 256 символов. С этим связана одна общая проблема – система кодирования текстовых данных должна быть одинакова во всем мире и на всех компьютерах. Но эта проблема все еще не решена, так как, например, в России существует несколько систем кодирования текстовых данных. А относительно второй части проблемы можно сказать следующее: компьютеры, на которых применялись свои оригинальные системы кодирования, устарели и вышли из употребления. Кодирование текстовых данных осуществляется в соответствии со стандартами ASCII (американская система кодирования для обмена информацией), в основу которых положен принцип удовлетворения международных интересов и интересов отдельных стран и разработчиков. В соответствии с этим стандартом таблица кодирования символов разделена на две части: базовую (коды от 0 до 127) и расширенную (коды от 128 до 255). Базовая часть в свою очередь делится еще на две части. В первую часть входят коды от 0 до 31, которые были отданы разработчикам аппаратуры. Во вторую часть включены коды от 32 до 127. Эти коды составляют международную часть. Таблицы международной части используются во всех странах мира.
За расширенную часть стандарт не отвечает. В этой части каждая страна располагает свои символы исходя из своего удобства.
В настоящее время разработана шестнадцатиразрядная система кодирования текстовых данных, которая называется UNICODE. Данная система кодирования позволяет закодировать 65 536 символов. Благодаря системе UNICODE в одной таблице можно закодировать символы большинства стран планеты.
Кодировка КОИ-8 (восьмизначный код обмена информацией) применяется в сети Интернет, а также в компьютерных системах в России.
Кодировка ISO (международный стандарт кодировки русского текста), несмотря на свое обозначение как стандарта, практически не применяется.