Аналоговые и дискретные сигналы. Дискретное представление информации.
Информационное взаимодействие в природе носит волновой характер, так звук – это акустические (механические) волны, свет – электромагнитные волны, люди видят предметы в отраженном от них свете. Потребность в сохранении и передаче информации привела к возникновению письменности – преобразовании звуковой волны в символьные коды – буквы.
Изобретение фонографа, а потом и магнитофона дало возможность сохранять и воспроизводить звук. Люди научились записывать и воспроизводить видеосигналы.
Появление компьютерной техники и использование универсальной цифровой системы кодирования открыло перед человечеством новые широкие возможности записи, сохранения и воспроизведения информации.
Информация в компьютере может быть представлена с помощью сигналов двух видов.
Аналоговые – сигналы, величина которых сохраняется непрерывно на каком-то отрезке времени, аналогичные порождающим процессам.
Дискретные – сигналы, величина которых сохраняется в виде значений в определенные моменты времени и принимающие фиксированные значения уровня.
Непрерывные сообщения можно преобразовывать в дискретные, применяя дискретизацию и квантование по уровню.
Дискретизация (англ. discretisation) – устранение непрерывности (пространственной или по времени) волновых информационных сигналов.
Квантование (англ. quantization) – преобразование диапазона всех возможных значений входного сигнала в конечное число выходных элементов
Передачу практически любых сообщений можно свести к передаче их отсчетов, следующих друг за другом с интервалом дискретизации t.
Для абсолютно точного представления информации в общем случае необходимо бесконечное число разрядов. На практике же в этом нет необходимости, так как получатели информации (органы чувств человека, механизмы и т.д.) обладают конечной разрешающей способностью, то есть не замечают незначительной разницы между абсолютно точным и приближенным значениями воспроизводимого.
С учетом этого можно подвергнуть дискретные отсчеты квантованию. Интервал между соседними разрешенными уровнями называется шагом квантования. На практике чаще применяется равномерное квантование, при котором шаг квантования постоянный. На рис.3.1 представлена схема дискретизации и квантования звукового сигнала, где ΔА – шаг квантования устанавливает сохраняемые уровни значения амплитуды звуковой волны; Δt – шаг дискретизации звука (интервал снятия значений амплитуды звуковой волны по времени).
Рис.3.1. Дискретизация и квантование акустического сигнала
На рис.3.2 показана схема пространственной дискретизации. Изображение (слева) разбивается на геометрические элементы с шагом дискретизации Δl, в пределах которого значение цветовой характеристики может считаться неизменным. Результат применения шкалы квантования цвета по уровням градации с шагом ΔС показан справа на рисунке.
Рис. 3.2. Схема пространственной дискретизации
Достоинством дискретного представления информации является, в первую очередь, возможность автоматизации передачи и обработки сигналов с помощью компьютеров. Современный персональный компьютер позволяет работать с разнообразными данными: числами, символьными данными (текстом), графическими данными, звуковыми данными, и все данные в компьютере представлены в двоичном цифровом коде.
Формы представления чисел в компьютере и кодирование числовой информации рассматривались в предыдущей главе. Важными источниками информации являются кроме числовых текстовые, звуковые и графические данные.
Для записи слов была изобретена дискретная система кодирования – алфавит, но она не подходит для хранения и автоматической обработки в вычислительной технике. Двоичное кодирование символьных данных производится с помощью кодовых таблиц, в которых каждому символу соответствует двоичный код.
Для представления изображений используют два способа – растровый и векторный. Оба они используют двоичный код для хранения цветовых и пространственных характеристик.
Для представления звука в виде цифрового кода сигнал дискретизируют по времени и квантуют по уровню с помощью аналого-цифрового преобразователя.
Текстовые данные являются важнейшим источником информации. Для записи слов человечеством были изобретены буквы, для указания оттенков речи – знаки препинания. Все это – символы, символьный способ хранения изначально дискретен, и способ компьютерного представления сводится к кодированию символов численным способом.
Все используемые способы представления символов в памяти компьютера, так или иначе, сводятся к нумерации символов алфавита и хранения полученных кодов как целых чисел. Этому коду драйвер видеокарты ставит в соответствие начертание символа (тем или иным шрифтом).
Такое кодирование производится размещением кодовых таблиц в оперативной памяти компьютера, по которым каждому символу ставится в соответствие двоичный код.
При кодировании языков, использующих алфавитную (не иероглифическую) письменность, достаточно 127 символов (в английском языке 26 букв +26 прописных «заглавных» +10 цифр + знаки препинания и арифметические знаки). Следовательно, для кодировки достаточно по 7 бит на каждый символ, этот принцип использует самая распространенная система кодирования латиницы – ASCII (American Standard Code for Information Interchange – американский стандартный код для обмена информацией). Код ASCII был разработан в 60-х годах XX века для любых видов передачи информации (телеграфа, телетайпа) и поэтому в нём, кроме информационных символов, используются символы-команды для управления связью. Эти символы: Начало текста, Конец текста, Звуковой сигнал, Горизонтальная табуляция и т. д. ныне вышли из употребления. Их коды являются служебными и трактуются большинством форматов как управляющие команды. Они занимают первые 31 позиции в таблице.
Таблица 3.1.
Таблица символов ASCII (128 – 255)
С 1981 г. в таблице ASCII для представления 1 символа используется 1 байт, т.е. таблица может описывать 28=256 символических кодов.
Коды с десятичными номерами 0—127 образуют основную страницу таблицы. В основной странице располагаются управляющие команды для принтеров (0—31 – возврат каретки, перевод строки и т.д.), затем спецсимволы (#$%&*@ пр.), цифры и латинские буквы, прописные и строчные.
Коды с номерами 128—255 (табл. 3.1) отданы под знаки национальных алфавитов и символов псевдографики (псевдографика широко использовалась в 80-е годы). Вид символов, имеющих значение кода больше 127, зависит от выбранного шрифта.
С распространением компьютеров, программных продуктов и использования информационных ресурсов по миру выяснилось, что во многих странах Юго-Восточного региона 128 кодов под национальные символы не хватает, и в 1991 г. был принят стандарт ISO-10646-1 (иначе UNICODE-3). Для этого стандарта на кодирование символа отводится 3 байта.
В Юникоде первые 128 символов тоже совпадают с соответствующими символами ASCII. Далее размещены основные алфавиты современных языков. В целом, UNICODE-3 описывает алфавиты всех известных (в том числе и «мертвых» языков; в кодировку внесены все математические и иные научные, и символьные обозначения, и даже придуманные языки – письменность эльфов и Мордора.
В современных компьютерах используется укороченная, 16-битовая версия UNICODE. По этой системе каждый символ кодируется двухбайтовым числом, следовательно, таблица описывает 216=65536 кодов, этой емкости вполне хватает для алфавитов современных широко используемых языков. Текстовые документы, созданные по такой таблице кодировки, имеют в два раза больший объем, по сравнению с кодировкой ASCII, но при современных технических средствах это не представляет особых проблем и затруднений.
Существуют и другие таблицы кодирования.
UTF (Unicode Transformation Format) – применяется в UNIX-подобных операционных системах, кодировка с переменным количеством байт/символ.
CP1251 – «Code Page 1251» – однобайтовая кодовая страница кодировки ОС Windows
Для представления русского варианта кириллицы были разработаны несколько кодовых таблиц, наиболее распространенной была КОИ-8 (Код Обмена Информацией, 8-ми битный).
На сегодняшний день компьютерную графику по способу формирования и хранения изображений в памяти компьютера принято подразделять на растровую и векторную.
Растровое изображение формируется цветовыми точками. Растровые графические данные, в зависимости от способа сжатия, выбора глубины цветовой палитры, возможности хранения слоев и прочих возможностей при кодировании подразделяются по форматам стандартных способов записи файлов.
Векторное изображение формируется из набора объектов, описываемых с помощью математических формул.
Векторную графику, в свою очередь, по методу отображения можно разделить на большие категории:
– 2D-графику (плоскостную);
– 3D-графику (объемную);
– фрактальную графику (создание регулярных структур).
Изображения векторной графики также имеют собственные стандарты форматов хранения файлов.
По назначению компьютерную графику можно разделить на:
– Конструкторскую (инженерную) графику;
– Полиграфическую;
– Web-графику и т. д.
В таком делении учитываются требования области применения: для конструкторских работ важна точность отображения, но не слишком велики требования к цветовым характеристикам; для полиграфии – наоборот, точная цветопередача является основным требованием; в Web-графике существуют ограничения по объему файлов, к тому же, во всемирной паутине весьма ограничены цветовые палитры.
Цветовые модели. Разрешение
Для каждой точки растрового изображения (или для каждого объекта векторного изображения) должна сохраняться цветовая характеристика.
Если изображение монохромное (черно-белое) то хранить нужно только один признак цвета – есть цвет или нет, т.е. достаточно одного бита на каждый пиксель (объект) изображения.
Для описания градации одного цвета применяется обычное кодирование, в котором номер обозначает градацию. Чем больше значение, тем сильнее проявляется цвет. Таким образом, появляется возможность задавать оттенок цвета. Чтобы получить реальные полутона (для монохромного изображения), для хранения каждой цветовой точки нужно отводить большее количество разрядов. В этом случае черный цвет будет представлен нулевым значением, а белый – максимально возможным числом. Например, при восьмибитном кодировании получится 256 разных значений яркости (оттенки серого, Grayscale).
В более сложных случаях, когда речь идет о кодировании сложного цвета с большим количеством оттенков, рассматривают разложение цвета на несколько отдельных компонентов, которые, смешиваясь (т.е. действуя в одной точке), образуют заданный цвет.
Для цветных изображений нужно закодировать яркость и оттенок точки. Для получения наивысшей точности цветопередачи необходимо иметь по 256 значений для каждого из основных цветов (вместе это дает 23*8 – более 16 миллионов оттенков).
Рис. 3.3 Пространство цветов в модели RGB
Цветовое пространство характеризуют количеством битов, отводимых на сохранение цвета. Чаще всего используются режимы TrueColor (24 бита, в соотношении 8:8:8) и HighColor (16 бит, в соотношении 5:6:5).
Компоненты цвета и способ образования из них видимого оттенка образуют цветовую модель.
Теория цвета построена на особенностях зрения человека. Считается, что в глазу имеются сенсоры «колбочки», воспринимающие красный, зеленый и синий цвета, их отнесли к базовым (Red – красный; Green – зеленый; Blue – голубой). Остальные цвета получаются как смешение долей цвет. Белый – смешение максимального значения цветовых каналов, черный – отсутствие свечения по всем каналам. Эта модель цветового пространства названа аддитивной (суммирующей) и именуется RGB. Мониторы работают именно в этой системе, т.к. физически монитор излучает именно эти цвета.
Распространена и другая – субтрактивная (разделяющая) модель цветового пространства, получаемая вычитанием из белого базовых цветов. В итоге получены голубой, пурпурный и желтый цвета. Cyan – голубой; Magenta – фиолетовый; Yellow – желтый. При смешивании в равных максимальных долях они должны давать черный цвет. Поскольку на практике точного черного цвета при смешивании не получается, то в модель добавляется компенсирующий четвертый компонент – blacK, поэтому модель носит название CMYK. В этом пространстве работает большинство печатающих устройств.
Говоря о любом виде компьютерной графики нельзя не упомянуть о разрешении – понятии, которое применяется в очень разных смыслах:
Разрешение экрана – свойство видеоподсистемы, и настроек ОС, определяет размер изображения на экране; единицы измерения – PICSEL.
Разрешение электронного изображения – свойство файла, задается при создании (при сканировании, фотографировании и т.д.), определяет размер самого изображения; единицы изменения PPI – PICSEL PER INCH.
Разрешение печатного изображения – свойство принтера, количество точек, которые могут быть напечатаны на участке заданной длины, определяет качество изображения при заданном размере; единицы измерения DPI – DOTS PER INCH.
Чем больше разрешение – тем выше качество изображения, но и больше места требует сохраняемый графический файл. Для экранного отображения достаточно разрешения 70—75 ppi, для качественной распечатки на струйном/лазерном принтере потребуется 150—200 dpi, полиграфическим считается разрешение более 250 dpi.
Растровая графика
Растровые изображения формируются цветовыми точками, называемыми пикселями (PICSEL – PICtureS ELement). Из них создается двумерный массив (матрица).
Растровая графика – основное средство представления и обработки фотографических изображений, стилизованных художественных рисунков, с помощью именно этого способа представления информации строятся современные человеко-машинные интерфейсы. Но, несмотря на универсальность, этот способ представления информации имеет целый ряд недостатков. К ним относятся: зависимость качества изображения от его объема, трудность выделения и манипуляции отдельными элементами, существенное снижение качества изображения в результате геометрических преобразований (масштабирования, поворотов).
Устройствами, создающими растровое изображение, помимо собственно компьютера с растровым графическим редактором, являются:
– сканер;
– цифровая фото- и видео- аппаратура;
– программы – захватчики кадров теле- и видео- программ;
– программы создания растровой графики.
Сканеры и цифровая аппаратура используют светочувствительные элементы, при попадании на которые световой или лазерный луч передает характеристики точек. Эти характеристики в цифровом формате сохраняются на элементах памяти и, тем самым, достигается возможность передать изображение в компьютерную обработку.
Из-за разнообразия типов изображений и областей из использования существует огромное количество разнообразных графических форматов. Для того, чтобы программы понимали файлы разных форматов, существуют конвертеры – программы, переводящие файлы из формата в формат. Существует несколько наиболее употребительных форматов:
– .bmp – для хранения и передачи изображений в среде Windows;
– .jpg – для хранения изображений с применением сжатия (удаления избыточной информации);
– .gif – для хранения сжатых изображений с фиксированным количеством цветов, разрабатывался для применения в Интернете;
– .tif – предназначен для хранения изображений высокого (полиграфического) качества, имеется возможность перенесения на другие аппаратные платформы и т.д..
Векторная графика
Векторные изображения формируется из набора математически представленных геометрических объектов.
Рисунок хранится как набор координат, векторов и других чисел, характеризующих набор примитивов. Наиболее распространенными примитивами являются: отрезки, прямоугольники и их производные (со сглаженными углами), эллипсы и их части, кривые Безье (математические кривые третьего порядка, задаваемые 4 точками), а также составленные из них сложные контуры.
Линии – это кривые разных порядков, при этом прямая рассматривается как частный случай кривой; они обладают свойствами – толщиной, цветом, начертанием (сплошная, штриховая). Из минимальных объектов-линий создаются контуры. Каждый контур имеет 2 или более опорные точки-узлы. Если 1-ая точка совпадает с последней – конур замкнут, и приобретает свойство заполнения (цветом, рисунком-текстурой, градиентной заливкой).
Большим преимуществом векторного представления графики является значительно меньший объем файлов по сравнению с растровой – изображение описывается не битовой картой, а несколькими формулами, при этом объем файла не зависит от размеров изображения. Еще одно достоинство векторного представления – его объектность: объекты легко выделять, при всех трансформациях (уменьшение, увеличение, искажение) качество не ухудшается и не зависит от разрешения.
Недостатком этой формы представления относится большая сложность создания фотореалистичных изображений и высокие требования к ресурсам вычислительной системы, необходимым для пересчета координат объектов при трансформации.
Устройством ввода векторного изображения является дигитайзер (сколка). Механическое воздействие на панель этого устройства позволяет фиксировать координаты точек, а сила нажатия – определять толщину линии между точками.
Распространенными форматами хранения векторных изображений являются:
– .wmf – формат хранения векторных изображений в Windows;
– .ai,.cdf – собственные форматы векторных редакторов AdobeIllustrator и CorelDraw, совместимые друг с другом.
– .dwg – формат файлов конструкторского программного пакета AutoCad.
Звук – это продольная механическая волна, распространяемая в воздухе или другой среде во всех направлениях от источника колебаний.
Всякий звук (игра музыкальных инструментов, голос человека) – это своеобразная смесь многих гармонических колебаний с определенным набором частот. Как и любая волна, звуковая волна характеризуется двумя основными параметрами – амплитудой и частотой.
Частота – это количество звуковых колебаний в секунду; измеряется в герцах (Гц). Чем выше частота, тем выше тон звука.
Амплитуда колебаний определяет громкость звука и зависит в первую очередь от мощности источника звука.
Абсолютную величину звукового давления измеряют в паскалях (Па). Порогом слышимости обладают звуки, имеющие амплитуду около 20мкПа (2*10—5 Па). Уровень болевого порога слышимости около 200 Па, т.е минимальное и максимальное значения отличаются на 6—7 порядков. Из-за большого разброса величин абсолютными значениями пользоваться неудобно, и используют логарифмическую шкалу децибелов.
Десятичный логарифм отношения некоторой величины к ее эталонному значению (порогу слышимости) называется белом (Б), а его десятая часть – децибелом (дБ).
Формула звука
где L – уровень звука в дБ
РЗВ – измеряемое звуковое давление
РПС – звуковое давление порога слышимости
Звук можно представить в виде кривой, которая показывает зависимость звукового давления от времени. Замеряя напряжение через равные промежутки времени и сохраняя полученные численные значения можно дискретизировать (оцифровать звук). При этом сохраняются мгновенные значения звукового сигнала в определенные моменты времени (выборки). Чем чаще берутся выборки, тем точнее цифровая копия звука.
Частота следования отсчетов называется частотой дискретизации, а диапазон значений отсчета определяется разрядностью его двоичного представления.
При цифровом способе хранения звука не сохраняется весь профиль кривой звукового давления (и соответственно, сопоставленного ему напряжения). На рис.3.4 проиллюстрированы потери информации об истинном изменении времени и значениях амплитуды.
Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование, и сгладить получившийся ступенчатый сигнал.
Рис. 3.4. Потери информации при дискредитации звука
Устройство, выполняющее оцифровку (кодирование аналогового сигнала), называется аналого-цифровым преобразователем (АЦП).
Для обратного преобразования служит цифро-аналоговый преобразователь (ЦАП).
Дискретизация сигнала с произвольной частотой не всегда дает возможность восстановить форму входного сигнала, а использование частоты в два раза большей, чем частота фиксируемого сигнала однозначно даст восстановление искомой формы.
Это утверждение является одной из важнейших теорем, используемых в теории информации, теорема В.А.Котельникова (в англоязычной литературе – теорема Найквиста-Шеннона):
Непрерывная функция Х (t) не имеющая в своем спектре составляющих с частотами, лежащими за пределами полосы f (-Fm, Fm), полностью определяется последовательностью своих отсчетов в дискретные моменты времени X (ti), следующих с шагом t <1/2Fm.
Таким образом, по дискретной последовательности отсчетов всегда можно восстановить исходную непрерывную функцию Х (t), если отсчеты брались с интервалом t <1/2Fm. То есть любой непрерывный сигнал может быть преобразован в дискретную последовательность, а затем восстановлен по последовательности своих дискретных значений.
Человеческое ухо воспринимает чистые гармонические тоны в том случае, если их частоты не превышают 20 килогерц, т.е. 20 тысяч колебаний в секунду. Остальные тоны, частоты которых выше 20 килогерц, оказываются неслышимыми для человека – ультразвук. Этот факт ограниченности возможностей человеческого уха по частоте и предоставляет возможность установления разумного интервала для снятия значений звукового давления.
Точная формулировка теоремы Котельникова применима только к сигналам с неизменными частотными характеристиками и бесконечной длительностью, и поэтому для оцифровки реальных звуковых сигналов выбирают несколько большую частоту дискретизации (с запасом).
Предел восприятия частоты звука составляет 20 КГц, и частоты 40 КГц будет вполне достаточно для осуществления цифровой записи, лишенной искажений, но при этом некоторые шумы и искажения в записи все же будут присутствовать. В современной цифровой записи звука принят стандарт записи с частотой снятия значения звукового давления, или частотой дискретизации, равной 44100 герц. Компьютер позволяет записывать звук, как с большими, так и с меньшими частотами дискретизации.
Разрядность цифрового звука (глубина цифрового звука) – количество бит, отведенных для хранения значений звукового давления. Поскольку «единицей» хранения информация в компьютере является байт, то стандартный цифровой звук бывает 8 битным, 16 битным и 24 битным.
Одна секунда стереозвука (на два канала) вмещает 44100 х 2 = 88200 записей, при разрядности 16 (2 байта) это соответствует 176400 байтам (без учета заголовков и другой информации). Одна минута 8-битового одноканального (моно) звука будет занимать 44100 х 60 = 2646000 байт, или 2584 кБ, или 2,5 мБ.
Такие значительные требования к памяти при хранении аудиоинформации способствуют применению различных методов сжатия и иных принципов хранения звука.
Методы компьютерного синтеза звука. С появлением мини – ЭВМ, а позднее – персональных компьютеров, в составе аппаратных средств появились и средства, обеспечивающие взаимодействие компьютеров с простейшими генераторами звука – динамиками. Эти простейшие средства работы со звуком использовались в основном (и используются до сих пор) как средство диагностики и реакции на действия оператора системы.
Современное устройство для воспроизводства и записи звука (музыки, речи, шумов) – это звуковая карта, или адаптер.
В режиме записи звуковая плата производит оцифровку звука для последующей записи в память компьютера. В режиме воспроизведения, как цифровой аудиоплеер, считывает из памяти цифровые сигналы и преобразует их в аналоговые звуковые. В режиме создания звука плата действует как музыкальный инструмент (синтезатор), при этом используются два основных метода: частотная модуляция (FM-синтез) и таблично-волновой синтез (WT).
FM-синтез – использует специальные генераторы сигналов, определяющие частоту (высоту) тона и амплитуду (громкость). Для синтеза звука каждого музыкального инструмента требуется два таких генератора. Современные платы могут воспроизводить до 9—10 разных голосов инструментов (чаще 2—4), но звук при FM-синтезе имеет «металлический оттенок».
WT синтез – дает возможность хранить музыкальный звук в виде коллекции заранее созданных наборов звуков. Такие сэмплы (sample – пример, образец) соответствующих тембрам различных инструментов хранятся в памяти звуковой платы в MIDI-файлах. Лучшие звуковые платы могут хранить и использовать до 8 Мбайт сэмплов, выпускаются также табличные расширители, позволяющие нарастить массив MIDI-файлов.
Файл. mid содержит в себе запись действий музыканта о том, какая клавиша была нажата, в какой момент времени, с какой силой, как долго удерживалась, с какой силой (этот параметр особенно важен не для клавишных инструментов, а, например, для смычковых), была ли нажата педаль и т. п. Для озвучивания таких файлов важно наличие механизма преобразования записанных инструкций в звук.
Для ввода мелодии в стандарте MIDI в компьютер применяется специальное средство ввода – MIDI-клавиатура. Она похожа на клавиатуру пианино, но предназначена для передачи соответствующих нот звуковой карте – для последующего синтеза звука заданным инструментом. Программы синтеза мелодий отображают набранные ноты в соответствии с музыкальной нотацией и позволяют редактировать их.
Понятие формата компьютерного звука используется в двух различных смыслах. При использовании специализированного носителя или способа записи и специальных устройств чтения/записи в понятие формата входят физические характеристики носителя звука – размеры кассеты с магнитной лентой или диском и т. п.
При использовании универсального информационного носителя широкого применения – например, компьютерного гибкого или жесткого диска – под форматом понимают только способ кодирования цифрового сигнала, особенности расположения битов и слов и структуру служебной информации; вся «низкоуровневая» часть, относящаяся непосредственно к работе с носителем, в этом случае остается в ведении компьютера и его операционной системы.
Специализированные форматы относятся к устаревшим, но в качестве примера можно привести следующие:
– DCC (Digital Compact Cassette – цифровая компакт-кассета) – бытовая система записи в продольном направлении на стандартную компакт-кассету
– CD (Compact Disk – компакт-диск) – односторонний пластмассовый диск с оптической лазерной записью и считыванием, диаметром 120 или 90 мм, вмещающий максимум 74 минуты стереозвучания с частотой дискретизации 44.1 кГц и 16-разрядным линейным квантованием. Система предложена фирмами Sony и Philips и носит название CD-DA (Compact Disk – Digital Audio). Различаются штампованные (CD) однократно записываемые (CD-R) и многократно перезаписываемые (CD-RW) компакт-диски.
– MD (MiniDisk) – бытовая и концертная система записи на магнитооптический диск, разработанная Sony (диаметром 64 мм).
В настоящее время стандартом универсального носителя являются форматы:
– .WAV (Wave Microsoft RIFF – Resource Interchange File Format) – содержит оцифрованный звук (моно/стерео, 8/16 разрядов, с разной частотой оцифровки),
– .MID (SMF Standard MIDI File) – «партитура» для MIDI-инструментов (ноты, команды смены инструментов, управления и т.п.).
– .MP3 – сжатый звук по технологии MPEG (Motion Pictures Experts Group, Layers 3).
С точки зрения информатики фильм представляет собой сочетание звуковой и графической информации. При традиционных видео-технологиях для создания на экране эффекта движения используется технология быстрой смены статических картинок. В традиционном кадре на кинопленке основную его часть, разумеется, занимает видеоизображение, а сбоку размещена звуковая дорожка – графически зафиксированные колебания.
При использовании традиционных методов сохранения информации компьютерная (оцифрованная) версия фильма получится слишком большой.
До 90-х годов основными методами представления видеоданных были аналоговые методы. Обработка и редактирование данных выполнялись с помощью подхода, который сейчас называется линейный видеомонтаж (Linear Video Editing). При этом подходе данные всегда поступают на вход системы обработки последовательно, и система не может произвольно выбирать материалы, то есть монтаж из нескольких фрагментов выполняется всегда линейно.
Существенным шагом в технологии обработки видеозаписей было появление специализированных плат видеозахвата, выполнявших функции аналого-цифрового преобразования (для ввода), цифро-аналогового (для вывода) и имевших в своем составе средства аппаратного сжатия. Наличие таких плат позволило сжимать видеопоток до приемлемой величины с той скоростью, с которой он поступал на вход. С появлением таких плат появились и получили широкое распространение средства нелинейного видеомонтажа, т.е. средства, позволяющие в любой момент обратиться к любому фрагменту обрабатываемых материалов и преобразовывать их для получения итогового видеоизображения.