Тема 1.2 Меры и единицы представления, измерения и хранения информации

Единицы представления данных

Существует множество систем представления данных. С одной из них, принятой в информатике и вычислительной технике, двоичным кодом, мы познакомились выше. Наименьшей единицей такого представления является бит (двоичный разряд).

Совокупность двоичных разрядов, выражающих числовые или иные данные, образует некий битовый рисунок. Практика показывает, что с битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В настоящее время в качестве таких форм используются группы из восьми битов, которые называются байтами.

Десятичное число Двоичное число Байт
0000 0001
0000 0010
1111 1111

Понятие о байте как группе взаимосвязанных битов появилось вместе с первыми образцами электронной вычислительной техники. Долгое время оно было машиннозависимым, то есть для разных вычислительных машин длина байта была разной. Только в конце 60-х годов понятие байта стало универсальным и машиннонезависимым.

Во многих случаях целесообразно использовать не восьмиразрядное кодирование, а 16-разрядное, 24-разрядное, 32-разрядное и более. Группа из 32 взаимосвязанных бит (четырех взаимосвязанных байтов) называется словом. Соответственно, группы из двух взаимосвязанных байтов (16 разрядов) называются полусловом, а группы из восьми байтов (64 разряда) – удвоенным словом. На сегодняшний день, такой системы обозначения достаточно.

Единицы измерения данных

Существует много различных систем и единиц измерения данных. Каждая научная дисциплина и каждая область человеческой деятельности может использовать свои, наиболее удобные или традиционно устоявшиеся единицы. В информатике для измерения данных используют тот факт, что разные типы данных имеют универсальное двоичное представление и потому вводят свои единицы данных, основанные на нем.

Наименьшей единицей измерения является байт. Поскольку одним байтом, как правило, кодируется один символ текстовой информации, то для текстовых документов размер в байтах соответствует лексическому объему в символах.

Более крупная единица измерения – килобайт (Кбайт). Условно можно считать, что 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислитель­ной техники, работающей с двоичными числами, более удобно представление чисел в виде степени двойки и потому на самом деле 1 Кбайт равен 210 байт (1024 байт). Однако всюду, где это не принципиально, с инженерной погрешностью (до 3 %) «забывают» о «лишних» байтах.

В килобайтах измеряют сравнительно небольшие объемы данных. Условно можно считать, что одна страница неформатированного машинописного текста составляет около 2 Кбайт.

Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига-, тера-; в более крупных единицах пока нет практической надобности.



· 1 Кбайт = 1024 байт = 210 байт ≈ 103 байт.

· 1 Мбайт = 1024 Кбайт = 210 Кбайт = 220 байт = 1.048.576 байт ≈ 106 байт.

· 1 Гбайт = 1024 Мбайт = 210 Мбайт = 230 байт = 1.073.741.824 байт ≈ 109 байт.

· 1 Тбайт = 1024 Гбайт = 210 Гбайт = 240 байт = 1.099.511.627.776 байт ≈ 1012 байт.

· 1 Пбайт = 1024 Тбайт = 210 Тбайт = 250 байт = 1.125.899.906.842.624 байт ≈ 1015 байт.

Таким образом, например, минимальный объем видеопамяти необходимый для LCD-монитора с разрешением 1280´1024 dpi в режиме цветопередачи True Color (32 бита) составит:

1280´1024´32 бит = 41.943.040 бит = 5.242.880 байт = 5.120 Кбайт = 5 Мбайт.

Единицы хранения данных

При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру, а при этом, как мы уже знаем, образуется «паразитная нагрузка» в виде адресных данных. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру.

Поскольку адресные данные тоже имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких как байты, неудобно. Их неудобно хранить и в более крупных единицах (килобайтах, мегабайтах и т. п.), поскольку неполное заполнение одной единицы хранения приводит к неэффективности хранения.

В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.

Проще всего представить себе файл в виде безразмерного канцелярского досье, в которое можно по желанию добавлять содержимое или извлекать его оттуда. Поскольку в определении файла нет ограничений на размер, можно представить себе файл, имеющий 0 байтов (пустой файл),и файл, имеющий любое число байтов.

В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла.

Понятие о файловой структуре

Требование уникальности имени файла очевидно – без этого невозможно гарантировать однозначность доступа к данным. В средствах вычислительной техники требование уникальности имени обеспечивается автоматически – создать файл с именем, тождественным уже имеющемуся, не может ни пользователь, ни автоматика.

Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов (папок), через которые проходит. В качестве разделителя используется символ «\» (обратная косая черта).

Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. Понятно, что в этом случае на одном носителе не может быть двух файлов с тождественными полными именами.

Пример записи полного имени файла:

\\...\\

Пример записи двух файлов, имеющих одинаковое собственное имя и размещенных на одном носителе, но отличающихся путем доступа, то есть полным именем:

· С:\Windows\Temp\document.doc.

· С:\Documents and Settings\All Users\Документы\document.doc.


Тема 1.3 Системы счисления

Система счисления (СС) – система приемов и правил, которые позволяют устанавливать взаимно однозначное соответствие между любым числом и его представлением в виде совокупности конечного числа символов.

В зависимости от способа изображения чисел с помощью цифр системы счисления делятся на позиционные и непозиционные.

В непозиционных системах любое число определяется как некоторая функция от численных значений совокупности цифр, которые представляют это число. Цифры в непозиционных системах исчисления отвечают некоторым фиксированным числам. Пример непозиционной системы – римская система исчисления.

В электронных цифровых устройствах применяются позиционные системы счисления. Позиционной системой счисления называется потому, что значение каждой входящей в число цифры зависит от ее положения в записи числа.

Любая позиционная СС с основанием q может быть представлена в виде полинома:

A(q) = rnqn + rn–1qn–1 + rn–2qn–2 + … + r1q1 + r0q0 + r–1q–1 + …,

где A – число в позиционной СС с основанием q; ri – коэффициент; n – степень и индекс.

Позиционные СС бывают различными в зависимости от основания:

1) Десятичная с основанием 10

[0 1 2 3 4 5 6 7 8 9]

23610 = 2∙102 + 3∙101 + 6∙100

2) Восьмеричные с основанием 8

[0 1 2 3 4 5 6 7]

2368 = 2∙82 + 3∙81 + 6∙80 = 15810

3) Шестнадцатеричная с основанием 16

[0 1 2 3 4 5 6 7 8 9 A B C D E F]

2АF16 = 2∙162 + A∙161 + F∙160 = 2∙162 + 10∙161 + 15∙160 = 68710

4) Двоичная с основанием 2

[0 1]

10112 = 1∙23 +0∙22 + 1∙21 + 1∙20 = 1110

Таблица 1.3.1 – Методы перевода целых и дробных чисел в десятичную СС

Тип преобразования Целые числа Дробные числа
Повторное умножение промежуточного результата на q и сложение со значением разряда данного числа. Первый промежуточный результат есть старший разряд Повторное деление промежуточного результата на q и сложение с разрядом данного числа. Первый промежуточный результат есть последний разряд, разделенный на q
Двоичное в десятичное 1∙2 + 1 = 3 3∙2 + 0 = 6 6∙2 + 1 = 13 13∙2 + 1 = 27 27∙2 + 0 = 54 54∙2 + 0 = 108 11011002 = 10810 1:2 = 0,5 (0,5 + 1):2 = 0,75 (0,75 + 0):2 = 0,375 (0,375 + 1):2 = 0,6875 (0,6875 + 0):2 = 0,34375 (0,34375 + 1):2 = 0,67187 (0,67187 + 0):2 = 0,33593 0,01010112 = 0,33593 ≈ 0,33610
Десятичное в восьмеричное 1∙8 + 5 = 13 13∙8 + 4 = 108 1548 = 10810 5:8 = 0,625 (0,625 + 0):8 = 0,078125 (0,078125 + 6):8 = 0,75976 (0,75976 + 5):8 = 0,71997 (0,71997 + 2):8 = 0,33999 0,256058 = 0,33999 ≈ 0,34010
Десятичное в шестнадцатеричное 6∙16 + 12 = 108 6С16 = 10810 A:16 = 0,625 (0,625 + 0):16 = 0,039062 (0,039062 + 6):16 = 0,75976 (0,75976 + 7):16 = 0,71997 (0,71997 + 5):16 = 0,33999 0,570A16 = 0,33999 ≈ 0,34010

Таблица 1.3.2 – Методы перевода целых и дробных чисел из десятичной СС

Тип преобразования Целые числа Дробные числа
Деление данного десятичного числа на q. Остатки дают превращенное число, которое читается в обратном направлении Повторное умножение данного десятичного числа на q. Разряд перед запятой дает разряд превращенного числа. При дальнейшем умножении используется лишь дробная часть промежуточного результата
Десятичное в двоичное 108:2 = 54 остаток 0 54:2 = 27 остаток 0 27:2 = 13 остаток 1 13:2 = 6 остаток 1 6:2 = 3 остаток 0 3:2 = 1 остаток 1 1:2 = 0 остаток 1 10810 = 11011002 0,34∙2 = 0,68 переносится 0 0,68∙2 = 1,36 переносится 1 0,36∙2 = 0,72 переносится 0 0,72∙2 = 1,44 переносится 1 0,44∙2 = 0,88 переносится 0 0,88∙2 = 1,76 переносится 1 0,76∙2 = 1,52 переносится 1 Прерывание 0,3410 = 0,01010112
Десятичное в восьмеричное 108:8 = 13 остаток 4 13:8 = 1 остаток 5 1:8 = 0 остаток 1 10810 = 1548 0,34∙8 = 2,72 переносится 2 0,72∙8 = 5,76 переносится 5 0,76∙8 = 6,08 переносится 6 0,08∙8 = 0,64 переносится 0 0,64∙8 = 5,12 переносится 5 Прерывание 0,3410 = 0,256058
Десятичное в шестнадцатеричное 108:16 = 6 остаток 12 6:16 = 0 остаток 6 10810 = 6С16 0,34∙16 = 5,44 переносится 5 0,44∙16 = 7,04 переносится 7 0,04∙16 = 0,64 переносится 0 0,64∙16 = 10,24 переносится 10 Прерывание 0,3410 = 0,570A8

Для перевода чисел из одной СС в другую удобно использовать промежуточное преобразование числа в двоичную СС.

Таблица 1.3.3 – Методы перевода целых чисел из одной СС в другую СС

Десятичное число Двоичное число Восьмеричное число Десятичное число Двоичное число Шестнадцатеричное число
A
B
C
D
E
F

Перевод [восьмеричное число] ↔ [двоичное число]
24518 = 010.100.101.001 = 101001010012
Восьмеричные цифры
Двоичные триады
1010011110102 = 101.001.111.010 = 51728
Двоичные триады
Восьмеричные цифры

Перевод [шестнадцатеричное число] ↔ [двоичное число]
4C716 = 0100.1100.0111 = 100110001112
Шестнадцатеричные цифры С
Двоичные тетрады
1010001111102 = 1010.0011.1110 = A3E16
Двоичные тетрады
Шестнадцатеричные цифры A E

Перевод [восьмеричное число] → [двоичное число] → [шестнадцатеричное число]
24518 = 010.100.101.001 = 101001010012
Восьмеричные цифры
Двоичные триады
101001010012 = 0101.0010.1001 = 52916
Двоичные тетрады
Шестнадцатеричные цифры
24518 = 010.100.101.001 = 101001010012 = 0101.0010.1001 = 52916
Перевод [шестнадцатеричное число] → [двоичное число] → [восьмеричное число]
4C716 = 0100.1100.0111 = 100110001112
Шестнадцатеричные цифры С
Двоичные тетрады
100110001112 = 010.011.000.111 = 23078
Двоичные триады
Восьмеричные цифры
4C716 = 0100.1100.0111 = 100110001112 = 010.011.000.111 = 23078

Двоичная арифметика

Арифметические действия над двоичными числами выполняются следующим образом:

Сложение Вычитание Умножение
0 + 0 = 0 0 – 0 = 0 0∙0 = 0
0 + 1 = 1 1 – 0 = 1 0∙1 = 0
1 + 0 = 1 1 – 1 = 0 1∙0 = 0
1 + 1 = 10 10 – 1 = 1 1∙1 = 1

Сложение двух многоразрядных двоичных чисел проводится поразрядно с учетом единиц переполнения от предшествующих разрядов:

Вычитание многоразрядных двоичных чисел, аналогично сложению, начинается из младших разрядов. Если занять единицу в старшем разряде, образуются две единицы в младшем разряде:

Умножение представляет собой многоразовое сложение промежуточных сумм и сдвиги:

Процесс деления состоит из операций вычитания, которые повторяются:




1748899671818649.html
1748936470950690.html
    PR.RU™