Здравствуйте, в этой статье мы постараемся ответить на вопрос: «Единицы измерения. Справочник». Если у Вас нет времени на чтение или статья не полностью решает Вашу проблему, можете получить онлайн консультацию квалифицированного юриста в форме ниже.
Все современные цифровые устройства имеют в основе двоичную систему. Так получилось из-за конкретных свойств электроники: схемы, на которых строились и строятся компьютеры, могут иметь одно из двух устойчивых состояний. Когда-то были попытки создать троичный компьютер, но исследования в этой области так и не продолжились.
1.6.1. КОДИРОВАНИЕ ЧИСЕЛ.
Используя n бит, можно записывать двоичные коды чисел от 0 до 2n-1, всего 2n чисел.
1) Кодирование положительных чисел: Для записи положительных чисел в байте заданное число слева дополняют нулями до восьми цифр. Эти нули называют незначимыми.
Например: записать в байте число 1310 = 11012
Результат: 00001101
2) Кодирование отрицательных чисел:Наибольшее положительное число, которое можно записать в байт, — это 127, поэтому для записи отрицательных чисел используют числа с 128-го по 255-е. В этом случае, чтобы записать отрицательное число, к нему добавляют 256, и полученное число записывают в ячейку.
1.6.2. КОДИРОВАНИЕ ТЕКСТА.
Соответствие между набором букв и числами называется кодировкой символа. Как правило, код символа хранится в одном байте, поэтому коды символов могут принимать значение от 0 до 255. Такие кодировки называют однобайтными. Они позволяют использовать 256 символов. Таблица кодов символов называется ASCII (American StandardCodeforInformationInterchange- Американский стандартный код для обмена информацией). Таблица ASCII-кодов состоит из двух частей:
Коды от 0 до 127 одинаковы для всех IBM-PC совместимых компьютеров и содержат:
коды управляющих символов;
коды цифр, арифметических операций, знаков препинания;
некоторые специальные символы;
коды больших и маленьких латинских букв.
Вторая часть таблицы (коды от 128 до 255) бывает различной в различных компьютерах. Она содержит:
коды букв национального алфавита;
коды некоторых математическихсимволов;
коды символов псевдографики.
В настоящее время все большее распространение приобретает двухбайтная кодировка Unicode. В ней коды символов могут принимать значение от 0 до 65535.
1.6.3. КОДИРОВАНИЕ ЦВЕТОВОЙ ИНФОРМАЦИИ.
Одним байтом можно закодировать 256 различных цветов. Это достаточно для рисованных изображений типа мультфильмов, но не достаточно для полноцветных изображений живой природы. Если для кодирования цвета использовать 2 байта, можно закодировать уже 65536 цветов. А если 3 байта – 16,5 млн. различных цветов. Такой режим позволяет хранить, обрабатывать и передавать изображения, не уступающие по качеству наблюдаемым в живой природе.
Из курса физики известно, что любой цвет можно представить в виде комбинации трех основных цветов: красного, зеленого, синего (их называют цветовыми составляющими). Если кодировать цвет точки с помощью 3 байтов, то первый байт выделяется красной составляющей, второй – зеленой, третий – синей. Чем больше значение байта цветовой составляющей, тем ярче этот цвет.
Белый цвет – у точки есть все цветовые составляющие, и они имеют полную яркость. Поэтому белый цвет кодируется так: 255 255 255. (11111111 11111111 11111111)
Черный цвет – отсутствие всех прочих цветов: 0 0 0. (00000000 00000000 00000000)
Серый цвет – промежуточный между черным и белым. В нем есть все цветовые составляющие, но они одинаковы и нейтрализуют друг друга.
Например: 100 100 100 или 150 150 150. (2-й вариант — ярче).
Красный цвет – все составляющие, кроме красной, равны 0. Темно-красный: 128 0 0. Ярко-красный: 255 0 0.
Зеленый цвет – 0 255 0.
Синий цвет – 0 0 255.
1.6.4. КОДИРОВАНИЕ ГРАФИЧЕСКОЙ ИНФОРМАЦИИ.
Рисунок разбивают на точки. Чем больше будет точек, и чем мельче они будут, тем точнее будет передача рисунка. Затем, двигаясь по строкам слева направо начиная с верхнего левого угла, последовательно кодируют цвет каждой точки. Для черно-белой картинки достаточно 1 байта для точки, для цветной – до 3-х байт для одной точки.
Двоичная система счисления
В двоичной системе счисления используются всего две цифры 0 и 1. Другими словами, двойка является основанием двоичной системы счисления. (Аналогично у десятичной системы основание 10.)
Чтобы научиться понимать числа в двоичной системе счисления, сначала рассмотрим, как формируются числа в привычной для нас десятичной системе счисления.
В десятичной системе счисления мы располагаем десятью знаками-цифрами (от 0 до 9). Когда счет достигает 9, то вводится новый разряд (десятки), а единицы обнуляются и счет начинается снова. После 19 разряд десятков увеличивается на 1, а единицы снова обнуляются. И так далее. Когда десятки доходят до 9, то потом появляется третий разряд – сотни.
Двоичная система счисления аналогична десятичной за исключением того, что в формировании числа участвуют всего лишь две знака-цифры: 0 и 1. Как только разряд достигает своего предела (т.е. единицы), появляется новый разряд, а старый обнуляется.
Попробуем считать в двоичной системе:
0 – это ноль
1 – это один (и это предел разряда)
10 – это два
11 – это три (и это снова предел)
100 – это четыре
101 – пять
110 – шесть
111 – семь и т.д.
Перевод чисел из двоичной системы счисления в десятичную
Не трудно заметить, что в двоичной системе счисления длины чисел с увеличением значения растут быстрыми темпами. Как определить, что значит вот это: 10001001? Непривычный к такой форме записи чисел человеческий мозг обычно не может понять сколько это. Неплохо бы уметь переводить двоичные числа в десятичные.
В десятичной системе счисления любое число можно представить в форме суммы единиц, десяток, сотен и т.д. Например:
1476 = 1000 + 400 + 70 + 6
Можно пойти еще дальше и разложить так:
1476 = 1 * 103 + 4 * 102 + 7 * 101 + 6 * 100
Посмотрите на эту запись внимательно. Здесь цифры 1, 4, 7 и 6 — это набор цифр из которых состоит число 1476. Все эти цифры поочередно умножаются на десять возведенную в ту или иную степень. Десять – это основание десятичной системы счисления. Степень, в которую возводится десятка – это разряд цифры за минусом единицы.
Аналогично можно разложить и любое двоичное число. Только основание здесь будет 2:
10001001 = 1*27 + 0*26 + 0*25 + 0*24 + 1*23 + 0*22 + 0*21 + 1*20
Если посчитать сумму составляющих, то в итоге мы получим десятичное число, соответствующее 10001001:
1*27 + 0*26 + 0*25 + 0*24 + 1*23 + 0*22 + 0*21 + 1*20 = 128 + 0 + 0 + 0 + 8 + 0 + 0 + 1 = 137
Т.е. число 10001001 по основанию 2 равно числу 137 по основанию 10. Записать это можно так:
100010012 = 13710
Почему двоичная система счисления так распространена?
Дело в том, что двоичная система счисления – это язык вычислительной техники. Каждая цифра должна быть как-то представлена на физическом носителе. Если это десятичная система, то придется создать такое устройство, которое может быть в десяти состояниях. Это сложно. Проще изготовить физический элемент, который может быть лишь в двух состояниях (например, есть ток или нет тока). Это одна из основных причин, почему двоичной системе счисления уделяется столько внимания.
Инженерный калькулятор
Физические величины и их единицы в СИ
Определение количества информации
Вес символа (i) и мощность алфавита (N) связаны между собой соотношением: 2i = N.
Так, алфавит мощностью в 256 символов имеет вес каждого символа в 8 бит, то есть один байт. Это означает, что на каждую букву приходится по байту. В таком случае, нетрудно определить, сколько весит весь кодируемый текст сообщения. Для этого достаточно вес символа алфавита умножить на количество символов в тексте. При подсчете количества символов в сообщении следует не забывать, что знаки препинания, а также пробелы – это тоже символы и они весят столько же, сколько и буквы.
Например, при условии, что каждая буква кодируется одним байтом, для текста, «Ура! Наступили каникулы.» информационный объем определяется умножением 8 битов на 24 символа (без учета кавычек). Произведение 8 * 24 = 192 бита – столько весит кодируемая фраза. В переводе на байты: 192 бита разделить на 8 получим 24 байта.
Эта схема работает и в обратной задаче. Пусть информационное сообщение составляет 2 килобайта и состоит из 512 символов. Необходимо определить мощность алфавита, используемого для кодирования сообщения.
Решение: Сначала целесообразно 2 килобайта перевести в биты: 2 * 1024 = 2048 (бит). Затем объем информационного сообщения делят на количество символов: 2048 / 512 = 4 (бит), получают вес одного символа. Для определения мощности алфавита 2 возводят в степень 4 и получают 16 – это мощность алфавита, то есть количество символов, используемых для кодирования текста.
Единицы физических величин. Общая информация
Единица физической величины (единица величины, единица, единица измерения) (англ. Measurement unit, unit of measurement, unit) — физическая величина фиксированного размера, которой условно по соглашению присвоено числовое значение, равное 1.
С единицей физической величины можно сравнить любую другую величину того же рода и выразить их отношение в виде числа. Применяется для количественного выражения однородных с ней физических величин.
Единицы измерения имеют присвоенные им по соглашению наименования и обозначения.
Различают основные и производные единицы.
Основные единицы в данной системе единиц устанавливаются для тех физических величин, которые выбраны в качестве основных в соответствующей системе физических величин. Так, Международная система единиц (СИ) основана на Международной системе величин (англ. International System of Quantities, ISQ), в которой основными являются семь величин: длина, масса, время, электрический ток, термодинамическая температура, количество вещества и сила света.
Соответственно, в СИ основными единицами являются единицы указанных величин.
Размеры основных единиц устанавливаются по соглашению в рамках соответствующей системы единиц и фиксируются либо с помощью эталонов (прототипов), либо путём фиксации численных значений фундаментальных физических постоянных.
Отличия между «мегабайтами», «мебибайтами» и «мегабитами»
Двоичные приставки. В названиях существует некоторая путаница. Например, существует приставка «би-», и по правилам двойка в какой-то степени должна обозначаться именно с ее помощью. Например, 1024 байта — кибибайт, а килобайт — это ровно 1000 байтов. Соответственно, 1024 кибибайта — мебибайт, а 1000 килобайтов — мегабайт.
Но де-факто такими обозначениями мало кто пользуется. Большинство называет кибибайты и мебибайты килобайтами и мегабайтами. Мы упомянули это, только чтобы вас не смущали обозначения единиц измерения «КиБ», «МиБ» или же KiB, MiB и так далее. Они означают именно кибибайты и мибибайты и используются, например, в некоторых операционных системах.
Отсчет от бита. А еще есть «килобиты», «мегабиты» и «гигабиты» — вы наверняка слышали о таких единицах в рекламе интернет-провайдеров. Так сложилось исторически. На «нижних», близких к физической электронике уровнях сети для расчета количества информации используются биты, а не байты. На более «высоких» уровнях применяются байты, но расчеты в кило- и мегабитах закрепились.
Расчет в таких случаях производится не от байта, а от бита. То есть в степень возводится не количество байт, а количество бит. 1 килобайт — это 8 килобит, так же как и 1 байт — это 8 бит.
Для килобитов, мегабитов и других подобных единиц тоже действует правило с приставкой «би-», так что технически правильнее было бы писать «кибибит», «мебибит» и так далее. Килобит и мегабит в таком случае означали бы 1000 бит и 1000 килобит соответственно. Но опять же такими обозначениями мало кто пользуется.
Почему объем жесткого диска меньше, чем написано на этикетке
Вы возможно уже сталкивались с ситуацией, когда вы купили жесткий диск емкостью 500 ГБ, а операционная система видит заметно меньше, например, только 465 ГБ. Ответ кроется все в тех же приставках и бардаке в их применении. Зато маркетологи знают, как можно буквально по мановению волшебной палочки увеличить емкость дисков своей компании. Достаточно посчитать ее по своей собственной методике.
Производитель может придерживаться при расчетах объема диска международной системы СИ, где гигабайт это 109 и напишет на этикетке диска емкостью 500 млрд. байт, что он на 500 ГБ. Когда вы его подключите к компьютеру, то Windows будет считать в двоичной системе и насчитает только 465 ГБ. Причем чем больше емкость диска, тем больше разница между этикеткой и реально доступным объемом. Более того, производитель может посчитать каким-нибудь еще способом, допустим, гигабайт окажется равным 1 млн. килобайт.
Файл. Форматы файлов.
Файл – наименьшая единица хранения информации, содержащая последовательность байтов и имеющая уникальное имя.
Основное назначение файлов – хранить информацию. Они предназначены также для передачи данных от программы к программе и от системы к системе. Другими словами, файл – это хранилище стабильных и мобильных данных. Но, файл – это нечто большее, чем просто хранилище данных. Обычно файл имеет имя, атрибуты, время модификации и время создания.
Файловая структура представляет собой систему хранения файлов на запоминающем устройстве, например, на диске. Файлы организованы в каталоги (иногда называемые директориями или папками). Любой каталог может содержать произвольное число подкаталогов, в каждом из которых могут храниться файлы и другие каталоги.
Способ, которым данные организованы в байты, называется форматом файла.
Для того чтобы прочесть файл, например, электронной таблицы, нужно знать, каким образом байты представляют числа (формулы, текст) в каждой ячейке; чтобы прочесть файл текстового редактора, надо знать, какие байты представляют символы, а какие шрифты или поля, а также другую информацию.
Программы могут хранить данные в файле способом, выбираемым программистом. Часто предполагается, однако, что файлы будут использоваться различными программами, поэтому многие прикладные программы поддерживают некоторые наиболее распространенные форматы, так что другие программы могут понять данные в файле. Компании по производству программного обеспечения (которые хотят, чтобы их программы стали «стандартами»), часто публикуют информацию о создаваемых ими форматах, чтобы их можно было бы использовать в других приложениях.
Все файлы условно можно разделить на две части – текстовые и двоичные.
Текстовые файлы – наиболее распространенный тип данных в компьютерном мире. Для хранения каждого символа чаще всего отводится один байт, а кодирование текстовых файлов выполняется с помощью специальных таблиц, в которых каждому символу соответствует определенное число, не превышающее 255. Файл, для кодировки которого используется только 127 первых чисел, называется ASCII—файлом (сокращение от American Standard Code for Information Intercange – американский стандартный код для обмена информацией), но в таком файле не могут быть представлены буквы, отличные от латиницы (в том числе и русские). Большинство национальных алфавитов можно закодировать с помощью восьмибитной таблицы. Для русского языка наиболее популярны на данный момент три кодировки: Koi8-R, Windows-1251 и, так называемая, альтернативная (alt) кодировка.
Такие языки, как китайский, содержат значительно больше 256 символов, поэтому для кодирования каждого из них используют несколько байтов. Для экономии места зачастую применяется следующий прием: некоторые символы кодируются с помощью одного байта, в то время как для других используются два или более байтов. Одной из попыток обобщения такого подхода является стандарт Unicode, в котором для кодирования символов используется диапазон чисел от нуля до 65 536. Такой широкий диапазон позволяет представлять в численном виде символы языка любого уголка планеты.
Но чисто текстовые файлы встречаются все реже. Документы часто содержат рисунки и диаграммы, используются различные шрифты. В результате появляются форматы, представляющие собой различные комбинации текстовых, графических и других форм данных.
Двоичные файлы, в отличие от текстовых, не так просто просмотреть, и в них, обычно, нет знакомых слов – лишь множество непонятных символов. Эти файлы не предназначены непосредственно для чтения человеком. Примерами двоичных файлов являются исполняемые программы и файлы с графическими изображениями.
Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между:
В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т. д. МЭК предлагает «кибибайт», «мебибайт», «гибибайт» и т. д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.
В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц.
В английском языке для «киби»=1024 иногда используют прописную букву K, дабы подчеркнуть отличие от обозначаемой строчной буквой приставки СИ кило. Однако, такое обозначение не опирается на авторитетный стандарт, в отличие от российского ГОСТа касательно «Кбайт».
Почему объем жесткого диска меньше, чем написано на этикетке
Вы возможно уже сталкивались с ситуацией, когда вы купили жесткий диск емкостью 500 ГБ, а операционная система видит заметно меньше, например, только 465 ГБ. Ответ кроется все в тех же приставках и бардаке в их применении. Зато маркетологи знают, как можно буквально по мановению волшебной палочки увеличить емкость дисков своей компании. Достаточно посчитать ее по своей собственной методике.
Производитель может придерживаться при расчетах объема диска международной системы СИ, где гигабайт это 10 9 и напишет на этикетке диска емкостью 500 млрд. байт, что он на 500 ГБ. Когда вы его подключите к компьютеру, то Windows будет считать в двоичной системе и насчитает только 465 ГБ. Причем чем больше емкость диска, тем больше разница между этикеткой и реально доступным объемом. Более того, производитель может посчитать каким-нибудь еще способом, допустим, гигабайт окажется равным 1 млн. килобайт.
Единицы по возрастанию
Килобайт (КБ) — это 1024 байта, а не одна тысяча байтов, как можно было бы ожидать, потому что компьютеры используют двоичную систему вместо десятичной.
Объем памяти компьютера часто измеряется в мегабайтах (МБ) и гигабайтах (ГБ). Книга среднего размера содержит около 1 МБ информации. Этот объем составляет 1024 килобайта или 1 048 576 (1024 x 1024) байтов, а не один миллион байтов.
Точно так же один 1 ГБ составляет 1024 МБ или 1 073 741 824 (1024 x 1024 x 1024) байта. Терабайт (ТБ) составляет 1024 ГБ.
1 ТБ — это примерно столько же информации, сколько во всех книгах в большой библиотеке или примерно на 1610 компакт-дисках с данными. Петабайт (ПБ) составляет 1024 ТБ.
1 ПБ данных, если измерять его заполненными DVD, можно представить как примерно 223 100 дисков. Университет Индианы в настоящее время создает системы хранения, способные хранить петабайты данных. Эксабайт (ЭБ) составляет 1024 ПБ. Зетабайт (ZB) равен 1024 EB. Наконец, йоттабайт (YB) равен 1024 ZB.
Таблица единиц информации
Единица измерения | Количество в байт |
---|---|
1 бит | 1/8 байт |
1 килобайт | 1024 байт |
1 мегабайт | 1048576 байт |
1 гигабайт | 1073741824 байт |
1 терабайт | 1099511627776 байт |
1 петабайт | 1125899906842624 байт |
Таблицу единиц измерения информации используют инженеры, проектировщики, конструкторы, ученые различных областей науки и ученики в школе. Она необходима для прикладных измерений в быту и на производстве.
Способы перевода битов в байты
Самой маленькой единицей именно хранения информации, считается мегабайт, которое обозначается, как МБ. Например, одна песня занимает в среднем от 3 до 5 Мб. Популярные некогда CD-диски были объемом в 650 Мб. Впрочем, и самая «весомая» флешка была в 250 Мб. Сейчас эти объемы уже никого не устроят. В переводе мер, 1 мегабайт равен 1024 Килобайтам.
Сейчас оптимальной единицей хранения информации считается гигабайт – Гб. Посмотрите на свои накопители информации, они все измеряются в гигабайтах. Пришедший на смену CD-диску DVD-диск имеет объем уже в 4,7 ГБ. Жесткие диски компьютеров измеряются уже минимум в 500 Гб.
Но развитие технических характеристик носителей не стоит на месте и сейчас уже в ходу новые объемы, такие как «терабайты». При покупке нового компьютера жесткий диск в ГБ нас уже не устраивает, подавай в ТБ. На сегодня, практически вся информация, которая «гуляет» по сети интернет уже измеряется в терабайтах. Все эти единицы легко переводятся друг в друга.