Что измеряется в байтах
Что такое бит, байт килобайт, мегабайт, гигабайт, терабайт и как они связаны между собой?
Приветствую, на связи Алексей! Все, кто так или иначе работает или с компьютером, или с планшетом, сталкивается с такими понятиями, как «бит», «байт», «мегабайт» и пр.
А не сталкиваться с ними невозможно, поскольку это единицы измерения информации, которую мы получаем в интернете, копируем на флешки или переносим на диски. Представляя себе этот самый объем файлов, мы сможем выбирать необходимый носитель, чтобы хватило места для копируемых файлов.
В противном случае вы, просто на просто, не сможете сохранить информацию. Любой файл имеет свой определенный объем или, как еще говорят, «вес». Таким образом, байт, мегабайт, гигабайт, терабайт, петабайт и пр. определяют емкостное количество любого цифрового хранилища. У этих единиц есть родственные: мегабит, мегабайт и гигабит и многие их путают. Но, в отличие от битов, байтов, мегабит и мегабайт применимы при изменении скорости передачи данных, т. е. интернета.
Итак, давайте разберемся, что это за единицы объема информации, что они означают и как переводятся одна в другую.
Единицы измерения информации, история возникновения
Для чего нужны единицы измерения информации? Ведь это такое эфемерное понятие… До этого уже измеряли практически все, что можно измерить. Но вот как быть с информацией? Казалось бы, как можно измерить информацию заключенную, например, на листочке бумаги или же выраженную звуком. Однако можно. Для нее была придумана такая минимальная единица, как бит. И ввел ее в 1948 году Клод Элвуд Шеннон.
В своей статье «Математическая теория связи» он впервые ввел такое слово, как «bit», которым и обозначил наименьшую единицу количества информации. Правда слово это он позаимствовал у Джона Тьюки, который использовал это слово, как сокращенное от «binary digit». Родился Клод Шеннон в 1916 году в городе Гэйлорде штата Мичиган. С детства он увлекался техникой и математикой.
Это казалось бы рядовое событие явилось одним из тех кирпичиков, на котором стоит фундамент того, что мы называем «информационные технологии». С появлением единиц измерения информации, человечество постепенно осознало, что все знания на земле можно перевести в цифровые значения; в этом же виде информацию можно передать на расстояние хранить и обрабатывать.
В 1940 году Клод Шеннон защитил диссертацию, в которой доказал, что работу переключателей и реле в электрических схемах можно представить методами алгебры. Эта работа, впоследствии, стала основополагающей для развития такого раздела кибернетики, как теория информации. Таким образом, это понятие исчисления количества информации прижилось и сейчас имеет очень широкое применение.
Наравне с битом, существует и еще одна единица количества информации – байт.
Что такое бит и байт?
Что же такое эти самые бит и бай?. Как говорилось ранее, бит – это сокращенное слово от «binary digit», что означает двоичное или бинарное число. Таким образом бит воспринимает два числа – 0 или 1.
Но восемь бит представляют собой уже символ и называется это – байт. Таких последовательностей, состоящих из восьми бит 256. Этого вполне достаточно, что бы представить любой символ.
Таким образом, каждый символ равен восьми битам или одному байту. Термин «байт» был введен гораздо позже термина «бит». В 1964 году его ввел Вернер Бухгольц, который работал в IBM.
Название этого термина произошло от названия BInary digiT Eight, что означает двоичное число восемь. Что бы не путать новое название с уже имеющимся BIT (BInary digiT), буква I была заменена на букву Y. В результате и появилось новое название BYTE (байт).
Как и другие системы исчисления, веса, объема, расстояния, единицы измерения информации имеют несколько вариантов, обозначающихся приставками: килобайт, мегабайт, терабайт и пр.
Так же как, скажем граммы переводятся в килограммы и наоборот, единицы информации тоже могут переходить одна в другую. Используя их, мы можем четко определять каков у нас объем необходимой информации, и какое хранилище хорошо подойдет для ее переноса или хранения.
Способы перевода битов в байты
Самой маленькой единицей именно хранения информации, считается мегабайт, которое обозначается, как МБ. Например, одна песня занимает в среднем от 3 до 5 Мб. Популярные некогда CD-диски были объемом в 650 Мб. Впрочем, и самая «весомая» флешка была в 250 Мб. Сейчас эти объемы уже никого не устроят. В переводе мер, 1 мегабайт равен 1024 Килобайтам.
Сейчас оптимальной единицей хранения информации считается гигабайт – Гб. Посмотрите на свои накопители информации, они все измеряются в гигабайтах. Пришедший на смену CD-диску DVD-диск имеет объем уже в 4,7 ГБ. Жесткие диски компьютеров измеряются уже минимум в 500 Гб.
Но развитие технических характеристик носителей не стоит на месте и сейчас уже в ходу новые объемы, такие как «терабайты». При покупке нового компьютера жесткий диск в ГБ нас уже не устраивает, подавай в ТБ. На сегодня, практически вся информация, которая «гуляет» по сети интернет уже измеряется в терабайтах. Все эти единицы легко переводятся друг в друга.
Но и это еще не предел. Существуют такие единицы, как Петабайты Пб. В одном петабайте находится уже 1024 Тб, в одном Тб – 1024 ГБ, в одном Гб – 1024 Мб, в одном Мб – 1024 Кб. Можно подсчитать, сколько таких Кб будет содержаться в одном Пб.
Например, в стандартный лист А4 формата содержится около 100 килобайт печатного текста. В одном же Пб содержится уже пятьсот миллиардов страниц такого текста. И еще одна, самая большая единица хранения информации – Эксабайт Эб. В одном Эб содержится уже 1024 петабайтов. Это достаточно огромное хранилище, которое пока вряд ли необходимо рядовому пользователю.
Например, в 1 ЭБ можно «уместить» одиннадцать миллионов видео в стандарте высокого разрешения. Кто-то может облизнется от такого объема. Но, не отчаивайтесь, не далеко то время, когда наши компьютеры будут снабжены такими жесткими дисками.
Кстати, если говорить о звуках, то примерно подсчитано, что все слова, произнесенные людьми можно уместить в 5Эб. Что бы самостоятельно определить сколько в байтах битов, в гигабайтах килобайт и т.д., можно воспользоваться такой схемой.
Если вы не хотите заморачиваться математическими подсчетами, можно или в табличном редакторе MS Excel создать форму для пересчета, или же воспользоваться онлайн конвертерами.
Как видите, ничего сложного в понятии количества информации нет. Но представлять себе это необходимо, поскольку мы всегда храним нужную информацию, переносим ее с одного места на другое. От этого зависит выбор хранилища для нашей информации. Успехов!
Сколько битов в байте, Кб, Мб, Гб и Тб
Что такое байт. Сколько бит в байте
Единицы информации
Таблица байтов:
Почему на диске, карте памяти или флешке всегда меньше памяти, чем написано на упаковке?
Емкость проданных твердотельных накопителей, жестких дисков, флеш-накопителей и карт памяти указывается в гигабайтах (ГБ) или терабайтах (ТБ). Например, покупая SSD-накопитель заявленной емкостью 512 ГБ, мы должны получить ровно столько же места для наших данных. Однако после установки накопителя в компьютер оказывается, что у нас около 476 ГБ. Почему в реальности такое значение?
Основная причина в том, как рассчитывается емкость диска. Люди используют десятичную систему счисления, основание которой равно 10. Компьютеры, однако, работают в двоичной системе, в которой основанием является число 2. Наименьшей единицей памяти, используемой в информатике, является байт. Обычно используемые десятичные префиксы (из системы СИ): кило (k) для тысячи, мега (M) для миллиона, гига (G) для миллиарда и тера (T) для триллиона. Таким образом, мы получаем один килобайт (тысяча байтов), мегабайт (миллион байтов), гигабайт (миллиард байтов) и терабайт (один триллион байтов) соответственно.
Следовательно, по заявлению производителей, емкость SSD на 512 ГБ составляет ровно 512 000 000 000 байт (512 байт x 1000 x 1000 x 1000).
Однако для компьютеров и бинарных файлов, которые они используют, вычисление этих значений немного отличается. 1 килобайт равен 102 байтам. 1 мегабайт равен 1 048 576 байтам (1024 x 1024), а 1 гигабайт равен 1 073 731 824 байтам (1024 x 1024 x 1024). Таким образом, диск с заявленным производителем объемом 512 ГБ фактически имеет емкость 476,84 ГБ. Рассчитываем это так: 512000000000 / 1024/1024/1024 = 476,84 ГБ.
Подводя итог. Производители дисков считают 1 ГБ = 1 000 000 000 (миллиардом) байтов, а в двоичных файлах 1 ГБ = 1 073 731 824 байта. Этим объясняется разница в заявленной и реальной емкости SSD, дисковых накопителей и других носителей данных. Стоит отметить, что в 1998 году была предпринята попытка преодолеть эту двусмысленность. Международная электротехническая комиссия (IEC) предложила обозначить кратность 1024, добавив букву «i» после знака множителя (KiB вместо KB, MiB вместо MB) и изменив префикс, заканчивающийся на «bi» (kibibyte вместо килобайт, мебабайт вместо мегабайта). Новые имена, однако, не получили широкого распространения, и по сей день используются префиксы SI, которые проще использовать.
Что измеряется в байтах
Байт (англ. byte ) — единица хранения и обработки цифровой информации; совокупность битов, обрабатываемая компьютером одномоментно. В современных вычислительных системах байт считается равным восьми битам, в этом случае он может принимать одно из 256 (2 8 ) различных значений (состояний, кодов). Однако в истории компьютеров известны решения с другим размером байта (например, 6 битов, 32 бита, 36 битов), поэтому иногда в компьютерных стандартах и официальных документах для обозначения 8-битного слова используется термин «октет» (лат. octet ).
В большинстве вычислительных архитектур байт — это минимальный независимо адресуемый набор данных.
Содержание
История
Название «байт» (слово byte представляет собой сокращение словосочетания BinarY TErm — «двоичный терм») было впервые использовано в 1956 году В. Бухгольцем (англ. Werner Buchholz ) при проектировании первого суперкомпьютера IBM 7030 (англ.) для пучка одновременно передаваемых в устройствах ввода-вывода шести битов. Позже, в рамках того же проекта, байт был расширен до восьми бит.
Ряд ЭВМ 1950-х и 1960-х годов (БЭСМ-6, М-220) использовали 6-битовые символы в 48-битовых или 60-битовых машинных словах. В некоторых моделях ЭВМ производства Burroughs Computer Corporation (англ.) (ныне Unisys) размер символа был равен 9 битам. В советской ЭВМ Минск-32 использовался 7-битный байт.
Байтовая адресация памяти была впервые применена в системе IBM System/360. В более ранних компьютерах адресовать можно было только целиком машинное слово, состоявшее из нескольких байтов, что затрудняло обработку текстовых данных.
8-битные байты были приняты в System/360, вероятно, из-за использования BCD-формата представления чисел: одна десятичная цифра (0-9) требует 4 бита (тетраду) для хранения; один 8-битный байт может представлять две десятичные цифры. 6-битные байты могут хранить только по одной десятичной цифре, два бита остаются незадействованными.
По другой версии, 8-битный размер байта связан с 8-битным же числовым представлением символов в кодировке EBCDIC.
По третьей версии, из-за двоичной системы кодирования в компьютерах наиболее выгодными для аппаратной реализации и удобными для обработки данных являются длины слов кратные степеням 2, в том числе и 1 байт = 2 3 = 8 битов, системы и компьютеры с длинами слов не кратными степеням 2 отпали из-за невыгодности и неудобства.
Постепенно 8-битные байты стали стандартом де-факто и с начала 1970-х в большинстве компьютеров байты состоят из 8 бит и размер машинного слова кратен 8 битам.
Из соображений удобства единицы нетекстовых типов данных также делают кратными 8 битам, например:
Количество состояний (кодов) в байте
Количество состояний (кодов, значений), которое может принимать 1 восьмибитный байт с позиционным кодированием, определяется в комбинаторике, равно количеству размещений с повторениями и вычисляется по формуле:
Производные единицы
Измерения в байтах | ||||||||
---|---|---|---|---|---|---|---|---|
ГОСТ 8.417-2002 | Приставки СИ | приставки МЭК | ||||||
Название | Символ | Степень | Название | Степень | Название | Символ | Степень | |
байт | Б | 2 0 | — | 10 0 | байт | B | Б | 2 0 |
килобайт | KБ | 2 10 | кило- | 10 3 | кибибайт | KiB | КиБ | 2 10 |
мегабайт | МБ | 2 20 | мега- | 10 6 | мебибайт | MiB | МиБ | 2 20 |
гигабайт | ГБ | 2 30 | гига- | 10 9 | гибибайт | GiB | ГиБ | 2 30 |
терабайт | ТБ | 2 40 | тера- | 10 12 | тебибайт | TiB | ТиБ | 2 40 |
петабайт | ПБ | 2 50 | пета- | 10 15 | пебибайт | PiB | ПиБ | 2 50 |
эксабайт | ЭБ | 2 60 | экса- | 10 18 | эксбибайт | EiB | ЭиБ | 2 60 |
зеттабайт | ЗБ | 2 70 | зетта- | 10 21 | зебибайт | ZiB | ЗиБ | 2 70 |
йоттабайт | ЙБ | 2 80 | йотта- | 10 24 | йобибайт | YiB | ЙиБ | 2 80 |
Иногда десятичные приставки используются и в прямом смысле, например, при указании ёмкости жёстких дисков: у них гигабайт может обозначать не 1 073 741 824=1024 3 байтов, а миллион килобайтов (то есть 1 024 000 000 байтов), а то и просто миллиард байтов.
Обозначение
Межгосударственный (СНГ) стандарт ГОСТ 8.417-2002 [1] («Единицы величин») в «Приложении А» для обозначения байта регламентирует использование русской заглавной буквы «Б». Кроме того, констатируется традиция использования приставок СИ вместе с наименованием «байт» для указания множителей, являющихся степенями двойки (1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт и т. д., причём вместо строчной «к» используется заглавная «К»), и упоминается, что подобное использование приставок СИ не является корректным.
Использование заглавной буквы «Б» для обозначения байта соответствует требованиям ГОСТ и позволяет избежать путаницы между сокращениями от байт и бит. Однако следует учитывать, что в стандарте нет сокращения для «бит», поэтому использование записи вроде «Гб» как синонима для «Гбит» недопустимо.
Склонение
Что измеряется в байтах
Для информации существуют свои единицы измерения информации. Если рассматривать сообщения информации как последовательность знаков, то их можно представлять битами, а измерять в байтах, килобайтах, мегабайтах, гигабайтах, терабайтах и петабайтах.
Давайте разберемся с этим, ведь нам придется измерять объем памяти и быстродействие компьютера.
Единицей измерения количества информации является бит – это наименьшая (элементарная) единица.
Байт – основная единица измерения количества информации.
Байт – довольно мелкая единица измерения информации. Например, 1 символ – это 1 байт.
Производные единицы измерения количества информации
1 килобайт (Кб)=1024 байта =2 10 байтов
1 мегабайт (Мб)=1024 килобайта =2 10 килобайтов=2 20 байтов
1 гигабайт (Гб)=1024 мегабайта =2 10 мегабайтов=2 30 байтов
1 терабайт (Гб)=1024 гигабайта =2 10 гигабайтов=2 40 байтов
Методы измерения количества информации
Итак, количество информации в 1 бит вдвое уменьшает неопределенность знаний. Связь же между количеством возможных событий N и количеством информации I определяется формулой Хартли:
Алфавитный подход к измерению количества информации
При этом подходе отвлекаются от содержания (смысла) информации и рассматривают ее как последовательность знаков определенной знаковой системы. Набор символов языка, т.е. его алфавит можно рассматривать как различные возможные события. Тогда, если считать, что появление символов в сообщении равновероятно, по формуле Хартли можно рассчитать, какое количество информации несет в себе каждый символ:
Вероятностный подход к измерению количества информации
Этот подход применяют, когда возможные события имеют различные вероятности реализации. В этом случае количество информации определяют по формуле Шеннона:
I – количество информации,
N – количество возможных событий,
Pi – вероятность i-го события.
Задача 1.
Шар находится в одной из четырех коробок. Сколько бит информации несет сообщение о том, в какой именно коробке находится шар.
Имеется 4 равновероятных события (N=4).
По формуле Хартли имеем: 4=2 i . Так как 2 2 =2 i , то i=2. Значит, это сообщение содержит 2 бита информации.
Задача 2.
Чему равен информационный объем одного символа русского языка?
В русском языке 32 буквы (буква ё обычно не используется), то есть количество событий будет равно 32. Найдем информационный объем одного символа. I=log2 N=log2 32=5 битов (2 5 =32).
Примечание. Если невозможно найти целую степень числа, то округление производится в большую сторону.
Задача 3.
Чему равен информационный объем одного символа английского языка?
Задача 4.
Световое табло состоит из лампочек, каждая из которых может находиться в одном из двух состояний (“включено” или “выключено”). Какое наименьшее количество лампочек должно находиться на табло, чтобы с его помощью можно было передать 50 различных сигналов?
С помощью N лампочек, каждая из которых может находиться в одном из двух состояний, можно закодировать 2 N сигналов.
2 5 6 , поэтому пяти лампочек недостаточно, а шести хватит. Значит, нужно 6 лампочек.
Задача 5.
Метеостанция ведет наблюдения за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100, которое записывается при помощи минимально возможного количества битов. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений.
В данном случае алфавитом является множество чисел от 0 до 100, всего 101 значение. Поэтому информационный объем результатов одного измерения I=log2101. Но это значение не будет целочисленным, поэтому заменим число 101 ближайшей к нему степенью двойки, большей, чем 101. это число 128=2 7 . Принимаем для одного измерения I=log2128=7 битов. Для 80 измерений общий информационный объем равен 80*7 = 560 битов = 70 байтов.
Задача 6.
Определите количество информации, которое будет получено после подбрасывания несимметричной 4-гранной пирамидки, если делают один бросок.
Пусть при бросании 4-гранной несимметричной пирамидки вероятности отдельных событий будут равны: p1=1/2, p2=1/4, p3=1/8, p4=1/8.
Тогда количество информации, которое будет получено после реализации одного из них, можно вычислить по формуле Шеннона:
Задача 7.
Задача 8.
Оцените информационный объем следующего предложения:
Тяжело в ученье – легко в бою!
Так как каждый символ кодируется одним байтом, нам только нужно подсчитать количество символов, но при этом не забываем считать знаки препинания и пробелы. Всего получаем 30 символов. А это означает, что информационный объем данного сообщения составляет 30 байтов или 30 * 8 = 240 битов.
Единицы измерения информации – что такое биты, байты, кило- и мегабайты, как переводить одно в другое
Пора разобраться, что означает «флешка на 16 ГБ» или «этот трек весит 3 МБ».
В этой статье мы будем говорить про единицы измерения цифровой информации. То есть той, которая считывается и обрабатывается вашим компьютером.
Почему эта информация названа цифровой? Потому что любой текст, любая картинка, музыка или анимация воспринимается компьютером как последовательность двух цифр – нулей и единиц. Ноль означает, что сигнала нет, единица означает, что он есть. Они в определенной последовательности чередуются и передают все возможные виды информации.
Естественно, чем больше нулей и единиц используется, тем больше места занимает их перечень. Единицы измерения информации служат как раз для того, чтобы этот перечень измерить и определить, сколько для него надо места.
Самая маленькая единица информации
Это один бит. Бит – это такой информационный объем, в котором помещается только одна цифра – либо 0, либо 1.
Много это или мало? Чудовищно мало. Точка, которую я сейчас поставил, на языке машинного кода выглядит так: 00101110. Восемь цифр! Восемь бит информации нужно только для того, чтобы «запомнить» эту точку.
Чтобы запомнить цифру «10» – достаточно будет информационного объема в 4 бита, потому что 10 – это 1010.
Естественно, в битах измерять информацию неудобно, поэтому они переводятся в более крупные единицы – байты.
Что такое байт
Байт – это 8 битов. Вам вот это надо запомнить, потому что здесь у большинства людей путаница. Биты переводятся в байты не как миллиметры в сантиметры и не как сантиметры в метры. Их в байте не 10, а именно 8.
Почему именно столько – сложно сказать. Когда компьютеры развивались, байты были очень даже разными, в них могло быть и 6, и 7 битов. Все пошло, очевидно, с первого персонального компьютера Altair, который был выпущен в 1974 году. У него был процессор, который за раз обрабатывал именно 8 битов информации – то есть объем, равный одному байту. Отсюда и началось широкое распространение байта.
Что такое килобайты, мегабайты, гигабайты
Килобайт (КБ) – это 1 024 байт. Вы должны запомнить, что это не 1 000 байт, а именно 1 024.
Так получается, потому что килобайты – это двойка в десятой степени. Если мы двойку будем десять раз умножать на саму себя, то получится именно 1 024.
Один мегабайт (МБ) – это 1 024 килобайта. Один гигабайт (ГБ) – 1 024 мегабайта.
Объемы жестких дисков часто считаются в терабайтах. Терабайт – это 1 024 гигабайта.
Много это или мало
Тяжело объяснить. Когда будете покупать флешки и хранить на них информацию разных видов, поймете.
Приведу несколько примеров веса разных файлов. У меня на компьютере есть видеоролик в хорошем качестве, он длится 3 минуты и весит 300 мегабайт.
Песня Софии Ротару «Романтикэ» продолжительностью 4 минуты и 14 секунд весит 3,89 Мегабайт.
Текст всей этой статьи, сохраненный в вордовском документе, весит всего-навсего 13 килобайт. Потому что текст очень-очень легкий, его перевод в систему нулей и единиц занимает совсем мало места.
Можно ли уменьшить объем информации
Да. Первый способ – архивировать ее. Есть специальные программы-архиваторы типа WinRAR (ссылка ведет на официальный сайт разработчика) – они позволяют архивировать файлы, то есть определенным образом их сжимать, чтобы экономить место.
Обратите внимание, музыка, видео и картинки сжимаются плохо, потому что там мало что можно сжать. Тексты сжимаются лучше. Эта статья в архиве будет весить уже не 13 килобайт, а 10.
Еще один плюс архива – файл в нем защищен от вирусных атак. Если он изначально не был поражен вирусом, то при передаче его в архиве никакие вирусы к нему не подступятся.
Уменьшить вес картинок можно с помощью сервисов типа TinyPNG – они упрощают цветовую гамму, убирают такие оттенки цветов, которые все равно не различаются человеческим глазом.
Мы всегда сжимаем через TinyPNG картинки перед загрузкой на сайт.
Я напишу про архивацию и сжатие картинок отдельные тексты, поставлю сюда ссылки. Подписывайтесь на обновления сайта – ссылки на новые статьи придут вам на почту.