Алфавитный подход к измерению информации

29
Алфавитный подход к измерению информации

description

Алфавитный подход к измерению информации. Все множество используемых в языке символов называется алфавитом . Полное количество символов алфавита принято называть мощностью алфавита ( N). Сколько информации несет один символ в русском языке. П Р И В Е Т ! К А К Д. 2 I = N. - PowerPoint PPT Presentation

Transcript of Алфавитный подход к измерению информации

Page 1: Алфавитный подход к измерению информации

Алфавитный подход к измерению информации

Page 2: Алфавитный подход к измерению информации

• Все множество используемых в языке символов называется алфавитом.

• Полное количество символов алфавита принято называть мощностью алфавита (N).

Page 3: Алфавитный подход к измерению информации

Сколько информации несет один символ в русском языке

П Р И В Е Т ! К А К Д

2I = N

2I = 54. I = 5.755 бит.

Вот сколько информации несет один символ в русском тексте!

Page 4: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

Алфавит – набор знаков, используемых при кодировании информации с помощью некоторого языка.

Примеры: АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ 32 ABCDEFGHIJKLMNOPQRSTUVWXYZ

26 × O 2 0123456789

10

Мощность алфавита – количество символов.

Алфавитный подход

Все символы несут одинаковую информацию: Все символы несут одинаковую информацию:!

NI 2log мощность алфавитамощность алфавита

информационная емкость символаинформационная емкость символа

4

Page 5: Алфавитный подход к измерению информации

Таким образом, при алфавитном подходе к измерению информации количество информации от содержания не

зависит. Количество информации зависит от объема текста и от мощности алфавита

Количество информации C, содержащееся в символьном сообщении, равно K x i, где К – число символов в тексте сообщения, а i – информационный вес символа, который находится из уравнения

2 i = N, где N мощность используемого алфавита.

Page 6: Алфавитный подход к измерению информации

Количество информации в текстеА для того, чтобы найти количество информации во всем тексте,

нужно посчитать число символов в нем и умножить на I.Посчитаем количество информации на одной странице книги.

Пусть страница содержит 50 строк. В каждой строке — 60 символов. Значит, на странице умещается 50x60=3000 знаков. Тогда объем информации будет равен: 5,755 х 3000 = 17265 бит.

При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста

и мощности алфавита.

Page 7: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

Алфавитный подходЗадача. Определить объем информации в сообщении

ПРИВЕТВАСЯ для кодирования которого используется русский алфавит

(только заглавные буквы).

Ответ: 10·5 бит = 50 бит

считаем все символы (здесь 10 символов) мощность алфавита – 32 символа (32=25) 1 символ несет 5 бит информации

Решение:

7

Page 8: Алфавитный подход к измерению информации

Задание :• Определите информационный объем страницы

книги, если для записи текста использовались только заглавные буквы русского алфавита, кроме буквы Ё.

Решение:1. N = 322. 2I = N3. 2I = 324. I = 55. На странице 3000 знаков, тогда объем

информации = 3000 * 5 = 15000 бит.

Page 9: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

Пример 1. Алфавит племени Мульти состоит из 8 букв. Какое количество информации несет одна буква этого алфавита? Слово, состоящее из пяти букв? Ответ: 3 бита, 15 бит.Пример 2. Сообщение, записанное буквами 64-х символьного алфавита, содержит 20 символов. Какой объем информации оно содержит?Решение: 2i = 64; i = 6 битовI = 20 * 6 = 120 битовОтвет: 120 битовПример 3. Для записи сообщения использовался 32-х символьный алфавит. Все сообщение занимает 4 страницы, на каждой странице по 30 строк, в каждой строке по 50 символов. Какое количество информации в этом сообщении?Решение: 2i = 32; i = 5 битовI = 4*30*50 * 5 = 30000 битов.Ответ: 30000 битов

Page 10: Алфавитный подход к измерению информации

Достаточный алфавит

Поскольку 256 = 28, то один символ этого алфавита «весит» 8 бит. Причем 8 бит информации — это настолько характерная величина, что ей даже присвоили свое название — байт.

1 байт = 8 бит

Page 11: Алфавитный подход к измерению информации

Количество информации в тексте

Пусть небольшая книжка, сделанная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов.

Значит страница содержит 40x60=2400 байт информации.

Объем всей информации в книге: 2400 х 150 = 360 000 байт.

Page 12: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

1) 4 2) 2 3) 8 4) 6

Задание 1. В алфавите формального (искусственного) языка

всего два знака-буквы («+» и «-»). Каждое слово этого языка состоит из двух букв. Максимальное число слов этого языка:

Решение.Решение задачи сводится к поиску количества (N)

комбинаций строк длиной (i) 2 символа, составленных из 2 знаков. Следовательно, используя формулу 2i = N, получаем 22 = 4.

Ответ: 1.

Page 13: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

1) 8 бит 2) 1 байт 3) 3 бита 4) 2 бита

Задание 2. Алфавит племени содержит всего 8 букв. Какое

количество информации несет одна буква этого алфавита?

Решение.Мощность алфавита племени – 8 букв. Применим формулу 2i

= N, где N – мощность алфавита, i – количество бит на один символ алфавита. 2i =8, i=3 бит, что соответствует варианту ответа №3.

Ответ: 3.

Page 14: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

1) 10 2) 16 3) 4 4) 8

Задание 3.

Если вариант теста в среднем имеет объем 20 килобайт (на каждой странице теста 40 строк по 64 символа в строке, 1 символ занимает 8 бит), то количество страниц в тесте равно:

Решение.Известен информационный объем теста и

информационный «вес» одного символа в нем. Найдем объем одной страницы: 40*64*8 бит. 20 Кбайт = 20*1024 байт = 20*1024*8 бит. Найдем количество страниц: 20*1024*8/(40*64*8) = 8 (стр.) (Ответ № 4)

Ответ: 4.

Page 15: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

1) 5000 байт 2) 5120 байт 3) 500 байт 4) 5000 бит

Задание 4. В пяти килобайтах:

Решение.5 Кб = 5*1024 байт = 5120 байт, что соответствует ответу №2.Ответ: 2

Page 16: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

1) 235 2) 16*220 3) 224 4) 222

Задание 5 Сколько байт в 32

Гбайт?

Решение.32Гб = 25 Гб = 25*210 Мб = 25*210 *210 Кб =25*210 *210*210 байт = 235 байт, что соответствует ответу №1.Ответ: 1.

Page 17: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

Задание 6. Считая, что один символ кодируется одним байтом,

подсчитать в байтах количество информации, содержащееся в фразе: “Терпение и труд все перетрут.”

Решение. В фразе 29 символов (включая точку и пробелы), 1 символ

несет 1 байт информации, значит фраза содержит 29 байт.Ответ: 29.

Page 18: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

1) 108 бит 2) 864 бит 3) 108 килобайт 4) 864 килобайт

Задание 7. (Задание А2 демоверсии 2004 г.)Считая, что каждый символ кодируется одним байтом,

оцените информационный объём предложения: «Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил И лучше выдумать не мог.»

Решение.Предложенная строка содержит ровно 108 символов,

включая кавычки, пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, поэтому объём этого предложения составит 108 байт или 108х8=864 бит, что соответствует ответу №2.

Ответ: 2.

Page 19: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

1) 4 2) 5 3) 6 4) 7

Задание 8. (Задание А3 демоверсии 2004 г.)Шахматная доска состоит из 64 полей: 8 столбцов и 8 строк.

Какое минимальное количество бит потребуется для кодирования координат одного шахматного поля?

Решение.Для того, чтобы различить 64 клетки шахматного поля

потребуются 64 значения двоичного кода. Поскольку 64=26, то в двоичном коде потребуется шесть разрядов. Верный ответ-№3.

Ответ: 3.

Page 20: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

1) 5 2) 2 3) 3 4) 4

Задание 9. (Задание А4 демоверсии 2004 г.)Получено сообщение, информационный объём

которого равен 32 битам. Чему равен этот объём в байтах?

Решение. 1 байт = 8 бит, следовательно, 32/8=4, что соответствует

ответу №4.Ответ: 4.

Page 21: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

1) 10 2) 100 3) 125 4) 1000

Задание 10. Каждое показание счётчика, фиксируемое в памяти

компьютера, занимает 10 бит. Записано 100 показаний этого датчика. Каков информационный объём снятых значений в байтах?

Решение. 10 бит*100= 1000 бит, 1 байт = 8 бит, следовательно:

1000/8=125 байт. Значит, верный ответ №3.Ответ: 3.

Page 22: Алфавитный подход к измерению информации

Скорость передачи информации

Прием-передача информации могут происходить с разной скоростью.

Количество информации, передаваемое за единицу времени, есть скорость передачи информации или скорость информационного потока.

Очевидно, эта скорость выражается в таких единицах, как бит в секунду (бит/с), байт в секунду (байт/с), килобайт в секунду (Кбайт/с) и т.д.

Page 23: Алфавитный подход к измерению информации

К. Поляков, 2006-2011 http://kpolyakov.narod.ru

Задачи: передача информацииСкорость передачи данных через ADSL-соединение равна 256000 бит/c. Передача файла через это соединение заняла 2 минуты. Определите размер файла в килобайтах.

время передачи: 2·60 сек=120 сек передано информации

256 ·1000·120 бит = 28· 23·125 · 22·30 бит=

Решение:

Ответ: объем файла 3750 Кбайт

213·125·30 Кбайт213

23

Page 24: Алфавитный подход к измерению информации
Page 25: Алфавитный подход к измерению информации

1. Информационное сообщение объемом 1,5 Кбайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого записано это сообщение?

Дано: I = 1,5 Кб, К = 3072 символа. Найти: N — ? Решение. I = 1,5 Кб = 1,5 • 1024 • 8=12 288 бит. N = 2i = 24 = 16 символовОтвет: 16 символов.

Page 26: Алфавитный подход к измерению информации

2. Книга, набранная с помощью компьютера, содержит 150 страниц, на каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге?

Дано: страниц – 150, одна страница — 40 строк, одна строка – 60 символов,

Найти: I — ?

Решение.• 150 • 40 • 60 = 360 000 — количество символов во всей

книге. • Если в компьютер ном тексте 1 символ несет в себе 1

байт информации, то объем информации в книге равен:• 360 000 • 1 байт = 360 000 байт. • Переведем в другие единицы измерения: 360 000 байт =

0,3 Мб• Ответ: Объем информации в книге составляет

приблизительно 0,3 Мб.

Page 27: Алфавитный подход к измерению информации

3. Сообщение занимает 2 страницы и содержит 1/16 Кбайта информации. На каждой странице записано 256 символов. Какова мощность использованного алфавита?

Дано: I = 1/16 Кб, страниц — 2, одна страница — 256 символов.

Найти: N — ? Решение.I = 1/16 Кб=1/16*1024*8=512битК = 256 * 2 = 512 символов на двух страницах. i=1/K=512/512=1битN= 2i = 21 = 2 символаОтвет: 2 символа.

Page 28: Алфавитный подход к измерению информации

4. Подсчитайте, используя алфавитный подход к измерению информации, сколько бит информации содержится в тексте, заключенном в кавычки: «Кодирование информации с помощью знаковых систем». Учесть, что между словами ставится только один пробел и для кодирования информации используется кодировка Windows CP1251(таблица кодировки содержит 256 символов).

Решение: 48 символов по 1 байту. Количество информации 48*8=384 бит.

Ответ: 384 бит.

Page 29: Алфавитный подход к измерению информации

Дома: Решить задачу: Для записи сообщения использовался 64-х символьный алфавит. Каждая страница содержит 30 строк. Все сообщение содержит 8775 байтов информации и занимает 6 страниц. Сколько символов в строке?