Тема: Алфавитный подход к измерению информации
Цель: сформировать у учащихся понимание алфавитного подхода к измерению информации. Требования к знаниям и умениям:
Учащиеся должны знать:
что такое «алфавит», «мощность алфавита», «скорость передачи данных»;
производные единицы измерения информации;
как найти количество информации в тексте.
Учащиеся должны уметь:
находить количество информации в тексте;
переводить количество информации в производные. Программно-дидактическое обеспечение: ПК, программа Калькулятор.
Ход урока
I. Постановка целей урока
Сколько символов в компьютерном алфавите?
Каков объем информации, содержащейся в книге, на аудиокассете, на компакт-диске, в библиотеке?
Для передачи информации в объеме 10 учебников можно затратить всего 1 минуту. Как это сделать?
II. Проверка домашнего задания
Задачи уровня знания и понимания проверьте на доске. Работа над ошибками в практической работе.
III. Изложение нового материала
1. Алфавитный подход к измерению информации
Вы научились определять количество информации, которое содержится в сообщениях, уменьшающих неопределенность наших знаний, т. е. мы рассматривали информацию со своей точки зрения — с позиции человека. Для нас количество информации зависит от ее содержания, понятности и новизны. Например, в опыте по доставанию шара из корзины одинаковое количество информации содержится и в зрительном образе (мы видим красный шар), и во фразе «Красный шар», и в длинной фразе «Я достал красный шар».
Однако любое техническое устройство не воспринимает содержание информации. Здесь не работают «неопределенность знаний» и «вероятность информации». Поэтому в вычислительной технике используется другой подход к измерению информации.
Вокруг нас везде и всюду происходят информационные обмены. Информацией обмениваются между собой люди, животные, технические устройства, органы человека или животного и т.д. во всех этих случаях передача информации происходит в виде последовательностей различных сигналов. В вычислительной технике такие сигналы кодируют определенные смысловые символы, т.е. такие сигналы кодируют последовательности знаков -букв, цифр, кодов цвета точек и т.д. С этой точки зрения рассматривается другой подход к измерению информации — алфавитный.
Каким образом в этом случае можно найти количество информации?
Рассмотрим пример:
У нас есть небольшой текст, написанный на русском языке. Он состоит из букв русского алфавита, цифр, знаков препинания. Для простоты будем считать, что символы в тексте присутствуют с одинаковой вероятностью.
Множество используемых в тексте символов называется алфавитом. В информатике под алфавитом понимают не только буквы, но и цифры, и знаки препинания, и другие специальные знаки. У алфавита есть размер (полное количество его символов), который называется мощностью алфавита.
Обозначим мощность алфавита через N. Тогда воспользуемся формулой для нахождения количества информации их вероятностного подхода:
I = log2N.
Для расчета количества информации по этой формуле нам необходимо найти мощность алфавита N. На самом деле мы уже рассчитывали мощность алфавита, когда рассматривали кодирование текстовой информации. Найдем N для нашей задачи.
Пример 1
Найти объем информации, содержащейся в тексте из 3000 символов, написанном русскими буквами.
Решение:
1) Найдем мощность алфавита:
N = 33 русских прописных буквы + 33 русских строчных букв + 21 специальный знак = 87 символов.
Подставим в формулу и рассчитаем количество информации:
2) I = log287 = 6,4 бита.
Такое количество информации — информационный объем — несет один символ в русском тексте. Теперь, чтобы найти количество информации во всем тесте, нужно найти общее количество символов в нем и умножить на информационный объем одного символа.
Пусть в тексте 3000 символов. Значит
6,4*3000= 19140 бит.
Теперь дадим задание переводчику перевести этот текст на немецкий язык. Причем так, чтобы в тексте осталось 3000 символов. Содержание текста при этом осталось точно такое же. Поэтому с точки зрения вероятностного подхода количество информации также не изменится, т.е. новых и понятных знаний не прибавилось и не убавилось.
Пример 2
Найти количество информации, содержащейся в немецком тексте с таким же количеством символов.
Решение:
Найдем мощность немецкого алфавита:
1) N = 26 немецких прописных буквы + 26 немецких строчных букв + 21
специальный знак = 73 символа.
Найдем информационный объем одного символа:
2)I = log273 = 6,1 бит.
Найдем объем всего текста.
3)6,1*3000= 18300 бит.
Сравнивая объемы информации русского текста и немецкого, мы видим, что на немецком языке информации меньше, чем на русском. Но ведь содержание не изменилось! Следовательно, при алфавитном подходе к измерению информации ее количество не зависит от содержания, а зависит от мощности алфавита и количества символов в тексте. С точки зрения алфавитного подхода, в толстой книге информации больше, чем в тонкой. При этом содержание книги не учитывается.
Правило для измерения информации с точки зрения алфавитного подхода.
Найти мощность алфавита — N.
Найти информационный объем одного символа — i = log2N.
Найти количество символов в сообщении — К.
4. Найти информационный объем всего сообщения — I.
Пример 3
Найти объем текста, записанного на языке, алфавит которого содержит 128 символов и 2000 символов в сообщении.
Дано: К = 2000, N= 128.
Найти: I — ?
Решение:
1) i = log2N = log2128 = 7 бит — объем одного символа.
2) I = i*K = 7-2000 = 14000 бит — объем сообщения.
Ответ: 14000 бит.
2. Другие единицы измерения информации
В компьютере также используется свой алфавит, который можно назвать компьютерным. Количество символов, которое в него входит, равно 256 символов. Это мощность компьютерного алфавита. Также мы выяснили, что закодировать 256 разных символом можно с помощью 8 бит. 8 бит является настолько характерной величиной, что ей присвоили свое название — байт.
Итак, следующая по величине единица измерения информации — байт.
1 байт = 8 битам.
Используя этот факт можно быстро подсчитать количество информации, содержащееся в компьютерном тексте, т.е. тексте, набранном с помощью компьютера. А учитывая, что большинство статей, книг, публикаций и т.д. написаны с помощью текстовых редакторов, то таким способом можно найти информационный объем любого сообщения, созданного подобным образом. Пример 4
Найти информационный объем страницы компьютерного текста.
Пояснение: возьмите в качестве примера реальный текст из какого-нибудь учебника без картинок. Расчеты производить приблизительно.
Решение:
Найдем информационный объем одного символа: I = log2N, N = 256, I = log2256 = 8 бит = 1 байт.
Найдем количество символов на странице. Примерно.
— Как можно это сделать быстро? (Найти количество символов в строке и умножить на количество строк.)
Пояснение: пусть дети выберут произвольную строку и подсчитают количество символов в ней, учитывая все знаки препинания и пробелы. Упростите до целого значения. 40 символов *50 строк = 2000 символов.
3) Найдем информационный объем всей страницы: 2000 • 1 = 2000 байт.
Ответ: 2000 байт.
Вывод: дело в том, что информационный объем одного символа несет как раз 1 байт информации. Поэтому достаточно подсчитать количество символов в тексте, которое и даст объем текста в байтах.
Например, если в тексте 3000 символов, то его информационный объем равен 3000 байтам.
Согласитесь, что байт — маленькая единица измерения информации.
Пример 5
Найти информационный объем небольшой книги в 130 страниц.
Пояснение: страницы взять из предыдущей задачи.
Решение:
2000 байт • 130 = 260000 байт.
Ответ: 260000 байт.
И это информационный объем только одной книги! А если взять объем целой библиотеки? Получится очень большое число.
Для измерения больших объемов информации используют следующие единицы:
1 килобайт = 1 Кб = 210 байт = 1024 байта;
1 мегабайт = 1 Мб = 210 Кб = 1024 Кб;
1 гигабайт = 1 Гб = 210 Мб = 1024 Мб.
В 100 Мб можно уместить:
50 000 | |
Цветных слайдов высочайшего качества | 150 |
Аудиозапись | 1,5 часа |
Музыкальный фрагмент качества CD — стерео | 10 минут |
фильм высокого качества записи | 15 секунд |
Протоколы операций по банковским счетам | За 1000 лет |
Обмен информацией происходит с разной скоростью. Если говорить о людях, то темп речи очень важен для взаимопонимания. Некоторые люди разговаривают очень медленно, другие — наоборот быстро (тараторят). И с теми и с другими иногда слушателю бывает некомфортно. Скорость чтения также у людей бывает разная. Конечно, хорошо обладать высокой скоростью чтения, больше книг можно прочитать. Существуют даже специальные приемы развития высокой скорости чтения. Скорость передачи информации называется скоростью информационного потока и выражается в битах в секунду (бит/с), байтов в секунду (байт/с), Кбайтов в секунду (Кб/с) и т.д.
Скорость чтения и скорость речи можно вычислить.
Скорость информационного потока в случае, когда он происходит между техническими устройствами, намного выше, чем между людьми. Прием и передачи информации в этом случае происходит по каналам связи. К основным характеристикам каналов связи относятся:
максимальная скорость передачи информации по каналу связи называется пропускной способностью канала;
надежность;
стоимость;
резервы развития.
В следующей таблице приведены характеристики некоторых каналов связи.
Скорость передачи данных (Мбит/с) | Помехоустойчивость | Наращиваемость | |
Электрический кабель: — витая пара — коаксиальный кабель | 10-100 до 10 | Низкая Высокая | Простая Проблематичная |
Телефонная линия | 1-2 | Низкая | Без проблем |
Оптические светодиоды (сверхтонкие силиконовые волокна) | 10-200 | Абсолютная | Без проблем |
Пояснение: таблицу подготовьте заранее на доске или на бумаге и раздайте Детям.
Анализируя эту таблицу, можно сказать, что сегодня предпочтение отдается высокоскоростному оптоволокну. Информация по таким каналам связи передается в виде светового сигнала, посылаемого лазерным излучателем. Например, при скорости 50 Мбайт/с в течение 1 минуты передается объем информации, равный содержанию 10 школьных учебников.
IV. Закрепление изученного
Ответьте на вопросы, поставленные в начале урока.
Решите задачи:
№2.
Перевести объем книги из примера 5 в другие единицы измерения. Решение:
260000/1024 = 253,90625 Кб. 253,90625/1024 =247955 Мб.
№3.
Найти х из соотношения: 16х байт = 256 Мбайт.
Решение:
24х байт = 28-220 байт; 24х = 28-220;
24х = 228.
4х = 28; х = 7.
Ответ: х = 7.
V. Итоги урока
Оцените работу класса и назовите учащихся, отличившихся на уроке. Домашнее задание
Уровень знания:
1) Как определяется количество информации с алфавитной точки зре-
ния? Выучить правило для измерения информации с точки зрения
алфавитного подхода.
2) Выучить единицы измерения информации.
Уровень понимания:
В чем отличие алфавитного подхода к измерению информации от вероятностного?
Выразите:
3 Кбайта в байтах и битах;
81920 бит в байтах и Кбайтах;
3072 Мбайта в Гбайтах и Кбайтах.
3) Мощность некоторого алфавита равна 64 символам. Каким будет
объем информации в тексте, состоящем из 100 символов.
Уровень применения:
Определите свою скорость речи и скорость чтения с точки зрения информатики.