Для предоставления текстовой информации достаточно сколько символов

Обновлено: 19.05.2024

Именная карта банка для детей
с крутым дизайном, +200 бонусов

Закажи свою собственную карту банка и получи бонусы

План урока:

Текст как форма представления информации

Примером текстовой информации может служить параграф школьного учебника, детская считалка, ремарка актера в пьесе, расписание уроков, магазинный чек и т.д.

Издавна люди пытались сохранить различного рода сведения на таких носителях, как камень, глина, береста, папирус, на смену которым пришла повсеместно используемая бумага.

Письменный текст записывали различными инструментами – острой костяной палочкой, перьевыми ручками, авторучками и с позапрошлого века стали печатать на пишущих машинках.

Чтобы зафиксировать большой объем информации или изменить смысл предложений, необходимо было проделывать огромную работу, трудоемкую и длительную. С помощью компьютера текстовую информацию можно с легкостью не только вводить, но и редактировать, сохранять, передавать и печатать любое количество копий на принтере. Компьютерные программы коренным образом изменили технологию письма . В современном мире все чаще бумажные документы заменяются электронными.

Причиной перехода к безбумажным технологиям во многих сферах деятельности человека является увеличение скорости и качества обработки информации, уменьшение себестоимости электронных носителей при росте цен на бумагу вследствие мирового экологического кризиса.

Представление текстовой информации в компьютере –это преобразование вводимых символов с помощью кодовой таблицы. Современная универсальная таблица кодировки Unicode позволяет охватить более 65 тысяч символов различных алфавитов, цифры, знаки препинания, математические и другие символы.

Фрагмент кодовой таблицы Unicode

Для каждого знака в памяти компьютера выделяется 2 байта или 16 бит двоичного кода. Таким образом, можно вычислить объем текстовой информации, легко перемножив количество символов (включая пробелы) на информационный вес одного символа. Для выражения крупных объемов информации используются такие единицы измерения, как килобайты, мегабайты и гигабайты.

Единицы измерения информации

Различают следующие виды текстовой информации:

фактуальная (отражает события, описание людей, мест действия, времени и т.д.);
концептуальная (открывает замысел автора, его позицию, точку зрения);
подтекстовая (дополнительная информация, позволяющая полнее раскрыть предыдущие виды информации).

Большинство текстов имеют сложную структуру, подразумевающую сочетание различных типов сведений: когнитивных, оперативных, эмоциональных и эстетических. Каждый из видов информации в тексте характеризуется своими особыми способами языкового выражения.

Текстовые документы

В целях упрощения работы с письменной информацией создали специальное программное обеспечение – текстовые редакторы (процессоры). Каждый текст, написанный в нем, будет называться текстовым документом. Это может быть и научная статья с формулами, и рассказ, и рекламное объявление.

Компьютерный текстовый документ как структура данных, реализованная с помощью гиперссылок, называется гипертекстом . Такой метод организации электронного документа позволяет в кратчайшие сроки переходить к необходимым сведениям и устанавливать связи между различными фрагментами текста.

Основные объекты текстового документа

Различают следующие основные структурные единицы текстового документа:

символ – самый маленький элемент текста;
слово – буквенный или цифровой ряд, ограниченный пробелами или символами препинания;
абзац – набор письменных элементов, начинающийся с красной строки;
строка – ряд символов внутри абзаца, который расположен в пределах одной горизонтальной линии между границами полей документа;
фрагмент – произвольная непрерывная часть текста (может быть какодно слово, строчка, абзац, так и весь документ).

Компьютер – основной инструмент работы с текстом

В современном мире компьютер – уникальное устройство, в том числе и для работы с текстовой информацией. Элементарные программы для текстовых документов имеют возможность создания текстов, составленных из символов, печатаемых с клавиатуры, и небольшой комплект инструментов для оформления информации. Для подготовки наиболее сложных текстов с графиками, табличным представлением данных, надписями, схемами, картинками и фотографиями целесообразно использование сильных текстовых процессоров.

Среди множества программ, предназначенных для работы с текстовой информацией, выделяют следующие:

Foxit Reader – бесплатная программа для открытия текстовых документов в формате PDF. Кроме просмотра, она имеет возможность редактировать и отправлять текст на печать.

Libre Office Writer– свободное офисное приложение. Прямой аналог Open Office Writer.Текстовый документа, напечатанный в этой программе, будет иметь формат ODF.

Adobe Reader – удобная программа для работы текстовыми документами в формате PDF, используемого для создания текстовой информации высокого качества.

Open Office Writer– бесплатное программное обеспечение, полная альтернатива приложению Microsoft Office Word. Поддерживает многие форматы. Из минусов данного приложения – отсутствует автоматическая проверка грамматики.

Word Pad – стандартная программа операционной системы Microsoft Windows, обладающая ограниченными функциональными возможностями.

В большинстве случаев для создания текстового документа используют программу Microsoft Word, имеющую богатый арсенал инструментов для обработки текстовой информацией. Позволяет создавать документы различной сложности.

Основные стадии подготовки электронного текстового документа:

Ввод (набор символов).
Редактирование.
Форматирование.
Печать.

Ввод текста

К устройствам ввода текстовой информации относится графический планшет, сканер, сенсорный экран и самое распространённое - клавиатура. Она позволяет вводить числа, буквы, различные знаки и управлять действиями компьютера служебными клавишами.

При вводе текстовой информации следует придерживаться несложных правил:

Каждый абзац начинается после нажатия на клавишу Enter с новой строки.
Отступ для абзаца создается нажатием на Tab.

Редактирование текста

Редактирование текста представляет собой процедуру внесения необходимых правок. Этот этап подготовки документа требует внимания и усидчивости.

В процессе редактирования текста изменяется содержание текста. В результате работы текст должен стать грамотным и понятным.

Основными функциями редактирования текста являются:

выделение текстового отрывка;
удаление, копирование, перемещение и вставка необходимых фрагментов текста;
корректировка документа, включающая в себя подстановку вместо повторяющихся слов синонимов, устранение грамматических, пунктуационных, орфографических и стилистических ошибок.

Редактирование текста осуществляется перемещением курсора в необходимое место с помощью мыши либо нажатием служебных клавиш (их комбинации).

Основные сочетания клавиш

Работать можно как с отдельными знаками, строками, абзацами,так и со всем текстом. Прежде всего нужный фрагмент следует выделить. Для этого нужно установить курсорную стрелку в начало элемента и, зажимая левую кнопку мышки, провести до его окончания.

Далее можно его скопировать, вырезать, удалить соответствующими кнопками или сочетаниями клавиш.

Microsoft Word – самая популярная программа для редактирования текста. Она обладает богатыми возможностями и удобным интерфейсом. Основные средства для редактирования текста в Word:

Режим вставки и замены символов (в первом режиме при печатании знаки вставляются между уже имеющимися, а при втором – очередные символы заменяют ранее напечатанные при вводе) Файл→Параметры→Дополнительно

Режим Тезауруса (используется для автоматической замены выделенных слов синонимами)

Автоматическая проверка правописания (проверка орфографии и грамматики)

Средства рецензирования (позволяет создавать примечания, исправления и другие операции, не изменяя исходный текст) вкладка Рецензирование

Форматирование текста

Следующий этап обработки текста заключается в его форматировании. Форматирование текста подразумевает изменение внешнего вида документа. Информация подвергается оформлению по необходимым критериям.

Форматирование текста представляет собой:

выбор параметров страницы;
форматирование символов;
форматирование абзацев;
создание списков.

Вначале выбирается альбомная или книжная ориентация страницы (Разметка страницы → Ориентация).

Также в этой вкладке можно устанавливать различные параметры страницы (поля, размер, колонки и т.д.)

Нумерация страницы производится нажатием на кнопку Вставка → Номер страницы.

В процессе форматирования текста изменяется размер, начертание и цвет шрифта на Главной вкладке.

Оформление абзацев состоит в выравнивании текста относительно границ страницы (по левому или правому краю, центру или ширине).

Применение номерованных или маркированных списков позволит облегчить восприятие текстовой информации.

Подготовка документа заканчивается его распечатыванием. Для этой цели используют принтеры (устройства, переводящие электронную информацию на бумажный носитель) разного типа:

Учитель: Сегодня на уроке вы узнаете, как представляется текстовая информация в компьютере. Научитесь кодировать и декодировать текстовую информацию с помощью кодовых таблиц и ПК.

2. Ход урока

1. Объяснение нового материала.

Учитель: Сегодня на уроке мы с вами разберём понятия: текстовая информация, кодовая таблица. Будем кодировать и декодировать текстовую информацию.

Начиная с конца 60-х годов, компьютеры получили возможность работать с текстовой информацией.

Текстовая информация – это информация, выраженная в письменной форме.

(см. Презентация, слайд 3)

Определение текстовой информации записать в тетрадь.

В процессе восприятия, передачи и хранения информации человеком и техническими устройствами происходит её кодирование.

Учитель: Ребята, давайте вспомним: Что такое кодирование?

(см. Презентация, слайд 4)

Ответ: Кодирование – это процесс преобразования информации в форму, воспринимаемую компьютером, т.е. двоичный код.

Учитель: Декодирование?

Ответ: Декодирование – это процесс обратный кодированию, который заключается в том, что происходит преобразование данных из двоичного кода в форму, понятную человеку.

(см. Презентация, слайд 5)

Учитель: Человек различает знаки по их начертанию. Для предоставления текста в памяти компьютера необходимо представить его в виде двоичного кода.

Ребята, как представлен двоичный код в компьютере? (В виде каких символов?)

Ответ: в виде последовательности из 0 и 1

Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. По формуле можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:

N = 2 i
256 = 2 8
i = 8 бит

N – мощность алфавита
i – информационный вес символа

Записать в тетрадь.

(см. Презентация, слайд 6)

Учитель: При вводе в компьютер текстовой информации происходит её двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определённая последовательность из 8 электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну ячейку.

В процессе вывода символа на экран компьютера производится обратный процесс – декодирование, т.е. преобразование кода символа в его изображение.

(см. Презентация, слайд 7)

Учитель: Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.

Определение таблицы кодировки записать в тетрадь.

(см. Презентация, слайд 8)

Учитель: Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена).

(см. Презентация, слайд 9)

Таблица кодов ASCII делится на:

1) Функциональные клавиши (принято называть управляющими) Символы с номерами от 0 до 31. Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.

Символ 32 – пробел, т.е. пустая позиция в тексте.

2) Коды 32 – 127 – входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.

3) Коды 128 – 255 – национальный алфавит.

Учитель: Рассмотрим кодовую таблицу MS – DOS (СР(кодовая страница)866) подробнее.

Кодовая таблица MS – DOS (СР(кодовая страница)866) (называемая кодовой страницей) включает в себя:

– имеют номера со 128 по 159 — (с " А " по " Я "),

– буква " Ё " стоит особняком под номером 240 .

строчные русские буквы (чтобы сохранить символы псевдографики) разбросаны:

– буквы с " а " по " п " имеют номера со 160 по 175 ,

– с " р " по " я " занимают позиции с 224 по 239 ,

– буква " ё " снова на отшибе и имеет номер 241 .

(см. Презентация, слайд 10)

Понятие кодировки Unicode

В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, для их кодировки стали использовать 2 байта (16 бит).

N = 2 i
2 i = 2 16 = 65536
N = 65536

N – мощность алфавита символов в кодовой таблице Unicode.
i – информационный вес символа

(см. Презентация, слайд 11 – 12)

Для разных типов ЭВМ используютcя различные кодировки:

Тексты, созданные в одной кодировке не будут правильно отображаться в другой.

(см. Презентация, слайд 13)

На данном слайде вы видите сравнение кодов в различных кодировочных таблицах.

(см. Презентация, слайд 14)

1. Давайте с помощью кодовой таблицы ASCII (аски) декодируем текст: С помощью последовательности десятичных кодов: 99 111 109 112 117 116 101 114 (computer)

(см. Презентация, слайд 15)

Цель: научиться определять числовые коды символов и вводить символы с помощью числовых кодов.

(см. Презентация, слайд 16)

Учитель: Работа в текстовом редакторе MS Word. Запустите текстовый редактор MS Word. Удерживая клавишу “ALT”, наберите коды на дополнительной цифровой клавиатуре:

152 170 174 171 160

Учитель: Какое слово получили?

Выполнение практической работы учащимися

Проверка выполнения практической работы.

3. Подведение итогов урока

Учитель: Сегодня на уроке вы научились кодировать и декодировать текстовую информацию при помощи кодировочной таблицы MS – DOS (СР(кодовая страница)866).

4. Домашнее задание

(см. Презентация, слайд 17)

Учебник Н.Д. Угриновича § 3.1, ответить на вопросы. Произвести кодирование стихотворения из 4– строк (до 100 символов).

ЭТО СВЯЗАНО С ТЕМ, ЧТО ИНФОРМАЦИЮ, ПРЕДСТАВЛЕННУЮ В ТАКОМ ВИДЕ, ЛЕГКО ТЕХНИЧЕСКИ СМОДЕЛИРОВАТЬ, НАПРИМЕР В ВИДЕ ЭЛЕКТРИЧЕСКИХ СИГНАЛОВ. Если в какой-то момент времени по проводнику идет ток, то по нему передается единица, если тока нет- ноль. Аналогично, если направление магнитного поля на каком-то участке поверхности магнитного диска одно- на этом участке записан ноль, другое- единица. Если определенный участок поверхности оптического диска отражает лазерный луч- на нем записан ноль, не отражает- единица. Оперативная память состоит из очень большого числа триггеров- электронных схем, состоящих из двух транзисторов. Триггер может сколь угодно долго находиться в одном из двух состояний- когда один транзистор открыт, а другой закрыт, или наоборот. Одно состояние обозначается нулем, а другое единицей.

ОБЪЕМ ИНФОРМАЦИИ, НЕОБХОДИМЫЙ ДЛЯ ЗАПОМИНАНИЯ ОДНОГО ИЗ ДВУХ СИМВОЛОВ-0 ИЛИ 1, НАЗЫВАЕТСЯ 1 БИТ (англ. binary digit- двоичная единица). 1 бит- минимально возможный объем информации. Он соответствует промежутку времени, в течение которого по проводнику передается или не передается электрический сигнал, участку поверхности магнитного диска, частицы которого намагничены в том или другом направлении, участку поверхности оптического диска, который отражает или не отражает лазерный луч, одному триггеру, находящемуся в одном из двух возможных состояний.

Итак, если у нас есть один бит, то с его помощью мы можем закодировать один из двух символов- либо 0, либо 1.

Если же есть 2 бита, то из них можно составить один из четырех вариантов кодов: 00 , 01 , 10 , 11 .

Если есть 3 бита- один из восьми: 000 , 001 , 010 , 100 , 110 , 101 , 011 , 111 .

1 бит- 2 варианта,

2 бита- 4 варианта,

3 бита- 8 вариантов;

Продолжая дальше, получим:

4 бита- 16 вариантов,

5 бит- 32 варианта,

6 бит- 64 варианта,

7 бит- 128 вариантов,

8 бит- 256 вариантов,

9 бит- 512 вариантов,

10 бит- 1024 варианта,

N бит - 2 в степени N вариантов.

В обычной жизни нам достаточно 150-160 стандартных символов (больших и маленьких русских и латинских букв, цифр, знаков препинания, арифметических действий и т.п.). Если каждому из них будет соответствовать свой код из нулей и единиц, то 7 бит для этого будет недостаточно (7 бит позволят закодировать только 128 различных символов), поэтому используют 8 бит.

ДЛЯ КОДИРОВАНИЯ ОДНОГО ПРИВЫЧНОГО ЧЕЛОВЕКУ СИМВОЛА В ЭВМ ИСПОЛЬЗУЕТСЯ 8 БИТ, ЧТО ПОЗВОЛЯЕТ ЗАКОДИРОВАТЬ 256 РАЗЛИЧНЫХ СИМВОЛОВ.

СТАНДАРТНЫЙ НАБОР ИЗ 256 СИМВОЛОВ НАЗЫВАЕТСЯ ASCII ( произносится "аски", означает "Американский Стандартный Код для Обмена Информацией"- англ. American Standart Code for Information Interchange).

ОН ВКЛЮЧАЕТ В СЕБЯ БОЛЬШИЕ И МАЛЕНЬКИЕ РУССКИЕ И ЛАТИНСКИЕ БУКВЫ, ЦИФРЫ, ЗНАКИ ПРЕПИНАНИЯ И АРИФМЕТИЧЕСКИХ ДЕЙСТВИЙ И Т.П.

Таким образом, если человек создает текстовый файл и записывает его на диск, то на самом деле каждый введенный человеком символ хранится в памяти компьютера в виде набора из восьми нулей и единиц. При выводе этого текста на экран или на бумагу специальные схемы - знакогенераторы видеоадаптера (устройства, управляющего работой дисплея) или принтера образуют в соответствии с этими кодами изображения соответствующих символов.

Набор ASCII был разработан в США Американским Национальным Институтом Стандартов (ANSI), но может быть использован и в других странах, поскольку вторая половина из 256 стандартных символов, т.е. 128 символов, могут быть с помощью специальных программ заменены на другие, в частности на символы национального алфавита, в нашем случае - буквы кириллицы. Поэтому например, передавть по электронной почте за границу тексты, содержащие русские буквы, бессмысленно. В англоязычных странах на экране дисплея вместо русской буквы Ь будет высвечиваться символ английского фунта стерлинга, вместо буквы р - греческая буква альфа, вместо буквы л - одна вторая и т.д.

ОБЪЕМ ИНФОРМАЦИИ, НЕОБХОДИМЫЙ ДЛЯ ЗАПОМИНАНИЯ ОДНОГО СИМВОЛА ASCII НАЗЫВАЕТСЯ 1 БАЙТ.

Очевидно что, поскольку под один стандартный ASCII-символ отводится 8 бит,

Остальные единицы объема информации являются производными от байта:

1 КИЛОБАЙТ = 1024 БАЙТА И СООТВЕТСТВУЕТ ПРИМЕРНО ПОЛОВИНЕ СТРАНИЦЫ ТЕКСТА,

1 МЕГАБАЙТ = 1024 КИЛОБАЙТАМ И СООТВЕТСТВУЕТ ПРИМЕРНО 500 СТРАНИЦАМ ТЕКСТА,

1 ГИГАБАЙТ = 1024 МЕГАБАЙТАМ И СООТВЕТСТВУЕТ ПРИМЕРНО 2 КОМПЛЕКТАМ ЭНЦИКЛОПЕДИИ,

1 ТЕРАБАЙТ = 1024 ГИГАБАЙТАМ И СООТВЕТСТВУЕТ ПРИМЕРНО 2000 КОМПЛЕКТАМ ЭНЦИКЛОПЕДИИ.

Обратите внимание, что в информатике смысл приставок кило- , мега- и других в общепринятом смысле выполняется не точно, а приближенно, поскольку соответствует увеличению не в 1000, а в 1024 раза.

СКОРОСТЬ ПЕРЕДАЧИ ИНФОРМАЦИИ ПО ЛИНИЯМ СВЯЗИ ИЗМЕРЯЕТСЯ В БОДАХ.

1 БОД = 1 БИТ/СЕК.

В частности, если говорят, что пропускная способность какого-то устройства составляет 28 Килобод, то это значит, что с его помощью можно передать по линии связи около 28 тысяч нулей и единиц за одну секунду.

Для представления текстовой информации достаточно 256 различных символов.

Для кодирования каждого знака требуется количество информации, равное 8 битам. Формула для определения количества информации:

N=2 i 256 = 2 8

i – количество информации (в битах),

Для представления символов и соответствующих им кодов используется кодовая таблица.

Таблица ASCII (American Standard Code for Information Interchange – Американский стандартный код для обмена информацией).

Различные кодировки знаков

Новый международный стандарт кодирования текстовых символов Unicode отводит на каждый символ 2 байта (16 битов)

N = 2 I , N = 2 16 , N = 65536

i – информационный вес одного символа, который измеряется в битах на один символ.

Пример:

Дано : K=1048576 символов; i=8 бит/символ

V=K×i=1048576*8=8388608бит=1048576байт=1024 Кб=1Мб, что составляет 1Мб*100%/1,44Мб=69% объёма дискеты

1. Полный набор символов, используемый для кодирования, называют:

2. Минимальным объектом, используемым для кодирования текста, является:

3. Количество битов, необходимое для кодирования одного символа алфавита в коде Unicode, равно:

5. Какие символы могут быть зашифрованы кодами таблицы ASCII 119 и 251?

Задача1 . Во сколько раз увеличится информационный объем страницы текста при его преобразовании из кодировки Windows (таблица кодировки содержит 256 символов) в кодировку Unicode (таблица кодировки содержит 65 536 символов)?

1) в 2 раза 2) в 8 раз 3) в 16 раз 4) в 256 раз

Количество информации, необходимое, чтобы закодировать каждый знак в кодировке Windows (256 символов):

N = 2 I  256 = 2 I  2 8 = 2 I  I = 8 битов .

Количество информации, необходимое, чтобы закодировать каждый знак в кодировке Unicode (65 536 символов):

N = 2 I  65 536 = 2 I  2 16 = 2 I  I = 16 битов .

Для кодировки каждого знака необходимо в два раза больше информации, следовательно информационный объем страницы текста увеличится в 2 раза .

Алфавит содержит 32 буквы. Какое количество информации несет одна буква?

Мощность алфавита N = 32

Какое количество информации несет одна буква?

1. 32 = 2 5, значит вес одного символа b = 5 бит.

Ответ: одна буква несет 5 бит информации.

Мощность алфавита N = 16

Текст состоит из 10 символов.

Определить объем информации в битах.

1. 16 = 2 4 , значит вес одного символа b = 4 бита.

2. Всего символов 10, значит объем информации 10×4 = 40 бит.

Текст состоит из 100 символов

Какова мощность алфавита?

1. Определим вес одного символа: 300 / 100 = 3 бита.

2. Мощность алфавита определяем по формуле: 2 3 = 8.

Ответ: мощность алфавита N = 8.

1) 30 2) 60 3) 120 4) 480

-80%

Читайте также: