§13. Тексты в компьютерной памяти

Основные темы параграфа:

преимущества компьютерного документа по сравне­нию с бумажным;

             как представляются тексты в памяти компьютера;

                    что такое гипертекст.

 

Преимущества компьютерного документа

по сравнению с бумажным

А теперь от обсуждения вопроса о том, что представляет собой компьютер, перейдем к ответу на вопрос, что умеет де­лать компьютер. Начиная с этой главы, мы будем знако­миться с применением ЭВМ.

Первая область применения, которую мы рассмотрим, работа с текстами. При ручной записи часто неприятную проб­лему составляет необходимость исправлять ошибки или вно­сить какие-то изменения в текст. При этом приходится зачер­кивать, стирать, заклеивать, что портит вид текста. Необходи­мость переписывать текст ведет к потере времени и лишнему расходу бумаги.

Имея компьютер, можно создавать тексты, не тратя на это лишнее время и бумагу. Носителем текста становится па­мять ЭВМ. Конечно, для длительного его сохранения это должна быть внешняя память магнитные или оптические диски,

                     Текст на внешних носителях сохраняется                        

                     в виде файла.                                                                             

Есть ряд преимуществ сохранения текстов в файловой форме на компьютерных носителях по сравнению с бумагой. Во-первых, это компактное размещение. Например, текст толстой книги в 500 страниц помещается на маленькую дис­кету диаметром 9 см, А если использовать специальные ме­тоды сжатия, то размер текста, помещающегося на дискете, можно увеличить в несколько раз.

Во-вторых, если данный текст становится ненужным, то дискету, как бумагу, не надо выбрасывать или сдавать в ма­кулатуру. С нее с помощью компьютера легко стереть этот текст и на его место записать новый.

В-третьих, с помощью компьютера легко скопировать файлы в любом количестве на другие носители.

В-четвертых, файл с текстом можно быстро переслать дру­гому человеку по электронной почте. Для этого ваш ком­пьютер и компьютер адресата должны иметь связь через компьютерную сеть.

Главное неудобство хранения текстов в файлах состоит в том, что прочитать их можно только с помощью компьютера. Человек может просмотреть текст на экране дисплея или на­печатать на бумаге, используя принтер.

Уже сейчас имеются некоторые издания, которые не печа­таются на бумаге, а хранятся и распространяются в форме файлов. Когда компьютеры станут такими же обычными предметами в каждом доме, как сейчас радио и телевизор, то безбумажных изданий станет еще больше, Представьте себе, что вся ваша личная библиотека разместится в коробке с ди­сками. Причем по объему информации она будет не меньше, чем сотни книг, собранных родителями. А экономя бумагу, мы сохраняем леса на нашей планете.

Как представляются тексты в памяти компьютера

А теперь «заглянем» в память компьютера и разберемся, как же представлена в нем текстовая информация.

Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и других. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом, а число символов в алфави­те его мощностью.

Для представления текстовой информации в компьютере используется алфавит мощностью 256 символов. Мы знаем, что один символ такого алфавита несет 8 битов информации: 2 = 256. 8 битов = 1 байт, следовательно:

Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу.

Понятно, что это дело условное, можно придумать множест­во способов кодирования.

Все символы компьютерного алфавита пронумерованы от О до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки, С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица ко­дировки под названием ASCII (American Standart Code for In­formation Interchange американский стандартный код для информационного обмена).

Точнее говоря, стандартной в этой таблице является толь­ко первая половина, т. е. символы с номерами от нуля (дво­ичный код 00000000) до 127 (01111111), Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная с 10000000 и кончая 11111111, используются в разных вари­антах. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

В табл. 3.1 приведена стандартная часть кода ASCII (коды от 0 до 31 имеют особое назначение, не отражаются каки­ми-либо знаками и в данную таблицу не включены). Здесь приведены десятичные номера символов, символы, двоич­ные коды.

Обратите внимание на то, что в этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возраста­нию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного коди­рования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символь­ной информации. Для русского алфавита принцип последова­тельного кодирования соблюдается не всегда.

Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следую­щим содержанием:

01100110 01101001 01101100 01100101.

Л теперь попробуйте решить обратную задачу. Какое сло­во записано следующим двоичным кодом;

01100100 01101001 01110011 01101011 ?

В табл. 3.2 приведен один из вариантов второй половины кодовой таблицы ASCII, который называется альтернатив­ной кодировкой. Видно, что в ней для букв русского алфави­та соблюдается принцип последовательного кодирования.

Тексты вводятся в память компьютера с помощью клавиа­туры. На клавишах написаны привычные нам буквы, циф­ры, знаки препинания и другие символы. В оперативную па­мять они попадают в форме двоичного кода.

Из памяти компьютера текст может быть выведен на эк­ран или на печать в символьной форме. Но для долговремен­ного хранения его следует записать на внешний носитель в виде файла.

Что такое гипертекст

Наиболее существенное отличие компьютерного текста от бумажного вы почувствуете, если встретитесь с текстом, ин­формация в котором организована по принципу гипертекста.

Гипертекст — это текст, организованный так, что его можно просматривать в последовательности смысловых связей между его отдельными фрагментами. Такие связи называются гиперсвязями (гиперссылками).

Чаще всего по принципу гипертекста организованы компьютерные справочники, энциклопедии, учебники. Та­кую «книгу» можно читать не только в обычном порядке, «листая страницы» на экране, но и перемещаясь по смысло­вым связям в произвольном порядке. Например, при изуче­нии на уроке физики темы «Второй закон Ньютона» с помо­щью компьютерного учебника ученик прочитал определение закона «Сила равна произведению массы на ускорение».

 

image041


image042

image043 

Ему захотелось вспомнить определение массы. Указав в тек­сте на слово «масса» (связанные понятия обычно выделяют­ся цветом или подчеркиванием, а указывать на них удобно с помощью мыши), он быстро перейдет к разделу учебника, где рассказывается о массе тел. Прочитав определение «Мас­са — мера инертности тела», ученик может пожелать уточ­нить, что такое инертность. По гиперссылке он быстро вый­дет на нужный раздел.

После такой экскурсии вглубь материала ученик может вернуться в исходную точку, щелкнув мышью по кнопке «Назад», так как система запоминает весь маршрут продви­жения по гиперссылкам.

Коротко о главном

С помощью компьютера можно создавать текстовые доку­

менты и хранить их на носителях внешней памяти в виде файлов.

Преимущества файлового хранения текстов: возможность редактирования, быстрого копирования на другие носители; возможность передачи текста по линиям компьютерной связи.

Каждый символ текста кодируется восьмиразрядным дво­ичным кодом. Для представления текстов в компьютере ис­пользуется алфавит мощностью 256 символов,

В таблице кодировки каждому символу алфавита постав­

лен в соответствие порядковый номер и восьмиразрядный двоичный код. Международным стандартом является код ASCII — американский стандартный код для информацион­ного обмена.

Гипертекст — это текст, организованный так, что его можно просматривать в последовательности смысловых свя­зей между его отдельными фрагментами. Такие связи назы­ваются гиперсвязями (гиперссылками). Гиперссылка позво­ляет быстро перейти к просмотру того раздела, на который она указывает.

Вопросы и задания

1.В чем преимущества хранения текстов в файлах по сравнению с бумажным способом хранения?

2.Что такое гипертекст? Какие возможности предоставляет ги­пертекст пользователю?

3.Каков размер алфавита, используемого в компьютерах для представления текстов?

4.Сколько места в памяти занимает код одного символа?

5.Что такое таблица кодировки? Как называется таблица кодировки, используемая в большинстве современных персональ­ных компьютеров?

6.Закодируйте в двоичной форме свою фамилию, записанную ла­тинскими буквами, используя табл. 3.1.

7.Познакомьтесь с альтернативной частью кода ASCII, использу­емой в школьных компьютерах. Выясните, соблюдается ли принцип последовательного кодирования алфавита из русских букв {их называют кириллицей).

Закодируйте короткую фразу на русском языке. Обменяйтесь полученными кодами с соседом по парте и декодируйте тексты друг друга.