КампутарыІнфармацыйныя тэхналогіі

Кадаванне тэкставай інфармацыі ў кампутары

Кампутар - складаная прылада, з дапамогай якога можна ствараць, пераўтвараць і захоўваць інфармацыю. Аднак ЭВМ працуе не зусім зразумелым для нас спосабам - графічныя, тэкставыя і лікавыя дадзеныя захоўваюцца ў выглядзе масіваў двайковых лікаў. У дадзеным артыкуле мы разгледзім, як ажыццяўляецца кадаванне тэкставай інфармацыі.

Тое, што для нас з'яўляецца тэкстам, для ЭВМ - паслядоўнасць знакаў. Кожны знак уяўляе сабой пэўны набор нулёў і адзінак. Пад знакамі маюцца на ўвазе не толькі малыя і вялікія літары лацінскага алфавіту, але таксама і знакі прыпынку, арыфметычныя знакі, службовыя сімвалы, спецыяльныя абазначэння і нават прабел.

Двайковае кадаваньне тэкставай інфармацыі

Пры націску пэўнай клавішы на ўнутраны кантролер пасылаецца электрычны сігнал, які пераўтвараецца ў двайковы код. Код супастаўляецца з пэўным сімвалам, які і выводзіцца на экран. Для прадстаўлення лацінскага алфавіту ў лічбавым фармаце была створана міжнародная сістэма кадавання ASCII. У ёй для запісу аднаго знака трэба 1 байт, такім чынам, знак складаецца з васьмізначнай паслядоўнасці нулёў і адзінак. Інтэрвал запісы - ад 00000000 да 11111111, то ёсць кадаваньне тэкставай інфармацыі пры дапамозе дадзенай сістэмы дазваляе прадставіць 256 знакаў. У большасці выпадкаў гэтага бывае дастаткова.

ASCII падзелена на дзве часткі. Першыя 127 сімвалаў (ад 00000000 да 01111111) з'яўляюцца інтэрнацыянальнымі і ўяўляюць сабой спецыфічныя сімвалы і літары ангельскага алфавіту. Другая ж частка - пашырэнне (ад 10000000 да 11111111) - прызначана для прадстаўлення нацыянальнага алфавіту, напісанне якога выдатна ад лацінскага.

Кадаванне тэкставай інфармацыі ў ASCII пабудавана па прынцыпе нарастаючым паслядоўнасці, гэта значыць чым больш парадкавы нумар лацінскай літары, тым больш значэнне яе ASCII-кода. Лічбы і руская частка табліцы пабудаваныя па тым жа прынцыпе.

Аднак у свеце існуе яшчэ некалькі відаў кадоўкі для літар кірыліцы. Самыя распаўсюджаныя - гэта ЯКІЯ-8 (васьмібітнай кадоўка, ужывальная ўжо ў 70-х гадах на першых руифицированных АС Unix), ISO 8859-5 (распрацаваная Міжнародным бюро стандартызацыі), СР 1251 (кадаваньне тэкставай інфармацыі, якое ўжываецца ў сучасных АС Windows), а таксама 2-байтавая кадоўка Unicode, з дапамогай якой можна ўявіць 65536 знакаў. Такое разнастайнасць кадовак абумоўлена тым, што ўсе яны распрацоўваліся ў розны час, для розных аперацыйных сістэм і з розных меркаванняў. З-за гэтага часта ўзнікаюць цяжкасці пры пераносе тэксту з аднаго носьбіта на іншы - пры несупадзенні кадовак карыстальнік ўбачыць толькі набор незразумелых значкоў. Як можна выправіць дадзеную сітуацыю? У Word, напрыклад, пры адкрыцці дакумента выдаецца паведамленне пра праблемы з адлюстраваннем тэксту і прапануецца некалькі варыянтаў перакадаванні.

Такім чынам, кадаванне і апрацоўка тэкставай інфармацыі ў нетрах кампутара - працэс даволі складана арганізаваны і працаёмкі. Ўсе знакі любога алфавіту ўяўляюць сабой толькі пэўную паслядоўнасць лічбаў двайковай сістэмы, адна ячэйка - гэта адзін байт інфармацыі.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 be.birmiss.com. Theme powered by WordPress.