КампутарыПраграмаванне

ASCII, сімвалы: апісанне, табліца кодаў і віды

Як вядома, кампутар захоўвае інфармацыю ў двайковым выглядзе, прадстаўляючы яе ў якасці паслядоўнасці адзінак і нулёў. Каб перавесці інфармацыю ў форму, зручную для чалавечага ўспрымання, кожная ўнікальная паслядоўнасць лічбаў пры адлюстраванні замяняецца на адпаведны ёй знак.

Адной з сістэм суаднясення бінарных кодаў з друкаванымі і кіраўнікамі сімваламі з'яўляецца кадоўка ASCII.

Пры сённяшнім узроўні развіцця камп'ютэрных тэхналогій ад карыстальніка не патрабуецца веданне кода кожнага канкрэтнага знака. Аднак агульнае разуменне таго, як ажыццяўляецца кадаванне, з'яўляецца вельмі карысным, а для некаторых катэгорый спецыялістаў і зусім неабходным.

стварэнне ASCII

У першапачатковым выглядзе кадоўка была распрацавана ў 1963 годзе і затым на працягу 25 гадоў двойчы абнаўлялася.

У зыходным варыянце табліца сімвалаў ASCII ўключала 128 знакаў, пазней з'явілася пашыраная версія, дзе першыя 128 знакаў былі захаваны, а кодах з задзейнічаным восьмым бітам пастаўлены ў адпаведнасць адсутнічалі раней сімвалы.

На працягу многіх гадоў дадзеная кадоўка з'яўлялася самай папулярнай у свеце. У 2006 годзе вядучае месца заняла Latin 1252, а з канца 2007 года да гэтага часу лідзіруючую пазіцыю трывала трымае Юнікод.

Камп'ютэрнае ўяўленне ASCII

Кожны ASCII-сімвал мае ўласны код, які складаецца з 8 знакаў, якія прадстаўляюць сабой нуль або адзінку. Мінімальным лікам у такім прадстаўленні з'яўляецца нуль (восем нулёў у двайковай сістэме), які і з'яўляецца кодам першага элемента ў табліцы.

Максімальным двайковым кодам у зыходнай версіі ASCII з'яўляецца нуль + сем адзінак, а ў пашыранай версіі - восем адзінак, паколькі падключаецца восьмы біт.

кіраўнікі сімвалы

Кіравальнымі знакамі называюцца знакі, якія не маюць графічнага прадстаўлення і выкарыстоўваюцца для арганізацыі тэксту, кіравання прыладамі і т. Д. Яны могуць пазначаць пачатак ці канец тэксту, табуляцыі, генерацыю гукавога сігналу, розныя аперацыі для працы па тэлетайпа (тэлетайп - машына для перадачы дадзеных па электрычным каналу), дазвол высновы дадзеных на прыладзе, адмену дзеяння і інш.

У табліцы сімвалаў ASCII пазіцыі з 0 па 31, а таксама 127 выдзелены пад кіраўнікі знакі. Усяго такіх знакаў 33.

астатнія сімвалы

Тыя, што засталіся 95 пазіцый адведзены пад знакі прыпынку і знакі матэматычных аперацый, дзесятковыя лічбы, літары лацінскага алфавіту, якія адрозніваюцца рэгістрам: «А» вялікай і "а" маленькай адпавядаюць розныя коды ў табліцы сімвалаў ASCII.

Нумары знакаў у табліцы

Калі чалавек займаецца распрацоўкай праграмнага забеспячэння або выконвае некаторыя іншыя задачы з вобласці інфармацыйных тэхналогій, яму неабходна ведаць нумары шэрагу сімвалаў ASCII.

Як згадвалася вышэй, пазіцыі 0-31 і 127 займаюць кіраўнікі сімвалы. Нумар 32 замацаваны за прабелам, нумары 33-47 і 58-64 адведзены пад знакі прыпынку і асноўныя матэматычныя аперацыі.

Лацінскія вялікія літары размешчаны па алфавіце і маюць нумары з 65-га па 90-й. Малыя літары таксама размешчаны па алфавіце, іх пазіцыі - з 97-й па 122-ю. Тыя, што засталіся нумары (91-96 і 123-126) замацаваны за квадратнымі і фігурнымі дужкамі, касой і прамой рысай, а таксама некаторымі дыякрытычныя знакі.

Поўную табліцу знакаў у зручным графічным прадстаўленні можна ўбачыць на малюнку, прадстаўленым вышэй. На малюнку ніжэй дэманструюцца нумары знакаў у рускай табліцы сімвалаў ASCII.

пашыраная ASCII

Паколькі зыходны варыянт кадоўкі распрацоўваўся ў разліку на амерыканскага карыстальніка, у ім не былі прадугледжаны не толькі розныя віды пісьменства і нацыянальныя алфавіты, але нават зручнае выкарыстанне дыякрытычныя знакі, актыўна ўжываюцца ў еўрапейскіх мовах.

Для фарміравання пашыранай кадоўкі быў задзейнічаны 8-й біт. Дадзеная версія ўключае ў сябе сімвалы нацыянальных еўрапейскіх алфавітаў і фанетычнай транскрыпцыі, элементы графікі, якія выкарыстоўваліся для малявання табліц, шэраг матэматычных знакаў.

Некаторыя ASCII-сімвалы сёння выкарыстоўваюцца рэдка. У прыватнасці, гэта датычыцца знакаў, служачых для малявання табліц, паколькі за гады, якія прайшлі з моманту распрацоўкі пашыранай кадоўкі, былі ўкаранёны значна больш зручныя спосабы графічнага прадстаўлення табліц.

Нацыянальныя варыянты кадоўкі

Да з'яўлення пашыранага варыянту ASCII для адлюстравання нацыянальных алфавітаў выкарыстоўваліся перапрацаваныя версіі кадоўкі, дзе на месцы лацінскіх літар размяшчаліся рускія, грэчаскія, арабскія сімвалы.

Два кода ў табліцы былі адведзены пад пераключэнне паміж стандартнай US-ASCII і яе нацыянальным варыянтам.

Пасля таго як ASCII стала уключаць не 128, а 256 знакаў, распаўсюджванне атрымаў варыянт кадоўкі, пры якім зыходная версія табліцы была захавана ў першых 128 кодах з нулявым 8-м бітам. Знакі нацыянальнага пісьменства захоўваліся ў верхняй палове табліцы (128-255-я пазіцыі).

Ведаць непасрэдна коды сімвалаў ASCII карыстачу не патрабуецца. Распрацоўніку праграмнага забеспячэння звычайна дастаткова ведаць нумар элемента ў табліцы, каб пры неабходнасці разлічыць яго код, выкарыстоўваючы бінарную сістэму.

Руская мова

Пасля распрацоўкі ў пачатку 70-х гадоў кадовак для скандынаўскіх моў, кітайскага, карэйскага, грэцкага і інш., Стварэннем уласнага варыянту заняўся і Савецкі Саюз. Неўзабаве быў распрацаваны варыянт 8-бітнай кадоўкі пад назвай КОИ8, якая захоўвае першыя 128 кодаў сімвалаў ASCII і якая вылучае столькі ж пазіцый пад літары нацыянальнага алфавіту і дадатковыя знакі.

Да ўкаранення Юнікода КОИ8 дамінавала ў расійскім сегменце інтэрнэту. Існавалі варыянты кадоўкі як для рускага, так і для ўкраінскага алфавіту.

праблемы ASCII

Паколькі колькасць элементаў нават у пашыранай табліцы не перавышала 256, магчымасць вмещения ў адну кадоўку некалькіх розных пісьменнасцяў адсутнічала. У 90-я гады ў Рунэце з'явілася праблема «крокозябр», калі тэксты, набраныя рускімі сімваламі ASCII, адлюстроўваліся некарэктна.

Праблема складалася ў неадпаведнасці кодаў розных варыянтаў ASCII адзін аднаму. Успомнім, што на пазіцыях 128-255 маглі размяшчацца розныя знакі, і пры змене адной кірылічнай кадыроўкі на іншую ўсе літары тэксту замяняліся на іншыя, якія маюць ідэнтычны нумар у іншай версіі кадоўкі.

бягучы стан

З з'яўленнем Юнікода папулярнасць ASCII рэзка пайшла на змяншэнне.

Прычына гэтага крыецца ў тым факце, што новая кадоўка дазволіла змясціць знакі амаль усіх пісьмовых моваў. Пры гэтым першыя 128 знакаў ASCII адпавядаюць тым жа сымбалям ў Юнікодзе.

У 2000-м ASCII была самай папулярнай кадоўкай ў інтэрнэце і выкарыстоўвалася на 60% праіндэксаваных «Гуглом» вэб-старонак. Ужо да 2012 года доля такіх старонак ўпаў да 17%, а месца самай папулярнай кадоўкі заняў Юнікод (UTF-8).

Такім чынам, ASCII з'яўляецца важнай часткай гісторыі інфармацыйных тэхналогій, аднак яе выкарыстанне ў далейшым бачыцца малаперспектыўным.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 be.birmiss.com. Theme powered by WordPress.