КампутарыПраграмаванне

Кадоўка ASCII (American standard code for information interchange) - базавая кадоўка тэксту для лацінкі

Па дадзеных Міжнароднага Саюза электрасувязі, ў 2016 годзе Інтэрнетам з той ці іншай рэгулярнасцю карысталася тры з паловай мільярды чалавек. Большасць з іх нават не задумваюцца аб тым, што любыя паведамленні, пасыланыя імі праз ПК або мабільныя гаджэты, а таксама тэксты, якія адлюстроўваюцца на разнастайных маніторах, на самай справе ўяўляюць сабой камбінацыі з 0 і 1. Такое ўяўленне інфармацыі называецца кадаваннем. Яно забяспечвае і значна палягчае ажыццяўленне яе захоўвання, апрацоўкі і перадачы. У 1963 годзе была распрацавана амерыканская кадоўка ASCII, якой і прысвечана дадзеная артыкул.

Прадстаўленне інфармацыі ў кампутары

З пункту гледжання любой электронна-вылічальнай машыны тэкст уяўляе сабой набор асобных знакаў. Да іх ліку належаць не толькі літары, уключаючы загалоўныя, але і знакі прыпынку, лічбы. Акрамя таго, выкарыстоўваюцца спецзнакі «=», «&», «(» і прабелы.

Мноства знакаў, з якіх складаецца тэкст, называецца алфавітам, а іх колькасць - магутнасцю (пазначаецца, як N). Для яе вызначэння выкарыстоўваецца выраз N = 2 ^ b, дзе b - лік біт або інфармацыйны вага канкрэтнага знака.

Даказана, што алфавіт магутнасцю 256 знакаў дазваляе прадставіць усе неабходныя сімвалы.

Так як 256 ўяўляе сабой 8 ступень двойкі, то вага кожнага сімвала роўны 8 біт.

Адзінка вымярэння 8 біт называецца 1 байт, таму прынята казаць, што двайковы код любога знака ў тэксце, якi захоўваецца на кампутары, займае адзін байт памяці.

Як ажыццяўляецца кадаванне

Любыя тэксты ўводзяцца ў памяць персанальнага кампутара з дапамогай клавіш клавіятуры, на якіх напісаныя лічбы, літары, знакі прыпынку і іншыя сімвалы. У аператыўную памяць яны перадаюцца ў двайковым кодзе, т. Е. Кожнаму сімвалу супастаўляецца звыклы для чалавека дзесяцярычнае код, ад 0 да 255, якому адпавядае двайковы код - ад 00000000 да 11111111.

Байтавыя кадаванне сімвалаў дазваляе працэсару, які выконвае апрацоўку тэксту, звяртацца да кожнага знаку асобна. У той жа час 256 знакаў цалкам дастаткова для прадстаўлення любой знакавай інфармацыі.

Кадоўка сімвалаў ASCII

Гэтая абрэвіятура на англійскай расшыфроўваецца як American standard code for information interchange.

Яшчэ на світанку кампутарызацыі стала відавочна, што можна прыдумаць самыя разнастайныя спосабы кадоўкі інфармацыі. Аднак для пераносу інфармацыі з адной ЭВМ на іншую патрабавалася распрацаваць адзіны стандарт. Так, у 1963 годзе ў ЗША з'явілася табліца кадоўкі ASCII. У ёй любому знаку камп'ютэрнага алфавіту пастаўлены ў адпаведнасць яго парадкавы нумар у двайковым прадстаўленні. Першапачаткова кадоўка ASCII выкарыстоўвалася толькі ў Злучаных Штатах, а затым стала міжнародным стандартам для ПК.

змест табліцы

Коды ASCII дзеляцца на 2 часткі. Міжнародным стандартам лічыцца толькі першая палова гэтай табліцы. У яе ўваходзяць сімвалы з парадкавымі нумарамі ад 0 (кадуецца як 00000000) да 127 (код 01.111.111).

Парадкавы нумар

N

Кадоўка тэксту ASCII

сімвал

0 - 31

0000 0000 - 0001 1111

Сімвалы з N ад 0 да 31 называюць кіраўнікамі. Іх функцыяй з'яўляецца «кіраўніцтва» працэсам вываду тэксту на манітор або друкавалая прылада, падача гукавога сігналу і да т.п.

32 - 127

0010 0000 - 0111 1111

Сімвалы з N ад 32 да 127 (стандартная частка табліцы) - вялікія і малыя літары лацінскага алфавіту, 10-ные лічбы, знакі прыпынку, а таксама розныя дужкі, камерцыйныя і інш. Сімвалы. Сімвалам 32 пазначаецца прабел.

128 - 255

1000 0000 - 1111 1111

Сімвалы з N ад 128 да 255 (альтэрнатыўная частка табліцы або кодавая старонка) могуць мець розныя варыянты, кожны з якіх мае свой нумар. Кодавая старонка выкарыстоўваецца для задання нацыянальных алфавітаў, якія выдатныя ад лацінскага. У прыватнасці, менавіта з яе дапамогай ажыццяўляецца кадоўка ASCII для рускіх знакаў.

У табліцы кадоўкі вялікія і малыя літары ідуць адзін за адным у алфавітным парадку, а лічбы - па ўзрастанні значэнняў. Такі прынцып захоўваецца і для рускага алфавіту.

кіраўнікі сімвалы

Табліца кадоўкі ASCII першапачаткова стваралася для прыёму і перадачы інфармацыі па такім ужо даўно не якім карыстаецца прыладзе, як тэлетайп. У сувязі з гэтым у набор сімвалаў былі ўключаныя непечатаемые, якія выкарыстоўваюцца ў якасці каманд для кіравання гэтым прыладай. Падобныя каманды ўжываліся і ў такіх докомпьютерную метадах абмену паведамленнямі, як азбука Морзэ, і пр.

Самым распаўсюджаным «тэлетайпным» сімвалам з'яўляецца NUL (00, «нулявы»). Ён і па гэты дзень выкарыстоўваецца ў большасці моў праграмавання, пазначаючы прыкмета канца радка.

Дзе ўжываюць кадоўку ASCII

Амерыканскі стандартны код неабходны не толькі для ўводу тэкставай інфармацыі з клавіятуры. Яго таксама выкарыстоўваюць у графіцы. У прыватнасці, у праграме ASCII Art Maker выявы розных пашырэнняў ўяўляюць сабой спектр сімвалаў кадоўкі ASCII.

Падобныя прадукты бываюць двух тыпаў: якія выконваюць функцыю графічных рэдактараў шляхам пераўтварэння выявы ў тэкст і канвертуе «малюнкі» у ASCII-графіку. Напрыклад, вядомы смайлік з'яўляецца яркім прыкладам кодировочного знака.

ASCII можа выкарыстоўвацца і пры стварэнні дакумента HTML. У такім выпадку вы можаце ўводзіць нейкі набор знакаў, а пры праглядзе старонкі на экране з'явіцца сімвал, які адпавядае дадзеным коду.

ASCII неабходны і для стварэння шматмоўных сайтаў, так як знакі, якія не ўваходзяць у канкрэтную нацыянальную табліцу, замяняюцца ASCII-кодамі.

некаторыя асаблівасці

Для кадавання тэкставай інфармацыі ў кадоўцы ASCII першапачаткова выкарыстоўвалі 7 біт (адзін заставаўся пустым), аднак сёння яна працуе як 8-бітная.

Літары, якія размяшчаюцца ў калонках, якія знаходзяцца зверху і знізу, адрозніваюцца адзін ад аднаго толькі адным-адзіным бітам. Гэта значна зніжае ступень складанасці праверкі.

Прымяненне ASCII ў Microsoft Office

Пры неабходнасці гэты від кадавання тэкставай інфармацыі можа выкарыстоўвацца ў тэкставых рэдактарах карпарацыі Microsoft, такіх як Notepad і Office Word. Аднак пры наборы тэксту ў такім выпадку будзе немагчыма выкарыстоўваць некаторыя функцыі. Напрыклад, вы не зможаце ажыццяўляць вылучэнне тлустым шрыфтам, так як кадоўка ASCII захоўвае толькі сэнс інфармацыі, ігнаруючы яе агульны выгляд і форму.

стандартызацыя

Арганізацыя ISO прыняла стандарты ISO 8859. Гэтая група вызначае васьмібітнай кадоўкі для розных моўных груп. У прыватнасці, ISO 8859-1 - гэта Extended ASCII, якая ўяўляе сабой табліцу для Злучаных Штатаў і краін Заходняй Еўропы. А ISO 8859-5 - гэта табліца, якая ўжываецца для кірыліцы, у тым ліку для рускай мовы.

Па шэрагу гістарычных прычын стандарт ISO 8859-5 выкарыстоўваўся вельмі нядоўга.

Для рускай мовы на дадзены момант рэальна ўжываюцца кадоўкі:

  • CP866 (Code Page 866) або DOS, якая часта называецца альтэрнатыўнай кадоўкай ДАСТ. Яна актыўна выкарыстоўвалася да сярэдзіны 90-х гадоў мінулага стагоддзя. На дадзены момант практычна не выкарыстоўваецца.
  • ЯКІЯ-8. Кадоўка была распрацавана ў 1970-80-я гады, і на дадзены момант гэта агульнапрыняты стандарт для паштовых паведамленняў у Рунэце. Яна шырока ўжываецца і ў АС сямейства Unix, у тым ліку Linux. «Рускі» варыянт ЯКІЯ-8 называецца ЯКІЯ-8R. Акрамя таго, існуюць версіі і для іншых кірылічных моў, напрыклад ўкраінскага.
  • Code Page 1251 (CP 1251, Windows - 1251). Распрацаваны карпарацыяй Microsoft для забеспячэння падтрымкі рускай мовы ў асяроддзі Windows.

Асноўным вартасцю першага стандарту CP866 было захаванне псевдографіческіх сімвалаў на тых жа пазіцыях, што і ў Extended ASCII. Гэта дазваляла запускаць без змен тэкставыя праграмы, замежнай вытворчасці, такія як вядомы Norton Commander. На дадзены момант CP866 ўжываецца для праграм, распрацаваных пад Windows, якія працуюць у поўнаэкранным тэкставым рэжыме або ў тэкставых вокнах, у тым ліку ў FAR Manager.

Камп'ютэрныя тэксты, напісаныя ў кадоўцы CP866, у апошні час сустракаюцца досыць рэдка, аднак менавіта яна ўжываецца для рускіх імёнаў файлаў у "Виндоус".

"Юнікод"

На дадзены момант найбольш шырокае распаўсюджанне атрымала менавіта гэтая кадоўка. Коды "Юнікода" падзеленыя на вобласці. Першая (ад U + 0000 да U + 007F) уключае сімвалы набору ASCII з кодамі. Затым ідуць вобласці знакаў розных нацыянальных пісьменнасцяў, а таксама пунктуацыйныя знакі і тэхнічныя сымбалі. Акрамя таго, частка кодаў "Юнікода" зарэзерваваная на выпадак ўзнікнення неабходнасці ўключыць новыя сімвалы ў будучыні.

Цяпер вы ведаеце, што ў кадоўцы ASCII кожны знак ўяўляецца як камбінацыя 8 нулёў і адзінак. Неадмыслоўцам гэтая інфармацыя можа здацца непатрэбнай і нецікавай, але хіба вам не хоча ведаць, што адбываецца «у мазгах" вашага ПК ?!

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 be.birmiss.com. Theme powered by WordPress.