Kodowanie Unicode: standard kodowania znaków

Data:

2019-02-11 03:20:13

Przegląd:

582

Ranking:

1Kochać 0Niechęć

Udział:

Table of contents:

Każdy użytkownik Internetu, próbując dostosować tę lub inną jego funkcję przynajmniej raz widział na wyświetlaczu napisane alfabetem łacińskim słowo «Unicode». Co to jest, dowiecie się, czytając ten artykuł.

unicode że to

Określenie

Kodowanie "Unicode" ó standard kodowania znaków. Został on zaproponowany organizacją non-Unicode, Inc. w 1991 roku. Standard został zaprojektowany w celu zjednoczenie jak największej liczby różnorodnej znaków w jednym dokumencie. Strona, która została stworzona na jego podstawie, może zawierać litery i znaki z różnych języków (rosyjskiego do koreańskiego) i znaki matematyczne. Przy tym wszystkie znaki w tym formacie są wyświetlane bez problemów.

Przyczyny tworzenia

Kiedyś, na długo przed pojawieniem się jednolitego systemu "Unicode", kodowanie wybrany na podstawie preferencji autora dokumentu. Z tego powodu często, aby przeczytać jeden dokument, trzeba było korzystać z różnych tabel. Czasami trzeba było zrobić kilka razy, co znacznie усложняло życie przeciętnemu użytkownikowi. Jak już wspomniano, rozwiązanie tego problemu w 1991 roku został poproszony organizacją non-Unicode, Inc., oferuje nowy typ kodowania znaków. Został powołany połączyć przestarzałych i różne standardy. "Unicode" - kodowanie, która озволила osiągnąć pomyślenia na ten moment: stworzyć narzędzie, obsługujący ogromną ilość znaków. Wynik przerósł wielu gotowości ó pojawiły się dokumenty, jednocześnie zawierające zarówno angielski, jak i tekst rosyjski, łacina i wyrażeń matematycznych.

Bardziej:

Co to jest Ethernet – główne zalety internetu-sieci

Co to jest Ethernet – główne zalety internetu-sieci

O tym, co to jest Ethernet, okazało się w latach siedemdziesiątych XX wieku. Wynalazł ten typ sieci lokalnej Robert Metcalfe, który pracował w tym czasie na firmy Xerox. W latach 70-tych Metcalf otworzył własną firmę 3com, gdzie zakończyła się opraco...

UAC: wyłączyć lub ułaskawienie

UAC: wyłączyć lub ułaskawienie

W odległej już od nas w 2006 roku światowa komputerowa opinia publiczna była wstrząsa wyjściem SYSTEMU Windows Vista. Na nowy system od razu runął niesamowity lawinę negatywnych, powód dla którego nadal zostały.Jednym z nich była opcja UAC, wyłączyć ...

Jak dodać muzykę w iTunes: trzy proste sposoby

Jak dodać muzykę w iTunes: trzy proste sposoby

Telefony komórkowe kilku lat przekształciliśmy się z zwykłego narzędzia komunikacji w gadżety, które zastępują konsole do gier, książki, wideo i odtwarzaczy audio. A jeśli nie tak dawno muzykę można było po prostu pobrać z witryn internetowych i usta...

Ale stworzenia jednolitego kodowania poprzedzone koniecznością rozwiązania wielu problemów, które pojawiły się z powodu ogromnej różnorodności standardów już istniejących na ten moment. Najczęstsze z nich to:

  • Elfów instrukcje, lub «кракозябры»;
  • Ograniczony zestaw znaków;
  • Problem konwersji kodowania;
  • Kopia lustrzana czcionek.

unicode standard

Mały ekskurs historyczny

Wyobraź sobie, że na dworze 80-tych. technika Komputerowa nie jest jeszcze tak rozpowszechniona i ma wygląd inny od dzisiejszego. W tym czasie każdy SYSTEM jest wyjątkowy i dopracowany każdym entuzjastów pod konkretne potrzeby. Konieczność wymiany informacji zamienia się w dodatkową poprawę czegokolwiek. Próba przeczytać dokument, który powstał pod inny SYSTEM operacyjny, często wyświetla dziwne znaki, i zaczynają się gry z kodowaniem. Nie zawsze udaje się zrobić to szybko, a czasami wymagany dokument można otworzyć za pół roku, albo i później. Ludzie, którzy często wymieniają się informacjami, tworzą dla siebie tabeli konwersji. I oto praca nad nimi identyfikuje ciekawy szczegół: tworzyć trzeba je na dwa sposoby: «z mojej w ci» i z powrotem. Zrobić banalną inwersję obliczeń maszyna nie może dla niej w prawej kolumnie oryginał, a w lewym - wynik, ale nie odwrotnie. Jeśli pojawiała się potrzeba używać żadnych specjalnych znaków w dokumencie, należy je najpierw dodać, a potem jeszcze i wyjaśnić partnerowi, co ma zrobić, aby znaki te nie przekształciły się w óкракозябры». I nie zapominajmy, że pod każdą kodowanie musiał opracować lub wprowadzać własne czcionki, co doprowadziło do powstania ogromnej ilości aktów w SYSTEMIE.

Wyobraź sobie jeszcze, że na stronie czcionek zobaczysz 10 sztuk identycznych Times New Roman z małymi oznaczeń: dla UTF-8, UTF-16, ANSI, UCS-2. Teraz zdajesz sobie sprawę, że opracowanie uniwersalnego standardu była pilnej potrzeby?

kodowanie Unicode

«Ojcowie-twórcy»

Początki tworzenia Unicode należy szukać w 1987 roku, kiedy Joe Becker z Xerox razem z Lee Collins i Markiem Davisem z firmy Apple rozpoczął badania w dziedzinie praktycznego tworzenia uniwersalnego zestawu znaków. W sierpniu 1988 roku, Joe Becker opublikował projekt oferty w zakresie tworzenia 16-bitowym międzynarodowej, wielojęzycznej systemu kodowania.

Przez kilka miesięcy grupa robocza Unicode została poszerzona o Kena Whistler i Mike ' a Кернегана z RLG, Glenn Wright z Sun Microsystems i wielu innych specjalistów, co pozwoliło zakończyć pracy, po wcześniejszym kształtowania jednolitego standardu kodowania.

unicode kodowanie

Opis

W oparciu o Unicode leży pojęcie symbolu. Pod tym określeniem rozumie się abstrakcyjne zjawisko, istniejącego w konkretnej postaci piśmiennictwa i реализуемое przez grafem (swoje «portrety»). Każdy znak jest określony w "Unicode" unikalnym kodem, należących do danego modułu standardu. Na przykład, grafem B istnieje i w angielskim i w polskim alfabecie, ale w Unicode jej odpowiadają 2 różnych znaków. Do nich stosuje się transformację w małą literę, czyli każdy z nich opisany jest kluczem bazy danych, zestaw właściwości i pełną nazwą.

Zalety Unicode

Od innych współczesnych kodowanie "Unicode" różniła się ogromnym zapasem znaków dla ószyfrowania» znaków. Rzecz w tym, że jego poprzednicy mieli 8 bitów, czyli wspierali 28 znaków, a to nowe opracowanie miała już 216 znaków, co było wielkim krokiem naprzód. To pozwoliło zakodować praktycznie wszystkie istniejące i typowe alfabetów.

Wraz Z pojawieniem się"Unicode" już potrzebować użyć tabeli konwersji: jak jednolity standard on po prostu patrzył na nie ich potrzebę. Dokładnie tak samo to już przeszłość i «кракозябры» - jednolity standard zrobił ich niemożliwe, tak jak i wykluczył konieczność tworzenia ujęć czcionek.

Rozwój Unicode

Oczywiście, że postęp nie stoi w miejscu, i od momentu pierwszej prezentacji minęło już 25 lat. Jednak kodowanie "Unicode" uparcie utrzymuje swoją pozycję w świecie. W dużej mierze było to możliwe dzięki temu, że stał się on łatwo внедряемым i rozprzestrzenił, będąc uznanym twórcom własnościowego (płatnego) i otwartego oprogramowania.

kodowanie unicode (standard kodowania znaków)

Nie należy sądzić, że dzisiaj nam jest dostępna ta sama kodowanie "Unicode", co ćwierć wieku temu. W tej chwili jej wersja zmieniła się na 5.x.x, a liczba kodowanych znaków wzrosła do 231. Od możliwości korzystania większy zapas znaków chcieli, aby nadal utrzymać wsparcie dla Unicode-16 (kodowania, gdzie maksymalna ich liczba została ograniczona cyfrą 216). Od momentu swojego powstania do wersji 2.0.0 "Unicode-standard" zwiększył liczbę znaków, które w nim były, praktycznie 2 razy. Wzrost możliwości kontynuował w kolejnych latach. Do wersji 4.0.0 już pojawiła się potrzeba zwiększenia sam standard, co było zrobione. W wyniku "Unicode" znalazł ten widok, w jakiej znamy ją dzisiaj.

unicode co to jest

Co jeszcze jest w Unicode?

Oprócz ogromnej, stale пополняющегося liczby znaków, "Unicode"-kodowanie informacji tekstowych ma jeszcze jedną przydatną cechę. Chodzi o tzw. normalizacji. Zamiast przerzucać cały dokument znak po znaku i wystawiać odpowiednie ikony z tabeli zgodności, jest to jeden z istniejących algorytmów normalizacji. O co chodzi?

Zamiast marnować zasoby mocy obliczeniowej maszyny na regularne skanowanie tego samego znaku, który może być podobny w różnych alfabecie, wykorzystuje specjalny algorytm. Pozwala on wynieść podobne symbole oddzielną графой tabeli odnośników i odwoływać się już do nich, a nie raz po raz, aby ponownie sprawdzić wszystkie dane.

Takich algorytmów opracowano i wdrożono cztery. W każdym z nich konwersja odbywa się według ściśle określonej zasady, отличающемуся od innych, więc nazwać jakiś jeden z nich najbardziej skuteczne nie jest możliwe. Każdy został zaprojektowany dla określonych potrzeb, został wdrożony i jest stosowany z powodzeniem.

unicode kodowanie informacji tekstowej

Rozszerzanie normy

W Ciągu 25 lat swojej historii kodowanie "Unicode" otrzymała prawdopodobnie najbardziej rozpowszechnione w świecie. Pod ten standard zmieniaja również programy i strony www. O szerokości stosowania może mówić fakt, że Unicode dziś korzysta ponad 60 % zasobów internetowych.

Teraz wiadomo, kiedy pojawił się standard "Unicode". Co to jest, wiesz także i w stanie ocenić wartość wynalazku dokonanego przez grupę specjalistów Unicode, Inc. ponad 25 lat temu.


Article in other languages:

AR: https://tostpost.com/ar/computers/17049-the-unicode-standard-character-encoding.html

BE: https://tostpost.com/be/kamputary/28705-kado-ka-yun-kod-standart-kadavannya-s-mvala.html

DE: https://tostpost.com/de/computer/28722-codierung-unicode-standard-zeichenkodierung-aus.html

ES: https://tostpost.com/es/los-ordenadores/28751-la-codificaci-n-unicode-la-norma-de-codificaci-n-de-caracteres.html

HI: https://tostpost.com/hi/computers/16107-the-unicode-standard-character-encoding.html

JA: https://tostpost.com/ja/computers/17630-unicode.html

KK: https://tostpost.com/kk/komp-yuterler/28677-kodirovka-yunikod-standart-kodtau-r-m-zder.html

PT: https://tostpost.com/pt/computadores/28550-codifica-o-unicode-norma-de-codifica-o-de-caracteres.html

TR: https://tostpost.com/tr/bilgisayarlar/31449-kodlama-unicode-karakter-kodlama-standard.html

UK: https://tostpost.com/uk/komp-yuteri/28643-koduvannya-yun-kod-standart-koduvannya-simvol-v.html

ZH: https://tostpost.com/zh/computers/16121-unicode.html






Alin Trodden - autor artykułu, redaktor
"Cześć, jestem Alin Trodden. Piszę teksty, czytam książki, Szukam wrażeń. I nie jestem zły w opowiadaniu ci o tym. Zawsze chętnie biorę udział w ciekawych projektach."

Uwaga (0)

Ten artykuł nie ma komentarzy, bądź pierwszy!

Dodaj komentarz

Nowości

Co to jest karta tunelowania Teredo firmy Microsoft: po co jest on potrzebny, jak działa i jak go wyłączyć?

Co to jest karta tunelowania Teredo firmy Microsoft: po co jest on potrzebny, jak działa i jak go wyłączyć?

Siódma wersja systemu Windows od momentu jej wyjścia przedstawił użytkownikom wiele niespodzianek. Tak, wielu odkryli w systemie (a dokładniej w «Menedżerze urządzeń») sterownik do karty tunelowania Teredo firmy Micros...

Porównanie przeglądarek: jaki najlepiej

Porównanie przeglądarek: jaki najlepiej

W dobie internetu przeglądarka jest najważniejszą rzeczą, która jest zainstalowana na komputerze. Dlatego warto zwrócić szczególną uwagę na ten element systemu. Jeśli przeglądarka jest dobry, surfowanie po internecie, będzie jest ...

Viber lub WhatsApp: co jest lepsze?

Viber lub WhatsApp: co jest lepsze?

Istniejące na dzień dzisiejszy komunikatorów prawie całkowicie odesłali w niebyt wysyłanie zwykłych SMS-ów w środowisku urządzeń mobilnych. Programy te wykonane SMS niewygodne i całkowicie nieopłacalną. W tym segmencie już prawdzi...

Przejście

Przejście "Metro-2". Opis gry

«Metro-2: Śmierć wodza” – długo oczekiwana kontynuacja projektu rosyjskich programistów, wydany na długo przed znanej na całym świecie Metro 2033. Ta gra wyszła w 2006 roku, a jej twórcą była firma Orion Games. O...

Naprawa pendrive po sformatowaniu: instrukcja

Naprawa pendrive po sformatowaniu: instrukcja

niestety, utrata danych znajdujących się na dyskach wymiennych jak zwykłych pamięci flash lub kart pamięci - jedno z najbardziej rozpowszechnionych zjawisk. Przy czym nie zawsze jest to związane z fizycznymi awariami lub przez pra...

Jak usunąć interfejs w

Jak usunąć interfejs w "COP: GO" za pomocą konsoli poleceń?

gry Komputerowej "Counter Strike: GO" jest jednym z najbardziej popularnych strzelanek, w którą grają tysiące użytkowników. Tutaj ogromną ilość poleceń konsoli, które pozwalają dostosować interfejs użytkownika, jak chcesz. Ale któ...