Šestibitový znakový kód - Six-bit character code
Six-bitový kód znaku je kódování znaků určen pro použití v počítačích s slovo délky násobek 6. šest bitů lze pouze kódování 64 odlišné znaky, takže tyto kódy obecně obsahovat pouze velká písmena, číslice, některé interpunkční znaky , a někdy i ovládání postav. 7-track magnetická páska formát byl vyvinut pro ukládání dat do těchto kódů, spolu s další paritní bit .
Typy šestbitových kódů
Časný šestbitový binární kód byl použit pro Braillovo písmo , čtecí systém pro nevidomé, který byl vyvinut ve dvacátých letech 19. století.
Nejranější počítače se zabývaly pouze číselnými daty a neposkytovaly žádná ustanovení pro znaková data. Šestibitový BCD , s několika variantami, používala IBM na raných počítačích, jako je IBM 702 v roce 1953 a IBM 704 v roce 1954. Šestbitové kódování bylo nahrazeno 8bitovým kódem EBCDIC počínaje rokem 1964, kdy systém/ 360 standardizováno na 8bitových bajtech . Existuje několik variant tohoto typu kódu (viz níže ).
Šestbitové znakové kódy obecně následovaly pětibitový Baudotův kód a předcházely sedmbitovému ASCII . Jednou populární variantou byl DEC SIXBIT. Jedná se jednoduše o kódy znaků ASCII od 32 do 95 kódované od 0 do 63 odečtením 32 (tj. Sloupců 2, 3, 4 a 5 tabulky ASCII (16 znaků do sloupce), posunutých do sloupců 0 až 3, odečtením 2 od vysokých bitů); obsahuje mezeru, interpunkční znaménka, čísla a velká písmena, ale žádné kontrolní znaky. Protože neobsahoval žádné řídicí znaky, dokonce ani konec řádku, nebyl použit pro obecné zpracování textu. Nicméně, jména šesti postav, jako jsou názvy souborů a assembler symboly by mohly být uloženy v jediné 36-bitové slovo PDP-10 , a tři znaky vejde do každé slovo z PDP-1 znaky a dvě vejde do každé slovo PDP- 8 .
Šestbitové kódy by mohly kódovat více než 64 znaků pomocí znaků Shift Out a Shift In , v podstatě zahrnujících dvě odlišné sady 62 znaků a přepínání mezi nimi. Například oblíbený komunikační terminál IBM 2741 podporoval řadu znakových sad až pro 88 tiskových znaků plus řídicí znaky.
UTF-6 kódování bylo navrženo pro Unicode , ale byl nahrazen Punycode .
Šestibitový kód BCD
Six-bit BCD kód byl adaptace děrovaného kódu karty do binárního kódu . IBM použila termíny binárně kódované desítkové a BCD na variace BCD alphamerics používaných ve většině raných počítačů IBM, včetně řady IBM 1620 , IBM 1400 a členů bez desítkové architektury řady IBM 700/7000 .
COBOL databáze šestibitový kód
Šestbitový kód byl také použit v databázích COBOL, kde byly informace o konci záznamu ukládány samostatně.
Šestibitový kód karty s magnetickým proužkem
Šestbitový kód s přidaným lichým paritním bitem se používá na stopě 1 karet s magnetickým proužkem , jak je uvedeno v ISO/IEC 7811 -2.
Šestbitový kód DEC
Kód DEC SIXBIT obsahující několik řídicích znaků - spolu se SO/SI , umožňující rozšíření kódu - byl v roce 1963 specifikován jako ECMA - 1 (viz níže ). Další, méně obvyklá varianta se získá pouhým odstraněním vysokého bitu kódu ASCII v rozsahu 32 - 95 (kódy 32 - 63 zůstávají na svých pozicích, vyšší hodnoty od nich odečtou 64). Taková varianta byla někdy použita na DEC PDP-8 (1965).
Šestbitový kód FIELDATA
FIELDATA byl sedmbitový kód (s volitelnou paritou), z něhož bylo formálně definováno pouze 64 pozic kódu (zabírajících šest bitů). Varianty používaly počítače UNIVAC řady 1100. Tyto systémy považovaly kód za šestbitový kód a používaly 36bitové slovo (schopné uložit šest takto redukovaných znaků FIELDATA).
Šestibitový kód Braillova písma
Znaky v Braillově písmu jsou znázorněny pomocí šesti tečkovaných pozic uspořádaných do obdélníku. Každá pozice může obsahovat vyvýšenou tečku nebo ne, takže Braillovo písmo lze považovat za šestbitový binární kód. Některé modernější braillské systémy přidávají další dvě tečky, čímž se tyto systémy místo toho stávají osmibitovým kódem.
Šestbitové kódy pro binární kódování textu
Přenos binárních dat přes systémy, které jsou určeny pouze pro text, může někdy způsobit problémy. Například e-mail historicky podporoval pouze 7bitové kódy ASCII a odstranil by 8. bit, čímž by došlo k poškození binárních dat odesílaných přímo přes jakýkoli problémový poštovní server. Jiné systémy mohou způsobovat problémy nesprávnou interpretací řídicích znaků během ukládání nebo přenosu. Existuje řada schémat pro balení 8bitových dat do textových reprezentací, které mohou procházet systémy textové pošty, které se dekódují v cílovém umístění. Mezi příklady 6bitových podmnožin znaků používaných pro balení binárních dat patří Uuencode a Base64 . Tyto sady neobsahují žádné řídicí znaky (pouze tisknutelná čísla, písmena, interpunkci a možná mezeru) a umožňují přenos dat přes jakékoli médium, které je také schopné přenášet text čitelný pro člověka.
Příklady šestibitových kódů BCD
IBM, které ovládalo komerční zpracování dat, používá řadu šestibitových kódů, které byly svázány se znakovou sadou používanou na děrných kartách , viz BCD (kódování znaků) .
Níže jsou uvedeny další kódy znaků dodavatele s jejich ekvivalenty Unicode .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
0 0030 |
# 0023 |
@ 0040 |
TAPE MARK |
|||
1_ |
SP 0020 |
/ 002F |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
ZÁZNAMOVÁ ZNAČKA |
, 002C |
% 0025 |
|||
2_ |
- 002D |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
P 0050 |
Q 0051 |
R 0052 |
-0 002D 0030 |
0024 $ |
* 002A |
|||
3_ |
& 0026 |
0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Já 0049 |
+0 002B 0030 |
. 002E |
A 00A4 |
SKUPINOVÁ ZNAČKA |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
0 0030 |
= 003D |
- 2212 |
||||
1_ |
SP 0020 |
/ 002F |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
, 002C |
( 0028 |
||||
2_ |
- 2014 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
P 0050 |
Q 0051 |
R 0052 |
-0 002D 0030 |
0024 $ |
* 002A |
|||
3_ |
+ 002B |
0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Já 0049 |
+0 002B 0030 |
. 002E |
) 0029 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
: 003A |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
0 0030 |
= 003D |
60 2260 |
≤ 2264 |
! 0021 |
[ 005B |
1_ |
SP 0020 |
/ 002F |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
] 005D |
, 002C |
( 0028 |
→ 2192 |
61 2261 |
~ 007E |
2_ |
- 2212 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
P 0050 |
Q 0051 |
R 0052 |
% 0025 |
0024 $ |
* 002A |
↑ 2191 |
↓ 2193 |
> 003E |
3_ |
+ 002B |
0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Já 0049 |
< 003C |
. 002E |
) 0029 |
≥ 2265 |
? 003F |
; 003B |
Příklady šestibitových variant ASCII
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
SP 0020 |
! 0021 |
„ 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
„ 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
1_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
2_ |
@ 0040 |
0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Já 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
3_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
SP 0020 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
TAK 000E |
SI 000F |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
1_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
2_ |
NUL 0000 |
0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Já 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
3_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
ESC 001B |
DEL 007F |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
1_ |
SP 0020 |
! 0021 |
„ 0022 |
# 0023 |
£ 00A3 |
% 0025 |
& 0026 |
„ 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
2_ |
@ 0040 |
0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Já 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
3_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
0024 $ |
] 005D |
↑ 2191 |
← 2190 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
@ 0040 |
0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Já 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
1_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
2_ |
SP 0020 |
! 0021 |
„ 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
„ 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
GOST 6bitový kód
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
+ 002B |
- 002D |
/ 002F |
, 002C |
. 002E |
SP 0020 |
1_ |
E 23E8 |
↑ 2191 |
( 0028 |
) 0029 |
× 00D7 |
= 003D |
; 003B |
[ 005B |
] 005D |
* 002A |
' 2018 |
' 2019 |
60 2260 |
< 003C |
> 003E |
: 003A |
2_ |
А 0410 |
11 0411 |
В 0412 |
Г 0413 |
14 0414 |
15 0415 |
16 0416 |
17 0417 |
18 0418 |
19 0419 |
K 041A |
Л 041B |
М 041C |
1 041D |
О 041E |
П 041F |
3_ |
Р 0420 |
С 0421 |
Т 0422 |
У 0423 |
24 0424 |
25 0425 |
26 0426 |
27 0427 |
28 0428 |
29 0429 |
Ы 042B |
Ь 042C |
Э 042D |
Ю 042E |
Я 042F |
DEL 007F |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Příklad šestibitových braillských kódů
Následující tabulka ukazuje uspořádání znaků s hexadecimální hodnotou, odpovídajícím znakem ASCII, 6bitovými kódy Braillova písma (kombinace bodů), glyfem Braillova písma Unicode a obecným významem (skutečný význam se může měnit v závislosti na kontextu).
|
|
Viz také
- Binárně kódované desetinné číslo
- BCD (kódování znaků)
- Zobrazovací kód CDC
- DEC RADIX 50 / MOD40
- IBM SQUOZE
- Transcode IBM
- ASCII
- Baudotův kód
- EBCDIC
- Unicode
- ANSI X3.64
- UTF-8
- UTF-16
Reference
externí odkazy
- „Referenční příručka k počítači Control Data 1604-C“ (PDF) . (7.44 MB)
- „Standard ECMA pro 6bitový kód znaku vstupu/výstupu“ (PDF) . (1,53 MB)
- Referenční kód znaku SIXBIT Digital Equipment Corporation Systém kódování znaků SIXBIT