Bit - Bit

Bit je nejzákladnější jednotka informace ve výpočetní a digitální komunikace . Jméno je kontrakce o binární číslice . Bit představuje logický stav s jednou ze dvou možných hodnot . Tyto hodnoty jsou nejčastěji reprezentovány buď 1 “ nebo „ 0 , ale běžně se používají i jiné reprezentace jako true / false , yes / no , + / - nebo on / off .

Soulad mezi těmito hodnotami a fyzickými stavy základního úložiště nebo zařízení je věcí konvence a různá přiřazení lze použít i v rámci stejného zařízení nebo programu . Může být fyzicky implementován pomocí dvoustavového zařízení.

Symbol pro binární číslici je buď „bit“ podle doporučení normy IEC 80000-13 : 2008, nebo malé písmeno „b“, jak doporučuje norma IEEE 1541-2002 .

Sousedící skupina binárních číslic se běžně nazývá bitový řetězec , bitový vektor nebo jednorozměrné (nebo vícerozměrné) bitové pole . Skupina osmi binárních číslic se nazývá jeden  bajt , ale historicky není velikost bajtu striktně definována. Poloviční, plná, dvojitá a čtyřnásobná slova se často skládají z několika bajtů, což je malá síla dvou.

V teorii informace , jeden bit je informační entropie z binární náhodné proměnné, která je 0 nebo 1, se stejnou pravděpodobností, nebo informace, které jsou získané, když je hodnota této proměnné znám. Jako jednotka informace je bit také známý jako shannon , pojmenovaný podle Clauda E. Shannona .

Dějiny

Kódování dat diskrétními bity bylo použito v děrných kartách vynalezených Basile Bouchonem a Jean-Baptiste Falconem (1732), vyvinutých Josephem Marie Jacquardem (1804), a později adoptovaných Semyonem Korsakovem , Charlesem Babbageem , Hermannem Hollerithem a raných výrobci počítačů jako IBM . Variantou této myšlenky byla perforovaná papírová páska . Ve všech těchto systémech médium (karta nebo páska) koncepčně neslo řadu pozic otvorů; každou pozici bylo možné buď prorazit, nebo ne, a tak nést jeden bit informací. Kódování textu pomocí bitů bylo také použito v Morseově abecedě (1844) a raných digitálních komunikačních strojích, jako jsou dálnopisy a burzovní automaty (1870).

Ralph Hartley navrhl použití logaritmické míry informací v roce 1928. Claude E. Shannon poprvé použil slovo „bit“ ve svém klíčovém dokumentu z roku 1948 „ Matematická teorie komunikace “. Jeho původ přisuzoval Johnu W. Tukeyovi , který 9. ledna 1947 napsal poznámku Bell Labs, ve které zkrátil „binární informační číslici“ jednoduše „kousat“. Vannevar Bush napsal v roce 1936 „kousky informací“, které mohly být uloženy na děrné štítky používané v tehdejších mechanických počítačích. První programovatelný počítač, který postavil Konrad Zuse , používal pro čísla binární zápis.

Fyzická reprezentace

Bit může být uložen digitálním zařízením nebo jiným fyzickým systémem, který existuje v jednom ze dvou možných odlišných stavů . Mohou to být dva stabilní stavy klopného obvodu, dvě polohy elektrického spínače , dvě různé úrovně napětí nebo proudu povolené obvodem , dvě různé úrovně intenzity světla , dva směry magnetizace nebo polarizace , orientace reverzibilního dvojitého řetězcová DNA atd.

Bity lze implementovat v několika formách. Ve většině moderních výpočetních zařízení je bit obvykle reprezentován elektrickým napětím nebo proudovým impulzem nebo elektrickým stavem klopného obvodu.

U zařízení využívajících pozitivní logiku je číselná hodnota 1 (nebo logická hodnota true) reprezentována kladnějším napětím vzhledem k zobrazení 0 . Specifická napětí jsou různá pro různé logické rodiny a jsou povoleny variace, které umožňují stárnutí součásti a odolnost proti rušení. Například v logice tranzistor -tranzistor (TTL) a kompatibilních obvodech jsou číselné hodnoty 0 a 1 na výstupu zařízení reprezentovány ne více než 0,4 voltu, respektive ne méně než 2,6 voltu; zatímco vstupy TTL jsou specifikovány tak, aby rozpoznávaly 0,8 voltů nebo nižší jako 0 a 2,2 voltů nebo vyšší jako 1 .

Přenos a zpracování

Bity jsou přenášeny jeden po druhém v sériovém přenosu a větším počtem bitů v paralelním přenosu . Bitovou operací případně zpracovává bity jeden po druhém. Rychlost přenosu dat se obvykle měří v desítkových násobcích SI jednotkového bitu za sekundu (bit/s), například kbit/s.

Úložný prostor

V prvních neelektronických zařízeních pro zpracování informací, jako je Jacquardův tkalcovský stav nebo Babbageův analytický motor , byl bit často uložen jako poloha mechanické páky nebo převodu nebo přítomnost nebo nepřítomnost otvoru v konkrétním bodě papírové karty nebo páska . První elektrická zařízení pro diskrétní logiku (jako jsou řídicí obvody výtahů a semaforů , telefonní spínače a počítač Konrada Zuse) představovaly bity jako stavy elektrických relé, které mohly být buď „otevřené“ nebo „uzavřené“. Když byla relé nahrazena elektronkami , počínaje čtyřicátými léty, stavitelé počítačů experimentovali s různými způsoby skladování, jako jsou tlakové impulsy pohybující se po linii zpoždění rtuti , náboje uložené na vnitřním povrchu katodové trubice nebo neprůhledné skvrny tisknout na sklo disků podle fotolitografických technik.

V 50. a 60. letech 20. století byly tyto metody do značné míry nahrazeny magnetickými paměťovými zařízeními, jako je paměť s magnetickým jádrem , magnetické pásky , bubny a disky , kde trochu představovala polarita magnetizace určité oblasti feromagnetického filmu nebo změna polarity z jednoho směru do druhého. Stejný princip byl později použit v paměti magnetických bublin vyvinuté v 80. letech minulého století a stále se nachází v různých položkách magnetických proužků, jako jsou lístky na metro a některé kreditní karty .

V moderní polovodičové paměti , jako je dynamická paměť s náhodným přístupem , mohou být dvě hodnoty bitu reprezentovány dvěma úrovněmi elektrického náboje uloženého v kondenzátoru . V určitých typech programovatelných logických polí a paměti jen pro čtení může být bit reprezentován přítomností nebo nepřítomností vodivé cesty v určitém bodě obvodu. V optických discích je bit kódován jako přítomnost nebo nepřítomnost mikroskopické jámy na odrazném povrchu. V jednorozměrných čárových kódech jsou bity kódovány jako tloušťka střídajících se černých a bílých čar.

Jednotka a symbol

Bit není definován v Mezinárodním systému jednotek (SI). Nicméně, Mezinárodní elektrotechnické komise vydala normy IEC 60027 , která určuje, že symbol pro binární číslice by měly být ‚trochu‘, a to by mělo být použito ve všech násobcích, jako je například ‚kbit‘ pro kb. Malé písmeno „b“ je však také široce používáno a bylo doporučeno standardem IEEE 1541 (2002) . Naproti tomu velká písmena 'B' jsou standardní a obvyklý symbol pro bajt.

Desetinný
Hodnota  Metrický 
1000 kbit kilobit
1 000 2 Mbit megabit
1000 3 Gbit gigabitový
1000 4 Tbit terabit
1000 5 Pbit petabit
1000 6 Ebit exabitovat
1000 7 Zbit zettabit
1000 8 Ybit yottabit
Binární
Hodnota  IEC  Tradiční 
1024 Kibit kibibit Kbit Kb kilobit
1024 2 Mibit mebibit Mbit Mb megabit
1024 3 Gibit gibibit Gbit Gb gigabitový
1024 4 Tibit tebibit Tbit Tb terabit
1024 5 Pibit pebibit -
1024 6 Eibit exbibit -
1024 7 Zibit zebibit -
1024 8 Yibit yobibit -

Více bitů

Více bitů může být vyjádřeno a reprezentováno několika způsoby. Pro usnadnění reprezentace běžně se opakujících skupin bitů v informační technologii se tradičně používalo několik jednotek informací . Nejběžnější je jednotkový bajt , vytvořený Wernerem Buchholzem v červnu 1956, který byl historicky používán k reprezentaci skupiny bitů použitých k zakódování jednoho znaku textu (dokud nezabralo vícebajtové kódování UTF-8 ) v počítači a za tímto účelem důvod, proč byl použit jako základní adresovatelný prvek v mnoha počítačových architekturách . Trend v hardwarovém designu konvergoval k nejběžnější implementaci používání osmi bitů na bajt, jak je dnes široce používán. Avšak kvůli nejednoznačnosti spoléhání se na základní hardwarový design byl jednotkový oktet definován tak, aby výslovně označoval sekvenci osmi bitů.

Počítače obvykle manipulují s bity ve skupinách pevné velikosti, běžně nazývaných „ slova “. Stejně jako bajt se počet bitů ve slově také liší podle hardwarového provedení a obvykle se pohybuje mezi 8 a 80 bity, nebo dokonce více v některých specializovaných počítačích. V 21. století mají maloobchodní osobní nebo serverové počítače velikost slova 32 nebo 64 bitů.

Mezinárodní soustava jednotek definuje řadu desetinných předpon pro násobky standardizovaných jednotek, které se běžně používají rovněž s bitem a bytem. Předpony kilo (10 3 ), přes yotta (10 24 ) zvýšit o násobky jeden tisíc, a odpovídající jednotky jsou kb (kb) skrz yottabit (Ybit).

Informační kapacita a komprese informací

Když je informační kapacita úložného systému nebo komunikačního kanálu prezentována v bitech nebo bitech za sekundu , často se to týká binárních číslic, což je kapacita hardwaru počítače pro ukládání binárních dat ( 0 nebo 1 , nahoru nebo dolů, aktuální nebo ne , atd.). Informační kapacita úložného systému je pouze horní hranicí množství informací v něm uložených. Pokud dvě možné hodnoty jednoho bitu úložiště nejsou stejně pravděpodobné, tento bit úložiště obsahuje méně než jeden bit informací. Pokud je hodnota zcela předvídatelná, pak čtení této hodnoty neposkytuje vůbec žádné informace (nulové entropické bity, protože nedochází k rozlišení nejistoty, a proto nejsou k dispozici žádné informace). Pokud počítačový soubor, který používá n  bitů úložiště, obsahuje pouze m  <  n  bitů informací, pak lze tyto informace v zásadě zakódovat přibližně v m  bitech, alespoň v průměru. Tento princip je základem technologie komprese dat. Použitím analogie se binární číslice hardwaru vztahují k množství dostupného úložného prostoru (jako je počet kbelíků, které jsou k dispozici k uložení věcí), a k informačnímu obsahu, který má různé úrovně granularity (jemné nebo hrubé, tj. komprimované nebo nekomprimované informace). Když je zrnitost jemnější - když jsou informace více komprimované - stejný kbelík pojme více.

Odhaduje se například, že kombinovaná technologická kapacita světa pro ukládání informací poskytuje 1 300 exabajtů hardwarových číslic. Když je však tento úložný prostor zaplněn a odpovídající obsah je optimálně komprimován, představuje to pouze 295 exabajtů informací. Při optimálním stlačení se výsledná nosnost blíží Shannonově informaci nebo informační entropii .

Bitové výpočty

Některé instrukce bitového počítačového procesoru (například bitová sada ) fungují spíše na úrovni manipulace s bity než manipulace s daty interpretovanými jako agregát bitů.

V 80. letech, kdy se bitmapové počítačové displeje staly populární, některé počítače poskytovaly specializované pokyny pro přenos bitových bloků pro nastavení nebo kopírování bitů, které odpovídaly dané obdélníkové oblasti na obrazovce.

Ve většině počítačů a programovacích jazyků, když se odkazuje na bit ve skupině bitů, jako je bajt nebo slovo, je obvykle určen číslem od 0 nahoru odpovídajícím jeho poloze v bajtu nebo slově. 0 však může odkazovat na nejvíce nebo nejméně významný bit v závislosti na kontextu.

Další informační jednotky

Podobné točivému momentu a energii ve fyzice; Informace-teoretické informace velikost a ukládání dat mají stejný rozměrnost z jednotek měření , ale je obecně žádný význam sčítání, odčítání nebo jinak kombinovat jednotky matematicky, i když jeden může působit jako vázaný na straně druhé.

Mezi informační jednotky používané v informační teorii patří shannon (Sh), přirozená informační jednotka (nat) a hartley (Hart). Jeden shannon je maximální očekávaná hodnota pro informace potřebné k určení stavu jednoho bitu úložiště. Ty souvisejí o 1 Sh ≈ 0,693 nat ≈ 0,301 Hart.

Někteří autoři také definují binit jako libovolnou informační jednotku ekvivalentní určitému pevnému, ale neurčenému počtu bitů.

Viz také

Reference

externí odkazy

  • Bit Calculator - nástroj poskytující převody mezi bit, byte, kilobit, kilobyte, megabit, megabajt, gigabit, gigabajt
  • BitXByteConverter - nástroj pro výpočet velikostí souborů, kapacity úložiště a digitálních informací v různých jednotkách