Příchod hackerů: praotec databází III.

9. 8. 2016
Doba čtení: 6 minut

Sdílet

Ilustrační obrázek
Autor: Depositphotos – stori
Ilustrační obrázek
IDS – Integrated Data Store – je někdy označován jako vůbec první DBMS. Společně s ním se zrodily síťové databázové modely, které ovládly svět počítačů až do nástupu relačních databází v 80. letech.

General Electric byla na počátku 60. let do jisté míry korporátním protipólem IBM. Společnost řídilo malé ústředí, jemuž byly podřízeny nejrůznější výrobní divize produkující prakticky všechny moderní výdobytky druhé poloviny dvacátého století – žárovkami počínaje, přes domácí spotřebiče až po sálové počítače a turbíny jaderných elektráren. Obrovský záběr byznysu GE vyžadoval značnou decentralizaci, což mělo své výhody i nevýhody. Na jednu stranu sice jednotlivé divize měly značnou míru nezávislosti na nejvyšším vedení, na stranu druhou byla GE jednou z prvních korporací, která řízení (management) považovala za univerzální dovednost, která nijak nesouvisí s tím, co (jaké odvětví či obor) řídíte, a nevyžaduje tedy odborné znalosti v dané oblasti.

Z toho vyplývající velký důraz kladený na standardizované finanční metriky znamenal, že v GE hrály již před více než půl stoletím prim témata jako forecasting, simulace a automatizace řízení. GE dokonce vytvořilo divizi PCSG – Production Control Services Group která pod vedením H.F. Dickieho aplikovala tzv. totální systémový přístup, zejména využívání počítačů a kybernetických principů při řízení průmyslové výroby. Není divu, že právě sem zamířil v roce 1960 z Dow Chemicals Charles Bachman, který měl v té době již rozsáhlé zkušenosti s využíváním počítačů ve výrobních podnicích i s návrhem prvních hierarchických počítačových databází (o systémech FGMRS a 9PAC jsme psali v předchozích dílech minisérie).

Charles Bachman, 2012 (Wikipedie)

Informační sklady

Necelé dva roky po nástupu do GE připravil Bachman pro vedení GE ISTF (Information Systems Task Force) prezentaci „Zavedení počítačů jako nového zdroje v našich podnicích“. Ta měla sloužit jako argument pro vývoj integrovaných podnikových informačních systémů a funkce jejich návrhářů (dnes bychom je asi nazvali podnikoví či informační architekti).

Zavedená rovnováha mezi marketingem, výrobou, financemi a vývojem je stále častěji narušována drzými mladíky, kteří si myslí, že vědí všechno o práci všech ostatních a navrhují, jak ji změnit. Byznys se musí naučit je i jejich nástroje přijmout a využívat.

Úryvek z textu prezentace Ch. Bachmana

Bachman zdůrazňoval, že podobně jako tradiční výroba má oddělenou fázi návrhu a vývoje, i v případě výpočetních systémů je třeba navrhovat je předem jako funkční celek, jehož klíčovým subsystémem je informační sklad: „Údržba informačních skladů je jedním z nejdůležitějších úkolů současných počítačů. Je to také věc, kterou prozatím zvládají jen velmi špatně.“

Dnes, v době integrovaných datových skladů, datové governance, relačních a in-memory databází, MDM či pokročilé práce s metadaty podobné věci bereme jako samozřejmé, na počátku šedesátých let byly ale počítače stále spíše stroje navržené k počítání než ke správě a třídění informací – a tomu do značné míry odpovídaly i možnosti jejich programovaného vybavení.

ITSF se pustila do experimentálního vývoje v továrně ve Filadelfii, jeho výsledkem byl integrovaný systém MIACS, který zahrnoval automatizaci plánování i výroby a provozu, nebo skladových zásob. Ve verzi pro mainframe GE 225 umožňoval například optimalizaci objednávek materiálu, vyřizování výrobních objednávek, správu skladu a další funkce – podle Bachmana se jednalo o vůbec první integrovaný systém pro řízení výroby a přímého předchůdce systémů MRP (o nich a jejich „otci“ českého původu Josefu Orlickém jsme již psali). GE postupně nasadila MICAS v řadě továren a ve druhé polovině 60. let jej také prodávala jako softwarový balíček pro výkonnější počítače řady GE 600 – jednalo se o jeden z mála skutečně úspěšných plně integrovaných výrobních informačních systémů své doby. Co bylo ale podstatnější, jednou z klíčových komponent MICAS byl Bachmanův „Informační sklad“.

IDS – Integrated Data Store

IDS byl jednou z prvních databází, která uvedla do praxe síťový navigační databázový model, jenž nabízel mnohem flexibilnější vztahy mezi záznamy (entitami) než model hierarchický. Nový typ databází umožnil pochopitelně i technologický vývoj – o něco větší operační paměti a postupný přechod od páskových k diskovým pamětem (i když navigační či síťové databáze jsou stále primárně určeny pro páskové systémy). Se síťovým modelem přišla zejména možnost využít databáze v řadě nových oblastí a rychlejší vyhledávání v nich – jednak proto, že již nebylo třeba vždy postupovat po celém hierarchickém stromě, a také díky sadě speciálních příkazů pro manipulaci s daty, z nichž se postupně zrodily první jazyky DML (Data Manipulation Language). To vše se ale prozatím odehrávalo na počítači GE 225 s pouhými 40 kilobajty RAM, která musela pojmout jak IDS, tak MIACS.

Dalším stupněm vývoje IDS byl systém WEYCOS, který Bachman s týmem v GE navrhnul pro společnost Weyerhaueser Wood Productions. Novinkou bylo připojení dálnopisů pro vzdálenou aktualizaci záznamů z kanceláří po celých Spojených státech – IDS tak získala „síťovou podobu“. Nakonec se ukázalo, že zastarávající počítače GE 235 na provoz systému nestačí, a tak musela být databáze IDS pro novější WEYCOS 2 přepracována do podoby, kdy k ní mohlo ve sdílené paměti přistupovat několik počítačů GE 600 – a na nich mohlo s daty z IDS pracovat až osm různých aplikací současně. IDS se tak svými možnostmi začala blížit skutečnému DBMS. Ostatně není divu – stala se jeho inspirací a předlohou.

Codasyl a DBTG

Napsal jsem a pak přepsal specifikace systému pro správu databází pro DBTG. Původní text byl vlastně textem popisujícím DMS u GE IDS. Záznamy „master“ a „detail“ u IDS byly nahrazeny termíny „owner“ a „member“ u DBTG, to byly, stejně jako „set“ dobrá zlepšení. Některé změny ale byly jen proto, aby další členové mohli také něčím přispět. Mně šlo především o to zachovat funkcionalitu IDS, spíš než zachovat původní jazyk pro manipulaci s daty IDS beze změn.

Charles Bachman o vzniku datového modelu CODASYL

CODASYL, Conference/Committe on Data Systems Languages vznikl v roce 1959 jako konsorcium pro vývoj počítačového jazyka standardizovaného napříč platformami. Jeho prvním počinem byl jazyk COBOL, navržený a publikovaný v první verzi již v roce 1959 (jeho základem byl především jazyk Flow-Matic navržený týmem Grace Hopperové, o které jsme v seriálu již také psali). V roce 1965 byla v rámci CODASYL založena skupina LPTF (List Processing Task Force), která měla za úkol vyvinout rozšíření jazyka COBOL pro práci s datovými sety (databázemi). Jeho základem se stal IDS Charlese Bachmana. LPTF byla v roce 1967 přejmenována na DBTG (Data Base Task Group) a její první zpráva o rok později nesla název COBOL Extensitons to handle data bases. Pojem databáze se tak začal dostávat do obecnějšího povědomí. O rok později, v říjnu 1969, byl publikován CODASYL Data Model, který zahrnoval samostatný jazyk DDL (Data Definition Language) pro návrh vlastní struktury databáze a další DDL pro návrh aplikačních pohledů na databázi a konečně jazyk DML (Data Manipulation Language) obsahující rozšiřující příkazy COBOLu pro manipulaci s daty. Začala se psát éra moderních databází – navigačních, jež měly dominovat po následující desetiletí až do nástupu relačních databázových modelů. Ale to už je zas jiný příběh.

hacking_tip

Schémata navigačního databázového modelu CODASYL (Wikipedie)

Byla to právě práce na IDS a návrhu CODASYL Data Model, za které byla Charlesi Bachmanovi již v roce 1973 udělena v pořadí osmá Turingova cena. Bachman sám se na přelomu 60. a 70. let věnoval návrhu jednoduššího jazyka DataBASIC, který se ale neprosadil. V 70. letech se dál pohyboval v oblasti databázových systémů a komunikačních protokolů. V roce 1983 zakládá vlastní společnost Bachman Information Systems, která po několikaletém úspěchu se software Data Analyst vstupuje na burzu, ale nakonec se nedokáže vyrovnat s nástupem osobních počítačů a levnějšího software, než byl ten pro mainframe systémy.

Charles Bachman si ve svých 91 letech užívá zasloužený odpočinek a posledních patnáct let se věnuje zejména zpracovávání materiálů v oblasti počítačové historie.   

Odkazy

Autor článku