Це сьогодні апаратні можливості комп’ютерної техніки дозволяють вільно витрачати гігабайти та мегагерци для відображення анімацій та інших дрібниць. У 1980-х роках комп’ютерам ледь вистачало потужностей для обробки звичайного тексту. Китайська мова, в якій немає літер, а кожне слово представляє собою графічний символ (ієрогліф), стала перешкодою. Щоб китайці змогли отримати персональний комп’ютер розробниками Sinotype III довелося здійснити інженерний подвиг.
Китай сьогодні є глобальним лідером в технологіях та економіці, його фабрики постачають товари в усі куточки світу, а його вчені – роблять грандіозні наукові успіхи. Всі ці інновації базуються на 40-річній технології комп’ютерної обробки китайської мови.
На початку 1980-х Китай масово закуповував комп’ютери у виробників із США та інших західних країн. Якщо в 1980 році країна імпортувала 600 машин, то в 1985 році цифра складала 130 000 машин.
У комп’ютерів виявилася значна проблема: самі ПК, принтери, монітори, операційні системи та програми не могли працювати з китайськими ієрогліфами. Фактично ці масові ПК не мали сенсу в Китаї. Додати підтримку ієрогліфів виявилося не так легко, оскільки вони вимагали багато пам’яті.
Для латинських символів вистачало 5 байтів на символ при відображенні в пікселях 5х7, а увесь англійський алфавіт та ряд інших символів – загалом 95 знаків ASCII – вимагав 475 байтів пам’яті. Це була невелика частина оперативної пам’яті Apple II, який мав 48 КБ.
Китайські ієрогліфи в розмірі 5х7 пікселів виявилися замалими для розпізнавання. Збільшення сітки до 16х16 пікселів вимагало вже 32 байти на один ієрогліф. Для зберігання 8000 найпопулярніших ієрогліфів потрібно було 256 КБ пам’яті – у чотири рази вище можливостей більшості тогочасних масових ПК. І до цієї цифри потрібно додати ще оперативну пам’ять для додатків та операційної системи.
Китайська цифрова революція
Розробникам китайського ПК Sinotype III, який був побудований на базі Apple II, вдалося створити рішення для економного зберігання китайських ієрогліфів. Це відкрило спосіб конвертувати виготовлені під західні алфавіти ПК та породило новий гігантський ринок.
Історія цього інженерного подвигу починається в організації Graphic Arts Research Foundation (GARF), де в 1950-х роках інженер Массачусетського технологічного інституту Самюель Колдвел винайшов машину Ideographic Composing Machine, відому також як Sinotype. Після його смерті в 1960 році проєкт цієї машини майже зупинився. Протягом 1960-1970-х розробкою Sinotype займалися різні компанії, серед яких Itek Corporation, RCA, а потім знову GARF.
Поява Sinotype стала можливою завдяки Луісу Розенблуму, який народився в 1921 році у Нью-Йорку та навчався у Массачусетському технологічному інституті, з якого випустився в 1942 році з дипломом у прикладній математиці. Розенблум пішов працювати до Polaroid, а в 1954 році перейшов до Photon, де він працював над фотокомпозицією нелатиських письмених систем. Розенблум був знайомий з роботою Колдвела над Sinotype і він фактично оживив цей проєкт, приєднавшись до GARF в середині 1970-х.
GARF працювала над Sinotype до 1980-х, і у проєкті брали участь відомий гарвардський лінгвіст Сусумо Куно, Річард Соломон. Однак проривний перехід від мінікомп’ютера Sinotype II до мікрокомп’ютера Sinotype III стався завдяки студенту, який працював у організації на той момент всього два тижні. Це був Брюс Розенблум – син Луіса Розенблума.
Це сталося в травні 1981 року, коли Брюс щойно склав екзамени і зайшов в офіс за паперами. Його колега Ерік Якобс працював над комп’ютером TRS-80 Model II. Брюс спостерігав за ним приблизно 30 хвилин, які дали старт Sinotype III.
Sinotype III мала коштувати приблизно $10 000, тоді як попереднє покоління обладнання обходилося для GARF у $100 000.
В липні 1981 року Брюс запропонував інвесторам Sinotype III, який коштував $7 500, а також додатково було необхідно $5 000 на створення програмного забезпечення. План включав розробку китайського текстового процесора, який працював на Apple II. Термін був приблизно чотири місяці.
Хакінг пам’яті
Розенблум майже одразу стикнувся з дефіцитом оперативної пам’яті. Він одразу закуповував Apple II з максимально доступним обсягом пам’яті у 48 КБ, але цього було замало. Тому він також додатково модифікував ПК, дооснастивши його ще 16 КБ.
Загальний обсяг тепер складав 64 КБ, проте цього вистачало лише на 100 ієрогліфів.
Розенблум ретельно вивчив конструкцію Apple II і йому вдалося додати ще 16 КБ пам’яті – загальний обсяг складав 80 КБ. Інженери Apple були шоковані, коли дізналися про таку модифікацію.
Це було поза можливостями процесора 6502, який міг безпосередньо працювати тільки з 64 КБ. Для доступу до всіх 80 КБ Брюс відкинув комплектну ОС та створив власну. З нею процесор “бачив” одночасно лише 64 КБ, але міг переключатися між двома блоками по 16 КБ.
На шляху до китайських ієрогліфів в реальному часі
Наявність 80 КБ пам’яті дозволила розмістити ще 400 китайських ієрогліфів. Більшість популярних символів все одно доводилося зберігати на зовнішніх носіях, що зменшувало швидкість доступу до них.
Брюс пробував використовувати чипи PROM для зберігання символів, але найбільш ємнісні пропонували лише 2 КБ, тобто для зберігання 7000 ієрогліфів потрібно було до 250 чипів.
Флопі-диски не підійшли також через велику кількість потрібних носіїв, а також через низьку швидкість доступу.
Тому Sinotype III оснастили топовим типом накопичувача – жорстким диском Corvus на 10 МБ.
Стало можливо вмістити всі потрібні ієрогліфи, однак доступ до них був дуже повільним – у 10 разів повільнішим, ніж для ієрогліфів в оперативній пам’яті. Символи з оперативки виводилися майже миттєво, символи на жорсткому диску – за секунду. Про друк в реальному часі не було мови.
Луіс Розенблум вирішив цю проблему за допомогою адаптивного тимчасового сховища. Sinotype III міг змінювати набір збережених в оперативній пам’яті символів залежно від ієрогліфів, які нещодавно вводив користувач.
Китайська на чипі
Навіть з усіма хаками та модифікаціями все одно залишалися тисячі ієрогліфів, які не вдавалося розмістити в сховищі комп’ютера. У більшості випадків популярних ієрогліфів вистачало, однак будь-який спеціальний контент потребував символів, що були відсутні в базі.
Інженери в 1970-1980-х почали вивчати різні апаратні рішення, відомі як “генератори китайського шрифту”, “китайські картки” (Zhongwenka), “генератори китайських символів”. Ці рішення також часто називали “китайською на чипі”. Це спеціальна картка, яка вставлялася в слот розширення материнської плати та відкривала доступ до тисяч китайських символів. Вона виконувала ту ж задачу, що і жорсткий диск, але значно швидше.
Наприклад, текстовий процесор Olympia 1011 Chinese завантажував один з трьох процесорів Intel 8085 генерацією китайських символів.
У 1980-х прогрес дозволив відмовитися від спеціалізованих текстових процесорів на користь більш мініатюрних генераторів китайських символів. Будь-хто міг купити таку картку та встановити її у свій комп’ютер.
Під кінець 1980-х підхід “китайська на чипі” став настільки важливим та поширеним, що практично всі комп’ютери з підтримкою китайської або японської мали таку картку.
За матеріалами: TechCrunch