Это сегодня аппаратные возможности компьютерной техники позволяют свободно тратить гигабайты и мегагерцы для отображения анимаций и прочих мелочей. В 1980-х годах компьютерам едва хватало мощностей для обработки обычного текста. Китайский язык, в котором нет букв, а каждое слово представляет собой графический символ (иероглиф), стал препятствием. Чтобы китайцы смогли получить персональный компьютер разработчиками Sinotype III пришлось совершить инженерный подвиг.
Китай сегодня является глобальным лидером в технологиях и экономике, его фабрики поставляют товары во все уголки мира, а его ученые делают грандиозные научные успехи. Все эти инновации основаны на 40-летней технологии компьютерной обработки китайского языка.
В начале 1980-х Китай массово закупал компьютеры у производителей из США и других западных стран. Если в 1980 году страна импортировала 600 машин, то в 1985 году цифра составляла 130 000 машин.
У компьютеров обнаружилась значительная проблема: сами ПК, принтеры, мониторы, операционные системы и программы не могли работать с китайскими иероглифами. Фактически эти массовые ПК не имели смысла в Китае. Добавить поддержку иероглифов оказалось не так легко, поскольку они требовали много памяти.
Для латинских символов хватало 5 байтов на символ при отражении в пикселях 5х7, а весь английский алфавит и ряд других символов — в целом 95 знаков ASCII — требовал 475 байтов памяти. Это была небольшая часть оперативной памяти Apple II, у которой было 48 КБ.
Китайские иероглифы в размере 5х7 пикселей оказались маловаты для распознавания. Увеличение сетки до 16х16 пикселей требовало уже 32 байта на один иероглиф. Для хранения 8000 самых популярных иероглифов нужно было 256 КБ памяти — в четыре раза выше возможностей большинства тогдашних массовых ПК. И к этой цифре нужно добавить еще оперативную память для приложений и операционной системы.
Китайская цифровая революция
Разработчикам китайского ПК Sinotype III, который был построен на базе Apple II, удалось создать решение для экономного хранения китайских иероглифов. Это открыло способ конвертировать изготовленные под западные алфавиты ПК и породило новый гигантский рынок.
История этого инженерного подвига начинается в организации Graphic Arts Research Foundation (GARF), где в 1950-х годах инженер Массачусетского технологического института Самюэль Колдвел изобрел машину Ideographic Composing Machine, известную также как Sinotype. После его смерти в 1960 году проект этой машины почти остановился. В течение 1960-1970-х разработкой Sinotype занимались различные компании, среди которых Itek Corporation, RCA, а затем снова GARF.
Появление Sinotype стала возможной благодаря Луису Розенблуму, который родился в 1921 году в Нью-Йорке и учился в Массачусетском технологическом институте, из которого выпустился в 1942 году с дипломом в прикладной математике. Розенблум пошел работать в Polaroid, а в 1954 году перешел в Photon, где он работал над фотокомпозицией нелатышских письменных систем. Розенблум был знаком с работой Колдвела над Sinotype и он фактически оживил этот проект, присоединившись к GARF в середине 1970-х.
GARF работала над Sinotype до 1980-х, и в проекте участвовали известный гарвардский лингвист Сусумо Куно Ричард Соломон. Однако прорывной переход от миникомпьютера Sinotype II к микрокомпьютера Sinotype III произошел благодаря студенту, который работал в организации на тот момент всего две недели. Это был Брюс Розенблум-сын Луиса Розенблума.
Это произошло в мае 1981 года, когда Брюс только что сдал экзамены и зашел в офис за бумагами. Его коллега Эрик Якобс работал над компьютером TRS-80 Model II. Брюс наблюдал за ним примерно 30 минут, которые дали старт Sinotype III.
Sinotype III должен был стоить примерно $10 000, в то время как предыдущее поколение оборудования обходилось для GARF в $100 000.
В июле 1981 года Брюс предложил инвесторам Sinotype III, который стоил $7 500, а также дополнительно было необходимо $5 000 на создание программного обеспечения. План включал разработку китайского текстового процессора, который работал на Apple II. Срок был примерно четыре месяца.
Хакинг памяти
Розенблум почти сразу столкнулся с дефицитом оперативной памяти. Он сразу закупал Apple II с максимально доступным объемом памяти в 48 КБ, но этого было мало. Поэтому он также дополнительно модифицировал ПК, дооснастив его еще 16 КБ.
Общий объем теперь составлял 64 КБ, однако этого хватало лишь на 100 иероглифов.
Розенблум тщательно изучил конструкцию Apple II и ему удалось добавить еще 16 КБ памяти — общий объем составлял 80 КБ. Инженеры Apple были шокированы, когда узнали о такой модификации.
Это было вне возможностей процессора 6502, который мог напрямую работать только с 64 КБ. Для доступа ко всем 80 КБ Брюс отбросил комплектную ОС и создал собственную. С ней процессор “видел” одновременно лишь 64 КБ, но мог переключаться между двумя блоками по 16 КБ.
На пути к китайским иероглифам в реальном времени
Наличие 80 КБ памяти позволило разместить еще 400 китайских иероглифов. Большинство популярных символов все равно приходилось хранить на внешних носителях, что уменьшало скорость доступа к ним.
Брюс пробовал использовать чипы PROM для хранения символов, но наиболее емкостные предлагали лишь 2 КБ, то есть для хранения 7000 иероглифов нужно было до 250 чипов.
Флопи-диски не подошли также из-за большого количества нужных носителей, а также из-за низкой скорости доступа.
Поэтому Sinotype III оснастили топовым типом накопителя — жестким диском Corvus на 10 МБ.
Стало возможно вместить все нужные иероглифы, однако доступ к ним был очень медленным — в 10 раз медленнее, чем для иероглифов в оперативной памяти. Символы из оперативки выводились почти мгновенно, символы на жестком диске — за секунду. О печати в реальном времени не было речи.
Луис Розенблум решил эту проблему с помощью адаптивного временного хранилища. Sinotype III мог изменять набор сохраненных в оперативной памяти символов в зависимости от иероглифов, которые недавно вводил пользователь.
Китайский на чипе
Даже со всеми хаками и модификациями все равно оставались тысячи иероглифов, которые не удавалось разместить в хранилище компьютера. В большинстве случаев популярных иероглифов хватало, однако любой специальный контент нуждался символов, которые отсутствовали в базе.
Инженеры в 1970-1980-х начали изучать различные аппаратные решения, известные как “генераторы китайского шрифта”, “китайские карты” (Zhongwenka), “генераторы китайских символов”. Эти решения также часто называли «китайским на чипе». Это специальная карта, которая вставлялась в слот расширения материнской платы и открывала доступ к тысячам китайских символов. Она выполняла ту же задачу, что и жесткий диск, но гораздо быстрее.
Например, текстовый процессор Olympia 1011 Chinese загружал один из трех процессоров Intel 8085 генерацией китайских символов.
В 1980-х прогресс позволил отказаться от специализированных текстовых процессоров в пользу более миниатюрных генераторов китайских символов. Любой мог купить такую карточку и установить ее в свой компьютер.
К концу 1980-х подход “китайский на чипе” стал настолько важным и распространенным, что практически все компьютеры с поддержкой китайского или японского имели такую карту.
По материалам: TechCrunch