2.5 Табулятор Холлерита
Итак, седьмая планета, которую он посетил, была Земля. Земля — планета не простая! На ней насчитывается сто одиннадцать королей (в том числе, разумеется, и негритянских), семь тысяч географов, девятьсот тысяч дельцов, семь с половиной миллионов пьяниц, триста одиннадцать миллионов честолюбцев — итого около двух миллиардов взрослых.
Антуан де Сент-Экзюпери. Маленький принц
Эксцентричный философ Александр Бард, известный публике не только своей «Трилогией Футурики» (The Futurica Trilogy) и термином «нетократия», но и благодаря участию в музыкальных коллективах Army of Lovers и Gravitonas, в одной из публичных лекций предложил переизобрести историю. Не в том смысле, конечно, чтобы подвергнуть сомнению исторические факты или их периодизацию, а скорее в том, что объективные данные исторической науки могут рассматриваться с разных точек зрения и точка зрения во многом определяется особенностями эпохи, к которой принадлежат сами историки, а также источниками их доходов. На смену истории, написанной монахами, пришла история эпохи индустриальной революции — и вот уже на смену трактатам, возводящим родословные царей к библейским персонажам, приходят работы, рассуждающие о каменном, бронзовом и железном веках. Подобная периодизация имеет в своей основе овладение технологиями обработки различных материалов, подчинение их человеческой воле, и, разумеется, венцом творения в таком случае становится современная фабрика. Сегодня, когда ИТ-гиганты бросили вызов мировому экономическому могуществу фабрикантов, появилась возможность иного взгляда на историю — построение периодизации на базе развития технологий обработки информации. На смену каменному, железному и бронзовому веку, изобретённым в эпоху индустриальной революции, грозят прийти век устной речи, век письменности, век книгопечатания, эпоха интернета[1]. Производство человека, воспроизводство человечества — это не только производство материальное, но и производство идей, знаний, технологий, именно поэтому технологии, используемые тем или иным обществом для обработки информации, возможно, в не меньшей мере характеризуют общество, чем технологии, используемые для изготовления орудий. Если взглянуть сквозь призму этого подхода на эпоху промышленной революции, то можно сказать, что она стала также первой революцией больших данных. Ян Макдугалл Хакинг, канадский специалист в области философии науки, называет процесс, развернувшийся в 1820–1840 гг., «лавиной печатных чисел». В этот период, по подсчётам учёного, количество напечатанных чисел росло в экспоненциальной прогрессии, в то время как количество печатных слов — только в линейной[2].
Предпосылки революции больших данных можно обнаружить в высказываниях её предвестников. На границе XVII–XVIII вв. Лейбниц писал, что новое прусское государство должно начаться с создания статистического бюро, потому что истинной мерой государственной власти является население. Лейбниц сформулировал эту идею приблизительно в 1685 г., через несколько лет после того, как Уильям Петти высказал аналогичную рекомендацию для Англии. Лейбниц видел роль центрального статистического бюро в том, чтобы служить различным ветвям администрации. Бюро должно вести общий реестр смертей, крещений и браков, используя собранную информацию для оценки численности населения и, следовательно, мощи государства. Задача прямого подсчёта населения тогда считалась невыполнимой. Впрочем, передовые идеи медленно пробивали себе дорогу. На протяжении XVIII в. проекты по сбору статистической информации о населении и экономике в ведущих европейских странах были уделом различных ведомств (например, торговых) и даже частных исследователей. Появление первых центральных статистических бюро относится к первой половине XIX в. Например, в Прусском королевстве указ о создании такого бюро был издан в 1805 г., Управление записей актов гражданского состояния Англии и Уэльса (General Register Office for England and Wales) образовано в 1836 г., Бюро переписи населения США (United States Census Bureau) — в 1840 г. Словом, на воплощение в жизнь идей Петти и Лейбница ушло почти полтора столетия.
В 1860 г. основатель саксонского статистического бюро, экономист и статистик Эрнст Энгель был приглашён на пост директора прусского статистического бюро. Своё 22-летнее пребывание на этом посту учёный начал в том числе с основания трёх новых периодических изданий, в одном из которых опубликовал 21-страничный список 410 регулярных статистических сборников, издаваемых центральным правительством в Берлине. Для сравнения: в 1800 г. этот список был бы пустым[3].
В 1833 г. в Великобритании возникло Манчестерское статистическое общество, а год спустя — Королевское статистическое общество. В числе его основателей, между прочим, были Чарльз Бэббидж и Томас Мальтус, основатель мальтузианства — теории, согласно которой неконтролируемый рост населения должен привести к голоду на Земле.
Рост объёмов статистических данных требовал создания эффективных механизмов для их обработки. Переписи населения в условиях его быстрого увеличения в XIX в. становились всё более сложными и затратными мероприятиями, что заставляло их организаторов идти на беспрецедентные доселе и весьма радикальные для своего времени меры: например, в ходе переписи населения США в 1880 г. женщинам впервые разрешили быть счётчиками. Однако, несмотря на это, обработка результатов растянулась почти на десятилетие. Поскольку переписи в США проводились каждые десять лет, возникла реальная угроза того, что данные, собранные в 1890 г., вообще не удастся обработать в десятилетний срок, а это, в свою очередь, грозило полным коллапсом переписной системы. Становилось очевидным, что здесь необходимо революционное решение проблемы, и оно вскоре последовало.
В 1879 г. одарённый юноша Герман Холлерит, сын немецких иммигрантов, с отличием окончил Школу горного дела при Колумбийском колледже[4] в Нью-Йорке (правда, со сниженными отметками по бухгалтерскому учёту и механике) и поступил на работу в Вашингтоне в качестве специального агента для Бюро переписи населения США. На эту работу Холлерита устроил его бывший преподаватель, профессор Уильям Троубридж, работавший в Бюро экспертом. В связи с готовящейся переписью 1880 г. организация нуждалась в сотрудниках с математическими и инженерными способностями.
Хотя сама перепись заняла всего несколько месяцев, последующая работа по составлению таблиц и анализу данных требовала многих лет кропотливого труда большого коллектива сотрудников, ввиду чего отчёты о переписи к моменту их выхода сильно устаревали.
В свободное время Холлерит помогал в составлении отчётов доктору Джону Биллингсу, главе отдела статистики естественного движения населения. Биллингс был благодарен Герману за помощь и пригласил его к себе на ужин. Этот ужин (в августе 1881 г.) стал поворотным моментом в жизни Холлерита, о котором он вспоминал позже[5]: «В один из воскресных вечеров мы сидели за чайным столиком доктора Биллингса, и он сказал мне, что необходима машина для осуществления чисто механической работы по составлению таблиц численности населения и аналогичных статистических данных. Мы говорили об этом, и я помню его идею о чём-то похожем на машину для сортировки типографских литер. Он думал о том, чтобы использовать карты с описанием индивида, выполненным при помощи вырезов на краю карты… Изучив вопрос, я вернулся к доктору Биллингсу и сказал, что, по моему мнению, я могу решить эту проблему, и предложил ему присоединиться ко мне. Доктор сказал, что ему интересно лишь увидеть работающее решение проблемы»[6].
Принявшись за самостоятельное решение проблемы, Холлерит изучил процедуру переписи. На первом этапе счётчики посещали каждое домохозяйство и записывали ответы на свои вопросы на больших переписных листах (schedules). Заполненные переписные листы отправлялись обратно в Вашингтон, где армия клерков переписывала ответы в листы учёта (tally sheets). Например, для каждого переписного листа белого мужчины в маленькую ячейку на листе учёта ставилась отметка в виде косой черты, всего в ячейке могло содержаться до пяти отметок. Общее количество отметок было несложно подсчитать, поскольку форма была разделена на большие ячейки, каждая из которых содержала определённое число маленьких. Клерки подсчитывали количество отметок и записывали его в нижней части листа. На следующем этапе суммы из листов учёта переносились в сводные таблицы, суммарные показатели которых соответствовали численности населения округа, штата и, наконец, всей страны.
В переписи 1880 г. использовалось шесть видов листов учёта, по одному для каждой крупной статистической классификации. В первом листе население было разбито на группы по полу, расе и месту рождения; в других листах эти данные сопоставлялись с грамотностью, профессией и другими характеристиками. Для каждого из типов подсчёта сотрудникам приходилось заново перебирать миллионы переписных листов — процесс чрезвычайно медленный и дорогостоящий, не говоря уже о вероятности ошибок. Более того, он не позволял осуществлять сложный анализ данных.
Практически вся подготовительная работа и работа после переписи осуществлялась вручную. Единственным используемым механическим устройством было простое приспособление, так называемое устройство Ситона, изобретённое Чарльзом Ситоном, главным клерком переписи. Оно состояло из сплошного рулона листов учёта, намотанного на набор катушек в деревянной коробке. Рулон зигзагообразно огибал катушки устройства, собирая, таким образом, несколько столбцов листов рядом, что позволяло ускорить простановку отметок. Заполненные рулоны изымались из коробки, разрезались на отдельные листы, значения из которых затем суммировались[7].
Рис. 30. Устройство Ситона
В своё время руководитель предыдущей переписи Фрэнсис Уокер сравнил результаты использования устройства Ситона с обычным способом обработки данных и обнаружил, что машина повысила производительность каждого клерка с 29 до 124 листов в день, то есть прирост производительности труда составил почти 428%. Хотя более поздний анализ показал, что эта оценка была сильно преувеличена, специальным актом Конгресса Ситону за его изобретение выплатили премию в размере 15 000 долларов (расчёт размера вознаграждения основывался на ожидаемой экономии, возникающей при использовании устройства; эта сумма равна годовому окладу 29 клерков)[8], [9]. В целом устройство Ситона не могло решить возникшую проблему. В 1880 г. число вопросов переписи в очередной раз возросло — с восемнадцати до двадцати четырёх, к тому же вырос спрос на получение более детальной статистики. Рос аппетит Конгресса к получению новых данных, и конгрессмены были готовы выделить дополнительные фонды на их сбор и обработку, а Уокер с энтузиазмом относился к возможности расширения штата. В итоге объём опубликованных результатов переписей увеличился с пяти томов разного размера в 1870 г. до двадцати двух толстых ин-кварто[10] томов в 1880 г. (да ещё и с приложением). Эта амбициозная программа потребовала значительного увеличения числа клерков, и их численность выросла с 438 человек в переписи 1870 г. до 1495 человек при подведении итогов переписи 1880 г.[11]
В 1882 г. Холлерит становится инструктором по машиностроению в Массачусетском технологическом институте, где начинает строить свой первый аппарат для суммирования и классифицирования данных. Спустя год он возвращается в Вашингтон, чтобы стать экспертом патентного ведомства. Правда, в отличие от Альберта Эйнштейна, проработавшего на аналогичной позиции семь лет, Холлерит увольняется, чтобы начать карьеру изобретателя и предпринимателя.
Первоначальный дизайн машины Холлерита предполагал использование перфорированной ленты. Не исключено, что это инженерное решение было навеяно конструкцией машины Ситона, но спустя более чем столетие трудно это достоверно установить. Сама по себе идея не нова, вспомним хотя бы Жака Вокансона, который использовал перфорированные полосы бумаги в своём станке. Принципиальной инновацией в случае Холлерита было использование электричества: перфолента проходила между металлическим барабаном и большими металлическими щётками; всякий раз, когда щётки сквозь отверстие соприкасались с поверхностью барабана, возникал электрический контакт, приводивший к увеличению значения счётчика, соответствующего определённой статистической категории. Несмотря на большой прогресс, достигнутый в сравнении с операциями, выполняемыми при помощи листов учёта, Холлерит вскоре понял, что совершил серьёзную ошибку: бумажная лента оказалась неудачным носителем информации, ограничивающим скорость и гибкость системы из-за необходимости только последовательной обработки данных. Таким образом, если нужна только часть данных с ленты, приходилось проматывать рулон целиком, а после нахождения данных не было возможности их как-либо извлечь для дальнейшего анализа (разве что вырезать их с ленты)[12]. Казалось, Холлерит зашёл в тупик, забыв об идее Биллингса о картах с насечками. Однако на помощь пришёл любопытный случай во время одного путешествия. Холлерит вспоминал позже: «…У меня был билет с тем, что, как я думаю, называлось перфорационной фотографией. Когда билет первый раз предъявлялся кондуктору, он, пробивая в нём отверстия, формировал описание человека, например: светлые волосы, тёмные глаза, большой нос и т. д. Таким образом, как вы видите, я лишь выполнил перфорационные фото каждого человека»[13], [14]. Таким образом, система, созданная для борьбы с воровством билетов, помогла изобретателю создать более элегантную конструкцию машины, перейдя от непрерывной ленты к перфорационным учётным карточкам каждого человека.
Рис. 31. Фото проездного билета
Интересно, что Холлерит не был первым исследователем, осознавшим всю мощь перфокарт в деле обработки больших объёмов данных. Ещё в первой половине XIX в. русский изобретатель Семён Корсаков сконструировал несколько механических устройств, основанных на использовании перфорированных таблиц и предназначенных для задач информационного поиска и классификации. Первое устройство Корсакова получило название «гомеоскоп» (от др.-греч. ὅμοιος — подобный и σκοπέω — смотреть). Самый простой вариант гомеоскопа представлял собой деревянный брусок с отверстиями, в которых находились штыри длиной немного больше толщины бруска. Один конец у каждого штыря был закруглён, и при надавливании на него противоположный конец штыря выдвигался с другой стороны бруска. Каждый штырь соответствовал какому-либо признаку некоторого объекта. Если конец штыря выступал из рабочей поверхности бруска, значит, у данного объекта соответствующий признак присутствовал, в противном случае — отсутствовал.
Гомеоскоп использовался для быстрого поиска объекта в перфорированной таблице. Каждая строка такой таблицы соответствовала объекту, а столбец — признаку. Например, в одном из экспериментов Корсакова объектом была болезнь, а признаками — наблюдаемые симптомы. Вначале надо было подготовить таблицу: при наличии у объекта некоторого признака проделывалось отверстие в соответствующей им ячейке таблицы. После этого можно было осуществлять поиск объекта: в гомеоскопе устанавливался соответствующий признакам набор штырей, и гомеоскоп, перемещаемый вдоль строк таблицы, останавливался, если для всех выдвинутых штырей в таблице находились соответствующие отверстия. Если же гомеоскоп доходил до конца таблицы, то это означало, что объект, обладающий всеми заданными при помощи штырей признаками, пока что не внесён в таблицу. Таким образом, используя гомеоскоп, можно было найти болезнь по набору наблюдаемых симптомов и узнать список рекомендуемых при ней лекарств, который записывался в дополнительном столбце таблицы.
Этот вариант гомеоскопа назван у Корсакова «прямолинейным гомеоскопом с неподвижными частями» (homéoscope rectiligne à pièces fixes). Более продвинутой версией гомеоскопа стал «прямолинейный гомеоскоп с подвижными частями» (homéoscope rectiligne à pièces mobiles). Он представлял собой стоящую раму, через центр которой вертикально была протянута толстая прямая проволочная ось. На неё были нанизаны рычажки, изготовленные из загнутых под прямым углом отрезков проволоки. У каждого рычажка один конец представлял собой крючок, который скользил по поверхности перфорированной таблицы, а на второй конец крепилась бирка с номером признака. Каждый из рычажков путём поворота мог быть перекинут на одну из сторон рамы. Если он опирался на левую сторону рамы, то крючок выступал из нижней плоскости устройства и при движении рамы по поверхности таблицы мог провалиться в соответствующее ему отверстие. Если же отверстие в соответствующей позиции отсутствовало, то крючок приподнимался, в результате чего поднималась и бирка, закреплённая на другом конце рычажка. Таким образом, эта версия гомеоскопа могла не только находить нужные записи, но и показывать при поиске отсутствующие у обрабатываемой записи признаки.
Следующим устройством Корсакова стал «плоский гомеоскоп» (homéoscope plane), состоящий из наложения друг на друга двух перфорированных таблиц. Одно измерение таблицы соответствовало локализации симптома (например, голова, нос, грудь, живот), а второе — типу симптома (боль, резь, покраснение и т. д.). Штыри, соответствующие искомым признакам (критериям), похожие на гвозди со шляпками, устанавливались в отверстие верхней таблицы. Затем верхняя таблица накладывалась на нижнюю, в результате чего штыри или проваливались в соответствующие отверстия второй таблицы, или приподнимались над поверхностью. Корсаков предлагал использовать размер или цвет шляпок штырей для обозначения степени важности соответствующих им поисковых признаков.
Корсаков создал также и более сложные устройства — «идеоскоп» (idéoscope) и «простой компаратор» (comparateur simple). Идеоскоп представлял собой усовершенствованную версию прямолинейного гомеоскопа с подвижными частями, способную обрабатывать таблицы, в которых существовало два типа отверстий — неглубокие и глубокие (соответствующие более важным признакам). Идеоскоп позволял увидеть признаки, совпадающие у двух объектов (с выделением наиболее важных); признаки искомого объекта, отсутствующие у сравниваемого объекта в таблице; признаки сравниваемого объекта, которых нет в искомом объекте (с выделением наиболее важных), а также признаки, отсутствующие у обоих объектов.
Компаратор же, состоявший из двух накладываемых друг на друга рамок со смещаемыми дощечками, позволял сравнивать две записи, каждая из которых задавалась динамически, без использования перфорированной таблицы.
В 1832 г. Корсаков издал на французском языке брошюру под названием «Начертание нового способа исследования при помощи машин, сравнивающих идеи» (Apercu d`un procédé nouveau d`investigation au moyen de machines à comparer les idées)[15] и в том же году представил свои изобретения на суд Императорской Академии наук в Санкт-Петербурге. Однако члены Академии не оценили идей Корсакова. В заключении комиссии было среди прочего сказано: «Г-н Корсаков потратил слишком много разума на то, чтобы научить других обходиться без разума»[16], [17]. На многие годы изобретения Корсакова были забыты, и идее обработки массивов данных при помощи перфорированных карт было суждено воплотиться в жизнь лишь благодаря усилиям Холлерита.
В 1889 г. новый руководитель переписи Роберт Портер организовал конкурс на лучшую систему для автоматизации обработки данных. На призыв Портера откликнулись три изобретателя, каждый из которых разработал собственные приспособления. Чарльз Пиджин, главный клерк Массачусетского бюро статистики труда, создал систему, использующую разноцветные картонные карточки (chips), соответствующие различным классам информации. Данные переписи заносились на карточки, которые затем сортировались по стопкам и подсчитывались. Система Пиджина успешно использовалась во время переписи населения штата Массачусетс в 1885 г.
Уильям Хант, работавший над той же переписью, предложил упрощённую версию системы Пиджина, в которой вместо картонных карточек использовались бумажные бланки с отметками, выполненными цветными чернилами. Третьим участником стал Холлерит, новая машина которого, использовавшая перфокарты, к этому моменту уже была испытана при анализе записей о смерти в Балтиморе, Нью-Йорке и Нью-Джерси в 1886–1889 гг.[18] Кроме того, машина Холлерита прошла испытания в военном ведомстве с целью составления таблиц о здоровье военнослужащих[19].
Все три системы были основаны на концепции «единичных записей» (unit records), представлявших собой отдельные записи для каждого объекта учёта. Во всех трёх системах информация о каждом индивиде переносилась из переписного листа на отдельные карточки из бумаги или картона. Вместо того чтобы использовать отметки в огромных листах учёта, производилась сортировка учётных карточек. Копирование информации на первом этапе добавляло дополнительный шаг к процессу, но позволяло увеличить эффективность всякий раз, когда было необходимо составить несколько таблиц для группы, выделенной на основе какой-либо характеристики. Например, после того как записи отсортировали по расе, полу и возрасту, эти группы можно было повторно использовать для составления таблиц с детализацией этих базовых групп на подгруппы по возрасту, месту рождения или профессии. В рамках традиционной системы подсчёта каждая новая таблица начиналась с нуля, что означало повторение одной и той же работы снова и снова.
Чтобы выбрать наиболее эффективную систему, Портер сформировал комитет для проведения конкурса. Каждый участник должен был перенести информацию о 10 491 жителе Сент-Луиса из переписи 1880 г. на свои карточки, бланки или перфокарты, а затем составить набор таблиц. Холлерит со своим табулятором оказался явным победителем. Итоги конкурса представлены в таблице:
Перенос данных, ч | Табуляция, ч | Всего, ч | |
---|---|---|---|
Карточки Пиджина (chips) | 110,9 | 44,7 | 155,6 |
Бланки Ханта (slips) | 144,4 | 55,4 | 199,8 |
Перфокарты Холлерита (cards) | 72,5 | 5,5 | 77,9 |
Как можно заметить, перенос данных на перфокарты осуществлялся быстрее, чем на цветные карточки или бланки. Первоначально Холлерит считал, что «отверстия в картах можно пробивать при помощи обычного кондукторского компостера». И действительно, он использовал такой компостер для переноса данных на карты в Балтиморе. Но в ходе проекта для военного ведомства Холлерит задействовал более эффективное устройство — пантограф, созданный с помощью Джорджа Бонда, известного специалиста компании Pratt & Whitney из Хартфорда. Оператор перемещал ручку над металлической пластиной, пронизанной мечеными отверстиями, соответствующими положениям отверстий в карте. Перфорации в карте выполнялись путём вжатия ручки в соответствующее отверстие пластины.
Рис. 32. Пантограф Холлерита
Однако наиболее впечатляющее преимущество система Холлерита продемонстрировала на этапе составления таблиц: подсчёт перфокарт был в десять раз быстрее подсчёта бланков и в восемь раз быстрее подсчёта карточек.
На каждой перфокарте, используемой табулятором Холлерита, отводилось место для 288 отверстий, при этом значение каждого из отверстий определялось его позицией. Центральным элементом машины был замыкающий контур пресса, напоминавший вафельницу. Верхняя часть пресса содержала подпружиненные штифты, по одному на каждое возможное отверстие в карте. В нижней части располагались маленькие чашечки, заполненные ртутью. Оператор помещал перфокарту в пресс и закрывал крышку. Большая часть штифтов натыкалась на картон и оставалась в поднятой позиции, но там, где в карте были пробиты отверстия, штифты проходили через них и попадали в ртутные чашечки, образуя тем самым электрическую цепь. Ток активировал электромагниты, которые проворачивали диски счётчиков. Машина настраивалась для работы с отдельными отверстиями или их комбинациями. Она позволяла за один проход осуществлять подсчёт до сорока характеристик или их сочетаний. Каждый из счётчиков мог подсчитать до 9999 значений; при достижении этого предела оператор переписывал показания со всех счётчиков на бумагу, а затем сбрасывал их значения.
В дополнение к функции подсчёта табулятор мог выполнять сортировку карт, для чего использовалась сортировочная коробка, разделённая на 24 отсека с подпружиненными крышками, открывающимися при помощи электромагнитов. Табулятор открывал отсек для размещения карточки на основании заданной характеристики или комбинации характеристик. Используя функции сортировки и подсчёта одновременно, карты можно было отсортировать и подсчитать за один прогон. После чего отсортированные карточки могли быть снова загружены в машину, что позволяло использовать сложные перекрёстные классификации[20]. Это, казалось бы, нехитрое устройство и обеспечило Холлериту уверенную победу.
Рис. 33. Табулятор Холлерита
К счастью для прогресса, конкуренты Холлерита быстро оправились от поражения и в будущем подарили миру множество замечательных работ и изобретений. Например, Пиджин в 1916 г. подал заявку на патент, описывающий новый способ показа диалога в немых фильмах. Актёры должны были надувать воздушные шары или надувные язычки с текстом, тем самым изображая разговор[21].
Клерки, использующие машины Холлерита для обработки данных переписи 1890 г., смогли обрабатывать в среднем от 7000 до 8000 перфокарт в день. В соответствии с выполненными расчётами использование машин Холлерита должно было сэкономить 580 000 долларов на заработной плате клерков; Холлериту выплатили 230 390 долларов в качестве арендной платы за 56 машин в течение четырёх лет, что составило почти 40% от этой суммы. Машины возвратили Холлериту в 1894 г., когда обработка результатов переписи завершилась.
В преддверии переписи 1900 г. Бюро объявило новый конкурс на лучшую систему автоматизации. На этот раз единственными конкурентами были Холлерит и Пиджин. Пиджин предложил сразу три новые системы: «Автоматическая механическая система табуляции» (Automatic Mechanical Tabulation System), «Электрическая система табуляции на основе коммутационной доски» (Pin Board Electrical Tabulation System) и «Электрический печатающий табулятор» (Electrical Typewriter Tabulator). Холлерит испытывал настолько серьёзные опасения в отношении этих новых устройств, что нанял детективов из агентства Пинкертона для промышленного шпионажа. Впрочем, тревога оказалась напрасной: машины Холлерита позволили подвести итоги тестовой переписи конкурса менее чем за половину времени, потраченного лучшей из машин Пиджина.
В ходе подведения итогов переписи Холлерит представил несколько нововведений. К числу наиболее важных из них относилась «Автоматическая табулирующая машина», в которой работа по помещению каждой из карт в отсек со штифтами, опусканию пресса и удалению карты выполнялась автоматически, что позволило ускорить процесс в шесть раз.
Для обработки данных сельскохозяйственной переписи Холлерит разработал «Суммирующий табулятор», который не только подсчитал количество ферм, но вычислил суммарную площадь их земель и общий объём производства. Кроме того, Холлерит использовал новый кнопочный перфоратор и автоматическую сортировочную машину[22]. Взятые вместе, эти новые устройства значительно улучшили технологию, использованную в 1890 г., что позволило опубликовать результаты переписи в рекордный с 1820 г. срок, а также сократить расходы на перепись в расчёте на единицу населения более чем на 15%[23].
В 1903 г. на смену поддерживавшему Холлерита директору Бюро переписи населения Уильяму Мерриаму пришёл Саймон Норт. Норт и Холлерит не ладили друг с другом: Холлерит выступал против назначения Норта, а Норт считал плату за аренду машин Холлерита непомерной. Конфликт привёл к отказу Бюро от использования машин Холлерита и переходу на короткое время к применению более медленных устройств Пиджина. Норт считал, что с созданием постоянного Бюро переписи в 1902 г. появилась необходимость в использовании собственного оборудования. Срок действия первоначальных патентов Холлерита истекал 8 января 1906 г., открывая всем желающим дорогу для изготовления аналогичных табуляторов.
В 1905 г. Норт добивается от Конгресса выделения 40 000 долларов для разработки собственного оборудования. Эти средства были использованы для создания мастерской переписных машин два года спустя. Бюро переписи наняло четырёх недостаточно лояльных инженеров Холлерита, назначив их руководителем иммигранта из Одессы Джеймса Пауэрса, выпускника Одесского технического училища и бывшего сотрудника механической мастерской, занимавшейся изготовлением оборудования для Императорского Новороссийского университета в Одессе[24]. (К сожалению, биографические данные о Пауэрсе крайне скудны. Вполне вероятно, что до переезда в США он был Яковом или Хаимом, Силиным или Силаевым, но мне пока не удалось разыскать никаких подробностей его доамериканской жизни. Парадоксальным образом мы крайне мало знаем о человеке, стоявшем у основания компании, ныне известной под названием Unisys Corporation, наследницы Powers Accounting Machine Company[25].)
Менее чем за год группе Пауэрса удалось разработать прототипы, обладавшие некоторыми преимуществами по сравнению с машинами Холлерита. Новый табулятор самостоятельно печатал результаты подсчётов на бумаге. Также Пауэрс создал новый электрический перфоратор с 240 клавишами, по одной для каждого отверстия на перфокарте, который обещал удвоить скорость ввода данных по сравнению с перфоратором Холлерита. Кроме того, мастерская переписных машин начала работу над полностью автоматическим табулятором, который должен был, подобно последним версиям машины Холлерита, обрабатывать стопки перфокарт без вмешательства оператора[26].
Холлерит был в ярости. Убеждённый в том, что его патенты нарушены, он инициировал лоббистскую кампанию против Норта. Враждебно относившийся к монополиям президент Рузвельт не спешил поддерживать Холлерита, но после того, как в 1909 г. Рузвельта на его посту сменил Тафт, Холлериту всё же удалось добиться увольнения Норта.
Новый директор Бюро переписи Эдвард Дюран тем не менее решил продолжить развитие собственных технологий. Менее чем за три месяца до начала переписи 1910 г. Холлерит подал иск против Дюрана, заявив о нарушении патентов на машины для сортировки карт. Получив запретительный судебный приказ, Холлерит добился приостановления работ над машинами, но потом суд округа Колумбия отменил приказ, после чего в иске было отказано[27].
Рис. 34. Автоматизация переписи в США
После утраты государственного контракта Холлерит принимает решение завершить самостоятельную предпринимательскую карьеру, начатую в 1896 г. созданием компании Tabulating Machine Company (после 1905 г. — The Tabulating Machine Company). В 1911 г. изобретатель продаёт свой бизнес Чарльзу Флинту, знаменитому «отцу трестов». Флинт объединил The Tabulating Machine Company с ещё двумя приобретёнными им фирмами под названием Computer Tabulating Recording Company, а в 1924 г. компания сменила название на International Business Machines Corporation, или сокращённо IBM[28].
Холлерит продолжал работать с основанной им компанией в качестве инженера-консультанта до 1921 г., но всё меньше и меньше занимался делами фирмы. После выхода в отставку он переселился на свою ферму в Мэриленде, где и провёл остаток жизни, сконцентрировавшись на выращивании крупного рогатого скота.
По словам немногих близких людей, Холлерит был «странным», «особенным», «закрытым», «малодоступным», «живущим только для своей семьи и работы». Ему нравились хорошие сигары, изысканное вино, коровы гернзейской породы и деньги, которых у него было предостаточно.
Герман Холлерит умер от сердечного приступа 17 ноября 1929 г. в Вашингтоне и был похоронен на семейном участке на кладбище Оак-Хилл в Джорджтауне.
Холлерит считается одной из основных фигур в развитии обработки данных. Изобретение табулятора ознаменовало начало эпохи (полу)автоматических систем в этой области, а сформированная им концепция массовой обработки данных доминировала в этом направлении в течение примерно столетия[29].
- ↑ Bard A., Söderqvist J. (2012). The Futurica Trilogy. Stockholm Text // https://books.google.ru/books?id=l-WCBwAAQBAJ
- ↑ Hacking I. (1982). Biopower and the avalanche of printed numbers / Humanities in Society // https://s3.amazonaws.com/arena-attachments/778687/622e0ba69d28d9ff4049b1bc81462079.pdf
- ↑ Hacking I. (1990). The Taming of Chance. Cambridge University Press // https://books.google.ru/books?id=KffZAQAAQBAJ
- ↑ * В период с 1784 по 1896 г. Колумбийским колледжем назывался будущий Колумбийский университет.
- ↑ Dalakov G. Tabulating machine of Herman Hollerith / History of Computers: hardware, software, internet… // https://history-computer.com/ModernComputer/Basis/TabulatingMachine_Hollerith.html
- ↑ Muirhead J. F. (1963). John Shaw Billings. New England Journal of Medicine, Vol. 268, Iss. 14, pp. 778–779 // https://doi.org/10.1056/nejm196304042681409
- ↑ Dalakov G. Tabulating machine of Herman Hollerith / History of Computers: hardware, software, internet… // https://history-computer.com/ModernComputer/Basis/TabulatingMachine_Hollerith.html
- ↑ Truesdell L. E. (1965). The development of punch card tabulation in the Bureau of the Census, 1890–1940: with outlines of actual tabulation programs. U. S. G.P.O // https://books.google.ru/books?id=MGZqAAAAMAAJ
- ↑ Wright C. D. (1966). The history and growth of the United States census[1790–1890] prepared for the Senate Committee on the Census. U. S. Govt. Print. Off, Johnson Reprint Corp // http://hdl.handle.net/2027/mdp.39015007025003
- ↑ * Ин-кварто (лат. in quarto «в четвёртую часть листа», «в четвёртку» от лат. quartus «четвёртый») — полиграфический термин, обозначающий размер страницы в одну четверть типографского листа. На одном листе при этом помещается 4 листа (8 страниц) книги. Размеры страницы составляют 241,5 × 305 мм.
- ↑ Ruggles S., Magnuson D. L. (2018). Capturing the American People: Census Technology and Institutional Change, 1790–2020 / MPC Working Papers Series. №2 // https://pop.umn.edu/sites/pop.umn.edu/files/ruggles_magnuson_capturing-2.pdf
- ↑ Dalakov G. Tabulating machine of Herman Hollerith / History of Computers: hardware, software, internet… // https://history-computer.com/ModernComputer/Basis/TabulatingMachine_Hollerith.html
- ↑ Truesdell L. E. (1965). The development of punch card tabulation in the Bureau of the Census, 1890–1940: with outlines of actual tabulation programs. U. S. G.P.O // https://books.google.ru/books?id=MGZqAAAAMAAJ
- ↑ Strickland J. (2014). Hollerith and the “Punched Photograph” / Computer History Museum: Volunteer Information Exchange, Vol. 4, Iss. 3, February 20 // https://s3.amazonaws.com/s3data.computerhistory.org/chmedu/VIE_04_003.pdf
- ↑ Karsakof S. (1832). Apercu d`un procédé nouveau d`investigation au moyen de machines à comparer les idées. St. Petersbourg.
- ↑ Корсаков С. Н. (2009). Начертание нового способа исследования при помощи машин, сравнивающих идеи / Пер. с франц., под ред. А. С. Михайлова. — М.: МИФИ // http://www.raai.org/library/books/korsakov/korsakov_book.pdf
- ↑ Михайлов А. С. (2016). Усиление возможностей разума — изобретения С. Н. Корсакова / Искусственный интеллект и принятие решений. № 2. С. 5–15 // http://www.aidt.ru/images/documents/2016-02/5_15.pdf
- ↑ Ruggles S., Magnuson D. L. (2018). Capturing the American People: Census Technology and Institutional Change, 1790–2020 / MPC Working Papers Series. № 2 // https://pop.umn.edu/sites/pop.umn.edu/files/ruggles_magnuson_capturing-2.pdf
- ↑ Austrian G. D. (2016). Herman Hollerith: Forgotten Giant of Information Processing. BookBaby // https://books.google.ru/books?id=Kn1vjwEACAAJ
- ↑ Ruggles S., Magnuson D. L. (2018). Capturing the American People: Census Technology and Institutional Change, 1790–2020 / MPC Working Papers Series. № 2 // https://pop.umn.edu/sites/pop.umn.edu/files/ruggles_magnuson_capturing-2.pdf
- ↑ Cartmell D. (2012). A Companion to Literature, Film, and Adaptation. Wiley // https://books.google.ru/books?id=63y9jREP6QEC
- ↑ Ruggles S., Magnuson D. L. (2018). Capturing the American People: Census Technology and Institutional Change, 1790–2020 / MPC Working Papers Series. № 2 // https://pop.umn.edu/sites/pop.umn.edu/files/ruggles_magnuson_capturing-2.pdf
- ↑ Merriam W. R. (1903). The Evolution of American Census Taking / The Century illustrated monthly magazine, Vol. LXV, Apr. 1903 // https://babel.hathitrust.org/cgi/pt?id=mdp.39015016778998;view=1up;seq=836
- ↑ Ruggles S., Magnuson D. L. (2018). Capturing the American People: Census Technology and Institutional Change, 1790–2020 / MPC Working Papers Series. № 2 // https://pop.umn.edu/sites/pop.umn.edu/files/ruggles_magnuson_capturing-2.pdf
- ↑ Truesdell L. E. (1965). The development of punch card tabulation in the Bureau of the Census, 1890–1940: with outlines of actual tabulation programs. U. S. G.P.O // https://books.google.ru/books?id=MGZqAAAAMAAJ
- ↑ Heide L. (2009). Punched-Card Systems and the Early Information Explosion, 1880–1945. Johns Hopkins University Press // https://books.google.ru/books?id=KVVIkZhuPnQC
- ↑ Ruggles S., Magnuson D. L. (2018). Capturing the American People: Census Technology and Institutional Change, 1790–2020 / MPC Working Papers Series. № 2 // https://pop.umn.edu/sites/pop.umn.edu/files/ruggles_magnuson_capturing-2.pdf
- ↑ Austrian G. D. (2016). Herman Hollerith: Forgotten Giant of Information Processing. BookBaby // https://books.google.ru/books?id=Kn1vjwEACAAJ
- ↑ Dalakov G. Biography of Herman Hollerith / History of Computers: hardware, software, internet… // https://history-computer.com/People/HollerithBio.html