В Библиотеке Конгресса США хранятся тысячи редких документов, описывающих историю Соединенных Штатов. Среди них и бумаги времен Гражданской Войны, и документы по генеологии и даже 850 бумаг, автором которых является сам Бенджамин Франклин. Однако, с каждым годом, состояние документов все ухудшается, в связи с чем возникла необходимость создать их электронные копии. Более того, библиотека намерена выложить их онлайн для публичного обозрения. Для этих целей была разработана система Scribe. Scribe – комплекс аппаратных и программных решений (заметим – Open Source программных решений), предназначенный для сканирования книг. Разработка этого проекта началась сразу после получения гранта в 2 миллиона долларов США от Sloan Foundation. Первые версии ПО разрабатывались как под Windows, так и под Linux, однако в последствии, поддержка Windows отмерла и сейчас работа ведется исключительно средствами Linux-решений. Базовым дистрибутивом был выбран Ubuntu. По словам разработчика ПО архива Brewster Kahle, на сканирование обычной книги уходит порядка 10 часов времени работы кластера. Более того, он утверждает, что исходный код системы – 100% Open Source. Хранятся все данные в Petabox.
Если Вам интересно узнать больше об этом неординарном проекте – милости просим.