Американский академик Калев Литару разработал программу для автоматической оцифровки исторических изображений из библиотеки Internet Archive. Последняя содержит всевозможные произведения от 1500 до 1922 года выпуска.
Для выявления изображений Литару использует алгоритм оптического распознавания символов (OCR). С его помощью он определяет границы текста, которые позволяют выявить на страницах иллюстрации.
На сегодняшний день оцифровке подверглось более 2,6 миллионов изображений. Все они находятся в открытом доступе на фотохостинге Flickr. Все оцифрованные изображения сопровождаются описанием, однако оно не всегда соответствует истине. Всего же планируется загрузить около 14 миллионов иллюстраций.