Мы живём среди компьютеров и свободного софта – и пишем о них. Если для кого-то написанное нами будет поводом заитересоваться этими темами – будем считать, что не зря долбили по клавишам.
Linux от Oracle
Пару лет назад мир свободного софта в очередной раз содрогнулся: компания Oracle объявила о выпуске собственного дистрибутива Linux – на базе не кого-нибудь, а текущей версии RHEL. Начались прорицания под стать Дельфийскому оракулу: либо Oracle съест Red Hat, либо преданные сторонники последнего забойкотируют Нерушимый Linux (именно так называлась первая версия от Oracle).
Прошло время, страсти поостыли. И Red Hat никуда не делся, и Linux от Oracle нашёл своё место под солнцем. В частности, в виде третьей своей версии, увидевшей свет 12 февраля. Которая именуется уже просто – Oracle Linux. В чём же её цимес?
В первую очередь – в ядре, которое тоже удостоилось имени собственного, Unbrecable Enterprise Kernel (сокращённо – uek). Давно уже общим местом стало воспевать «отзывчивость» дистрибутива Fedora и всех генетически связанных с ней систем. Так вот, Oracle Linux в этом отношении ей ничуть не уступает. А с учётом разницы в «железной» базе (Fedora у меня стоит на быстром SSD, для Oracle Linux нашёлся только полуутильный винчестер пятилетней давности), то возможно, что и превосходит.
Что это может дать простому постсоветскому юзеру? Прямо – пожалуй, что и ничего: и в самом дистрибутиве, и в его свободно доступном репозитории недостаёт очень многого. Но декларируемая политика компании – возможность использования ядра uek в любых сторонних продукта без всяких ограничений, – вселяет надежду, что его наработки будут аккумулированы и в дистрибутивах, развиваемых сообществом.
ОС Barrelfish: рыбозасолочный цех
Разработчики не часто удивляют нас появлением новых операционных систем. Оно и понятно: казалось бы, в существующих ОС реализованы все разумные идеи. Ан нет: осенью 2009 года мы имели удовольствие видеть представление Barrelfish – ОС с принципиально новой, мультиядерной (multikernel), архитектурой: в ней, подобно сельдям в бочке, несколько ядер (kernel), соответствующих ядрам (core) аппаратной платформы, работает независимо, с собственными приложениями.
Возможно, такой «рыбозасолочный» подход будет более эффективным при мультипроцессинге, нежели традиционные механизмы SMP или NUMA. А ведь именно эффективное распараллеливание задач между наличными ядрами – ныне единственный способ наращивания производительности, особенно ввиду скорого появления восьмиядерных процессоров даже в пользовательских декстопах.
Интересны разработчики и лицензия новой ОС. Первые – Высшая техническая школа Цюриха (ETHZ), известная многими именами учёных в области точных и компьютерных наук и... компания Microsoft, просто известная. А лицензия – практически стандартная в BSD-стиле.
Первого марта текущего года появился третий по счёту снапшот. Система позиционируется как исследовательская, и к практическому применению (пока) не пригодна. Однако кто знает – может быть, скоро мы увидим действующий «рыбозасолочный цех», порождённый альянсом научной свободы и проприетаризма.
Linux и OCR – братья на век
До недавнего времени Linux не мог похвастаться эффективными средствами для распознавания текстов: резонные люди рекомендовали прибегать к связке из FineReader+Wine.
Да и задача эта не выглядела актуальной: мне казалось, что большая часть «старого» контента уже оцифрована, а новый только в цифровой форме и создаётся. Однако по мере развития своих гуманитарных проектов (геологическго и исторического) я убедился, что был не прав: существует море «неокученных» старых материалов по этой теме. А материалы новые часто легче оцифровать с печатных версий, чем получить «файлы-исходники»: увы, один за другим уходят мамонты советской геологии.
Но действительности со свободными средствами распознавания оказалось «всё не так суицидально, ежли в корень посмотреть»: в 2008 году были открыты исходники OCR Cuneiform, которые тут же портировались на Linux и FreeBSD.
Правда, прямое применение Cuneiform к свежесканированным страницам производило удручающее впечатление. Однако дело оказалось легко поправимо благодаря программам:
•
Scan Tailor (разработка Иосифа Арцимовича) – она выполняет предварительную коррекцию отсканированного документа, и
•
YAGF (создана Андреем Боровским) – это интегрирующая графическая оболочка для Cuneiform, упрощающая её использование и расширяющая возможности.
Связка из этих трёх инструментов даёт результат хотя и не идеальный, но более чем приемлемый. И результат этот можно видеть на сайтах Памяти Советской геологии и Гиштория.
Куда катится мир?