Previous Entry Share Next Entry
2016-01

huge success

Написал читалку-писалку PDF’ок. Т.е. парсер+сериализатор. Читает, делает AST, конвертирует в нормализованный “граф элементов”, конвертирует обратно в AST, генерит метаданные, пишет.

А то все известные либы – это либо писалки, либо читалки, либо split-merge. Ребилд никто делать не умеет :/

На полноту не претендует (не знаю, что делать с многосекционными xref-таблицами, по смыслу задачи их надо выбрасывать), ну и смысловой анализ тоже никакой не делается, просто нормализация. И stream filters пока в процессе.

Сцуко, две недели, много нервов и исписанных листочков. Чортов Adobe.

А, да. Никто случайно не занимался вотермаркингом графов? :)


  • 1
fi_mihej December 26th, 2010
Вотермаркинг графов? Это вложить в граф, некую узнаваемую, но неизменяющую сути графа, инфу, которую потом узнать можно: ну типа "во! моя инфа есть - мой граф!"? Или наоборот - что-то вроде выделения хеша, отпечатка, и т.п., по которому конкретный граф опознать можно?
Я чо спрашиваю: термин незнакомый - интересно. :)

wizzard0 December 26th, 2010
da, tipa togo.

maxim December 26th, 2010
Круто, поздравляю!

cd_riper December 27th, 2010
писал все сам, с нуля?
а смысл?

wizzard0 December 27th, 2010
Готовых либ нет.

(no subject) (Anonymous) Expand
nicka_startcev December 27th, 2010
о. А вот эти все "новые и разные" версии .pdf - они сильно отличаются, или разницав каких-то мелочах?

(Anonymous) December 27th, 2010
сильно отличаются

thedeemon December 27th, 2010
На чем писал?

wizzard0 December 27th, 2010
Python

(Anonymous) December 27th, 2010
адоб-адобом, но вот однозначность стандарта относительно отображения документа действительно радует, иначе мне по работе пришлось бы огребать кучу проблем и чинить рендер

а с библиотеками определенно беда, из нормальных только Adobe PDF Library знаю да poppler. причем первый стоит определенно слишком много денег, а у второго с портабельностью проблемы

по работе вот такую штуку пришлось наваять: https://github.com/explicitcall/PDForm. в итоге все же перепишу ее на QML + poppler, когда руки дойдут

blacklion December 27th, 2010
я писал такое про PDF на перле много лет назад.

__hedin December 29th, 2010
PDF? Сам? Да ты бох о_О

wizzard0 December 29th, 2010
Не всё. Из талмуда, который PDF Reference, это ~10%.

__hedin December 29th, 2010
я когда-то смотрел книжку с типа описанием формата в свободной форме. так там был лютый ппц. чем дальше читаешь, тем дальше понимаешь что не понимаешь ничего )) Здоровый абзац текста, отдельные слова что значат понятно, но в предложения не складываются ))

wizzard0 December 29th, 2010
Это да, я перед этим что ли месяца два на эту доку медитировал...

dma_k January 21st, 2011
Какие либы ты просмотрел до того, как самому упражняться? Top 10 по функциональности можешь дать...?

  • 1
?

Log in

No account? Create an account