W dniu 01.10.2014 o 21:18, Dominik Tabisz pisze:
Rysiu spróbuj calibre
(...)
odczujesz jakim ślimakiem jest Calibre.
Calibre o ile dobrze pamiętam wewnętrznie używa właśnie pdf2html, więc jeden pies, a użycie skryptu ręcznie jest mniej zasobożerne.
\begin offtop
1)Dziwnym trafem całość wolnego/darmowego oprogramowania do grzebania w gotowych pdfach ma właściwośći identyczne z działającym programem. I pdfedit i calibre i kilka innych mniejszych konwerterów nie dorasta do pięt adobowym destylarkom ani oprogramowaniu z TeXlive (szkoda, że nie ma TeXowego narządka typu dvi2ps ale do pdfów). 2)Dziwnym trafem książka "pdftricks" (będąca świetnym uzupełnieniem/wyjaśnieniem specyfikacji formatu pdf) jest niedostępna w bibliotekach. Dziwnym trafem nikt nie podsuwa pomysłu rozwiązywania "dziwnego trafu" nr 1 na zadnym summer of code i podobnej imprezie. Czy dziwny traf numer 2 ma coś do tego? W końcu pe-de-ef to tylko nowsiejszy i głupsiejszy zamiennik postscriptu. Gdzie leży problem?
\end offtop
Ja bym powiedział że problem leży w samym formacie pdf. On nie jest przewidziany do dalszej edycji na poziomie tekstu, a jedynie do wyświetlania (coś jak płytka cd - po wypaleniu nie edytujesz zawartości). Z tego wynika parę faktów technicznych jak np brak czegoś takiego jak akapit tekstu (każdy tekst to 1 linijkowy string), co szalenie utrudnia powrót z tego formatu do jakiegoś edytowalnego, tak żeby to miało ręce i nogi. Wszystkie konwertery używają kombinacji ocr i sprytnych regexpów, żeby wrócić z tego formatu do jakiegoś edytowalnego. Jedyna inna opcja to edycja w formie grafiki wektorowej, polecam do tego celu Inkscape.
Rozwiązania są, ale inne niż myślisz. O ile wiem to LO ma (już teraz lub planowaną) opcję embeddowania oryginalnego pliku odt w eksportowanym pdfie. To w teorii ma zapewniać pełną edycję takiego pdfa później, w praktyce nie kojarzę żebym to gdzieś widział w akcji.
Z resztą... narzędzia do pdfów stoją jeszcze na całkiem zajebistym poziomie moim zdaniem. Porównajcie to z narzędziami do djvu, tam tylko można usiąść i płakać.