Rysiu spróbuj calibre
Zakładam, że pdfy masz z tekstem (jak jest prawie edytowalny w LO/OO). 1) Instalujesz calibre (i zażywasz puszkę uspokajacza) 2) Importujesz pdfy do calibre (lub open with - calibre), czekasz spokojnie aż się włączy 3) Dajesz na Convert/Konwertuj 4) W opcjach dajesz format wyjściowy epub lub rtf (odt brak), klikasz konwertuj 5) Czekasz, czekasz, czekasz jak stracisz nadzieję, to będzie gotowe.
Z epuba czy rtfa to już masz drogę prostą. Niby możesz w Calibre przetworzyć ileś eboków na raz, ale jest to program tak mulący i zasobożerny, że zajmie to całą noc i w końcu pewnie faktycznie się zawiesi. Niestety im dłuższy dokument konwertujesz, tym wyraźniej odczujesz jakim ślimakiem jest Calibre.
\begin offtop
1)Dziwnym trafem całość wolnego/darmowego oprogramowania do grzebania w gotowych pdfach ma właściwośći identyczne z działającym programem. I pdfedit i calibre i kilka innych mniejszych konwerterów nie dorasta do pięt adobowym destylarkom ani oprogramowaniu z TeXlive (szkoda, że nie ma TeXowego narządka typu dvi2ps ale do pdfów). 2)Dziwnym trafem książka "pdftricks" (będąca świetnym uzupełnieniem/wyjaśnieniem specyfikacji formatu pdf) jest niedostępna w bibliotekach. Dziwnym trafem nikt nie podsuwa pomysłu rozwiązywania "dziwnego trafu" nr 1 na zadnym summer of code i podobnej imprezie. Czy dziwny traf numer 2 ma coś do tego? W końcu pe-de-ef to tylko nowsiejszy i głupsiejszy zamiennik postscriptu. Gdzie leży problem?
\end offtop
Pozdrawiam Dominik
W dniu 1 października 2014 10:50 użytkownik "Łukasz "Cyber Killer" Korpalski" cyberkiller8@gmail.com napisał:
W dniu 01.10.2014 o 10:31, rysiek pisze:
Cześć,
I'm in a bit of a pickle, szukam metody automagicznego przerzucenia PDFa do ODT -- tak, mogę sobie kopiować tekst ręcznie, ale to jest upierdliwe; there has to be a better way, a jak na razie poza szemranymi stronami na necie "przekonwertujemy i wyślemy Ci mailem", nic nie znalazłem.
Libreoffice otwiera PDF i pozwala go edytować, ale jako... obrazek z (edytowalnym) tekstem. No way to save as ODT, all you get is ODG (grafika OpenDocument).
Halp?
Popularnie używa się pdf2html i różne regexpy do wycinania zbędnych elementów (np żeby wykryć gdzie jest akapit) i potem z htmla do jakiegoś formatu jaki lubisz. Uciążliwe i jedynie po części automatyczne, ale jak masz wiele takich samych pdfów albo jeden koszmarnie długi to może się nadać.
Szemrane konwertery używają wewnętrznie zapewne Fine Reader'a, który dla cyfrowych plików ma całkiem bardzo dobrą skuteczność, no ale kosztuje.
-- Łukasz "Cyber Killer" Korpalski
mail: cyberkiller8@gmail.com xmpp: cyber_killer@jabster.pl site: http://website.cybkil.cu.cc gpgkey: 0x72511999 @ hkp://keys.gnupg.net
//When replying to my e-mail, kindly please //write your message below the quoted text.
General mailing list General@lists.hackerspace.pl https://lists.hackerspace.pl/mailman/listinfo/general