PDF

Ako extrahovať zvýraznený text z PDF ako obyčajný textový súbor?

Ako extrahovať zvýraznený text z PDF ako obyčajný textový súbor?

Zvýraznenie textu v dokumente PDF je užitočné na označenie dôležitých oblastí, ku ktorým máte neskôr rýchly prístup. Na zvýraznenie PDF môžete použiť Microsoft Edge alebo akýkoľvek iný softvér, ktorý je vybavený funkciou zvýrazňovania PDF. Niekedy ste možno tiež cítili potrebu mať iba zvýraznený text, aby ste mohli mať súhrn PDF obsahujúci všetok podstatný text. Ak hľadáte nejaké spôsoby, ako uložiť iba zvýraznený text z PDF ako súbor TXT, potom môže byť tento príspevok užitočný.

Extrahujte zvýraznený text z PDF

Existuje nejaký bezplatný softvér a služba na extrahovanie zvýrazneného textu zo súboru PDF a jeho uloženie ako textového súboru:

Pozrime sa postupne na tento softvér PDF Highlight Extractor.

1] Extractor zvýrazňovania PDF

PDF Highlight Extractor je jednou z najjednoduchších možností na extrahovanie zvýrazneného textu zo súboru PDF. Toto open-source Extraktor zvýraznenia textu PDF má dve funkcie, ktoré upútajú pozornosť. Môžeš zobraziť ukážku zvýrazneného textu PDF na softvérovom rozhraní.

Druhou vlastnosťou je, že môžete nastavte začiatočnú alebo koncovú stránku alebo rozsah strán na extrahovanie textu. Namiesto skenovania celého PDF teda môžete definovať čísla strán, aby ste dostali zvýraznený text.

Ďalšou dobrou vlastnosťou je, že máte možnosť uložiť text ako obyčajný text alebo Súbor programu Excel.

Na jeho rozhraní pridajte súbor PDF pomocou danej možnosti a potom stlačte Extrahovať tlačidlo. Zrušte začiarknutie Všetky strany Ak chcete nastaviť rozsah stránok alebo ich ponechať v pôvodnom stave, vyberte túto možnosť. Po načítaní textu si ho môžete prezrieť. Nakoniec stlačte Text alebo Excel tlačidlo na uloženie zvýrazneného textu.

Tento softvér si môžete stiahnuť tu. Na používanie tohto softvéru je tiež potrebná Java. Nainštalujte si teda Java (ak ešte nie je) a spustite tento softvér, ktorý chcete použiť.

2] Foxit Reader

Foxit Reader je jedným z najlepších bezplatných čítačiek PDF. Na samostatných kartách môžete otvoriť viac súborov PDF, zvýrazniť PDF a pridať poznámku, export komentárov, pridať podpisy, a viac. Medzi obrovským zoznamom funkcií je aj extrahovanie zvýrazneného textu z PDF. Najlepšie na tejto funkcii je tiež uloží čísla stránok spolu s extrahovaným textom.

Ak chcete vyzdvihnúť zvýraznený text z PDF, otvorte súbor PDF na jeho rozhraní a otvorte Komentovať tab. Na tejto karte kliknite na Export možnosť dostupná v Spravovať komentáre oddiel. Uvidíte Zvýraznený text možnosť. Použite túto možnosť a potom môžete uložiť všetok zvýraznený text ako textový súbor.

Tu je odkaz na stiahnutie tohto softvéru. Počas inštalácie by ste mali zvoliť vlastnej inštalácie zahrnúť iba požadované súčasti tohto softvéru.

3] Sumnoty.sieť

Sumnoty.net je bezplatná služba, ktorá vám umožňuje anotovať súbory PDF a extrahovať zvýraznený text. Celý zvýraznený text je viditeľný osobitne na ľavom bočnom paneli. Pomocou tohto bočného panela môžete tiež odstráňte zvýraznený text, ktorý nepotrebujete a potom stiahnite zvyšok zvýrazneného textu.

Pred stiahnutím zvýrazneného textu môžete zahrnúť aj čísla strán a vylúčiť the zvýraznený text konkrétnej farby.

Máte tiež možnosť uložiť zvýraznený text z PDF ako Excel alebo Slovo spis. Takže vlastnosti sú dobré. Môžete sa zaregistrovať s bezplatným plánom a potom extrahujte 50 najdôležitejších vecí alebo anotácie na stiahnutie, čo je vo väčšine prípadov postačujúce.

Tu je odkaz na jeho domovskú stránku. Ak chcete extrahovať zvýraznený text z PDF, pridajte PDF z počítača alebo disk Google. Po nahraní súboru PDF sú na ľavej strane viditeľné poznámky a zvýraznený text. Použi Stiahnite si anotácie a potom môžete zvýraznený text uložiť do priečinka TXT, XLSX, alebo DOC formát súboru.

4] DyAnnotationExtractor

Softvér DyAnnotationExtractor vám pomôže extrahovať zvýraznený text a súbory komentáre z dokumentu PDF. Je to príkazový riadok softvér, ale jeho použitie je veľmi jednoduché. Iba jediný príkaz načíta text zvýraznený vo vstupnom súbore PDF.

Tento softvér môžete získať pomocou tohto odkazu. Stiahnite si jeho ZIP súbor a potom ho rozbaľte. Na uľahčenie spustenia príkazu by ste mali tiež vložiť PDF do rovnakého priečinka, do ktorého ste tento softvér extrahovali. Potom otvorte Príkazový riadok okno v danom priečinku. Môžete to urobiť zadaním cmd do poľa s adresou daného priečinka a potom stlačte Zadajte kľúč.

Po otvorení okna CMD pridajte súbor BAT tohto softvéru, vstupný príkaz vrátane cesty vstupného PDF, výstupný príkaz a názov výstupného súboru spolu s „.rozšírenie txt. Celý príkaz bude-

DyAnnotationExtractor.bat -input cesta vstupu PDF -výstup outputfilename.TXT

Vykonajte príkaz. Počkajte niekoľko sekúnd a bude pripravený textový súbor obsahujúci všetok zvýraznený text a komentáre načítané z daného PDF. Výstupný súbor je uložený v rovnakom vstupnom priečinku.

Existuje teda niekoľko možností, ktoré môžete použiť na extrahovanie zvýrazneného textu z PDF a následné uloženie výstupu ako textového súboru. Dúfam, že tieto pomôžu.

Hry Ako používať AutoKey na automatizáciu hier pre Linux
Ako používať AutoKey na automatizáciu hier pre Linux
AutoKey je obslužný program na automatizáciu stolných počítačov pre systémy Linux a X11, programovaný v programoch Python 3, GTK a Qt. Pomocou jeho fu...
Hry Ako zobraziť počítadlo FPS v hrách Linux
Ako zobraziť počítadlo FPS v hrách Linux
Hranie na systéme Linux získalo veľký tlak, keď spoločnosť Valve v roku 2012 oznámila podporu systému Linux pre klienta Steam a ich hry. Od tej doby s...
Hry Ako sťahovať a prehrávať Sid Meier's Civilization VI v systéme Linux
Ako sťahovať a prehrávať Sid Meier's Civilization VI v systéme Linux
Úvod do hry Civilization 6 predstavuje moderné poňatie klasického konceptu predstaveného v sérii hier Age of Empires. Myšlienka bola dosť jednoduchá; ...