Textricator: një tërheqës i thjeshtë i të dhënave për skedarët PDF

Logoja e tekstshkruesit

Textricator është një mjet interesant që duhet ta dini. Isshtë burim i hapur dhe përdoret për të nxjerrë të dhëna komplekse nga dokumentet PDF, pa pasur nevojë për njohuri programimi. Nëse dëshironi të dini më shumë informacion në lidhje me këtë mjet, mund të përdorni faqen zyrtare të internetit të projektit. Nga atje do të gjeni informacione dhe gjithashtu do të përdorni linqet e kodit të mjetit në Github, së bashku me dokumentacionin e tij.

Textricator mund të nxjerrë tekst nga Skedarët PDF dhe gjenerojnë të dhëna të strukturuara (CSV ose JSON). Diçka shumë praktike për të kur punoni me shumë PDF të të njëjtit format ose një PDF të madh, dhe madje mund të funksionojë në dokumentet OCR. Mjeti duket shumë i mirë, dhe u prezantua në Samitin e Kodit 2018 për Amerikën dhe u zhvillua nga Masat për Drejtësi me qëllim për të ndihmuar të gjithë ata që duan të nxjerrin këtë lloj të dhënash pa njohuri programimi.

Në vend të nevojave programuese të alternativave të tjera, Textricator lejon përdoruesin të përshkruajë strukturën e dokumentit duke përdorur një skedar yaml. Dhe kështu mund të nxjerrni të dhëna nga skedarët PDF në pothuajse çdo paraqitje, përfshirë tabelat, dhe të gjeneroni raporte komplekse nga mjete si Crystal Reports. Thatshtë kaq e thjeshtë, ju porosisni atë që dëshironi të mbledhni dhe Textricator e bën atë plotësisht automatikisht ...

Zhvilluesit e saj Joe Hale dhe Stephen Byrne ata kanë kaluar dy vitet e fundit duke punuar në projekt për të qenë në gjendje të nxjerrin dhjetëra mijëra faqe të të dhënave nga pothuajse çdo format PDF. Dhe mund të përdoret nga rreshti i komandës, por ka edhe një GUI të disponueshëm për lehtësi. Kështu që ne ju inkurajojmë nga LxA të përdorni këtë alternativë Tabula (megjithëse është më e kufizuar në funksione për të nxjerrë të dhëna sesa Textricator fleksibël) dhe softuer tjetër i ngjashëm me të për nxjerrjen e të dhënave.


Lini komentin tuaj

Adresa juaj e emailit nuk do të publikohet. Fusha e kërkuar janë shënuar me *

*

*

  1. Përgjegjës për të dhënat: AB Internet Networks 2008 SL
  2. Qëllimi i të dhënave: Kontrolloni SPAM, menaxhimin e komenteve.
  3. Legjitimimi: Pëlqimi juaj
  4. Komunikimi i të dhënave: Të dhënat nuk do t'u komunikohen palëve të treta përveç me detyrim ligjor.
  5. Ruajtja e të dhënave: Baza e të dhënave e organizuar nga Occentus Networks (BE)
  6. Të drejtat: Në çdo kohë mund të kufizoni, rikuperoni dhe fshini informacionin tuaj.