Textricator: helppo tietojen poimija PDF-tiedostoille

Textricator-logo

Textricator on mielenkiintoinen työkalu että sinun pitäisi tietää. Se on avoimen lähdekoodin ja sitä käytetään monimutkaisten tietojen purkamiseen PDF-dokumenteista ilman ohjelmointitietoja. Jos haluat lisätietoja tästä työkalusta, voit käyttää virallisilla verkkosivuilla projektin. Sieltä löydät tietoja ja myös linkit työkalun koodiin Githubissa sekä sen dokumentaatio.

Textricator voi poimia tekstiä PDF-tiedostot ja luoda jäsenneltyjä tietoja (CSV tai JSON). Jotain hyvin käytännöllistä työskenneltäessä monien samansuuruisten tai isojen PDF-tiedostojen kanssa, ja se voi toimia jopa OCR-asiakirjoissa. Työkalu näyttää erittäin hyvältä, ja se esiteltiin vuoden 2018 Code for America -huippukokouksessa, ja sen kehitti Measures for Justice auttamaan kaikkia niitä, jotka haluavat purkaa tämäntyyppisiä tietoja ilman ohjelmointitietoa.

Muiden vaihtoehtojen ohjelmointitarpeiden sijaan Textricator antaa käyttäjän kuvata asiakirjan rakennetta yaml-tiedostolla. Joten voit purkaa tietoja PDF-tiedostoista melkein missä tahansa asettelussa, taulukot mukaan lukien, ja luoda monimutkaisia ​​raportteja niistä työkaluja, kuten Crystal Reports. Se on niin yksinkertaista, tilaat mitä haluat kerätä ja Textricator tekee sen täysin automaattisesti ...

Sen kehittäjät Joe Hale ja Stephen Byrne He ovat viettäneet kaksi viimeistä vuotta projektin parissa voidakseen purkaa kymmeniä tuhansia sivuja tietoja melkein mistä tahansa PDF-formaatista. Ja sitä voidaan käyttää komentoriviltä, ​​mutta helppokäyttöisyyden vuoksi on käytettävissä myös GUI. Joten kannustamme sinua LxA: lta käyttämään tätä Tabula-vaihtoehtoa (vaikka toiminnot ovatkin rajallisempia tietojen poimimiseksi kuin joustava Textricator) ja muita vastaavia ohjelmistoja tietojen purkamiseen.


Artikkelin sisältö noudattaa periaatteita toimituksellinen etiikka. Ilmoita virheestä napsauttamalla täällä.

Ole ensimmäinen kommentti

Jätä kommentti

Sähköpostiosoitettasi ei julkaista.

*

*

  1. Vastaa tiedoista: AB Internet Networks 2008 SL
  2. Tietojen tarkoitus: Roskapostin hallinta, kommenttien hallinta.
  3. Laillistaminen: Suostumuksesi
  4. Tietojen välittäminen: Tietoja ei luovuteta kolmansille osapuolille muutoin kuin lain nojalla.
  5. Tietojen varastointi: Occentus Networks (EU) isännöi tietokantaa
  6. Oikeudet: Voit milloin tahansa rajoittaa, palauttaa ja poistaa tietojasi.