PDF-toiminnot
PDF-toiminnot mahdollistavat kuvien, tekstin ja taulukoiden poimimisen PDF-tiedostoista sekä uusien asiakirjojen luominen sivujen järjestämällä.
Jos haluat poimia tekstiä PDF-tiedostosta, käytä Poimi teksti PDF-tiedostosta -toimintoa. Seuraavassa esimerkissä poimitaan teksti salasanalla suojatun tiedoston tietyltä sivualueelta. Salasana määritetään lisäasetuksissa.
Taulukkomuotoon järjestettyjä tekstejä poimitaan ottamalla Rakenteisten tietojen optimointi käyttöön. Näin voidaan parantaa tulosten muotoa ja tarkkuutta.
Taulukoita poimitaan PDF-tiedostosta ottamalla Poimi taulukot PDF-tiedostosta -toiminto käyttöön, valitsemalla tiedosto ja määrittämällä sivut, joista poiminta tehdään.
Toiminto tuottaa ExtractedPDFTables-muuttujan, joka sisältää luettelon PDF-taulukon tiedoista. Lisätietoja tästä luettelotyypistä on kohdassa Lisätietotyypit.
Huomautus
- Poimi taulukoita PDF-tiedostosta -toiminto ei käytä optista merkkien tunnistusta, joten et voi poimia ei-kopioitavaa tekstiä skannatuista PDF-tiedostoista.
- Toiminnon taustalla oleva kirjasto poimii toisinaan lisää PDF-tietoja, jotka eivät ole taulukoita. Tämä toiminto minimoi todellisen taulukon poisjättämisen riskin.
PDF-tiedostojen tietojen poimimisen lisäksi voit luoda uuden PDF-tiedoston olemassa olevasta tiedostosta käyttämällä Poimi PDF-tiedoston sivut uuteen PDF-tiedostoon -toimintoa.
Seuraava esimerkki valitsee tietyt sivut ja sivualueen.
Tekstin poimiminen PDF-tiedostosta
Voit poimia tekstiä PDF-tiedostosta käyttämällä Poimi teksti PDF-tiedostosta -toimintoa. Toiminnon ominaisuuksissa voit määrittää PDF-lähdetiedoston ja sivut, joista teksti puretaan. Lisätoiminto-ominaisuuksissa voit määrittää salasanan, jos PDF-tiedosto on suojattu ja sen, pitäisikö moduuli optimoida rakenteisille tiedoille.
Syöteparametrit
Argumentti | Valinnainen | Hyväksyy | Oletusarvo | Description |
---|---|---|---|---|
PDF file | Ei | Tiedosto | PDF-tiedosto, josta teksti poimitaan. Syötä tiedostopolku tai muuttuja, joka sisältää tiedoston tai tekstipolun | |
Poimittavat sivut | – | Kaikki, Yksittäinen, Alue | Kaikki | Määrittää, miten monta sivua poimitaan. Esimerkiksi kaikki sivut, yksi sivu tai sivualue |
Single page number | Ei | Numeerinen arvo | Sen yhden sivun numero, jolta teksti poimitaan | |
From page number | Ei | Numeerinen arvo | Ensimmäinen sivunumero sivualueella, jolta teksti poimitaan | |
To page number | Ei | Numeerinen arvo | Viimeinen sivunumero sivualueella, jolta teksti poimitaan | |
Password | Kyllä | Suora salattu syöte tai tekstiarvo | PDF-tiedoston salasana. Jätä tämä tyhjäksi, jos PDF-tiedostoa ei ole suojattu salasanalla | |
Optimoi rakenteisille tiedoille | – | Totuusarvo | Epätosi | Määritä, tunnistetaanko tiedoston muotoiltu asettelu ja puretaanko teksti vastaavasti |
Tuotetut muuttujat
Argumentti | Type | Description |
---|---|---|
ExtractedPDFText | Tekstiarvo | Poimittu teksti |
Poikkeukset
Poikkeus | Kuvaus |
---|---|
PDF-tiedostoa ei ole | Tiedosto ei ole annetun polun sijainnissa |
Virheellinen salasana | Annettu salasana on virheellinen |
Tekstin poimiminen epäonnistui | Virhe yritettäessä poimia tekstiä |
Poimi taulukot PDF-tiedostosta
Voit purkaa PDF-tiedoston sisältämiä taulukoita Pura taulukoita PDF-tiedostosta -toiminnolla . Toiminnon ominaisuuksissa voit määrittää PDF-lähdetiedoston ja sivualueen, joista taulukot puretaan. Lisätoiminto-ominaisuuksissa voit määrittää salasanan, jos PDF-tiedosto on suojattu, määrittää, onko taulukossa otsikoita, ja lopuksi, onko taulukoiden sivujen väliset marginaalit yhdistettävä.
Syöteparametrit
Argumentti | Valinnainen | Hyväksyy | Oletusarvo | Description |
---|---|---|---|---|
PDF-tiedosto | Ei | Tiedosto | PDF-tiedosto, josta taulukot poimitaan. Syötä tiedostopolku tai muuttuja, joka sisältää tiedoston tai tekstipolun | |
Poimittavat sivut | – | Kaikki, Yksittäinen, Alue | Kaikki | Määrittää, kuinka monelta sivulta taulukot puretaan; kaikki sivut, yksittäinen sivu tai sivualue |
Yksi sivunumero | Ei | Numeerinen arvo | Yksittäisen sivun numero, josta taulukot puretaan | |
Ensimmäinen sivunumero | Ei | Numeerinen arvo | Ensimmäinen sivunumero sivualueesta, josta taulukot puretaan | |
Viimeinen sivunumero | Ei | Numeerinen arvo | Viimeinen sivunumero sivualueesta, josta taulukot puretaan | |
Password | Kyllä | Suora salattu syöte tai tekstiarvo | PDF-tiedoston salasana. Jätä tämä tyhjäksi, jos PDF-tiedostoa ei ole suojattu salasanalla | |
Yhdistä taulukot, jotka ylittävät sivun marginaalit | – | Totuusarvo | Tosi | Määrittää, yhdistetäänkö taulukot, jotka ylittävät sivun marginaalit määritetyllä sivualueella |
Ensimmäinen rivi sisältää sarakkeiden nimet | – | Totuusarvo | Tosi | Määrittää, sisältääkö taulukon ensimmäinen rivi sarakkeiden nimet |
Tuotetut muuttujat
Argumentti | Type | Description |
---|---|---|
ExtractedPDFTables | PDF-taulukon tietojen luettelo | Poimitut taulukot, joiden tiedot ovat luettelona |
Poikkeukset
Poikkeus | Kuvaus |
---|---|
PDF-tiedostoa ei ole | Tiedosto ei ole annetun polun sijainnissa |
Virheellinen salasana | Annettu salasana on virheellinen |
Taulukoiden poimiminen epäonnistui | Virhe yritettäessä poimia taulukoita |
Kuvien poimiminen PDF-tiedostosta
Voit poimia kuvia PDF-tiedostosta Poimi kuvat PDF-tiedostosta -toiminnon avulla. Toimintoparametreissa voit määrittää PDF-tiedoston ja sivut, joilta kuvat puretaan, purettujen kuvien nimeämiskäytännön ja tallennettujen kuvien kohdesijainnin. Voit myös määrittää salasanan, jos PDF-tiedosto on suojattu lisäasetuksilla.
Syöteparametrit
Argumentti | Valinnainen | Hyväksyy | Oletusarvo | Description |
---|---|---|---|---|
PDF file | Ei | Tiedosto | PDF-tiedosto, josta kuvat poimitaan. Syötä tiedostopolku tai muuttuja, joka sisältää tiedoston tai tekstipolun | |
Password | Kyllä | Suora salattu syöte tai tekstiarvo | PDF-tiedoston salasana. Jätä tämä tyhjäksi, jos PDF-tiedostoa ei ole suojattu salasanalla | |
Page(s) to extract | – | Kaikki, Yksittäinen, Alue | Kaikki | Määrittää, miten monta sivua poimitaan. Esimerkiksi kaikki sivut, yksi sivu tai sivualue |
Single page number | Ei | Numeerinen arvo | Sen yhden sivun numero, jolta kuvat poimitaan | |
From page number | Ei | Numeerinen arvo | Ensimmäinen sivunumero sivualueella, jolta kuvat poimitaan | |
To page number | Ei | Numeerinen arvo | Viimeinen sivunumero sivualueella, jolta kuvat poimitaan | |
Image(s) name | Ei | Tekstin arvo | Miten kuvien nimi alkaa. Poimittujen kuvien nimiesimerkki: GivenName_1, GivenName_2 | |
Save image(s) to | Ei | Kansio | Kansio, johon puretut kuvat tallennetaan png-tiedostoina |
Tuotetut muuttujat
Tämä toiminto ei tuota muuttujia.
Poikkeukset
Poikkeus | Description |
---|---|
Virheellinen salasana | Annettu salasana on virheellinen |
Kuvien poimiminen epäonnistui | Osoittaa, että PDF-tiedoston tiettyjen sivujen kuvien poimimisen aikana tapahtui virhe |
Kansiota ei ole | Osoittaa, että kansiota ei ole |
PDF-tiedostoa ei ole | Tiedosto ei ole annetun polun sijainnissa |
Poimi PDF-tiedoston sivut uuteen PDF-tiedostoon
Voit luoda uuden PDF-tiedoston erottelemalla sivuja olemassa olevasta PDF-tiedostosta käyttämällä PDF-tiedoston sivut uudeksi PDF-tiedostoksi -toimintoa. Toimintoparametreissa voit määrittää PDF-tiedoston, josta sivut puretaan, purettavat sivut, uuden PDF-tiedoston sijainnin ja mitä tapahtuu, jos tiedosto, jolla on sama nimi ja tunniste, on jo olemassa. Lisäominaisuuksien avulla voit määrittää salasanan, jos PDF-lähde on suojattu.
Syöteparametrit
Argumentti | Valinnainen | Hyväksyy | Oletusarvo | Description |
---|---|---|---|---|
PDF file | Ei | Tiedosto | PDF-tiedosto, josta sivut poimitaan. Syötä tiedostopolku tai muuttuja, joka sisältää tiedoston tai tekstipolun | |
Password | Kyllä | Suora salattu syöte tai tekstiarvo | PDF-tiedoston salasana. Jätä tämä tyhjäksi, jos PDF-tiedostoa ei ole suojattu salasanalla | |
Page selection | Ei | Tekstiarvo | Säilytettävien sivujen indeksinumerot (esimerkiksi 1, 3, 17–24) | |
Extracted PDF path | Ei | Tiedosto | Polku poimitun PDF-tiedoston tallennussijaintiin | |
If file exists | – | Korvaaminen, Älä korvaa, Järjestysliitteen lisääminen | Lisää peräkkäinen loppuliite | Määrittää, mitä tehdään, jos tuloksen PDF-tiedosto on jo olemassa |
Tuotetut muuttujat
Argumentti | Type | Description |
---|---|---|
ExtractedPDF | Tiedosto | Uusi PDF-tiedosto |
Poikkeukset
Poikkeus | Kuvaus |
---|---|
Virheellinen salasana | Annettu salasana on virheellinen |
PDF-tiedostoa ei ole | Tiedosto ei ole annetun polun sijainnissa |
Sivu on rajojen ulkopuolella | Osoittaa, että vähintään yksi sivu on PDF-tiedoston rajojen ulkopuolella |
Virheellinen sivuvalinta | Osoittaa, että annetut sivut eivät ole sallittuja PDF-tiedostolle |
Uuden PDF-tiedoston poimiminen epäonnistui | Osoittaa, että uuden PDF-tiedoston poimimisen aikana tapahtui virhe |
Yhdistä PDF-tiedostot
Yhdistää useita PDF-tiedostoja uuteen tiedostoon.
Voit käyttää Yhdistä PDF-tiedostot -toimintoa yhdistääksesi kaksi tai useampaa PDF-tiedostoa yhdeksi tiedostoksi. Yhdistettävät tiedostot voidaan antaa joko luettelon muodossa tai kokolainausmerkkeissä erotinmerkillä eroteltuna. Voit myös antaa PDF-tiedostojen salasanat, jos tiedostot on suojattu salasanalla.
Syöteparametrit
Argumentti | Valinnainen | Hyväksyy | Oletusarvo | Description |
---|---|---|---|---|
PDF files | Ei | Luettelotiedostoista | Yhdistettävät tiedostot. Jos tiedostoja on useita, sulje ne lainausmerkkeihin (") ja erota ne erottimella tai käytä tiedostoluetteloa | |
Merged PDF path | Ei | Tiedosto | Polku yhdistetyn PDF-tiedoston tallennussijaintiin | |
If file exists | – | Korvaaminen, Älä korvaa, Järjestysliitteen lisääminen | Lisää peräkkäinen loppuliite | Määrittää, mitä tehdään, jos kohdetiedosto on jo olemassa |
Passwords | Kyllä | Suora salattu syöte tai tekstiarvo | Erotellut salasanat. Tilauksen on oltava sama kuin syötettyjen PDF-tiedostojen järjestys. Jätä tämä tyhjäksi, jos PDFs-tiedostoja ei ole suojattu salasanalla | |
Erotinmerkki | Ei | Tekstin arvo | , | Mukautettu salasanaerotin. Tämän erottimen ei tule olla minkään salasanan osa |
Tuotetut muuttujat
Argumentti | Type | Description |
---|---|---|
MergedPDF | Tiedosto | Yhdistetty PDF-tiedosto |
Poikkeukset
Poikkeus | Kuvaus |
---|---|
PDF-tiedostoa ei ole | Tiedosto ei ole annetun polun sijainnissa |
Virheellinen salasana | Annettu salasana on virheellinen |
PDF-tiedostojen yhdistäminen epäonnistui | Osoittaa, että tiedostojen yhdistämisessä tapahtui virhe |