การดำเนินการของ PDF
การดำเนินการของ PDF ช่วยให้คุณสามารถแยกรูปภาพ ข้อความ และตารางจากไฟล์ PDF และจัดเรียงหน้าเพื่อสร้างเอกสารใหม่
ในการแยกข้อความจากไฟล์ PDF ให้ใช้การดำเนินการ แยกข้อความจาก PDF ตัวอย่างต่อไปนี้เป็นการแยกข้อความจากช่วงของหน้าที่ระบุที่เป็นไฟล์ที่ป้องกันด้วยรหัสผ่าน รหัสผ่านถูกระบุในการตั้งค่า ขั้นสูง
หากต้องการแยกข้อความที่จัดเรียงในรูปแบบตาราง ให้เปิดใช้งาน ปรับให้เหมาะสมกับข้อมูลที่มีโครงสร้าง เพื่อปรับปรุงรูปแบบและความแม่นยำของผลลัพธ์
หากต้องการแยกตารางออกจากไฟล์ PDF ให้ปรับใช้งานการดำเนินการ แยกตารางจาก PDF เลือกไฟล์ และระบุหน้าที่จะแยกออกมา
การดำเนินการสร้างตัวแปร ExtractedPDFTables ที่มีรายการข้อมูลตาราง PDF หากต้องการค้นหาข้อมูลเกี่ยวกับรายการประเภทนี้ ให้ไปที่ ชนิดข้อมูลขั้นสูง
หมายเหตุ
- การดำเนินการ แยกตารางจาก PDF ไม่ได้ใช้การรู้จำอักขระด้วยแสง (OCR) ดังนั้นคุณจึงไม่สามารถแยกข้อความที่ไม่สามารถคัดลอกออกจาก PDF ที่สแกนได้
- ไลบรารีเบื้องหลังการดำเนินการจะดึงข้อมูล PDF เพิ่มเติมที่ไม่ใช่ตารางเป็นครั้งคราว ฟังก์ชันนี้ช่วยลดความเสี่ยงของการละเว้นตารางจริงโดยไม่ได้ตั้งใจ
นอกเหนือจากการดึงข้อมูลจากไฟล์ PDF คุณสามารถสร้างเอกสาร PDF ใหม่จากไฟล์ที่มีอยู่โดยใช้การดำเนินการ แยกหน้าไฟล์ PDF เป็นไฟล์ PDF ใหม่
ตัวอย่างต่อไปนี้เลือกหน้าที่เป็นการรวมหน้าเฉพาะและช่วงของหน้า
แยกข้อความจาก PDF
คุณสามารถแยกข้อความจากไฟล์ PDF ได้โดยใช้การดำเนินการ "แยกข้อความจาก PDF" ในคุณสมบัติการดำเนินการ คุณสามารถกำหนดไฟล์ PDF ต้นฉบับและหน้าที่ควรแยกข้อความออกมา ภายใต้คุณสมบัติการดำเนินการขั้นสูง คุณสามารถกำหนดรหัสผ่านได้ในกรณีที่ไฟล์ PDF ได้รับการปกป้อง และกลไกควรปรับให้เหมาะสมสำหรับข้อมูลที่มีโครงสร้างหรือไม่
พารามิเตอร์อินพุต
อาร์กิวเมนต์ | ระบุหรือไม่ก็ได้ | ยอมรับ | ค่าตามค่าเริ่มต้น | คำอธิบาย |
---|---|---|---|---|
PDF file | ไม่ | แฟ้ม | ไฟล์ PDF ที่จะแยกข้อความ ป้อนพาธไฟล์ ตัวแปรที่มีไฟล์หรือพาธที่เป็นข้อความ | |
หน้าที่จะแยก | ไม่ระบุ | ทั้งหมด เดี่ยว ช่วง | ทั้งหมด | ระบุจำนวนหน้าที่จะแยก: หน้าทั้งหมด หน้าเดียว หรือช่วงของหน้า |
Single page number | ไม่ | ค่าตัวเลข | หมายเลขของหน้าเดียวที่จะแยกข้อความออกมา | |
From page number | ไม่ | ค่าตัวเลข | หมายเลขหน้าแรกจากช่วงของหน้าที่จะแยกข้อความออกมา | |
To page number | ไม่ | ค่าตัวเลข | หมายเลขหน้าสุดท้ายจากช่วงของหน้าที่จะแยกข้อความออกมา | |
รหัสผ่าน | ใช่ | ป้อนอินพุตที่เข้ารหัสโดยตรงหรือ ค่าข้อความ | รหัสผ่านของไฟล์ PDF ให้เว้นว่างไว้หากรหัสผ่านของไฟล์ PDF ไม่มีการป้องกัน | |
ปรับให้เหมาะสมกับข้อมูลที่มีโครงสร้าง | ไม่ระบุ | ค่าแบบบูลีน | เท็จ | ระบุว่าจะตรวจหาเค้าโครงที่จัดรูปแบบในเอกสารและแยกข้อความตามนั้นหรือไม่ |
ตัวแปรที่สร้าง
อาร์กิวเมนต์ | ชนิด | คำอธิบาย |
---|---|---|
ExtractedPDFText | ค่าข้อความ | ข้อความที่แยกออก |
ข้อยกเว้น
ข้อยกเว้น | คำอธิบาย |
---|---|
ถ้าไม่มีไฟล์ PDF อยู่ | ไม่มีไฟล์อยู่ในพาธที่ให้มา |
รหัสผ่านที่ไม่ถูกต้อง | รหัสผ่านที่ระบุไม่ถูกต้อง |
ไม่สามารถแยกข้อความ | เกิดข้อผิดพลาดขณะที่พยายามแยกข้อความ |
แยกตารางออกจาก PDF
คุณสามารถแยกตารางที่มีอยู่ในไฟล์ PDF ได้โดยใช้การดำเนินการ แยกตารางออกจาก PDF ในคุณสมบัติการดำเนินการ คุณสามารถกำหนดไฟล์ PDF และช่วงของหน้าที่ควรแยกตารางออกมา ภายใต้คุณสมบัติการดำเนินการขั้นสูง คุณสามารถกำหนดรหัสผ่านในกรณีที่ไฟล์ PDF ได้รับการปกป้อง กำหนดว่าตารางมีส่วนหัวหรือไม่ และสุดท้ายคือตารางที่ข้ามระยะขอบหน้าควรรวมเข้าด้วยกันหรือไม่
พารามิเตอร์อินพุต
อาร์กิวเมนต์ | ระบุหรือไม่ก็ได้ | ยอมรับ | ค่าตามค่าเริ่มต้น | คำอธิบาย |
---|---|---|---|---|
ไฟล์ PDF | ไม่ | แฟ้ม | ไฟล์ PDF ที่จะแยกตารางจาก ป้อนพาธไฟล์ ตัวแปรที่มีไฟล์หรือพาธที่เป็นข้อความ | |
หน้าที่จะแยก | ไม่ระบุ | ทั้งหมด เดี่ยว ช่วง | ทั้งหมด | ระบุจำนวนหน้าที่จะแยกตารางออกมา: ทุกหน้า หน้าเดียว หรือช่วงของหน้า |
หมายเลขหน้าเดียว | ไม่ | ค่าตัวเลข | หมายเลขของหน้าเดียวที่จะแยกตารางออกมา | |
หมายเลขหน้า จาก | ไม่ | ค่าตัวเลข | หมายเลขหน้าแรกจากช่วงของหน้าที่จะแยกตารางออกมา | |
หมายเลขหน้า ถึง | ไม่ | ค่าตัวเลข | หมายเลขหน้าสุดท้ายจากช่วงของหน้าที่จะแยกตารางออกมา | |
รหัสผ่าน | ใช่ | ป้อนอินพุตที่เข้ารหัสโดยตรงหรือ ค่าข้อความ | รหัสผ่านของไฟล์ PDF ให้เว้นว่างไว้หากรหัสผ่านของไฟล์ PDF ไม่มีการป้องกัน | |
รวมตารางที่ข้ามระยะขอบของหน้าเข้าด้วยกัน | ไม่ระบุ | ค่าแบบบูลีน | จริง | ระบุว่าจะรวมตารางที่ข้ามระยะขอบหน้ากระดาษในช่วงของหน้าที่ระบุเข้าด้วยกันหรือไม่ |
บรรทัดแรกประกอบด้วยชื่อคอลัมน์ | ไม่ระบุ | ค่าแบบบูลีน | จริง | ระบุว่าบรรทัดแรกของตารางมีชื่อคอลัมน์หรือไม่ |
ตัวแปรที่สร้าง
อาร์กิวเมนต์ | ชนิด | คำอธิบาย |
---|---|---|
ExtractedPDFTables | รายการของข้อมูลตาราง PDF | ตารางที่แยกพร้อมข้อมูลเป็นรายการ |
ข้อยกเว้น
ข้อยกเว้น | คำอธิบาย |
---|---|
ถ้าไม่มีไฟล์ PDF อยู่ | ไม่มีไฟล์อยู่ในพาธที่ให้มา |
รหัสผ่านที่ไม่ถูกต้อง | รหัสผ่านที่ระบุไม่ถูกต้อง |
ไม่สามารถแยกตาราง | เกิดข้อผิดพลาดขณะพยายามแยกตาราง |
แยกรูปภาพจาก PDF
ในการแยกรูปภาพจากไฟล์ PDF คุณสามารถใช้การดำเนินการ แยกรูปภาพจาก PDF ในพารามิเตอร์การดำเนินการ คุณสามารถกำหนดไฟล์ PDF และหน้าต่างๆ ที่จะแยกรูปภาพ รูปแบบการตั้งชื่อของรูปภาพที่แยกออกมา และตำแหน่งเป้าหมายของรูปภาพที่บันทึกไว้ คุณยังสามารถกำหนดรหัสผ่านได้หากไฟล์ PDF ได้รับการปกป้องภายใต้การตั้งค่าขั้นสูง
พารามิเตอร์อินพุต
อาร์กิวเมนต์ | ระบุหรือไม่ก็ได้ | ยอมรับ | ค่าตามค่าเริ่มต้น | คำอธิบาย |
---|---|---|---|---|
PDF file | ไม่ | แฟ้ม | ไฟล์ PDF ที่จะแยกรูปภาพ ป้อนพาธไฟล์ ตัวแปรที่มีไฟล์หรือพาธที่เป็นข้อความ | |
รหัสผ่าน | ใช่ | ป้อนอินพุตที่เข้ารหัสโดยตรงหรือ ค่าข้อความ | รหัสผ่านของไฟล์ PDF ให้เว้นว่างไว้หากรหัสผ่านของไฟล์ PDF ไม่มีการป้องกัน | |
Page(s) to extract | ไม่พร้อมใช้งาน | ทั้งหมด เดี่ยว ช่วง | All | ระบุจำนวนหน้าที่จะแยก: หน้าทั้งหมด หน้าเดียว หรือช่วงของหน้า |
Single page number | ไม่ | ค่าตัวเลข | หมายเลขของหน้าเดียวที่จะแยกรูปภาพออกมา | |
From page number | ไม่ | ค่าตัวเลข | หมายเลขหน้าแรกจากช่วงของหน้าที่จะแยกรูปภาพออกมา | |
To page number | ไม่ | ค่าตัวเลข | หมายเลขหน้าสุดท้ายจากช่วงของหน้าที่จะแยกรูปภาพออกมา | |
Image(s) name | ไม่ | ค่าข้อความ | ชื่อของภาพเริ่มต้นอย่างไร ตัวอย่างชื่อรูปภาพที่แยก: GivenName_1, GivenName_2 | |
Save image(s) to | ไม่ | โฟลเดอร์ | โฟลเดอร์สำหรับบันทึกภาพที่แยกออกมาเป็นไฟล์ .png |
ตัวแปรที่สร้าง
การดำเนินการนี้ไม่สร้างตัวแปรใดๆ
ข้อยกเว้น
ข้อยกเว้น | คำอธิบาย |
---|---|
รหัสผ่านที่ไม่ถูกต้อง | รหัสผ่านที่ระบุไม่ถูกต้อง |
แยกรูปภาพไม่สำเร็จ | ระบุว่าเกิดข้อผิดพลาดขณะดึงรูปภาพจากหน้าที่กำหนดของ PDF |
ไม่มีโฟลเดอร์อยู่ | ระบุว่าไม่มีโฟลเดอร์อยู่ |
ถ้าไม่มีไฟล์ PDF อยู่ | ไม่มีไฟล์อยู่ในพาธที่ให้มา |
แยกหน้าในไฟล์ PDF เป็นไฟล์ PDF ใหม่
คุณสามารถสร้างไฟล์ PDF ใหม่ได้โดยแยกหน้าจากไฟล์ PDF ที่มีอยู่โดยใช้การดำเนินการ หน้าไฟล์ PDF เป็นไฟล์ PDF ใหม่ ในพารามิเตอร์การดำเนินการ คุณสามารถกำหนดไฟล์ PDF ที่จะแยกหน้าออกมา หน้าที่จะแยก ตำแหน่งของไฟล์ PDF ใหม่ และสิ่งที่จะเกิดขึ้นหากไฟล์ที่มีชื่อและนามสกุลเดียวกันมีอยู่แล้ว สุดท้าย ภายใต้คุณสมบัติขั้นสูง คุณสามารถกำหนดรหัสผ่านได้ในกรณีที่ไฟล์ PDF ต้นฉบับได้รับการป้องกัน
พารามิเตอร์อินพุต
อาร์กิวเมนต์ | ระบุหรือไม่ก็ได้ | ยอมรับ | ค่าตามค่าเริ่มต้น | คำอธิบาย |
---|---|---|---|---|
ไฟล์ PDF | ไม่ | แฟ้ม | ไฟล์ PDF ที่จะแยกหน้า ป้อนพาธไฟล์ ตัวแปรที่มีไฟล์หรือพาธที่เป็นข้อความ | |
รหัสผ่าน | ใช่ | ป้อนอินพุตที่เข้ารหัสโดยตรงหรือ ค่าข้อความ | รหัสผ่านของไฟล์ PDF ให้เว้นว่างไว้หากรหัสผ่านของไฟล์ PDF ไม่มีการป้องกัน | |
Page selection | ไม่ | ค่าข้อความ | หมายเลขดัชนีของหน้าที่จะเก็บไว้ (เช่น 1,3,17-24) | |
Extracted PDF path | ไม่ | แฟ้ม | พาธที่จะจัดเก็บไฟล์ PDF ที่แยกออก | |
If file exists | ไม่พร้อมใช้งาน | เขียนทับ อย่าเขียนทับ เพิ่มคำต่อท้ายตามลำดับ | เพิ่มคำต่อท้ายตามลำดับ | ระบุสิ่งที่ต้องทำในกรณีที่มีไฟล์ PDF เอาต์พุตอยู่แล้ว |
ตัวแปรที่สร้าง
อาร์กิวเมนต์ | ชนิด | คำอธิบาย |
---|---|---|
ExtractedPDF | แฟ้ม | ไฟล์ PDF ใหม่ |
ข้อยกเว้น
ข้อยกเว้น | คำอธิบาย |
---|---|
รหัสผ่านที่ไม่ถูกต้อง | รหัสผ่านที่ระบุไม่ถูกต้อง |
ถ้าไม่มีไฟล์ PDF อยู่ | ไม่มีไฟล์อยู่ในพาธที่ให้มา |
หน้าอยู่นอกขอบเขต | ระบุว่าไฟล์ PDF หนึ่งหน้าขึ้นไปอยู่นอกขอบเขต |
การเลือกหน้าที่ไม่ถูกต้อง | ระบุว่าหน้าที่ระบุไม่ถูกต้องสำหรับไฟล์ PDF |
แยก PDF ใหม่ไม่สำเร็จ | ระบุว่าเกิดข้อผิดพลาดขณะที่พยายามแยก PDF ใหม่ |
ผสานไฟล์ PDF
รวมไฟล์ PDF หลายไฟล์เข้าด้วยกันไว้ในไฟล์ใหม่
คุณสามารถใช้การดำเนินการ รวมไฟล์ PDF เพื่อรวมไฟล์ PDF สองไฟล์ขึ้นไป และรวมเป็นไฟล์เดียว ไฟล์ที่จะรวมสามารถระบุได้ทั้งในรูปแบบของรายการ หรืออยู่ในเครื่องหมายคำพูดคู่ และแยกด้วยตัวคั่น คุณยังสามารถระบุรหัสผ่านสำหรับไฟล์ PDF ได้ ในกรณีที่มีการป้องกันด้วยรหัสผ่าน
พารามิเตอร์อินพุต
อาร์กิวเมนต์ | ระบุหรือไม่ก็ได้ | ยอมรับ | ค่าตามค่าเริ่มต้น | คำอธิบาย |
---|---|---|---|---|
PDF files | ไม่ | รายการ ของ ไฟล์ | ไฟล์ที่จะผสาน แนบไฟล์หลายไฟล์ด้วยเครื่องหมายคำพูดคู่ (") และแยกด้วยตัวคั่น หรือใช้รายการของไฟล์ | |
Merged PDF path | ไม่ | แฟ้ม | พาธที่จะจัดเก็บไฟล์ PDF ที่ผสาน | |
If file exists | ไม่พร้อมใช้งาน | เขียนทับ อย่าเขียนทับ เพิ่มคำต่อท้ายตามลำดับ | เพิ่มคำต่อท้ายตามลำดับ | ระบุสิ่งที่ต้องทำในกรณีที่มีไฟล์ปลายทางอยู่แล้ว |
รหัสผ่าน | ใช่ | ป้อนอินพุตที่เข้ารหัสโดยตรงหรือ ค่าข้อความ | รหัสผ่านที่คั่นด้วยจุลภาค ลำดับควรจะเหมือนกับลำดับของ PDF ที่ป้อนเข้า ให้เว้นว่างไว้หากรหัสผ่านของไฟล์ PDFs ไม่มีการป้องกัน | |
ตัวคั่น | ไม่ | ค่าข้อความ | , | ตัวคั่นรหัสผ่านที่กำหนดเอง ตัวคั่นนี้ไม่ควรเป็นส่วนหนึ่งของรหัสผ่านใดๆ |
ตัวแปรที่สร้าง
อาร์กิวเมนต์ | ชนิด | คำอธิบาย |
---|---|---|
MergedPDF | แฟ้ม | ไฟล์ PDF ที่ผสาน |
ข้อยกเว้น
ข้อยกเว้น | คำอธิบาย |
---|---|
ถ้าไม่มีไฟล์ PDF อยู่ | ไม่มีไฟล์อยู่ในพาธที่ให้มา |
รหัสผ่านที่ไม่ถูกต้อง | รหัสผ่านที่ระบุไม่ถูกต้อง |
ไม่สามารถผสานไฟล์ PDF | ระบุว่าเกิดข้อผิดพลาดขณะที่ผสานไฟล์ |