แชร์ผ่าน


การดำเนินการของ PDF

การดำเนินการของ PDF ช่วยให้คุณสามารถแยกรูปภาพ ข้อความ และตารางจากไฟล์ PDF และจัดเรียงหน้าเพื่อสร้างเอกสารใหม่

ในการแยกข้อความจากไฟล์ PDF ให้ใช้การดำเนินการ แยกข้อความจาก PDF ตัวอย่างต่อไปนี้เป็นการแยกข้อความจากช่วงของหน้าที่ระบุที่เป็นไฟล์ที่ป้องกันด้วยรหัสผ่าน รหัสผ่านถูกระบุในการตั้งค่า ขั้นสูง

หากต้องการแยกข้อความที่จัดเรียงในรูปแบบตาราง ให้เปิดใช้งาน ปรับให้เหมาะสมกับข้อมูลที่มีโครงสร้าง เพื่อปรับปรุงรูปแบบและความแม่นยำของผลลัพธ์

ภาพหน้าจอของการดำเนินการแยกข้อความจาก PDF

หากต้องการแยกตารางออกจากไฟล์ PDF ให้ปรับใช้งานการดำเนินการ แยกตารางจาก PDF เลือกไฟล์ และระบุหน้าที่จะแยกออกมา

การดำเนินการสร้างตัวแปร ExtractedPDFTables ที่มีรายการข้อมูลตาราง PDF หากต้องการค้นหาข้อมูลเกี่ยวกับรายการประเภทนี้ ให้ไปที่ ชนิดข้อมูลขั้นสูง

หมายเหตุ

  • การดำเนินการ แยกตารางจาก PDF ไม่ได้ใช้การรู้จำอักขระด้วยแสง (OCR) ดังนั้นคุณจึงไม่สามารถแยกข้อความที่ไม่สามารถคัดลอกออกจาก PDF ที่สแกนได้
  • ไลบรารีเบื้องหลังการดำเนินการจะดึงข้อมูล PDF เพิ่มเติมที่ไม่ใช่ตารางเป็นครั้งคราว ฟังก์ชันนี้ช่วยลดความเสี่ยงของการละเว้นตารางจริงโดยไม่ได้ตั้งใจ

ภาพหน้าจอของการดำเนินการแยกตารางจาก PDF

นอกเหนือจากการดึงข้อมูลจากไฟล์ PDF คุณสามารถสร้างเอกสาร PDF ใหม่จากไฟล์ที่มีอยู่โดยใช้การดำเนินการ แยกหน้าไฟล์ PDF เป็นไฟล์ PDF ใหม่

ตัวอย่างต่อไปนี้เลือกหน้าที่เป็นการรวมหน้าเฉพาะและช่วงของหน้า

ภาพหน้าจอของการดำเนินการแยกไฟล์ PDF ไปยังไฟล์ PDF ใหม่

แยกข้อความจาก PDF

คุณสามารถแยกข้อความจากไฟล์ PDF ได้โดยใช้การดำเนินการ "แยกข้อความจาก PDF" ในคุณสมบัติการดำเนินการ คุณสามารถกำหนดไฟล์ PDF ต้นฉบับและหน้าที่ควรแยกข้อความออกมา ภายใต้คุณสมบัติการดำเนินการขั้นสูง คุณสามารถกำหนดรหัสผ่านได้ในกรณีที่ไฟล์ PDF ได้รับการปกป้อง และกลไกควรปรับให้เหมาะสมสำหรับข้อมูลที่มีโครงสร้างหรือไม่

พารามิเตอร์อินพุต

อาร์กิวเมนต์ ระบุหรือไม่ก็ได้ ยอมรับ ค่าตามค่าเริ่มต้น คำอธิบาย
PDF file ไม่ แฟ้ม ไฟล์ PDF ที่จะแยกข้อความ ป้อนพาธไฟล์ ตัวแปรที่มีไฟล์หรือพาธที่เป็นข้อความ
หน้าที่จะแยก ไม่ระบุ ทั้งหมด เดี่ยว ช่วง ทั้งหมด ระบุจำนวนหน้าที่จะแยก: หน้าทั้งหมด หน้าเดียว หรือช่วงของหน้า
Single page number ไม่ ค่าตัวเลข หมายเลขของหน้าเดียวที่จะแยกข้อความออกมา
From page number ไม่ ค่าตัวเลข หมายเลขหน้าแรกจากช่วงของหน้าที่จะแยกข้อความออกมา
To page number ไม่ ค่าตัวเลข หมายเลขหน้าสุดท้ายจากช่วงของหน้าที่จะแยกข้อความออกมา
รหัสผ่าน ใช่ ป้อนอินพุตที่เข้ารหัสโดยตรงหรือ ค่าข้อความ รหัสผ่านของไฟล์ PDF ให้เว้นว่างไว้หากรหัสผ่านของไฟล์ PDF ไม่มีการป้องกัน
ปรับให้เหมาะสมกับข้อมูลที่มีโครงสร้าง ไม่ระบุ ค่าแบบบูลีน เท็จ ระบุว่าจะตรวจหาเค้าโครงที่จัดรูปแบบในเอกสารและแยกข้อความตามนั้นหรือไม่

ตัวแปรที่สร้าง

อาร์กิวเมนต์ ชนิด คำอธิบาย
ExtractedPDFText ค่าข้อความ ข้อความที่แยกออก

ข้อยกเว้น

ข้อยกเว้น คำอธิบาย
ถ้าไม่มีไฟล์ PDF อยู่ ไม่มีไฟล์อยู่ในพาธที่ให้มา
รหัสผ่านที่ไม่ถูกต้อง รหัสผ่านที่ระบุไม่ถูกต้อง
ไม่สามารถแยกข้อความ เกิดข้อผิดพลาดขณะที่พยายามแยกข้อความ

แยกตารางออกจาก PDF

คุณสามารถแยกตารางที่มีอยู่ในไฟล์ PDF ได้โดยใช้การดำเนินการ แยกตารางออกจาก PDF ในคุณสมบัติการดำเนินการ คุณสามารถกำหนดไฟล์ PDF และช่วงของหน้าที่ควรแยกตารางออกมา ภายใต้คุณสมบัติการดำเนินการขั้นสูง คุณสามารถกำหนดรหัสผ่านในกรณีที่ไฟล์ PDF ได้รับการปกป้อง กำหนดว่าตารางมีส่วนหัวหรือไม่ และสุดท้ายคือตารางที่ข้ามระยะขอบหน้าควรรวมเข้าด้วยกันหรือไม่

พารามิเตอร์อินพุต

อาร์กิวเมนต์ ระบุหรือไม่ก็ได้ ยอมรับ ค่าตามค่าเริ่มต้น คำอธิบาย
ไฟล์ PDF ไม่ แฟ้ม ไฟล์ PDF ที่จะแยกตารางจาก ป้อนพาธไฟล์ ตัวแปรที่มีไฟล์หรือพาธที่เป็นข้อความ
หน้าที่จะแยก ไม่ระบุ ทั้งหมด เดี่ยว ช่วง ทั้งหมด ระบุจำนวนหน้าที่จะแยกตารางออกมา: ทุกหน้า หน้าเดียว หรือช่วงของหน้า
หมายเลขหน้าเดียว ไม่ ค่าตัวเลข หมายเลขของหน้าเดียวที่จะแยกตารางออกมา
หมายเลขหน้า จาก ไม่ ค่าตัวเลข หมายเลขหน้าแรกจากช่วงของหน้าที่จะแยกตารางออกมา
หมายเลขหน้า ถึง ไม่ ค่าตัวเลข หมายเลขหน้าสุดท้ายจากช่วงของหน้าที่จะแยกตารางออกมา
รหัสผ่าน ใช่ ป้อนอินพุตที่เข้ารหัสโดยตรงหรือ ค่าข้อความ รหัสผ่านของไฟล์ PDF ให้เว้นว่างไว้หากรหัสผ่านของไฟล์ PDF ไม่มีการป้องกัน
รวมตารางที่ข้ามระยะขอบของหน้าเข้าด้วยกัน ไม่ระบุ ค่าแบบบูลีน จริง ระบุว่าจะรวมตารางที่ข้ามระยะขอบหน้ากระดาษในช่วงของหน้าที่ระบุเข้าด้วยกันหรือไม่
บรรทัดแรกประกอบด้วยชื่อคอลัมน์ ไม่ระบุ ค่าแบบบูลีน จริง ระบุว่าบรรทัดแรกของตารางมีชื่อคอลัมน์หรือไม่

ตัวแปรที่สร้าง

อาร์กิวเมนต์ ชนิด คำอธิบาย
ExtractedPDFTables รายการของข้อมูลตาราง PDF ตารางที่แยกพร้อมข้อมูลเป็นรายการ

ข้อยกเว้น

ข้อยกเว้น คำอธิบาย
ถ้าไม่มีไฟล์ PDF อยู่ ไม่มีไฟล์อยู่ในพาธที่ให้มา
รหัสผ่านที่ไม่ถูกต้อง รหัสผ่านที่ระบุไม่ถูกต้อง
ไม่สามารถแยกตาราง เกิดข้อผิดพลาดขณะพยายามแยกตาราง

แยกรูปภาพจาก PDF

ในการแยกรูปภาพจากไฟล์ PDF คุณสามารถใช้การดำเนินการ แยกรูปภาพจาก PDF ในพารามิเตอร์การดำเนินการ คุณสามารถกำหนดไฟล์ PDF และหน้าต่างๆ ที่จะแยกรูปภาพ รูปแบบการตั้งชื่อของรูปภาพที่แยกออกมา และตำแหน่งเป้าหมายของรูปภาพที่บันทึกไว้ คุณยังสามารถกำหนดรหัสผ่านได้หากไฟล์ PDF ได้รับการปกป้องภายใต้การตั้งค่าขั้นสูง

พารามิเตอร์อินพุต

อาร์กิวเมนต์ ระบุหรือไม่ก็ได้ ยอมรับ ค่าตามค่าเริ่มต้น คำอธิบาย
PDF file ไม่ แฟ้ม ไฟล์ PDF ที่จะแยกรูปภาพ ป้อนพาธไฟล์ ตัวแปรที่มีไฟล์หรือพาธที่เป็นข้อความ
รหัสผ่าน ใช่ ป้อนอินพุตที่เข้ารหัสโดยตรงหรือ ค่าข้อความ รหัสผ่านของไฟล์ PDF ให้เว้นว่างไว้หากรหัสผ่านของไฟล์ PDF ไม่มีการป้องกัน
Page(s) to extract ไม่พร้อมใช้งาน ทั้งหมด เดี่ยว ช่วง All ระบุจำนวนหน้าที่จะแยก: หน้าทั้งหมด หน้าเดียว หรือช่วงของหน้า
Single page number ไม่ ค่าตัวเลข หมายเลขของหน้าเดียวที่จะแยกรูปภาพออกมา
From page number ไม่ ค่าตัวเลข หมายเลขหน้าแรกจากช่วงของหน้าที่จะแยกรูปภาพออกมา
To page number ไม่ ค่าตัวเลข หมายเลขหน้าสุดท้ายจากช่วงของหน้าที่จะแยกรูปภาพออกมา
Image(s) name ไม่ ค่าข้อความ ชื่อของภาพเริ่มต้นอย่างไร ตัวอย่างชื่อรูปภาพที่แยก: GivenName_1, GivenName_2
Save image(s) to ไม่ โฟลเดอร์ โฟลเดอร์สำหรับบันทึกภาพที่แยกออกมาเป็นไฟล์ .png

ตัวแปรที่สร้าง

การดำเนินการนี้ไม่สร้างตัวแปรใดๆ

ข้อยกเว้น

ข้อยกเว้น คำอธิบาย
รหัสผ่านที่ไม่ถูกต้อง รหัสผ่านที่ระบุไม่ถูกต้อง
แยกรูปภาพไม่สำเร็จ ระบุว่าเกิดข้อผิดพลาดขณะดึงรูปภาพจากหน้าที่กำหนดของ PDF
ไม่มีโฟลเดอร์อยู่ ระบุว่าไม่มีโฟลเดอร์อยู่
ถ้าไม่มีไฟล์ PDF อยู่ ไม่มีไฟล์อยู่ในพาธที่ให้มา

แยกหน้าในไฟล์ PDF เป็นไฟล์ PDF ใหม่

คุณสามารถสร้างไฟล์ PDF ใหม่ได้โดยแยกหน้าจากไฟล์ PDF ที่มีอยู่โดยใช้การดำเนินการ หน้าไฟล์ PDF เป็นไฟล์ PDF ใหม่ ในพารามิเตอร์การดำเนินการ คุณสามารถกำหนดไฟล์ PDF ที่จะแยกหน้าออกมา หน้าที่จะแยก ตำแหน่งของไฟล์ PDF ใหม่ และสิ่งที่จะเกิดขึ้นหากไฟล์ที่มีชื่อและนามสกุลเดียวกันมีอยู่แล้ว สุดท้าย ภายใต้คุณสมบัติขั้นสูง คุณสามารถกำหนดรหัสผ่านได้ในกรณีที่ไฟล์ PDF ต้นฉบับได้รับการป้องกัน

พารามิเตอร์อินพุต

อาร์กิวเมนต์ ระบุหรือไม่ก็ได้ ยอมรับ ค่าตามค่าเริ่มต้น คำอธิบาย
ไฟล์ PDF ไม่ แฟ้ม ไฟล์ PDF ที่จะแยกหน้า ป้อนพาธไฟล์ ตัวแปรที่มีไฟล์หรือพาธที่เป็นข้อความ
รหัสผ่าน ใช่ ป้อนอินพุตที่เข้ารหัสโดยตรงหรือ ค่าข้อความ รหัสผ่านของไฟล์ PDF ให้เว้นว่างไว้หากรหัสผ่านของไฟล์ PDF ไม่มีการป้องกัน
Page selection ไม่ ค่าข้อความ หมายเลขดัชนีของหน้าที่จะเก็บไว้ (เช่น 1,3,17-24)
Extracted PDF path ไม่ แฟ้ม พาธที่จะจัดเก็บไฟล์ PDF ที่แยกออก
If file exists ไม่พร้อมใช้งาน เขียนทับ อย่าเขียนทับ เพิ่มคำต่อท้ายตามลำดับ เพิ่มคำต่อท้ายตามลำดับ ระบุสิ่งที่ต้องทำในกรณีที่มีไฟล์ PDF เอาต์พุตอยู่แล้ว

ตัวแปรที่สร้าง

อาร์กิวเมนต์ ชนิด คำอธิบาย
ExtractedPDF แฟ้ม ไฟล์ PDF ใหม่

ข้อยกเว้น

ข้อยกเว้น คำอธิบาย
รหัสผ่านที่ไม่ถูกต้อง รหัสผ่านที่ระบุไม่ถูกต้อง
ถ้าไม่มีไฟล์ PDF อยู่ ไม่มีไฟล์อยู่ในพาธที่ให้มา
หน้าอยู่นอกขอบเขต ระบุว่าไฟล์ PDF หนึ่งหน้าขึ้นไปอยู่นอกขอบเขต
การเลือกหน้าที่ไม่ถูกต้อง ระบุว่าหน้าที่ระบุไม่ถูกต้องสำหรับไฟล์ PDF
แยก PDF ใหม่ไม่สำเร็จ ระบุว่าเกิดข้อผิดพลาดขณะที่พยายามแยก PDF ใหม่

ผสานไฟล์ PDF

รวมไฟล์ PDF หลายไฟล์เข้าด้วยกันไว้ในไฟล์ใหม่

คุณสามารถใช้การดำเนินการ รวมไฟล์ PDF เพื่อรวมไฟล์ PDF สองไฟล์ขึ้นไป และรวมเป็นไฟล์เดียว ไฟล์ที่จะรวมสามารถระบุได้ทั้งในรูปแบบของรายการ หรืออยู่ในเครื่องหมายคำพูดคู่ และแยกด้วยตัวคั่น คุณยังสามารถระบุรหัสผ่านสำหรับไฟล์ PDF ได้ ในกรณีที่มีการป้องกันด้วยรหัสผ่าน

พารามิเตอร์อินพุต

อาร์กิวเมนต์ ระบุหรือไม่ก็ได้ ยอมรับ ค่าตามค่าเริ่มต้น คำอธิบาย
PDF files ไม่ รายการ ของ ไฟล์ ไฟล์ที่จะผสาน แนบไฟล์หลายไฟล์ด้วยเครื่องหมายคำพูดคู่ (") และแยกด้วยตัวคั่น หรือใช้รายการของไฟล์
Merged PDF path ไม่ แฟ้ม พาธที่จะจัดเก็บไฟล์ PDF ที่ผสาน
If file exists ไม่พร้อมใช้งาน เขียนทับ อย่าเขียนทับ เพิ่มคำต่อท้ายตามลำดับ เพิ่มคำต่อท้ายตามลำดับ ระบุสิ่งที่ต้องทำในกรณีที่มีไฟล์ปลายทางอยู่แล้ว
รหัสผ่าน ใช่ ป้อนอินพุตที่เข้ารหัสโดยตรงหรือ ค่าข้อความ รหัสผ่านที่คั่นด้วยจุลภาค ลำดับควรจะเหมือนกับลำดับของ PDF ที่ป้อนเข้า ให้เว้นว่างไว้หากรหัสผ่านของไฟล์ PDFs ไม่มีการป้องกัน
ตัวคั่น ไม่ ค่าข้อความ , ตัวคั่นรหัสผ่านที่กำหนดเอง ตัวคั่นนี้ไม่ควรเป็นส่วนหนึ่งของรหัสผ่านใดๆ

ตัวแปรที่สร้าง

อาร์กิวเมนต์ ชนิด คำอธิบาย
MergedPDF แฟ้ม ไฟล์ PDF ที่ผสาน

ข้อยกเว้น

ข้อยกเว้น คำอธิบาย
ถ้าไม่มีไฟล์ PDF อยู่ ไม่มีไฟล์อยู่ในพาธที่ให้มา
รหัสผ่านที่ไม่ถูกต้อง รหัสผ่านที่ระบุไม่ถูกต้อง
ไม่สามารถผสานไฟล์ PDF ระบุว่าเกิดข้อผิดพลาดขณะที่ผสานไฟล์