วิธีการนําเข้าข้อมูลลงใน Fabric โดยใช้กิจกรรม Azure Data Factory Copy
ตัวเชื่อมต่อ Microsoft Fabric Lakehouse ใน Azure Data Factory (ADF) และ Azure Synapse Analytics ทําให้สามารถอ่านและเขียนการดําเนินการกับ Microsoft Fabric Lakehouse (ทั้งสําหรับตารางและไฟล์) ตัวเชื่อมต่อนี้ช่วยให้คุณสามารถใช้ ADF และ Synapse Pipelines และการทําแผนที่กระแสข้อมูลเพื่อโต้ตอบกับ Fabric Lakehouses ได้ บทความนี้ช่วยให้คุณสามารถกําหนดค่า Microsoft Fabric เพื่ออนุญาตการรับรองความถูกต้องแบบโครงร่างสําคัญของบริการ และแสดงให้เห็นถึง Lakehouse เชื่อมต่อ or สําหรับทั้งการอ่านและการเขียนไปยัง Fabric Lakehouse
สําหรับข้อมูลเพิ่มเติมเกี่ยวกับ Microsoft Fabric Lakehouse สามารถดู ได้ที่ เลคเฮ้าส์คืออะไร
azure Data Factory Lakehouse เชื่อมต่อ or
ตอนนี้ตัวเชื่อมต่อบริการที่เชื่อมโยงของ Lakehouse ใหม่และชุดข้อมูลใหม่สองชุดมีให้สําหรับลูกค้าที่ต้องการเริ่มอ่านและเขียนลงใน Microsoft Fabric Lakehouse สําหรับคําแนะนําที่สมบูรณ์บน Lakehouse เชื่อมต่อ or ดูที่ คัดลอกและแปลงข้อมูลใน Microsoft Fabric Lakehouse Files (ตัวอย่าง)
การรับรองความถูกต้อง
บริการ Azure Data Factory ที่เชื่อมโยง
ตัวเชื่อมต่อ Microsoft Fabric Lakehouse จําเป็นต้องมีบริการหลัก (SPN)/การลงทะเบียนแอปสําหรับการรับรองความถูกต้อง เมื่อต้องเริ่มต้นใช้งาน คุณต้องสร้าง SPN ใหม่หรือใช้ SPN ที่มีอยู่แล้ว Microsoft Fabric อนุญาตให้เข้าถึง SPN สําหรับกลุ่มความปลอดภัยเฉพาะหรือสําหรับทั้งองค์กร ถ้ากลุ่มความปลอดภัยเฉพาะคือตัวเลือกที่องค์กรของคุณใช้ ดังนั้น SPN ที่ใช้ในตัวเชื่อมต่อ Lakehouse ต้องอยู่ในกลุ่มความปลอดภัยที่เพิ่มลงในรายการที่อนุญาต
หมายเหตุ
ไม่จําเป็นต้องมีสิทธิ์ API ของ Power BI (ผู้รับมอบสิทธิ์)
เข้าถึง API ของ Power BI
จากพอร์ทัลผู้ดูแลระบบ Power BI ผู้ดูแลระบบผู้เช่า Power BI ต้องเปิดใช้งาน อนุญาตให้โครงร่างสําคัญของบริการใช้ API ของ Power BI ต้องระบุกลุ่มความปลอดภัยภายใต้การตั้งค่า อนุญาตให้บริการหลักใช้ API ของ Power BI หรือคุณสามารถเปิดใช้งานสําหรับทั้งองค์กร
สําหรับคําแนะนําที่สมบูรณ์ โปรดดูที่ ฝังเนื้อหา Power BI ในแอปพลิเคชันการวิเคราะห์แบบฝังตัวด้วยองค์ประกอบหลักของบริการและข้อมูลลับของแอปพลิเคชัน
หมายเหตุ
เมื่อกําหนดกลุ่มความปลอดภัยให้กับพื้นที่ทํางาน อาจมีความล่าช้าให้บริการหลักได้รับสิทธิ์เข้าถึงพื้นที่ทํางานเนื่องจากการแคชสิทธิ์ใน Azure หากคุณต้องการการเข้าถึงทันที คุณสามารถใช้ PowerShell เพื่อบังคับให้มีการรีเฟรชสิทธิ์ของผู้ใช้ได้ เมื่อต้องการทําเช่นนั้น เปิด PowerShell ในฐานะผู้ดูแลระบบ จากนั้นเรียกใช้คําสั่งต่อไปนี้:
Install-Module -Name MicrosoftPowerBIMgmt
Connect-PowerBIServiceAccount -Tenant '<TENANT ID>' -ServicePrincipal -Credential (Get-Credential)
Get-PowerBIWorkspace
Invoke-PowerBIRestMethod -URL 'https://api.powerbi.com/v1.0/myorg/RefreshUserPermissions' -Method Post -Body ''
Get-PowerBIWorkspace
การเข้าถึงพื้นที่ทำงาน
เมื่อเพิ่มกลุ่มความปลอดภัยกลุ่มความปลอดภัยหรือองค์ประกอบหลักของบริการไปยังแต่ละพื้นที่ทํางานในฐานะ สมาชิก ผู้สนับสนุน หรือผู้ดูแลระบบด้วย โปรดดูให้ผู้ใช้เข้าถึงพื้นที่ทํางาน สําหรับรายละเอียดเพิ่มเติม
การสาธิต: ตั้งค่าการรับรองความถูกต้อง
บริการลงทะเบียนแอปหลัก
สร้างหรือใช้บริการลงทะเบียนแอปที่มีอยู่ (SPN) ทําตามขั้นตอนในลงทะเบียนแอปพลิเคชันด้วย Microsoft Entra ID และสร้างบริการหลัก
หมายเหตุ
คุณไม่จําเป็นต้องกําหนด URI เปลี่ยนเส้นทาง
กลุ่มความปลอดภัย
สร้าง Microsoft Entra Security Group ใหม่ หรือใช้กลุ่มที่มีอยู่ จากนั้นเพิ่ม SPN เข้าไป ทําตามขั้นตอนใน สร้างกลุ่มพื้นฐาน และเพิ่มสมาชิก เพื่อสร้าง Microsoft Entra Security Group
พอร์ทัลผู้ดูแลระบบ Power BI
จากพอร์ทัลผู้ดูแลระบบ Power BI ไปที่ การตั้งค่านักพัฒนา และเลือก อนุญาตให้บริการหลักใช้ API ของ Power BI จากนั้นจึงเปิดใช้งาน จากนั้นเพิ่มกลุ่มความปลอดภัยจากขั้นตอนก่อนหน้า สําหรับข้อมูลเพิ่มเติมเกี่ยวกับการตั้งค่าผู้เช่าพอร์ทัลผู้ดูแลระบบ Power BI ดู การตั้งค่าผู้เช่า
หมายเหตุ
โปรดตรวจสอบให้แน่ใจว่าการตั้งค่า ผู้ใช้สามารถเข้าถึงข้อมูลที่จัดเก็บไว้ใน OneLake ด้วยแอปภายนอกไปยัง Fabric ได้เปิดใช้งาน โปรดดูที่ อนุญาตแอปที่ทํางานภายนอก Fabric เพื่อเข้าถึงข้อมูลผ่านทาง OneLake
พื้นที่ทำงาน
เพิ่ม SPN หรือกลุ่มบริการไปยังพื้นที่ทํางานด้วยการเข้าถึงสมาชิก ผู้สนับสนุน หรือผู้ดูแลระบบ
Azure Data Factory: บริการที่เชื่อมโยง
จาก Azure Data Factory สร้าง Microsoft Fabric Lakehouse ที่เชื่อมโยงบริการใหม่
หมายเหตุ
เมื่อต้องการค้นหาพื้นที่ทํางานและ ID ของเลคเฮ้าส์ ให้นําทางไปยัง Fabric Lakehouse ของคุณ และระบุจาก URL ตัวอย่างเช่น: https://.../groups/<Workspace ID>>/lakehouses/<Lakehouse ID>
Azure Data Factory: ชุดข้อมูล
สร้างชุดข้อมูลที่อ้างอิงบริการ Microsoft Fabric Lakehouse ที่เชื่อมโยง
หมายเหตุ
เลือก ไม่มี สําหรับ ตัวเลือก นําเข้าเค้าร่าง ถ้ายังไม่มีตารางอยู่ และคุณกําลังระบุชื่อตารางใหม่ด้วยตนเอง
การสาธิต: เขียนไปยังตาราง Fabric Lakehouse ด้วยไปป์ไลน์ ADF
ทรัพยากร
สร้างไปป์ไลน์ใหม่และเพิ่มกิจกรรมการคัดลอกไปยังพื้นที่ทํางานของไปป์ไลน์ จากแท็บ แหล่งที่มา ของกิจกรรมการคัดลอก เลือกชุดข้อมูลต้นทางที่คุณต้องการย้ายไปยังตารางเลคเฮ้าส์ ในตัวอย่างนี้ เรากําลังอ้างอิงไฟล์.csv จากบัญชี Azure Data Lake Storage (ADLS) Gen2
อ่าง
นําทางไปยังแท็บอ่างล้างจานของกิจกรรมการคัดลอก และเลือกชุดข้อมูล Fabric Lakehouse ที่สร้างขึ้นก่อนหน้านี้
เรียกใช้ไปป์ไลน์
เรียกใช้ไปป์ไลน์เพื่อย้ายข้อมูล.csv ลงในตาราง Fabric Lakehouse
การสาธิต: อ่านจากตาราง Fabric Lakehouse ที่มีไปป์ไลน์ ADF
ในส่วนด้านบน เราสาธิตวิธีการใช้ ADF เพื่อเขียนลงใน Fabric Lakehouse Table ตอนนี้เรามาอ่านจาก Fabric Lakehouse Table และเขียนไปยังไฟล์ Parquet ใน Azure Data Lake Storage (ADLS) Gen2 ด้วยไปป์ไลน์ที่คล้ายกัน
ทรัพยากร
สร้างไปป์ไลน์ใหม่และเพิ่มกิจกรรมการคัดลอกไปยังพื้นที่ทํางานของไปป์ไลน์ จากแท็บ แหล่งที่มา ของกิจกรรมการคัดลอก เลือกชุดข้อมูล Fabric Lakehouse ที่ถูกสร้างขึ้นก่อนหน้านี้
อ่าง
นําทางไปยังแท็บคัดลอกของกิจกรรม อ่าง และเลือกชุดข้อมูลปลายทาง ในตัวอย่างนี้ ปลายทางคือ Azure Data Lake Storage (Gen2) เป็นไฟล์ Parquet
เรียกใช้ไปป์ไลน์
เรียกใช้ไปป์ไลน์เพื่อย้ายข้อมูลจากตาราง Fabric Lakehouse ลงในไฟล์ Parquet ใน ADLS Gen2
ตรวจสอบไฟล์ Parquet ใน ADLS Gen2
ขณะนี้ข้อมูลจากตาราง Fabric Lakehouse พร้อมใช้งานใน ADLS Gen2 เป็นไฟล์ Parquet
สรุป
ในส่วนนี้ เราได้สํารวจข้อกําหนดสําหรับ Lakehouse เชื่อมต่อ or โดยใช้การรับรองความถูกต้องโครงร่างสําคัญของบริการไปยัง Microsoft Fabric Lakehouse จากนั้นก็แนะนําตัวอย่างสําหรับทั้งการอ่านและการเขียนไปยัง Lakehouse จากไปป์ไลน์ Azure Data Factory ตัวเชื่อมต่อและความสามารถนี้ยังมีใน Azure Data Factory Mapping Data Flow, Azure Synapse Analytics และ Azure Synapse Analytics Mapping Data Flows