JavaScript 教學課程:使用 Azure Functions 和 Blob 儲存體來上傳和分析檔案
在本教學課程中,您將瞭解如何將影像上傳至 Azure Blob 儲存體,並使用 Azure Functions、電腦視覺 和 Cosmos DB 來處理它。 您也將了解如何在此程序中實作 Azure 函式觸發程序和繫結。 這些服務會一起分析包含文字的上傳影像、擷取其中的文字,然後將文字儲存在資料庫資料列中,以供稍後進行分析或其他用途。
Azure Blob 儲存體是 Microsoft 針對雲端所推出的可大幅調整物件儲存體解決方案。 Blob 儲存體專門設計來儲存影像和文件、串流媒體檔案、管理備份和封存資料等等。 您可以在概觀頁面上深入了解 Blob 儲存體。
警告
本教學課程旨在快速採用,因此不會遵循預設的安全需求。 若要深入瞭解此案例與默認目標,請移至 安全性考慮。
Azure Cosmos DB 是適用於新式應用程式開發的完全受控 NoSQL 和關聯式資料庫。
Azure Functions 是無伺服器的電腦解決方案,可讓您將小型程式碼區塊撰寫為可高度調整、無伺服器、事件驅動的函式並加以執行。 您可以在概觀頁面上深入了解 Azure Functions。
在本教學課程中,您將了解如何:
- 將影像和檔案上傳至 Blob 儲存體
- 使用 Azure 函式事件觸發程序來處理上傳至 Blob 儲存體的資料
- 使用 Azure AI 服務來分析影像
- 使用 Azure 函式輸出繫結將資料寫入到 Cosmos DB
必要條件
- 具有有效訂用帳戶的 Azure 帳戶。 免費建立帳戶。
- Visual Studio Code 已安裝。
- Azure Functions 延伸模組用以部署和設定函式應用程式。
- Azure 儲存體擴充功能
- Azure 資料庫延伸模組
- Azure 資源延伸模組
建立儲存體帳戶和容器
第一個步驟是建立儲存體帳戶來保存上傳的 Blob 資料,在此案例中為包含文字的影像。 儲存體帳戶會提供數個不同的服務,但本教學課程只使用 Blob 儲存體。
在 Visual Studio Code 中,選取 Ctrl + Shift + P,以開啟命令選擇區。
搜尋 Azure 儲存體:建立儲存體 帳戶 (進階)。
使用下表來建立儲存體資源。
設定 值 名稱 輸入 msdocsstoragefunction 或類似的內容。 資源群組 建立您先前建立的 msdocs-storage-function
資源群組。靜態 Web 裝載 否。 在 Visual Studio Code 中,選取 Shift + Alt + A 以開啟 Azure Explorer。
展開 [儲存體] 區段,展開您的訂用帳戶節點,並等候資源建立。
在 Visual Studio Code 中建立容器
- 仍在找到新儲存體資源的 Azure Explorer 中,展開資源以查看節點。
- 以滑鼠右鍵按一下 [Blob 容器],然後選取 [建立 Blob 容器]。
- 輸入名稱
images
。 這會建立私人容器。
從私人變更為 Azure 入口網站 中的公用容器
此程序需要有公用容器。 若要變更該組態,請在 Azure 入口網站中進行變更。
- 以滑鼠右鍵按一下 Azure Explorer 中的儲存體資源,然後選取 [在入口網站中開啟]。
- 在 [資料儲存體] 區段中,選取 [容器]。
- 尋找您的容器
images
,然後選取行尾的...
(省略符號)。 - 選取 [變更存取層級]。
- 選取 [Blob (僅限 Blob 的匿名讀取權限)],然後選取 [確定]。
- 返回 Visual Studio Code。
在 Visual Studio Code 中擷取連接字串
- 在 Visual Studio Code 中,選取 Shift + Alt + A 以開啟 Azure Explorer。
- 以滑鼠右鍵按一下您的儲存體資源,然後選取 [複製連接字串]。
- 將此連接字串貼在某處以供稍後使用。
- 記下儲存體帳戶名稱
msdocsstoragefunction
以供稍後使用。
建立 Azure AI 視覺服務
接下來,建立 Azure AI 視覺服務帳戶,以處理上傳的檔案。 視覺是 Azure AI 服務的一部分,並提供各種功能以從影像中擷取出資料。 您可以在概觀頁面上深入了解 Azure AI 視覺。
在入口網站頂端的搜尋列中,搜尋電腦,然後選取標示為電腦視覺的結果。
在 [電腦視覺] 頁面上,選取 [+ 建立]。
在 [建立電腦視覺] 頁面上,輸入下列值:
- 訂用帳戶:選擇您想要的訂用帳戶。
- 資源群組:使用您稍早建立的
msdocs-storage-function
資源群組。 - 區域:選取與您最接近的區域。
- 名稱:輸入
msdocscomputervision
的名稱。 - 定價層:如果可用,請選擇 [免費],否則請選擇 [標準 S1]。
- 如果您同意條款,請核取 [負責任 AI 注意事項] 方塊
選取底部的 [檢閱 + 建立]。 Azure 會花一點時間驗證您輸入的資訊。 驗證過設定後,選擇 [建立],Azure 便會開始佈建電腦視覺服務,這可能需要一些時間。
作業完成時,請選取 [移至資源]。
擷取電腦視覺金鑰
接下來,我們需要尋找電腦視覺服務的秘密金鑰和端點 URL 以便在 Azure 函式應用程式中使用。
在 [電腦視覺] 概觀頁面上,選取 [金鑰和端點]。
在 [金鑰和端點] 頁面上,複製 [金鑰 1] 值和 [端點] 值,並將其貼到某處以供稍後使用。 端點的格式應為
https://YOUR-RESOURCE-NAME.cognitiveservices.azure.com/
建立 Cosmos DB 服務帳戶
建立 Cosmos DB 服務帳戶來儲存檔案的分析資料。 Azure Cosmos DB 是適用於新式應用程式開發的完全受控 NoSQL 和關聯式資料庫。 您可以深入了解 Cosmos DB 及其針對數個不同產業資料庫提供的 API 支援。
雖然本教學課程會在您建立資源時指定 API,但適用於 Cosmos DB 的 Azure Function 繫結在所有 Cosmos DB API 上的設定方式都相同。
在入口網站頂端的搜尋列中,搜尋 Azure Cosmos DB,然後選取該結果。
在 [Azure Cosmos DB] 頁面上,選取 [+ 建立]。 從 API 選項清單中選取 [Azure Cosmos DB for NoSQL]。
在 [建立 Cosmos DB] 頁面上,輸入下列值:
- 訂用帳戶:選擇您想要的訂用帳戶。
- 資源群組:使用您稍早建立的
msdocs-storage-function
資源群組。 - 區域:選取與您資源群組相同的區域。
- 名稱:輸入
msdocscosmosdb
的名稱。 - 定價層:如果可用,請選擇 [免費],否則請選擇 [標準 S1]。
選取底部的 [檢閱 + 建立]。 Azure 會花一點時間驗證您輸入的資訊。 驗證過設定後,選擇 [建立],Azure 便會開始佈建電腦視覺服務,這可能需要一些時間。
作業完成時,請選取 [移至資源]。
選取 [資料總管],然後選取 [新增容器]。
使用下列設定建立新的資料庫和容器:
- 建立新的資料庫識別碼:
StorageTutorial
。 - 建立新的容器識別碼:
analysis
。 - 輸入分割區索引鍵:
/type
。
- 建立新的資料庫識別碼:
保留其餘的預設設定,然後選取 [確定]。
取得 Cosmos DB 連接字串
取得 Cosmos DB 服務帳戶的連接字串,以便在 Azure Function 應用程式中使用。
在 [Cosmos DB] 概觀頁面上,選取 [金鑰]。
在 [金鑰] 頁面上,複製 [主要連接字串] 以供稍後使用。
下載並設定範例專案
您可以在此 GitHub 存放庫的 JavaScript-v4
子目錄中找到本教學課程中使用的 Azure Function 程式碼。 您也可以使用下列命令來複製專案。
git clone https://github.com/Azure-Samples/msdocs-storage-bind-function-service.git \
cd msdocs-storage-bind-function-service/javascript-v4 \
code .
範例專案會完成下列工作:
- 擷取環境變數以連線到儲存體帳戶、電腦視覺和 Cosmos DB 服務
- 接受上傳的檔案以作為 Blob 參數
- 使用電腦視覺服務來分析 Blob
- 使用輸出繫結,將分析的影像文字當成 JSON 物件插入 Cosmos DB
下載並開啟專案之後,有一些需要了解的基本概念:
概念 | 目的 |
---|---|
函式 | Azure Function 是由函式程式碼和繫結所定義。 這些程式碼和繫結位於 ./src/functions/process-blobs.js。 |
觸發和繫結 | 觸發程序和繫結會指出預期要傳入或移出函式的資料,以及即將傳送或接收該資料的服務。 |
本教學課程中使用的觸發程序和繫結因為不再需要撰寫程式碼來連接服務,因此可以加速開發程序。
輸入儲存體 Blob 觸發程序
程式碼可指定 Blob 上傳至影像容器後觸發的函式。 此函式會在任何含有階層資料夾的 Blob 名稱上觸發。
// ...preceding code removed for brevity
app.storageBlob('process-blob-image', {
path: 'images/{name}', // Storage container name: images, Blob name: {name}
connection: 'StorageConnection', // Storage account connection string
handler: async (blob, context) => {
// ... function code removed for brevity
- app.storageBlob - 儲存體 Blob 輸入觸發程序可用來將函式繫結到 Blob 儲存體中的上傳事件。 觸發程序有兩個必要參數:
path
:觸發程序監看事件的路徑。 此路徑包含容器名稱images
,以及 Blob 名稱的變數替代項目。 此 Blob 名稱是從name
屬性擷取。{name}
:上傳的 Blob 名稱。 使用blob
是傳入函式之 Blob 的參數名稱。 請勿變更blob
值。connection
:儲存體帳戶的連接字串。 在本機環境中開發時,StorageConnection
值符合local.settings.json
檔案中的名稱。
輸出 Cosmos DB 觸發程序
當函式完成時,函式會使用傳回的物件作為要插入 Cosmos DB 的資料。
// ... function definition ojbect
app.storageBlob('process-blob-image', {
// removed for brevity
// Data to insert into Cosmos DB
const id = uuidv4().toString();
const analysis = await analyzeImage(blobUrl);
// `type` is the partition key
const dataToInsertToDatabase = {
id,
type: 'image',
blobUrl,
blobSize: blob.length,
analysis,
trigger: context.triggerMetadata
}
return dataToInsertToDatabase;
}),
// Output binding for Cosmos DB
return: output.cosmosDB({
connection: 'CosmosDBConnection',
databaseName:'StorageTutorial',
containerName:'analysis'
})
});
對於本文中的容器,以下是必要屬性:
id
:Cosmos DB 建立新資料列所需的識別碼。/type
:用來建立容器的指定分割區索引鍵。output.cosmosDB - Cosmos DB 輸出觸發程序用來將函式結果插入 Cosmos DB。
connection
:儲存體帳戶的連接字串。StorageConnection
值符合local.settings.json
檔案中的名稱。databaseName
:要連接的 Cosmos DB 資料庫。containerName
:資料表的名稱,以寫入函式所傳回的剖析影像文字值。 此資料表必須已經存在。
Azure Function 程式碼
以下是完整的函式程式碼。
const { app, input, output } = require('@azure/functions');
const { v4: uuidv4 } = require('uuid');
const { ApiKeyCredentials } = require('@azure/ms-rest-js');
const { ComputerVisionClient } = require('@azure/cognitiveservices-computervision');
const sleep = require('util').promisify(setTimeout);
const STATUS_SUCCEEDED = "succeeded";
const STATUS_FAILED = "failed"
const imageExtensions = ["jpg", "jpeg", "png", "bmp", "gif", "tiff"];
async function analyzeImage(url) {
try {
const computerVision_ResourceKey = process.env.ComputerVisionKey;
const computerVision_Endpoint = process.env.ComputerVisionEndPoint;
const computerVisionClient = new ComputerVisionClient(
new ApiKeyCredentials({ inHeader: { 'Ocp-Apim-Subscription-Key': computerVision_ResourceKey } }), computerVision_Endpoint);
const contents = await computerVisionClient.analyzeImage(url, {
visualFeatures: ['ImageType', 'Categories', 'Tags', 'Description', 'Objects', 'Adult', 'Faces']
});
return contents;
} catch (err) {
console.log(err);
}
}
app.storageBlob('process-blob-image', {
path: 'images/{name}',
connection: 'StorageConnection',
handler: async (blob, context) => {
context.log(`Storage blob 'process-blob-image' url:${context.triggerMetadata.uri}, size:${blob.length} bytes`);
const blobUrl = context.triggerMetadata.uri;
const extension = blobUrl.split('.').pop();
if(!blobUrl) {
// url is empty
return;
} else if (!extension || !imageExtensions.includes(extension.toLowerCase())){
// not processing file because it isn't a valid and accepted image extension
return;
} else {
//url is image
const id = uuidv4().toString();
const analysis = await analyzeImage(blobUrl);
// `type` is the partition key
const dataToInsertToDatabase = {
id,
type: 'image',
blobUrl,
blobSize: blob.length,
...analysis,
trigger: context.triggerMetadata
}
return dataToInsertToDatabase;
}
},
return: output.cosmosDB({
connection: 'CosmosDBConnection',
databaseName:'StorageTutorial',
containerName:'analysis'
})
});
此程式碼也會從環境變數擷取基本設定值,例如 Blob 儲存體連接字串和電腦視覺金鑰。 這些環境變數會在 Azure 函式環境部署之後新增至其中。
預設函式也會使用名為 AnalyzeImage
的第二個方法。 此程式碼會使用電腦視覺帳戶的 URL 端點和金鑰,向電腦視覺提出處理影像的要求。 要求會傳回影像中探索到的所有文字。 此文字會使用輸出繫結寫入至 Cosmos DB。
配置本機設定
若要在本機執行專案,請在 ./local.settings.json
檔案中輸入環境變數。 以您稍早在建立 Azure 資源時所儲存的值來填入到預留位置值。
雖然 Azure Function 程式碼會在本機執行,但它會連線到儲存體的雲端式服務,而不會使用任何本機模擬器。
{
"IsEncrypted": false,
"Values": {
"FUNCTIONS_WORKER_RUNTIME": "node",
"AzureWebJobsStorage": "",
"StorageConnection": "STORAGE-CONNECTION-STRING",
"StorageAccountName": "STORAGE-ACCOUNT-NAME",
"StorageContainerName": "STORAGE-CONTAINER-NAME",
"ComputerVisionKey": "COMPUTER-VISION-KEY",
"ComputerVisionEndPoint": "COMPUTER-VISION-ENDPOINT",
"CosmosDBConnection": "COSMOS-DB-CONNECTION-STRING"
}
}
建立 Azure Functions 應用程式
您現在已準備好使用 Visual Studio Code 延伸模組,將應用程式部署至 Azure。
在 Visual Studio Code 中,選取 Shift + Alt + A 以開啟 Azure Explorer。
在 [函式] 區段中,尋找並以滑鼠右鍵按一下訂用帳戶,然後選取 [在 Azure 中建立函式應用程式 (進階)]。
使用下表來建立 Function 資源。
設定 值 名稱 輸入 msdocsprocessimage 或類似的內容。 執行階段堆疊 選取 Node.js LTS 版本。 程式設計模型 選取 v4。 OS 選取 [Linux]。 資源群組 選擇您先前建立的 msdocs-storage-function
資源群組。地點 選取與您資源群組相同的區域。 方案類型 選取 [使用量]。 Azure 儲存體 選取您稍早建立的儲存體帳戶。 Application Insights 暫時跳過。 Azure 會佈建所要求的資源,這需要一些時間才能完成。
部署 Azure Functions 應用程式
- 當先前的資源建立程序完成時,以滑鼠右鍵按一下 Azure Explorer 的 [函式] 區段中的新資源,然後選取 [部署至函式應用程式]。
- 如果系統詢問「您是否確定要部署...」,請選取 [部署]。
- 當程序完成時,通知隨即出現,其中包含 [上傳設定] 等選擇。 選取該選項。 這會將 local.settings.json 檔案中的值複製到您的 Azure Function 應用程式中。 如果通知在您可選取之前消失,請繼續進行下一節。
新增儲存體和電腦視覺的應用程式設定
如果您在通知中選取了 [上傳設定],請略過本節。
Azure 函式已成功完成部署,但還無法連線到我們的儲存體帳戶和電腦視覺服務。 您必須先將正確的金鑰和連接字串新增至 Azure Functions 應用程式的組態設定。
在 Azure Explorer 的 [函式] 區段中尋找您的資源,以滑鼠右鍵按一下 [應用程式設定],然後選取 [新增設定]。
輸入下列秘密的新應用程式設定。 從您的本機專案複製秘密值並貼在
local.settings.json
檔案中。設定 StorageConnection StorageAccountName StorageContainerName ComputerVisionKey ComputerVisionEndPoint CosmosDBConnection
要將 Azure 函式連線到不同服務所需的所有環境變數目前均已備妥。
將影像上傳至 Blob 儲存體
您現在已做好準備,可以開始測試我們的應用程式了! 您可以將 Blob 上傳至容器,然後確認影像中的文字已儲存至 Cosmos DB。
- 在 Visual Studio Code 的 Azure Explorer 中,於 [儲存體] 區段中尋找並展開您的儲存體資源。
- 展開 [Blob 容器]並以滑鼠右鍵按一下您的容器名稱
images
,然後選取 [上傳檔案]。 - 您可以在可下載範例專案的根目錄中,找到一些包含在 images 資料夾內的範例影像,或者您也可以使用自己的影像。
- 針對 [目的地目錄],接受預設值
/
。 - 等到檔案上傳並列在容器中。
檢視影像的文字分析
接下來,您可以確認上傳是否觸發了 Azure 函式,而且影像中的文字已正確分析並儲存至 Cosmos DB。
在 Visual Studio Code 中,使用 Azure Explorer,在 Azure Cosmos DB 節點下方選取您的資源後展開以尋找資料庫 StorageTutorial。
展開資料庫節點。
分析容器現在應該可供使用。 選取容器的文件節點以預覽其中的資料。 您應會看到所上傳檔案的已處理影像文字項目。
{ "id": "3cf7d6f0-a362-421e-9482-3020d7d1e689", "type": "image", "blobUrl": "https://msdocsstoragefunction.blob.core.windows.net/images/presentation.png", "blobSize": 1383614, "analysis": { ... details removed for brevity ... "categories": [], "adult": {}, "imageType": {}, "tags": [], "description": {}, "faces": [], "objects": [], "requestId": "eead3d60-9905-499c-99c5-23d084d9cac2", "metadata": {}, "modelVersion": "2021-05-01" }, "trigger": { "blobTrigger": "images/presentation.png", "uri": "https://msdocsstorageaccount.blob.core.windows.net/images/presentation.png", "properties": { "lastModified": "2023-07-07T15:32:38+00:00", "createdOn": "2023-07-07T15:32:38+00:00", "metadata": {}, ... removed for brevity ... "contentLength": 1383614, "contentType": "image/png", "accessTier": "Hot", "accessTierInferred": true, }, "metadata": {}, "name": "presentation.png" }, "_rid": "YN1FAKcZojEFAAAAAAAAAA==", "_self": "dbs/YN1FAA==/colls/YN1FAKcZojE=/docs/YN1FAKcZojEFAAAAAAAAAA==/", "_etag": "\"7d00f2d3-0000-0700-0000-64a830210000\"", "_attachments": "attachments/", "_ts": 1688743969 }
恭喜! 您已成功使用 Azure Functions 和電腦視覺處理上傳至 Blob 儲存體的影像。
疑難排解
使用下表來協助進行此程序期間的問題疑難排解。
問題 | 解決方案 |
---|---|
包含 Only absolute URLs are supported 的 await computerVisionClient.read(url); 錯誤 |
確定您的 ComputerVisionEndPoint 端點的格式為 https://YOUR-RESOURCE-NAME.cognitiveservices.azure.com/ 。 |
安全性考量
此解決方案作為初學者教學課程,不會示範預設的安全做法。 這是刻意可讓您成功部署解決方案。 成功部署后的下一個步驟是保護資源。 此解決方案會使用三個 Azure 服務,每個服務都有自己的安全性功能和預設設定的考慮:
- Azure Functions - 保護 Azure Functions
- Azure 儲存體 - Blob 記憶體的安全性建議
- Azure 認知服務 - Azure AI 服務安全性功能
範例指令碼
清除資源
如果您不打算繼續使用此應用程式,則可以移除資源群組來刪除所建立的資源。
- 從 Azure Explorer 選取 [資源群組]。
- 從清單中尋找並以滑鼠右鍵按一下
msdocs-storage-function
資源群組。 - 選取 [刪除]。 刪除資源群組的流程可能需要幾分鐘的時間才能完成。