Speech SDK를 사용하여 오디오 입력 디바이스 선택
이 문서에서는 시스템에 연결된 오디오 디바이스의 ID를 가져오는 방법을 설명합니다. 그런 다음, 음성 SDK에서 이러한 ID를 사용하여 오디오 입력을 선택할 수 있습니다. AudioConfig
개체를 통해 오디오 디바이스를 구성합니다.
audioConfig = AudioConfig.FromMicrophoneInput("<device id>");
audioConfig = AudioConfig.FromMicrophoneInput("<device id>");
audio_config = AudioConfig(device_name="<device id>");
audioConfig = AudioConfiguration.FromMicrophoneInput("<device id>");
audioConfig = AudioConfiguration.fromMicrophoneInput("<device id>");
audioConfig = AudioConfiguration.fromMicrophoneInput("<device id>");
참고 항목
Node.js에서 실행하는 JavaScript에 대해서는 마이크를 사용할 수 없습니다.
데스크톱 애플리케이션용 Windows의 오디오 디바이스 ID
오디오 디바이스 엔드포인트 ID 문자열은 데스크톱 애플리케이션용 Windows의 IMMDevice
개체에서 검색할 수 있습니다.
다음 코드 샘플에서는 C++에서 오디오 디바이스를 열거하는 데 사용하는 방법을 보여 줍니다.
#include <cstdio>
#include <mmdeviceapi.h>
#include <Functiondiscoverykeys_devpkey.h>
const CLSID CLSID_MMDeviceEnumerator = __uuidof(MMDeviceEnumerator);
const IID IID_IMMDeviceEnumerator = __uuidof(IMMDeviceEnumerator);
constexpr auto REFTIMES_PER_SEC = (10000000 * 25);
constexpr auto REFTIMES_PER_MILLISEC = 10000;
#define EXIT_ON_ERROR(hres) \
if (FAILED(hres)) { goto Exit; }
#define SAFE_RELEASE(punk) \
if ((punk) != NULL) \
{ (punk)->Release(); (punk) = NULL; }
void ListEndpoints();
int main()
{
CoInitializeEx(NULL, COINIT_MULTITHREADED);
ListEndpoints();
}
//-----------------------------------------------------------
// This function enumerates all active (plugged in) audio
// rendering endpoint devices. It prints the friendly name
// and endpoint ID string of each endpoint device.
//-----------------------------------------------------------
void ListEndpoints()
{
HRESULT hr = S_OK;
IMMDeviceEnumerator *pEnumerator = NULL;
IMMDeviceCollection *pCollection = NULL;
IMMDevice *pEndpoint = NULL;
IPropertyStore *pProps = NULL;
LPWSTR pwszID = NULL;
hr = CoCreateInstance(CLSID_MMDeviceEnumerator, NULL, CLSCTX_ALL, IID_IMMDeviceEnumerator, (void**)&pEnumerator);
EXIT_ON_ERROR(hr);
hr = pEnumerator->EnumAudioEndpoints(eCapture, DEVICE_STATE_ACTIVE, &pCollection);
EXIT_ON_ERROR(hr);
UINT count;
hr = pCollection->GetCount(&count);
EXIT_ON_ERROR(hr);
if (count == 0)
{
printf("No endpoints found.\n");
}
// Each iteration prints the name of an endpoint device.
PROPVARIANT varName;
for (ULONG i = 0; i < count; i++)
{
// Get the pointer to endpoint number i.
hr = pCollection->Item(i, &pEndpoint);
EXIT_ON_ERROR(hr);
// Get the endpoint ID string.
hr = pEndpoint->GetId(&pwszID);
EXIT_ON_ERROR(hr);
hr = pEndpoint->OpenPropertyStore(
STGM_READ, &pProps);
EXIT_ON_ERROR(hr);
// Initialize the container for property value.
PropVariantInit(&varName);
// Get the endpoint's friendly-name property.
hr = pProps->GetValue(PKEY_Device_FriendlyName, &varName);
EXIT_ON_ERROR(hr);
// Print the endpoint friendly name and endpoint ID.
printf("Endpoint %d: \"%S\" (%S)\n", i, varName.pwszVal, pwszID);
CoTaskMemFree(pwszID);
pwszID = NULL;
PropVariantClear(&varName);
}
Exit:
CoTaskMemFree(pwszID);
pwszID = NULL;
PropVariantClear(&varName);
SAFE_RELEASE(pEnumerator);
SAFE_RELEASE(pCollection);
SAFE_RELEASE(pEndpoint);
SAFE_RELEASE(pProps);
}
C#에서는 다음과 같이 NAudio 라이브러리를 사용하여 CoreAudio API에 액세스하고 디바이스를 열거할 수 있습니다.
using System;
using NAudio.CoreAudioApi;
namespace ConsoleApp
{
class Program
{
static void Main(string[] args)
{
var enumerator = new MMDeviceEnumerator();
foreach (var endpoint in
enumerator.EnumerateAudioEndPoints(DataFlow.Capture, DeviceState.Active))
{
Console.WriteLine("{0} ({1})", endpoint.FriendlyName, endpoint.ID);
}
}
}
}
샘플 디바이스 ID는 {0.0.1.00000000}.{5f23ab69-6181-4f4a-81a4-45414013aac8}
입니다.
UWP의 오디오 디바이스 ID
UWP(유니버설 Windows 플랫폼)에서 오디오 입력 디바이스는 해당 DeviceInformation
개체의 Id()
속성을 사용하여 가져올 수 있습니다.
다음 코드 샘플에서는 C++ 및 C#에서 이 단계를 수행하는 방법을 보여 줍니다.
#include <winrt/Windows.Foundation.h>
#include <winrt/Windows.Devices.Enumeration.h>
using namespace winrt::Windows::Devices::Enumeration;
void enumerateDeviceIds()
{
auto promise = DeviceInformation::FindAllAsync(DeviceClass::AudioCapture);
promise.Completed(
[](winrt::Windows::Foundation::IAsyncOperation<DeviceInformationCollection> const& sender,
winrt::Windows::Foundation::AsyncStatus /* asyncStatus */) {
auto info = sender.GetResults();
auto num_devices = info.Size();
for (const auto &device : info)
{
std::wstringstream ss{};
ss << "looking at device (of " << num_devices << "): " << device.Id().c_str() << "\n";
OutputDebugString(ss.str().c_str());
}
});
}
using Windows.Devices.Enumeration;
using System.Linq;
namespace helloworld {
private async void EnumerateDevices()
{
var devices = await DeviceInformation.FindAllAsync(DeviceClass.AudioCapture);
foreach (var device in devices)
{
Console.WriteLine($"{device.Name}, {device.Id}\n");
}
}
}
샘플 디바이스 ID는 \\\\?\\SWD#MMDEVAPI#{0.0.1.00000000}.{5f23ab69-6181-4f4a-81a4-45414013aac8}#{2eef81be-33fa-4800-9670-1cd474972c3f}
입니다.
Linux의 오디오 디바이스 ID
디바이스 ID는 표준 ALSA 디바이스 ID를 사용하여 선택됩니다.
시스템에 연결된 입력의 ID는 arecord -L
명령의 출력에 포함됩니다.
또는 ALSA C 라이브러리를 사용하여 가져올 수 있습니다.
샘플 ID는 hw:1,0
및 hw:CARD=CC,DEV=0
입니다.
macOS의 오디오 디바이스 ID
Objective-C에서 구현된 다음 함수는 Mac에 연결된 오디오 디바이스의 이름과 ID 목록을 만듭니다.
deviceUID
문자열은 macOS용 Speech SDK에서 디바이스를 식별하는 데 사용됩니다.
#import <Foundation/Foundation.h>
#import <CoreAudio/CoreAudio.h>
CFArrayRef CreateInputDeviceArray()
{
AudioObjectPropertyAddress propertyAddress = {
kAudioHardwarePropertyDevices,
kAudioObjectPropertyScopeGlobal,
kAudioObjectPropertyElementMaster
};
UInt32 dataSize = 0;
OSStatus status = AudioObjectGetPropertyDataSize(kAudioObjectSystemObject, &propertyAddress, 0, NULL, &dataSize);
if (kAudioHardwareNoError != status) {
fprintf(stderr, "AudioObjectGetPropertyDataSize (kAudioHardwarePropertyDevices) failed: %i\n", status);
return NULL;
}
UInt32 deviceCount = (uint32)(dataSize / sizeof(AudioDeviceID));
AudioDeviceID *audioDevices = (AudioDeviceID *)(malloc(dataSize));
if (NULL == audioDevices) {
fputs("Unable to allocate memory", stderr);
return NULL;
}
status = AudioObjectGetPropertyData(kAudioObjectSystemObject, &propertyAddress, 0, NULL, &dataSize, audioDevices);
if (kAudioHardwareNoError != status) {
fprintf(stderr, "AudioObjectGetPropertyData (kAudioHardwarePropertyDevices) failed: %i\n", status);
free(audioDevices);
audioDevices = NULL;
return NULL;
}
CFMutableArrayRef inputDeviceArray = CFArrayCreateMutable(kCFAllocatorDefault, deviceCount, &kCFTypeArrayCallBacks);
if (NULL == inputDeviceArray) {
fputs("CFArrayCreateMutable failed", stderr);
free(audioDevices);
audioDevices = NULL;
return NULL;
}
// Iterate through all the devices and determine which are input-capable
propertyAddress.mScope = kAudioDevicePropertyScopeInput;
for (UInt32 i = 0; i < deviceCount; ++i) {
// Query device UID
CFStringRef deviceUID = NULL;
dataSize = sizeof(deviceUID);
propertyAddress.mSelector = kAudioDevicePropertyDeviceUID;
status = AudioObjectGetPropertyData(audioDevices[i], &propertyAddress, 0, NULL, &dataSize, &deviceUID);
if (kAudioHardwareNoError != status) {
fprintf(stderr, "AudioObjectGetPropertyData (kAudioDevicePropertyDeviceUID) failed: %i\n", status);
continue;
}
// Query device name
CFStringRef deviceName = NULL;
dataSize = sizeof(deviceName);
propertyAddress.mSelector = kAudioDevicePropertyDeviceNameCFString;
status = AudioObjectGetPropertyData(audioDevices[i], &propertyAddress, 0, NULL, &dataSize, &deviceName);
if (kAudioHardwareNoError != status) {
fprintf(stderr, "AudioObjectGetPropertyData (kAudioDevicePropertyDeviceNameCFString) failed: %i\n", status);
continue;
}
// Determine if the device is an input device (it is an input device if it has input channels)
dataSize = 0;
propertyAddress.mSelector = kAudioDevicePropertyStreamConfiguration;
status = AudioObjectGetPropertyDataSize(audioDevices[i], &propertyAddress, 0, NULL, &dataSize);
if (kAudioHardwareNoError != status) {
fprintf(stderr, "AudioObjectGetPropertyDataSize (kAudioDevicePropertyStreamConfiguration) failed: %i\n", status);
continue;
}
AudioBufferList *bufferList = (AudioBufferList *)(malloc(dataSize));
if (NULL == bufferList) {
fputs("Unable to allocate memory", stderr);
break;
}
status = AudioObjectGetPropertyData(audioDevices[i], &propertyAddress, 0, NULL, &dataSize, bufferList);
if (kAudioHardwareNoError != status || 0 == bufferList->mNumberBuffers) {
if (kAudioHardwareNoError != status)
fprintf(stderr, "AudioObjectGetPropertyData (kAudioDevicePropertyStreamConfiguration) failed: %i\n", status);
free(bufferList);
bufferList = NULL;
continue;
}
free(bufferList);
bufferList = NULL;
// Add a dictionary for this device to the array of input devices
CFStringRef keys [] = { CFSTR("deviceUID"), CFSTR("deviceName")};
CFStringRef values [] = { deviceUID, deviceName};
CFDictionaryRef deviceDictionary = CFDictionaryCreate(kCFAllocatorDefault,
(const void **)(keys),
(const void **)(values),
2,
&kCFTypeDictionaryKeyCallBacks,
&kCFTypeDictionaryValueCallBacks);
CFArrayAppendValue(inputDeviceArray, deviceDictionary);
CFRelease(deviceDictionary);
deviceDictionary = NULL;
}
free(audioDevices);
audioDevices = NULL;
// Return a non-mutable copy of the array
CFArrayRef immutableInputDeviceArray = CFArrayCreateCopy(kCFAllocatorDefault, inputDeviceArray);
CFRelease(inputDeviceArray);
inputDeviceArray = NULL;
return immutableInputDeviceArray;
}
예를 들어 기본 제공 마이크에 대한 UID는 BuiltInMicrophoneDevice
입니다.
iOS의 오디오 디바이스 ID
iOS에서는 음성 SDK를 사용하여 오디오 디바이스를 선택할 수 없습니다. SDK를 사용하는 앱은 AVAudioSession
프레임워크를 통한 오디오 라우팅에 영향을 줄 수 있습니다.
예를 들어 다음 명령은
[[AVAudioSession sharedInstance] setCategory:AVAudioSessionCategoryRecord
withOptions:AVAudioSessionCategoryOptionAllowBluetooth error:NULL];
음성 지원 앱에 Bluetooth 헤드셋을 사용할 수 있도록 합니다.
JavaScript의 오디오 디바이스 ID
JavaScript에서는 MediaDevices.enumerateDevices() 메서드를 사용하여 미디어 디바이스를 열거하고 fromMicrophone(...)
에 전달할 디바이스 ID를 찾을 수 있습니다.