FILESTREAM (SQL Server)
Se aplica a: SQL Server: solo Windows
FILESTREAM permite a las aplicaciones basadas en SQL Server almacenar datos no estructurados, como documentos e imágenes, en el sistema de archivos. Las aplicaciones pueden usar las API de transmisión de datos enriquecidas y el rendimiento del sistema de archivos al mismo tiempo que mantienen la coherencia transaccional entre los datos no estructurados y los datos estructurados correspondientes.
FILESTREAM integra Motor de base de datos de SQL Server con un sistema de archivos NTFS almacenando datos de objetos binarios grandes (BLOB) varbinary (max) como archivos en el sistema de archivos. Las instrucciones Transact-SQL pueden insertar, actualizar, consultar, buscar y realizar copias de seguridad de los datos de FILESTREAM. Las interfaces del sistema de archivos de Win32 proporcionan el acceso de la transmisión por secuencias a los datos.
FILESTREAM usa la memoria caché del sistema NT para almacenar en memoria caché los datos de archivos. El almacenamiento en caché de archivos en la memoria caché del sistema ayuda a reducir cualquier impacto que puedan tener los datos filestream en el rendimiento del motor de base de datos. No se usa el grupo de búferes de SQL Server; por consiguiente, esta memoria está disponible para el procesamiento de consultas.
FILESTREAM no se habilita automáticamente al instalar o actualizar SQL Server. Debe habilitar FILESTREAM utilizando el Administrador de configuración de SQL Server y SQL Server Management Studio. Para utilizar FILESTREAM, debe crear o modificar una base de datos que contenga un tipo especial de grupo de archivos. Luego, debe crear o modificar una tabla de modo que contenga una columna varbinary(max) con el atributo FILESTREAM. Después de completar estas tareas, puede usar Transact-SQL y Win32 para administrar los datos FILESTREAM.
Cuándo se usa FILESTREAM
En SQL Server, los BLOB pueden ser datos de varbinary(max) estándar que almacena los datos en tablas u objetos FILESTREAM varbinary(max) que almacenan los datos en el sistema de archivos. El tamaño y el uso de los datos determinan si debería usar el almacenamiento de base de datos o el almacenamiento del sistema de archivos. Si las condiciones siguientes son verdaderas, debería pensar en usar FILESTREAM:
- Los objetos que se están almacenando son, por término medio, mayores de 1 MB.
- El acceso de lectura rápido es importante.
- Está desarrollando aplicaciones que usan un nivel intermedio para la lógica de aplicación.
Para objetos de menor tamaño, el almacenamiento de BLOB varbinary(max) en la base de datos a menudo proporciona un mejor rendimiento de la transmisión de datos.
Almacenamiento de FILESTREAM
El almacenamiento de FILESTREAM se implementa como una columna varbinary(max) en la que los datos están almacenados como BLOB en el sistema de archivos. Los tamaños de los BLOB están limitados solo por el tamaño del volumen del sistema de archivos. La limitación varbinary(max) estándar de tamaños de archivo de 2 GB no se aplica a BLOB que están almacenados en el sistema de archivos.
Para especificar que una columna debería almacenar datos en el sistema de archivos, especifique el atributo FILESTREAM en una columna varbinary(max) . Este atributo hace que el motor de base de datos almacene todos los datos de esa columna en el sistema de archivos, pero no en el archivo de base de datos.
Los datos de FILESTREAM deben estar almacenados en los grupos de archivos FILESTREAM. Un grupo de archivos FILESTREAM es un grupo de archivos especial que contiene los directorios de sistema de archivos en lugar de los propios archivos. Estos directorios del sistema de archivos se denominan contenedores de datos. Los contenedores de datos son la interfaz entre el almacenamiento del motor de base de datos y el almacenamiento del sistema de archivos.
Cuando use el almacenamiento FILESTREAM, piense en lo siguiente:
- Cuando una tabla contiene una columna FILESTREAM, cada fila debe tener un identificador de fila único distinto de null.
- Se pueden agregar varios contenedores de datos a un grupo de archivos FILESTREAM.
- Los contenedores de datos FILESTREAM no pueden estar anidados.
- Cuando se usan clústeres de conmutación por error, los grupos de archivos FILESTREAM deben estar en recursos de disco compartido.
- Los grupos de archivos FILESTREAM pueden estar en volúmenes comprimidos.
Administración integrada
Debido a que FILESTREAM se implementa como columna varbinary(max) y se integra directamente en el motor de base de datos, la mayoría de las herramientas de administración de SQL Server y funciones funcionan sin la modificación de los datos FILESTREAM. Por ejemplo, puede usar todos los modelos de recuperación y copia de seguridad con datos FILESTREAM y se realizan copias de seguridad de los datos FILESTREAM con los datos estructurados de la base de datos. Si no desea realizar una copia de seguridad de los datos FILESTREAM con datos relacionales, puede usar una copia de seguridad parcial para excluir los grupos de archivos FILESTREAM.
Seguridad integrada
En SQL Server, los datos de FILESTREAM se protegen de la misma manera que los demás datos: concediendo permisos en el nivel de tabla o columna. Si un usuario tiene permiso para la columna FILESTREAM de una tabla, el usuario puede abrir los archivos asociados.
Nota:
El cifrado no se admite en los datos FILESTREAM.
Solo la cuenta con la que la cuenta de servicio de SQL Server se ejecuta se permiten los permisos al contenedor FILESTREAM. Recomendamos que no se concedan permisos a ninguna otra cuenta en el contenedor de datos.
Nota:
Los inicios de sesión de SQL no funcionarán con contenedores FILESTREAM. Solo la autenticación NTFS o ReFS funcionará con contenedores FILESTREAM.
Acceder a datos BLOB con Transact-SQL y acceso de transmisión de datos del sistema de archivos
Después de almacenar los datos en una columna FILESTREAM, puede tener acceso a los archivos usando las transacciones de Transact-SQL o usando las API de Win32.
Acceso a Transact-SQL
Usando Transact-SQL, puede insertar, actualizar y eliminar los datos de FILESTREAM:
- Puede usar una operación de inserción para rellenar previamente un campo FILESTREAM con un valor nulo, un valor vacío o un dato insertado relativamente corto. Sin embargo, se envía una gran cantidad de datos de manera más eficaz en un archivo que usa interfaces de Win32.
- Al actualizar un campo FILESTREAM, modifica los datos de BLOB subyacentes en el sistema de archivos. Cuando un campo FILESTREAM está establecido en NULL, se eliminan los datos de BLOB asociados al campo. No puede usar ninguna actualización fragmentada de Transact-SQL, implementada como UPDATE**.**Write(), para realizar actualizaciones parciales en los datos.
- Al eliminar una fila, o eliminar o truncar una tabla que contiene datos FILESTREAM, elimina los datos de BLOB subyacentes del sistema de archivos.
Acceso a la transmisión por secuencias del sistema de archivos
La compatibilidad de transmisión por secuencias de Win32 funciona en el contexto de una transacción de SQL Server. Dentro de una transacción, puede usar las funciones FILESTREAM para obtener una ruta de acceso al sistema de archivos de UNC lógica de un archivo. Tras ello, use la API OpenSqlFilestream para obtener un identificador de archivos. Después, este identificador lo pueden usar las interfaces de transmisión por secuencias de archivo de Win32, como ReadFile() y WriteFile(), para obtener acceso y actualizar el archivo a través del sistema de archivos.
Dado que las operaciones de archivo son transaccionales, no puede eliminar ni cambiar el nombre de los archivos FILESTREAM a través del sistema de archivos.
Advertencia
El contenedor FILESTREAM es una carpeta administrada por SQL Server. No agregue ni quite archivos en la carpeta FILESTREAM manualmente ni a través de otras aplicaciones. Si lo hace, se producirán errores de copia de seguridad e incoherencia. Para obtener más información, consulte MSSQLSERVER_3056, MSSQLSERVER_7908, y MSSQLSERVER_7906.
Modelo de la instrucción
El acceso del sistema de archivos de FILESTREAM modela una instrucción de Transact-SQL usando la apertura y el cierre de archivo. La instrucción se inicia cuando un identificador de archivos se abre y finaliza cuando se cierra el identificador. Por ejemplo, cuando se cierra un identificador de escritura, cualquier posible desencadenador de AFTER que esté registrado en la tabla se desencadena como si la instrucción UPDATE estuviera completada.
Espacio de nombres de almacenamiento
En FILESTREAM, el motor de base de datos controla el espacio de nombres del sistema de archivos físico de BLOB. Una nueva función intrínseca, PathName, proporciona la ruta UNC lógica del BLOB que se corresponde con cada celda de FILESTREAM de la tabla. La aplicación usa esta ruta de acceso lógica para obtener el identificador de Win32 y funcionar en los datos de BLOB usando las interfaces del sistema de archivos de Win32 normales. La función devuelve NULL si el valor de la columna FILESTREAM es NULL.
Acceso al sistema de archivos transaccionales
Una nueva función intrínseca, GET_FILESTREAM_TRANSACTION_CONTEXT(), proporciona el token que representa la transacción actual a la que la sesión está asociada. Se debe haber iniciado la transacción y no haberse anulado ni confirmado todavía. Al obtener un token, la aplicación enlaza las operaciones de transmisión por secuencias del sistema de archivos FILESTREAM con una transacción iniciada. La función devuelve NULL en caso de no haber ninguna transacción explícitamente iniciada.
Se deben cerrar todos los identificadores de archivo antes de que la transacción se confirme o se anule. Si un identificador se deja abierto más allá del ámbito de transacción, las lecturas adicionales frente al identificador producirán un error; las escrituras adicionales frente al identificador tendrán éxito pero los datos reales no se escribirán en el disco. De igual forma, si la base de datos o la instancia del motor de base de datos se cierra, se invalidan todos los identificadores abiertos.
Durabilidad transaccional
Con FILESTREAM, al confirmar la transacción, el motor de base de datos asegura la durabilidad de la transacción para los datos de BLOB FILESTREAM que se modifican del acceso a la transmisión por secuencias del sistema de archivos.
Semántica de aislamiento
La semántica de aislamiento se rige por los niveles de aislamiento de transacción del motor de base de datos. Se admite el nivel de aislamiento de lectura confirmada para Transact-SQL y el acceso al sistema de archivos. Se admiten operaciones de lectura repetibles, así como serializables y aislamientos de instantáneas. No se admite la lectura de datos sucios.
Las operaciones de apertura de acceso al sistema de archivos no esperan ningún bloqueo. En su lugar, se produce un error inmediato de las operaciones de apertura si no pueden obtener acceso a los datos debido al aislamiento de transacción. Se produce un error en las llamadas de API de transmisión por secuencias con ERROR_SHARING_VIOLATION si la operación de apertura no puede continuar debido a la infracción de aislamiento.
Para permitir que se realicen actualizaciones parciales, la aplicación puede emitir un control FS de dispositivo (FSCTL_SQL_FILESTREAM_FETCH_OLD_CONTENT) para capturar el contenido anterior en el archivo al que hace referencia el identificador abierto. Esto desencadena una copia de contenido antiguo de servidor. Para un mejor rendimiento de la aplicación, y para evitar encontrarse con posibles tiempos de espera mientras trabajas con archivos muy grandes, te recomendamos que uses E/S asincrónica.
Si se emite FSCTL una vez que se haya escrito en el identificador, se conservará la última operación de escritura y se perderán las escrituras anteriores realizadas en el identificador.
API del sistema de archivos y niveles de aislamiento admitidos
Cuando una API del sistema de archivos no puede abrir un archivo a causa de una infracción de aislamiento, se devuelve una excepción ERROR_SHARING_VIOLATION. Esta infracción de aislamiento se produce cuando dos transacciones intentan acceder al mismo archivo. El resultado de la operación de acceso depende del modo en el que se abrió el archivo y de la versión de SQL Server en la que se ejecute la transacción. En la tabla siguiente se explican resumidamente los posibles resultados de dos transacciones que están accediendo al mismo archivo.
Transacción 1 | Transacción 2 | Resultado en SQL Server 2008 (10.0.x) | Resultado en SQL Server 2008 R2 (10.50.x) y versiones posteriores |
---|---|---|---|
Abrir para lectura. | Abrir para lectura. | Ambas son correctas. | Ambas son correctas. |
Abrir para lectura. | Abrir para escritura. | Ambas son correctas. Las operaciones de escritura de la transacción 2 no influyen en las operaciones de lectura realizadas en la transacción 1. | Ambas son correctas. Las operaciones de escritura de la transacción 2 no influyen en las operaciones de lectura realizadas en la transacción 1. |
Abrir para escritura. | Abrir para lectura. | Se produce un error en la operación de apertura de la transacción 2 con una excepción ERROR_SHARING_VIOLATION. | Ambas son correctas. |
Abrir para escritura. | Abrir para escritura. | Se produce un error en la operación de apertura de la transacción 2 con una excepción ERROR_SHARING_VIOLATION. | Se produce un error en la operación de apertura de la transacción 2 con una excepción ERROR_SHARING_VIOLATION. |
Abrir para lectura. | Abrir para SELECT. | Ambas son correctas. | Ambas son correctas. |
Abrir para lectura. | Abrir para UPDATE o DELETE. | Ambas son correctas. Las operaciones de escritura de la transacción 2 no influyen en las operaciones de lectura realizadas en la transacción 1. | Ambas son correctas. Las operaciones de escritura de la transacción 2 no influyen en las operaciones de lectura realizadas en la transacción 1. |
Abrir para escritura. | Abrir para SELECT. | La transacción 2 se bloquea hasta que la transacción 1 se confirme o finalice la transacción. O bien, se agota el tiempo de espera de bloqueo de la transacción. | Ambas son correctas. |
Abrir para escritura. | Abrir para UPDATE o DELETE. | La transacción 2 se bloquea hasta que la transacción 1 se confirme o finalice la transacción. O bien, se agota el tiempo de espera de bloqueo de la transacción. | La transacción 2 se bloquea hasta que la transacción 1 se confirme o finalice la transacción. O bien, se agota el tiempo de espera de bloqueo de la transacción. |
Abrir para SELECT. | Abrir para lectura. | Ambas son correctas. | Ambas son correctas. |
Abrir para SELECT. | Abrir para escritura. | Ambas son correctas. Las operaciones de escritura de la transacción 2 no influyen en la transacción 1. | Ambas son correctas. Las operaciones de escritura de la transacción 2 no influyen en la transacción 1. |
Abrir para UPDATE o DELETE. | Abrir para lectura. | Se produce un error en la operación de apertura de la transacción 2 con una excepción ERROR_SHARING_VIOLATION. | Ambas son correctas. |
Abrir para UPDATE o DELETE. | Abrir para escritura. | Se produce un error en la operación de apertura de la transacción 2 con una excepción ERROR_SHARING_VIOLATION. | Se produce un error en la operación de apertura de la transacción 2 con una excepción ERROR_SHARING_VIOLATION. |
Abrir para SELECT con REPEATABLE READ. | Abrir para lectura. | Ambas son correctas. | Ambas son correctas. |
Abrir para SELECT con REPEATABLE READ. | Abrir para escritura. | Se produce un error en la operación de apertura de la transacción 2 con una excepción ERROR_SHARING_VIOLATION. | Se produce un error en la operación de apertura de la transacción 2 con una excepción ERROR_SHARING_VIOLATION. |
Escritura continua desde clientes remotos
El acceso del sistema de archivos remoto a los datos FILESTREAM está habilitado por el protocolo Bloque de mensajes de servidor (SMB). Si el cliente es remoto, no se almacena en caché ninguna operación de escritura del lado cliente. Las operaciones de escritura siempre se enviarán al servidor. Los datos pueden se pueden almacenar en memoria caché en el servidor. Recomendamos que las aplicaciones que se ejecutan en clientes remotos consoliden las operaciones de escritura pequeñas en operaciones de mayor tamaño. El objetivo es realizar menos escrituras.
No se admite la creación de vistas asignadas de memoria (E/S asignada de memoria) usando un identificador FILESTREAM. Si la asignación de memoria se usa para los datos FILESTREAM, el motor de base de datos no puede garantizar la coherencia y la durabilidad de los datos o la integridad de la base de datos.
Recomendaciones y directrices para mejorar el rendimiento de FILESTREAM
La característica FILESTREAM de SQL Server le permite almacenar datos de objetos binarios grandes varbinary(max) como archivos en el sistema de archivos. Si tiene un gran número de filas en contenedores de FILESTREAM, que forman el almacenamiento subyacente tanto para columnas de FILESTREAM como para tablas de FileTables, puede que llegue a tener un volumen de sistema de archivos con un gran número de archivos. Para conseguir el mejor rendimiento al procesar los datos integrados desde la base de datos, así como el sistema de archivos, es importante asegurarse de que el sistema de archivos tiene la configuración óptima. A continuación, se muestran algunas de las opciones de optimización disponibles desde la perspectiva de un sistema de archivos:
Comprobación de altitud para el controlador de filtro de FILESTREAM de SQL Server (p. ej.,
rsfx0100.sys
). Evalúe todos los controladores de filtros cargados para la pila de almacenamiento asociada con un volumen en el que la característica FILESTREAM almacena archivos y asegúrese de que el controlador rsfx está ubicado en la parte inferior de la pila. Puede usar el programa de control FLTMC.EXE para obtener una lista de los controladores de filtros de un volumen específico. A continuación, se muestra una salida de ejemplo de los filtros de la utilidad FLTMC: filtrosC:\Windows\System32>fltMC.exe
.Nombre de filtro Número de instancias Altitud Marco Sftredir 1 406000 0 MpFilter 9 328000 0 luafv 1 135000 0 FileInfo 9 45000 0 RsFx0103 1 41001,03 0 Compruebe que el servidor tenga la propiedad "hora del último acceso" deshabilitada para los archivos. Este atributo del sistema de archivos se mantiene en el registro: Nombre de clave:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem
Nombre: NtfsDisableLastAccessUpdate
Tipo: REG_DWORD
Valor: 1Compruebe que el servidor tiene deshabilitada la nomenclatura 8.3. Este atributo del sistema de archivos se mantiene en el registro: Nombre de clave:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem
Nombre: NtfsDisable8dot3NameCreation
Tipo: REG_DWORD
Valor: 1Comprueba que los contenedores de directorio de FILESTREAM no tengan habilitado el cifrado del sistema de archivos ni la compresión del sistema de archivos, ya que pueden suponer una sobrecarga al acceder a estos archivos.
Desde un símbolo del sistema con privilegios elevados, ejecute instancias de fltmc y asegúrese de que no haya controladores de filtros asociados al volumen en el que intenta realizar la restauración.
Comprueba que los contenedores de directorio de FILESTREAM no tengan más de 300 000 archivos. Puede usar la información de la vista de catálogo
sys.database_files
para averiguar qué directorios del sistema de archivos almacenan archivosFILESTREAM-related
. Esto puede evitarse con varios contenedores. (Vea la viñeta siguiente para obtener más información).Con un solo grupo de archivos de FILESTREAM, todos los archivos de datos se crean en la misma carpeta. La creación de un gran número de archivos puede verse afectada por índices NTFS de gran tamaño, que también se pueden fragmentar.
El hecho de tener varios grupos de archivos debería ayudar con este problema (la aplicación usa la partición o tiene varias tablas, cada una con su propio grupo de archivos).
Con SQL Server 2012 (11.x) y versiones posteriores, puedes tener varios contenedores o archivos en un grupo de archivos de FILESTREAM y se aplicará un esquema de asignación round robin. Por lo tanto, el número de archivos NTFS por directorio se reduce.
La copia de seguridad y la restauración pueden ser más rápidas con varios contenedores de FILESTREAM, si se usan varios volúmenes que almacenan contenedores.
SQL Server 2012 (11.x) admite varios contenedores por grupo de archivos y puede hacer que todo sea más fácil. No es necesario usar esquemas de partición complicados para administrar un mayor número de archivos.
Cuando hay un gran número de contenedores FILESTREAM en una instancia de SQL, iniciar las bases de datos con muchos contenedores FILESTREAM puede tardar mucho tiempo en registrarlos en el controlador de filtro FILESTREAM. La propagación de ellos en varios volúmenes diferentes ayuda a mejorar el tiempo de inicio de la base de datos.
MFT de NTFS se puede fragmentar y esto puede provocar problemas de rendimiento. El tamaño reservado de MFT depende del tamaño del volumen, por lo que esto no es algo que siempre se dé.
Puede comprobar la fragmentación de MFT con
defrag /A /V C:
(cambie C: por el nombre del volumen real).Puede reservar más espacio de MFT con fsutil behavior set mftzone 2.
Los archivos de datos de FILESTREAM se deben excluir del análisis de software antivirus.
Nota:
Windows Server 2016 habilita de forma automática Windows Defender. Asegúrese de que Windows Defender está configurado para excluir archivos de FILESTREAM. Si no lo hace, se puede reducir el rendimiento de las operaciones de copia de seguridad y restauración.
Para obtener más información, vea Configurar y validar exclusiones para exámenes de Antivirus de Windows Defender.
Tareas relacionadas
- Habilitar y configurar FILESTREAM
- crear una base de datos habilitada para FILESTREAM
- Crear una tabla para almacenar datos FILESTREAM
- Obtener acceso a datos FILESTREAM con Transact-SQL
- Crear aplicaciones cliente para datos FILESTREAM
- Obtener acceso a los datos FILESTREAM con OpenSqlFilestream
- Realizar actualizaciones parciales de los datos FILESTREAM
- Evitar conflictos con operaciones de base de datos en aplicaciones FILESTREAM
- Mover una base de datos habilitada para FILESTREAM
- Configurar FILESTREAM en un clúster de conmutación por error
- Configurar un Firewall para el acceso de FILESTREAM