Obtener todo el texto de todas las diapositivas en una presentación
En este tema se muestra cómo usar las clases del SDK de Open XML para obtener todo el texto de todas las diapositivas de una presentación mediante programación.
Obtención de un objeto PresentationDocument
En el SDK de Open XML, la PresentationDocument clase representa un paquete de documento de presentación. Para trabajar con un documento de presentación, cree primero una instancia de la PresentationDocument
clase y, a continuación, trabaje con esa instancia. Para crear la instancia de clase a partir del documento, llame al Open método que usa una ruta de acceso de archivo y a un valor booleano como segundo parámetro para especificar si un documento es editable. Para abrir un documento para el acceso de lectura y escritura, asigne el valor true
a este parámetro; para el acceso de solo lectura, asígnele el valor false
como se muestra en la instrucción siguiente using
. En este código, el presentationFile
parámetro es una cadena que representa la ruta de acceso del archivo desde el que desea abrir el documento.
// Open the presentation as read-only.
using (PresentationDocument presentationDocument = PresentationDocument.Open(presentationFile, false))
Con v3.0.0+ el Close() método se ha quitado en favor de confiar en la instrucción using.
Esto garantiza que se llama automáticamente al Dispose() método cuando se alcanza la llave de cierre. El bloque que sigue a la using
instrucción establece un ámbito para el objeto que se crea o se denomina en la using
instrucción , en este caso presentationDocument
.
Estructura básica de un documento de presentación
La estructura básica de un PresentationML
documento consta de varias partes, entre las que se encuentra la parte principal que contiene la definición de presentación. El siguiente texto de la especificación ISO/IEC 29500 presenta la forma general de un PresentationML
paquete.
La parte principal de un
PresentationML
paquete comienza con un elemento raíz de presentación. Dicho elemento contiene una presentación que, a su vez, hace referencia a una lista de diapositivas, a otra de patrones de diapositivas, a otra de patrones de notas y a otra de patrones de documentos. La lista de diapositivas hace referencia a todas las diapositivas de la presentación, la de patrones de diapositivas a todos los patrones de diapositivas que se han usado en la presentación, el patrón de notas contiene información acerca del formato de las páginas de notas y el patrón de documentos describe la apariencia de los documentos.Un documento es un conjunto impreso de diapositivas que se pueden proporcionar a un público.
Al igual que el texto y los gráficos, cada diapositiva puede incluir comentarios y notas, tener un diseño y formar parte de una o varias presentaciones personalizadas. Un comentario es una anotación dirigida a la persona que se encarga del mantenimiento de las diapositivas de la presentación. Una nota es un aviso o texto dirigido al moderador o al público.
Otras características que un
PresentationML
documento puede incluir son las siguientes: animación, audio, vídeo y transiciones entre diapositivas .Un
PresentationML
documento no se almacena como un cuerpo grande en una sola parte. En su lugar, los elementos que implementan ciertas agrupaciones de funcionalidades se almacenan en partes independientes. Por ejemplo, todos los autores de un documento se almacenan en una parte de autores mientras que cada diapositiva tiene su propia parte.ISO/IEC 29500: 2016
El siguiente ejemplo de código XML representa una presentación que contiene dos diapositivas denotadas por los identificadores 267 y 256.
<p:presentation xmlns:p="…" … >
<p:sldMasterIdLst>
<p:sldMasterId
xmlns:rel="https://…/relationships" rel:id="rId1"/>
</p:sldMasterIdLst>
<p:notesMasterIdLst>
<p:notesMasterId
xmlns:rel="https://…/relationships" rel:id="rId4"/>
</p:notesMasterIdLst>
<p:handoutMasterIdLst>
<p:handoutMasterId
xmlns:rel="https://…/relationships" rel:id="rId5"/>
</p:handoutMasterIdLst>
<p:sldIdLst>
<p:sldId id="267"
xmlns:rel="https://…/relationships" rel:id="rId2"/>
<p:sldId id="256"
xmlns:rel="https://…/relationships" rel:id="rId3"/>
</p:sldIdLst>
<p:sldSz cx="9144000" cy="6858000"/>
<p:notesSz cx="6858000" cy="9144000"/>
</p:presentation>
Con el SDK de Open XML, puede crear contenido y estructura de documentos mediante clases fuertemente tipadas que corresponden a elementos PresentationML. Puede encontrar estas clases en el espacio de DocumentFormat.OpenXml.Presentation nombres. En la tabla siguiente se enumeran los nombres de clase de las clases correspondientes a los sld
elementos , sldLayout
, sldMaster
y notesMaster
.
Elemento de PresentationML | Open XML SDK (clase) | Descripción |
---|---|---|
<sld/> |
Slide | Diapositiva de presentación. Es el elemento raíz de SlidePart. |
<sldLayout/> |
SlideLayout | Diseño de la diapositiva. Es el elemento raíz de SlideLayoutPart. |
<sldMaster/> |
SlideMaster | Patrón de diapositivas. Es el elemento raíz de SlideMasterPart. |
<notesMaster/> |
NotesMaster | Patrón de notas (o handoutMaster). Es el elemento raíz de NotesMasterPart. |
Código de ejemplo
El código siguiente obtiene todo el texto de todas las diapositivas de un archivo de presentación determinado. Por ejemplo, puede pasar el nombre del archivo como argumento y, a continuación, usar un foreach
bucle en el programa para obtener la matriz de cadenas devuelta por el método GetSlideIdAndText
como se muestra en el ejemplo siguiente.
if (args is [{ } path])
{
int numberOfSlides = CountSlides(path);
Console.WriteLine($"Number of slides = {numberOfSlides}");
for (int i = 0; i < numberOfSlides; i++)
{
GetSlideIdAndText(out string text, path, i);
Console.WriteLine($"Side #{i + 1} contains: {text}");
}
}
A continuación se incluye el código de ejemplo completo en C# y Visual Basic.
static int CountSlides(string presentationFile)
{
// Open the presentation as read-only.
using (PresentationDocument presentationDocument = PresentationDocument.Open(presentationFile, false))
{
// Pass the presentation to the next CountSlides method
// and return the slide count.
return CountSlidesFromPresentation(presentationDocument);
}
}
// Count the slides in the presentation.
static int CountSlidesFromPresentation(PresentationDocument presentationDocument)
{
// Check for a null document object.
if (presentationDocument is null)
{
throw new ArgumentNullException("presentationDocument");
}
int slidesCount = 0;
// Get the presentation part of document.
PresentationPart? presentationPart = presentationDocument.PresentationPart;
// Get the slide count from the SlideParts.
if (presentationPart is not null)
{
slidesCount = presentationPart.SlideParts.Count();
}
// Return the slide count to the previous method.
return slidesCount;
}
static void GetSlideIdAndText(out string sldText, string docName, int index)
{
using (PresentationDocument ppt = PresentationDocument.Open(docName, false))
{
// Get the relationship ID of the first slide.
PresentationPart? part = ppt.PresentationPart;
OpenXmlElementList slideIds = part?.Presentation?.SlideIdList?.ChildElements ?? default;
if (part is null || slideIds.Count == 0)
{
sldText = "";
return;
}
string? relId = ((SlideId)slideIds[index]).RelationshipId;
if (relId is null)
{
sldText = "";
return;
}
// Get the slide part from the relationship ID.
SlidePart slide = (SlidePart)part.GetPartById(relId);
// Build a StringBuilder object.
StringBuilder paragraphText = new StringBuilder();
// Get the inner text of the slide:
IEnumerable<A.Text> texts = slide.Slide.Descendants<A.Text>();
foreach (A.Text text in texts)
{
paragraphText.Append(text.Text);
}
sldText = paragraphText.ToString();
}
}